Home



 

TRANSCRIÇÃO FONOGRÁFICA

 

ADEUS À TRANSCRIÇÃO FONOGRÁFICA: UM ESTUDO DE CASO

Arnaldo Gomes dos Santos Júnior[1]

Perito Criminal Federal

SECRIM/SR/DPF/SP

 14 de Agosto de 2003

 

RESUMO

A transcrição fonográfica, como tarefa comum à atividade pericial, pode estar com os seus dias contados. Foi desenvolvida na SECRIM/SP uma nova metodologia de trabalho que contempla a captura dos diálogos de interesse ao apuratório para meio digital, possibilitando ao mesmo tempo perenizar as provas, aumentar a eficiência na elaboração do laudo e manter sons, ruídos e entonações originais. Tudo sem a necessidade de transcrever quaisquer trechos do material analisado.

 

1.                INTRODUÇÃO

A transcrição fonográfica nada mais é do que passar para o papel o que se ouve. No caso de análises periciais, a tarefa compreende transcrever diálogos discriminando as intervenções, as falas dos envolvidos. A parte de identificação do interlocutor, por outro laudo, já fica a cargo da fonética forense, que não é tratada nesse artigo.

Estimativas recentes indicam a relação mínima de um para dez entre tempo de gravação e tempo necessário para se efetuar uma boa transcrição. Trata-se de um trabalho bastante árduo se levarmos em consideração o altíssimo nível de concentração e as condições de ambiente demandadas (baixo ruído, por exemplo).

Historicamente, a maioria das seções e dos setores de Criminalística do país tem recebido fitas de áudio para transcrição.

Recentemente, a Seção de Criminalística da Superintendência Regional da Polícia Federal em São Paulo recebeu expediente com mais de 300 (trezentas) fitas para a transcrição. Como complicador, as fitas foram gravadas em baixa rotação, multiplicando a duração de cada uma por aproximadamente 3 (três). Como existem fitas de 60 (sessenta) e 90 (noventa) minutos de duração, a estimativa para o total de horas a serem transcritas seria de no mínimo 1000 (mil) horas. Tal volume de serviço inesperado certamente prejudicaria ou até mesmo inviabilizaria o andamento de diversos outros trabalhos.

A solução foi desenvolver uma metodologia para análise que aumentasse a eficiência do serviço sem implicar em perda de qualidade. Diversas soluções foram tentadas, incluindo conversas com pesquisadores de universidades e a opção foi se tentar um novo processo doravante denominado “reorganização de áudio”, o qual será objeto deste artigo. Serão descritos tanto os passos necessários para a realização da análise e para a elaboração do laudo pericial quanto os requisitos em termos de equipamentos, software e suprimento. Finalmente, um pouco da experiência vivida nesta seção será mostrada.

2.                A INFORMÁTICA COMO SUPORTE À REORGANIZAÇÃO DE ÁUDIO

Com o advento da informática e, principalmente, com a disponibilidade nos dias de hoje de computadores com avançados recursos em multimídia, a digitalização de áudio e vídeo deixou de ser uma tarefa para técnicos extremamente especializados e passou a estar ao alcance da grande maioria.

Para o problema específico de análise de material de áudio, diversas aplicações baseadas em informática podem ser desenvolvidas com maior ou menor custo:

  • Reorganização de áudio
  • Identificação de locutor
  • Constatação de montagem
  • Transcrição automática por computador e outras aplicações avançadas

2.1.             REORGANIZAÇÃO DE ÁUDIO

Este termo, cunhado nesta SECRIM, se refere à identificação e separação em meio digital de diálogos de interesse para o apuratório com o auxílio de programas de computador especiais.

Trata-se de um processo de fácil aplicação, baixo custo, alta produtividade e bons resultados para o apuratório. Com um aparelho para reprodução do material de áudio (um toca-fitas comum, por exemplo), um cabo de ligação, dois programas de computador e um computador com recursos básicos de multimídia e sistema operacional Windows[2], é possível realizar todo o processo. A descrição detalhada dos passos necessários poderá ser vista na seção 3.

2.2.             IDENTIFICAÇÃO DE LOCUTOR E CONSTATAÇÃO DE MONTAGEM

Estas aplicações requerem componentes  mais avançados como computadores com alto poder de processamento, aparelhos de reprodução com alta fidelidade sonora e programas de computador mais sofisticados. Mas o mecanismo básico é similar e se baseia na captura de áudio para o computador e a posterior análise com o auxílio de ferramentas adequadas. Estes processos não serão objeto de estudo neste artigo.

2.3.             OUTRAS POSSIBILIDADES COM O AUXÍLIO DO COMPUTADOR

Existem diversas outras aplicações que podem ser desenvolvidas na área de análise de material de áudio com o auxílio de computador.

Dentre elas, uma das mais desejadas é a transcrição automática, de interesse não apenas pericial mas também para o grande público. Ainda existe muito a ser feito em termos de pesquisa acadêmica nesta área para se atingir resultados satisfatórios e o estado da arte nos dias de hoje ainda não permite a aplicação pericial em grande escala. Programas de computador como o IBM ViaVoice[3] ainda não são capazes de transcrever diálogos sem treinamento prévio, o que é impensável na atividade pericial. Mas como as aplicações comuns para tal tecnologia também despertam grande interesse comercial, é de se esperar que nas próximas décadas computadores serão capazes de entender completamente a fala humana como nos filmes de ficção científica.

3.                PASSOS NECESSÁRIOS À REORGANIZAÇÃO DE ÁUDIO

Para facilitar o processo de reorganização de áudio, propõe-se a sua divisão em passos bem definidos descritos a seguir.

3.1.             Captura de áudio pelo computador

O primeiro passo do processo é a captura de áudio pelo computador. Ao finalizar este passo, o perito terá como resultado um arquivo de computador com todo o áudio constante no material questionado, que pode ser, por exemplo, uma fita cassete.

Para a realização deste passo, o perito precisa de um cabo modelo P2 x 2RCA[4], um aparelho para reprodução do áudio com saída RCA[5] e um computador com placa de som básica. Para gravação do áudio no computador, o perito pode usar o “Gravador de som”, que vem junto com a instalação básica do Windows, ou algum software de tratamento de áudio como o GoldWave[6].

Primeiramente, o perito usa o cabo P2 X 2RCA para ligar a saída RCA (LineOut) do aparelho de reprodução à entrada de linha (LineIn) da placa de som do computador. Se a saída do aparelho de reprodução for mono, basta usar um dos pinos RCA. Caso contrário, os dois pinos devem ser usados.

Logo após, o perito deve checar as configurações de som do computador usando para isso o programa “Controle de Volume”, que também é instalado automaticamente pelo Windows. Neste programa, o perito deve habilitar a entrada de linha e selecioná-la como dispositivo de fonte de som para gravação.

Em seguida, o perito deve colocar o toca-fitas em velocidade normal e iniciar o software de captura de áudio no computador.

Finalmente, o perito deve iniciar a gravação do áudio no computador e simultaneamente iniciar a reprodução do material de áudio no aparelho.

Para configuração do arquivo de áudio no computador, sugerem-se os seguintes parâmetros:

  • Taxa de amostragem (sampling rate): deve ser de pelo menos 11 KHz. Para o caso de fitas gravadas em baixa rotação, esta taxa deve ser multiplicada pelo fator de multiplicação da duração. Como exemplo: se uma fita de 60 minutos é usada em baixa rotação de modo a permitir a gravação de 180 minutos, sugere-se que a taxa de amostragem seja de, no mínimo, 3 x 11 KHz, ou seja, 33 KHz;
  • Canais de áudio: a configuração correspondente à saída do aparelho de reprodução. Por exemplo, se o aparelho for mono, deve-se definir o arquivo como mono;
  • Duração: sugere-se, por garantia, que o perito crie um arquivo de áudio para captura um pouco maior do que o trecho a ser capturado. Para um lado de fita cassete de 60 minutos de duração (portanto com 30 minutos de duração), sugere-se entre 32 e 35 minutos. Afinal, são comuns os casos de fitas com duração real maior que a especificada.

3.2.             Alteração de velocidade

Em diversos casos, a gravação do áudio original a ser analisado é feita com equipamentos especiais que permitem a redução da rotação e, com isso, o aumento da duração por fita. É comum encontrar fitas com tempo duas, três e até quatro vezes maior que a especificação, com correspondente perda de qualidade.

Caso o perito receba fitas cassete com rotação alterada, poderá realizar a alteração da velocidade do áudio capturado no computador com o auxílio de ferramentas apropriadas como o GoldWave. No caso da versão 4.02 deste software usado na SECRIM/SP, a opção “Time Warp” do menu “Effects” realiza esta tarefa, com possibilidade de redução de velocidade em até duas vezes de cada vez.

3.3.             Compactação de arquivos de áudio

No trabalho com arquivos multimídia, o espaço em disco é sempre uma questão a ser considerada. Arquivos de áudio e vídeo ficam muito grandes mesmo com pequena duração. A título de exemplo, 1 minuto de áudio em alta qualidade ocupa cerca de 10MB, enquanto 1 minuto de vídeo em alta qualidade pode ocupar entre 30MB e 100MB.

Para o caso de reorganização de áudio, a compactação utiliza o formato MP3, o que faz com que o tamanho do arquivo seja reduzido em razões que podem variar entre 5 e 20, conforme as configurações usadas. No caso da SECRIM/SP, tem se usado uma taxa bitrate de 64 kbit, que leva à redução do tamanho de um arquivo em cerca de 11 a 12 vezes. Esta taxa se mostrou adequada para o caso de fitas cassete com gravações telefônicas mas certamente deve ser alterada para casos de compactação de áudio de maior qualidade como sons extraídos a partir de CDs.

3.4.             Análise e separação de diálogos importantes

Após a captura do áudio para o computador e a alteração e compactação dos arquivos gerados, o perito deve realizar a análise de conteúdo e a separação de diálogos importantes, o que é, em última instância, a principal tarefa na reorganização de áudio.

Para tal, o perito deve utilizar um software especial para tratamento de áudio como o GoldWave e um computador com placa de som e caixas acústicas ou, o mais recomendado, bons fones de ouvido.

Após estudos aqui na SECRIM/SP, observou-se que a forma mais simples de se realizar a análise e separação de diálogos importantes é em dois passos:

  • Audição completa com anotação de trechos com diálogos importantes: o perito ouve o arquivo de áudio completamente e, ao detectar diálogos de interesse, anota os instantes de início e fim para posterior gravação em arquivo particular;
  • Gravação de arquivos com diálogos importantes em separado: em um segundo momento, o perito usa a ferramenta para marcar visualmente e gravar cada diálogo importante em um novo arquivo de áudio.

Com a ferramenta GoldWave na versão 4.02, por exemplo, o perito usa os controles de reprodução comuns (Play, Pause e Stop) e observa o contador de tempo para fazer a anotação dos trechos importantes. Em seguida, faz uso da opção “Set” do submenu “Marker” de menu “Edit” para definir instantes de início e fim do trecho a ser gravado. Finalmente, com a função “Copy To”, o perito pode gravar o diálogo de interesse em um arquivo separado em disco.

3.5.             Elaboração do laudo

Feita a separação de diálogos importantes, o perito passa à elaboração do laudo. Para tal, sugere-se a criação de uma tabela com os diálogos de interesse e quatro colunas a saber:

  • Número do trecho: número seqüencial que pode servir de referência para a leitura do laudo e o acesso a determinados diálogos de interesse durante a investigação ou o julgamento;
  • Duração: instantes de início e fim do diálogo no material de áudio analisado. Informação útil caso a materialidade da prova seja questionada;
  • Descrição: parágrafo com algumas palavras que serve para descrever, em nível bem alto, o conteúdo do diálogo. Auxilia a investigação e o julgamento, principalmente em casos com grande volume de material;
  • Ícone para escuta de arquivo: ícone que permite a ativação e conseqüente escuta do diálogo descrito.

A título de informação, para inserir um arquivo de áudio com diálogo como ícone em um documento usando o Microsoft Word versão 2002, basta:

  • Acessar o item “Objeto” no menu “Inserir”;
  • Selecionar a aba “Criar do Arquivo”;
  • Entrar com o nome do arquivo ou selecioná-lo visualmente através do botão Procurar;
  • Desmarcar a opção “Vincular ao arquivo”;
  • Marcar a opção “Exibir como ícone”.

Ao final, o laudo conterá um ícone como o exemplo a seguir:

3.6.             Finalização do laudo: gravação em CD e assinatura digital

A finalização é a última fase para a obtenção de um laudo de reorganização de áudio. Ela compreende a gravação em CD e a assinatura digital[7], processo através do qual um código identificador único (uma espécie de código DNA) é calculado a partir do arquivo.

Na SECRIM/SP, a finalização do laudo é feita da seguinte forma: o arquivo Word do laudo é gravado em um CD com sessão única e finalizada, o que não permite a regravação ou adição de informações. Além disso, a conclusão do laudo cita a folha de anexo com a assinatura digital, que será calculada e impressa para compor o laudo e garantir a sua fidelidade.

4.                A EXPERIÊNCIA DA SECRIM/SP COM A REORGANIZAÇÃO DE ÁUDIO

Como foi descrito na introdução deste artigo, o processo de reorganização de áudio foi idealizado na SECRIM/SP a partir de uma demanda quase intratável por transcrições fonográficas. Em estimativas iniciais, seria necessário mais de um ano para periciar as mais de trezentas fitas cassete gravadas em baixa rotação (entre três e quatro horas e meia de gravação).

Primeiramente, os peritos Arnaldo Gomes dos Santos Júnior e Maristela Guizardi Bisterço entraram em contato com o promotor responsável pelo caso para oferecer a alternativa, que havia sido desenvolvida internamente pela SECRIM/SP com os equipamentos nela disponíveis.

Após conversas com o promotor, os peritos montaram uma apresentação para o juiz, na qual expuseram os motivos, as características da solução proposta, um exemplo prático e os novos prazos a serem cumpridos. O juiz gostou do exposto e aprovou a nova metodologia, que foi imediatamente implantada nesta SECRIM.

Em seguida, um mini-curso foi formulado e ministrado pelo perito Arnaldo a todos os outros peritos da seção, abordando tanto aspectos teóricos quanto práticos do assunto. Este mini-curso foi realizado nas próprias dependências da SECRIM/SP em uma sala de meios com oito computadores. Cada turma foi composta por sete peritos e a duração variou entre duas e três horas.

Neste momento, os peritos estão analisando as fitas sob sua responsabilidade já com o auxílio das novas técnicas. O grau de familiaridade de cada um varia, obviamente, com a sua proficiência tanto em informática quanto em áudio mas, em termos gerais, os resultados têm sido mais que satisfatórios, tanto em termos de produtividade quanto em termos de qualidade e até mesmo no tocante a satisfação no trabalho.

5.                CONCLUSÃO

Este artigo destina-se a mostrar a experiência da SECRIM/SP com o novo processo de reorganização de áudio, que visa substituir com vantagens a transcrição fonográfica.

Mais do que isso, pretende que seja inaugurada uma nova era na perícia em áudio-visual com maior aplicação de tecnologia, maior produtividade, melhores resultados e maior satisfação pessoal para os responsáveis pelas análises de áudio.

6.                BIBLIOGRAFIA

[1]    GoldWave 4.02 – Software para captura e tratamento de áudio http://www.goldwave.com

[2]    RazorLame 1.1.5 – Software para compactação de áudio  http://www.dors.de/razorlame

[3]    IBM ViaVoice – Software para reconhecimento de voz
http://www.ibm.com/viavoice


[1] O autor é bacharel em Ciência da Computação pela UFMG em 1995 e mestre em Engenharia de Software também pela UFMG em 1998. Trabalha como Perito Criminal Federal na Seção de Criminalística da Superintendência Regional da Polícia Federal em São Paulo desde novembro de 2002. 

[2] Neste primeiro momento, foi utilizado o sistema operacional Windows por ele se encontrar instalado em todos os equipamentos do setor. Cabe destacar que sistemas gratuitos como o Linux podem ser utilizados com pequenas adaptações.

[3] Maiores informações sobre o IBM ViaVoice podem ser encontradas em [3] .

[4] Tal cabo pode ser comprado por cerca de R$5,00 em lojas de material eletro-eletrônico.

[5] Saídas RCA costumam ser denominadas “LineOut” e podem ser encontradas em bons toca-fitas ou aparelhos integrados ou modulares. Apenas toca-fitas portáteis (walkman) ou microsystems não costumam ter tais saídas.

[6] Maiores informações sobre o GoldWave podem ser encontradas em [1] .

[7] A assinatura digital deve ser calculada e impressa junto ao laudo para evitar que qualquer adulteração possa ser realizada sobre a versão digital do laudo.


.