TRANSCRIÇÃO FONOGRÁFICA
ADEUS
À TRANSCRIÇÃO FONOGRÁFICA: UM ESTUDO DE CASO
Arnaldo
Gomes dos Santos Júnior
Perito
Criminal Federal
SECRIM/SR/DPF/SP
14
de Agosto de 2003
RESUMO
A transcrição fonográfica,
como tarefa comum à atividade pericial, pode estar com os seus
dias contados. Foi desenvolvida na SECRIM/SP uma nova
metodologia de trabalho que contempla a captura dos diálogos de
interesse ao apuratório para meio digital, possibilitando ao
mesmo tempo perenizar as provas, aumentar a eficiência na
elaboração do laudo e manter sons, ruídos e entonações
originais. Tudo sem a necessidade de transcrever quaisquer
trechos do material analisado.
1.
INTRODUÇÃO
A transcrição fonográfica nada mais é
do que passar para o papel o que se ouve. No caso de análises
periciais, a tarefa compreende transcrever diálogos
discriminando as intervenções, as falas dos envolvidos. A
parte de identificação do interlocutor, por outro laudo, já
fica a cargo da fonética forense, que não é tratada nesse
artigo.
Estimativas recentes indicam a relação mínima
de um para dez entre tempo de gravação e tempo necessário
para se efetuar uma boa transcrição. Trata-se de um trabalho
bastante árduo se levarmos em consideração o altíssimo nível
de concentração e as condições de ambiente demandadas (baixo
ruído, por exemplo).
Historicamente, a maioria das seções e
dos setores de Criminalística do país tem recebido fitas de áudio
para transcrição.
Recentemente, a Seção de Criminalística
da Superintendência Regional da Polícia Federal em São Paulo
recebeu expediente com mais de 300 (trezentas) fitas para a
transcrição. Como complicador, as fitas foram gravadas em
baixa rotação, multiplicando a duração de cada uma por
aproximadamente 3 (três). Como existem fitas de 60 (sessenta) e
90 (noventa) minutos de duração, a estimativa para o total de
horas a serem transcritas seria de no mínimo 1000 (mil) horas.
Tal volume de serviço inesperado certamente prejudicaria ou até
mesmo inviabilizaria o andamento de diversos outros trabalhos.
A solução foi desenvolver uma
metodologia para análise que aumentasse a eficiência do serviço
sem implicar em perda de qualidade. Diversas soluções foram
tentadas, incluindo conversas com pesquisadores de universidades
e a opção foi se tentar um novo processo doravante denominado
“reorganização de áudio”, o qual será objeto deste
artigo. Serão descritos tanto os passos necessários para a
realização da análise e para a elaboração do laudo pericial
quanto os requisitos em termos de equipamentos, software e
suprimento. Finalmente, um pouco da experiência vivida nesta seção
será mostrada.
2.
A INFORMÁTICA COMO SUPORTE À REORGANIZAÇÃO DE ÁUDIO
Com o advento da informática e,
principalmente, com a disponibilidade nos dias de hoje de
computadores com avançados recursos em multimídia, a
digitalização de áudio e vídeo deixou de ser uma tarefa para
técnicos extremamente especializados e passou a estar ao
alcance da grande maioria.
Para o problema específico de análise de
material de áudio, diversas aplicações baseadas em informática
podem ser desenvolvidas com maior ou menor custo:
- Reorganização de
áudio
- Identificação de
locutor
- Constatação de
montagem
- Transcrição automática
por computador e outras aplicações avançadas
2.1.
REORGANIZAÇÃO DE ÁUDIO
Este termo, cunhado nesta SECRIM, se
refere à identificação e separação em meio digital de diálogos
de interesse para o apuratório com o auxílio de programas de
computador especiais.
Trata-se de um processo de fácil aplicação,
baixo custo, alta produtividade e bons resultados para o apuratório.
Com um aparelho para reprodução do material de áudio (um
toca-fitas comum, por exemplo), um cabo de ligação, dois
programas de computador e um computador com recursos básicos de
multimídia e sistema operacional Windows,
é possível realizar todo o processo. A descrição detalhada
dos passos necessários poderá ser vista na seção 3.
2.2.
IDENTIFICAÇÃO DE
LOCUTOR E CONSTATAÇÃO DE MONTAGEM
Estas
aplicações requerem componentes mais avançados
como computadores com alto poder de processamento, aparelhos de
reprodução com alta fidelidade sonora e programas de
computador mais sofisticados. Mas o mecanismo básico é similar
e se baseia na captura de áudio para o computador e a posterior
análise com o auxílio de ferramentas adequadas. Estes
processos não serão objeto de estudo neste artigo.
2.3.
OUTRAS POSSIBILIDADES COM O AUXÍLIO
DO COMPUTADOR
Existem diversas outras aplicações que
podem ser desenvolvidas na área de análise de material de áudio
com o auxílio de computador.
Dentre elas, uma das mais desejadas é a
transcrição automática, de interesse não apenas pericial mas
também para o grande público. Ainda existe muito a ser feito
em termos de pesquisa acadêmica nesta área para se atingir
resultados satisfatórios e o estado da arte nos dias de hoje
ainda não permite a aplicação pericial em grande escala.
Programas de computador como o IBM ViaVoice ainda não são capazes de
transcrever diálogos sem treinamento prévio, o que é impensável
na atividade pericial. Mas como as aplicações comuns para tal
tecnologia também despertam grande interesse comercial, é de
se esperar que nas próximas décadas computadores serão
capazes de entender completamente a fala humana como nos filmes
de ficção científica.
3.
PASSOS NECESSÁRIOS À REORGANIZAÇÃO DE ÁUDIO
Para facilitar o processo de reorganização
de áudio, propõe-se a sua divisão em passos bem definidos
descritos a seguir.
3.1.
Captura de áudio pelo
computador
O primeiro passo do processo é a captura
de áudio pelo computador. Ao finalizar este passo, o perito terá
como resultado um arquivo de computador com todo o áudio
constante no material questionado, que pode ser, por exemplo,
uma fita cassete.
Para a realização deste passo, o perito
precisa de um cabo modelo P2 x 2RCA,
um aparelho para reprodução do áudio com saída RCA
e um computador com placa de som básica. Para gravação do áudio
no computador, o perito pode usar o “Gravador de som”, que
vem junto com a instalação básica do Windows, ou algum
software de tratamento de áudio como o GoldWave.
Primeiramente, o perito usa o cabo P2 X
2RCA para ligar a saída RCA (LineOut) do aparelho de reprodução
à entrada de linha (LineIn) da placa de som do computador. Se a
saída do aparelho de reprodução for mono, basta usar um dos
pinos RCA. Caso contrário, os dois pinos devem ser usados.
Logo após, o perito deve checar as
configurações de som do computador usando para isso o programa
“Controle de Volume”, que também é instalado
automaticamente pelo Windows. Neste programa, o perito deve
habilitar a entrada de linha e selecioná-la como dispositivo de
fonte de som para gravação.
Em seguida, o perito deve colocar o
toca-fitas em velocidade normal e iniciar o software de captura
de áudio no computador.
Finalmente, o perito deve iniciar a gravação
do áudio no computador e simultaneamente iniciar a reprodução
do material de áudio no aparelho.
Para configuração do arquivo de áudio
no computador, sugerem-se os seguintes parâmetros:
- Taxa de amostragem (sampling
rate): deve ser de pelo menos 11 KHz. Para o caso de
fitas gravadas em baixa rotação, esta taxa deve ser
multiplicada pelo fator de multiplicação da duração.
Como exemplo: se uma fita de 60 minutos é usada em baixa
rotação de modo a permitir a gravação de 180 minutos,
sugere-se que a taxa de amostragem seja de, no mínimo, 3 x
11 KHz, ou seja, 33 KHz;
- Canais de áudio: a
configuração correspondente à saída do aparelho de
reprodução. Por exemplo, se o aparelho for mono, deve-se
definir o arquivo como mono;
- Duração:
sugere-se, por garantia, que o perito crie um arquivo de áudio
para captura um pouco maior do que o trecho a ser capturado.
Para um lado de fita cassete de 60 minutos de duração
(portanto com 30 minutos de duração), sugere-se entre 32 e
35 minutos. Afinal, são comuns os casos de fitas com duração
real maior que a especificada.
3.2.
Alteração de velocidade
Em diversos casos, a gravação do áudio
original a ser analisado é feita com equipamentos especiais que
permitem a redução da rotação e, com isso, o aumento da duração
por fita. É comum encontrar fitas com tempo duas, três e até
quatro vezes maior que a especificação, com correspondente
perda de qualidade.
Caso o perito receba fitas cassete com
rotação alterada, poderá realizar a alteração da velocidade
do áudio capturado no computador com o auxílio de ferramentas
apropriadas como o GoldWave. No caso da versão 4.02 deste
software usado na SECRIM/SP, a opção “Time Warp” do menu
“Effects” realiza esta tarefa, com possibilidade de redução
de velocidade em até duas vezes de cada vez.
3.3.
Compactação de arquivos de áudio
No trabalho com arquivos multimídia, o
espaço em disco é sempre uma questão a ser considerada.
Arquivos de áudio e vídeo ficam muito grandes mesmo com
pequena duração. A título de exemplo, 1 minuto de áudio em
alta qualidade ocupa cerca de 10MB, enquanto 1 minuto de vídeo
em alta qualidade pode ocupar entre 30MB e 100MB.
Para o caso de reorganização de áudio,
a compactação utiliza o formato MP3, o que faz com que o
tamanho do arquivo seja reduzido em razões que podem variar
entre 5 e 20, conforme as configurações usadas. No caso da
SECRIM/SP, tem se usado uma taxa bitrate de 64 kbit, que leva à redução do tamanho de um arquivo
em cerca de 11 a 12 vezes. Esta taxa se mostrou adequada para o
caso de fitas cassete com gravações telefônicas mas
certamente deve ser alterada para casos de compactação de áudio
de maior qualidade como sons extraídos a partir de CDs.
3.4.
Análise e separação de diálogos
importantes
Após a captura do áudio para o
computador e a alteração e compactação dos arquivos gerados,
o perito deve realizar a análise de conteúdo e a separação
de diálogos importantes, o que é, em última instância, a
principal tarefa na reorganização de áudio.
Para tal, o perito deve utilizar um
software especial para tratamento de áudio como o GoldWave e um
computador com placa de som e caixas acústicas ou, o mais
recomendado, bons fones de ouvido.
Após estudos aqui na SECRIM/SP,
observou-se que a forma mais simples de se realizar a análise e
separação de diálogos importantes é em dois passos:
- Audição completa
com anotação de trechos com diálogos importantes: o
perito ouve o arquivo de áudio completamente e, ao detectar
diálogos de interesse, anota os instantes de início e fim
para posterior gravação em arquivo particular;
- Gravação de
arquivos com diálogos importantes em separado: em um
segundo momento, o perito usa a ferramenta para marcar
visualmente e gravar cada diálogo importante em um novo
arquivo de áudio.
Com a ferramenta GoldWave na versão 4.02,
por exemplo, o perito usa os controles de reprodução comuns (Play,
Pause e Stop) e observa o
contador de tempo para fazer a anotação dos trechos
importantes. Em seguida, faz uso da opção “Set” do submenu
“Marker” de menu “Edit” para definir instantes de início
e fim do trecho a ser gravado. Finalmente, com a função
“Copy To”, o perito pode gravar o diálogo de interesse em
um arquivo separado em disco.
3.5.
Elaboração do laudo
Feita a separação de diálogos
importantes, o perito passa à elaboração do laudo. Para tal,
sugere-se a criação de uma tabela com os diálogos de
interesse e quatro colunas a saber:
- Número do trecho: número
seqüencial que pode servir de referência para a leitura do
laudo e o acesso a determinados diálogos de interesse
durante a investigação ou o julgamento;
- Duração: instantes
de início e fim do diálogo no material de áudio
analisado. Informação útil caso a materialidade da prova
seja questionada;
- Descrição: parágrafo
com algumas palavras que serve para descrever, em nível bem
alto, o conteúdo do diálogo. Auxilia a investigação e o
julgamento, principalmente em casos com grande volume de
material;
- Ícone para escuta
de arquivo: ícone que permite a ativação e conseqüente
escuta do diálogo descrito.
A título de informação, para inserir um
arquivo de áudio com diálogo como ícone em um documento
usando o Microsoft Word versão 2002, basta:
- Acessar o item
“Objeto” no menu “Inserir”;
- Selecionar a aba
“Criar do Arquivo”;
- Entrar com o nome do
arquivo ou selecioná-lo visualmente através do botão
Procurar;
- Desmarcar a opção
“Vincular ao arquivo”;
- Marcar a opção
“Exibir como ícone”.
Ao final, o laudo
conterá um ícone como o exemplo a seguir:
3.6.
Finalização do laudo: gravação
em CD e assinatura digital
A finalização é a última fase para a
obtenção de um laudo de reorganização de áudio. Ela
compreende a gravação em CD e a assinatura digital,
processo através do qual um código identificador único (uma
espécie de código DNA) é calculado a partir do arquivo.
Na SECRIM/SP, a finalização do laudo é
feita da seguinte forma: o arquivo Word do laudo é gravado em
um CD com sessão única e finalizada, o que não permite a
regravação ou adição de informações. Além disso, a
conclusão do laudo cita a folha de anexo com a assinatura
digital, que será calculada e impressa para compor o laudo e
garantir a sua fidelidade.
4.
A EXPERIÊNCIA DA SECRIM/SP COM A REORGANIZAÇÃO DE ÁUDIO
Como foi descrito na introdução deste
artigo, o processo de reorganização de áudio foi idealizado
na SECRIM/SP a partir de uma demanda quase intratável por
transcrições fonográficas. Em estimativas iniciais, seria
necessário mais de um ano para periciar as mais de trezentas
fitas cassete gravadas em baixa rotação (entre três e quatro
horas e meia de gravação).
Primeiramente, os peritos Arnaldo Gomes
dos Santos Júnior e Maristela Guizardi Bisterço entraram em
contato com o promotor responsável pelo caso para oferecer a
alternativa, que havia sido desenvolvida internamente pela
SECRIM/SP com os equipamentos nela disponíveis.
Após conversas com o promotor, os peritos
montaram uma apresentação para o juiz, na qual expuseram os
motivos, as características da solução proposta, um exemplo
prático e os novos prazos a serem cumpridos. O juiz gostou do
exposto e aprovou a nova metodologia, que foi imediatamente
implantada nesta SECRIM.
Em seguida, um mini-curso foi formulado e
ministrado pelo perito Arnaldo a todos os outros peritos da seção,
abordando tanto aspectos teóricos quanto práticos do assunto.
Este mini-curso foi realizado nas próprias dependências da
SECRIM/SP em uma sala de meios com oito computadores. Cada turma
foi composta por sete peritos e a duração variou entre duas e
três horas.
Neste momento, os peritos estão
analisando as fitas sob sua responsabilidade já com o auxílio
das novas técnicas. O grau de familiaridade de cada um varia,
obviamente, com a sua proficiência tanto em informática quanto
em áudio mas, em termos gerais, os resultados têm sido mais
que satisfatórios, tanto em termos de produtividade quanto em
termos de qualidade e até mesmo no tocante a satisfação no
trabalho.
5.
CONCLUSÃO
Este artigo destina-se a mostrar a experiência
da SECRIM/SP com o novo processo de reorganização de áudio,
que visa substituir com vantagens a transcrição fonográfica.
Mais do que isso, pretende que seja
inaugurada uma nova era na perícia em áudio-visual com maior
aplicação de tecnologia, maior produtividade, melhores
resultados e maior satisfação pessoal para os responsáveis
pelas análises de áudio.
6.
BIBLIOGRAFIA
[1]
GoldWave 4.02 – Software para captura e tratamento de
áudio http://www.goldwave.com
[2]
RazorLame 1.1.5 – Software para compactação de áudio
http://www.dors.de/razorlame
[3]
IBM ViaVoice – Software para reconhecimento de voz
http://www.ibm.com/viavoice
|