Home





 

VOZ HUMANA


 

 

 

 

 

A IBM sonha com a síntese da voz desde 1964, quando da criação do Shoebox (sintetizador de voz para falar dígitos). em 1993 ela lançaria IBM Personal Dictation System com a dura missão de reconhecer a voz.

 

Em 1997 Bill Gates declara que o reconhecimento de voz é a chave do desenvolvimento da informática, neste mesmo ano nasce o VIA VOICE da IBM.

 

O grande desafio dos aplicativos esta em decodificar a voz humana num dialogo natural, onde as frases não deixam claro onde começa e termina uma palavra, é o que chamaremos de fala contínua. A falta de uma pausa entre as palavras é o grande  obstáculo para os softwares, em distinguir corretamente o fim de uma palavra e o início da próxima.

 

Não encontramos o software capaz de fazer a transcrição na integra de uma fita cassete (tão comuns em casos de grampo telefônico), a lenda da transcrição completa ainda não foi idealizada, contudo algumas tarefas já são possíveis:

- computador escrevendo aquilo que ditamos;

- computador falando aquilo que escrevemos;

 

O site localizou alguns programas capazes de tratar a voz humana:

Dragon NaturallySpeaking

IBM ViaVoice

VoiceXpress

Vamos abordar o IBM Via Voice (em especial por que fala nossa língua portuguesa já faz algum tempo), muito conhecido e com a dura missão de inaugurar o placar nesta busca de sucesso na transcrição completa, suas limitações mostram a dimensão do problema das transcrições: 

- melhor desempenho se falando pausadamente;

- voz em alto e bom tom;

- dificuldades em separar sua voz de outra simultânea;

- uma mudança na pronúncia, e temos perdas;

E outros...

 

Enfim uma série de problemas ainda sem solução, mas o progresso em relação as gerações anteriores foi grande, pessoas com problemas visuais já podem se beneficiar, muito aplicativo ganha nova roupagem, no mundo corporativo as possibilidades de uso são formidáveis. A IBM em nossa opinião está na frente.
  

 

IBM - VIA VOICE

 

Extraído do site da IBM:

  

"Folha Online - janeiro/2002

A IBM está disponibilizando na internet uma demonstração de seu software de reconhecimento de voz, o ViaVoice.

A leitura de texto, uma das funcionalidades do programa, permite que o computador leia em voz alta o que for digitado ou ditado ao computador através do ViaVoice.

Usuários em diversas línguas podem testar o software. Entre os idiomas possíveis estão, além do Português, Inglês (dos EUA e da Inglaterra), Espanhol, Francês (da França e do Canadá), Alemão, Chinês, Tailandês, Italiano, entre outros.

Para testar a leitura de textos, basta acessar o site do ViaVoice (www.ibm.com/viavoice/br) e entrar no link "Demonstração de Leitura de Textos", na coluna à direita. É só digitar o texto na janela que se abre, escolher o idioma e acionar "Speak" para ouvir o computador pronunciar o conteúdo.

Este recurso também integra outras soluções IBM voltadas para deficientes visuais (SNS — Special Needs Systems).

O ViaVoice oferece suporte aos aplicativos do Office XP, da Microsoft, e foi criado com tecnologia de reconhecimento de voz para diferentes níveis de usuários, do iniciante ao experiente.

O aplicativo para Windows, versão 9, está disponível em dois modelos — Pro USB Edition e Standard Edition.

Todas as edições oferecem suporte para o ditado direto no Microsoft Word 2000.

O ViaVoice da IBM é parte de uma família de produtos de voz que inclui também o WebSphere Voice Server e outros programas de infra-estrutura, todos concebidos para ajudar as pessoas a se comunicarem com suas máquinas do modo mais natural possível, a voz.

A IBM capacita a utilização de voz não somente em PCs, mas também em aparelhos como computadores de mão e telefones, automóveis, portais de voz e centros de atendimento por telefone automatizados.

No Brasil, o ViaVoice 9 está disponível nas versões Standard Edition e Pro USB Edition. Os preços sugeridos são de R$ 213,18 para a versão Standard Edition e R$ 615,85 para a versão Pro USB Edition.

Mais informações sobre como adquirir o ViaVoice podem ser conseguidas pelo www.ibm.com/shop/br ou pelo telefone 0800-784262."

 

O texto da matéria da folha deixa claro as possibilidades do aplicativo e até o onde o Perito Criminal poderá sonhar, pelo menos por enquanto...

 

Não é, e nem será uma tarefa fácil transcrever uma fita de áudio na integra totalmente assistido por um software, ainda é necessário que o computador armazene as características da voz que envia o comando, e somente ela terá o benefício da transcrição. Uma vantagem é indiscutível, não precisamos mais digitar, o que pode ser relevante em uma transcrição que pode chegar facilmente em cem ou duzentas páginas de dialogo continuo.

 

Não esqueça de acessar o link da IBM falando do VIA VOICE:

 

IBM - VIA VOICE


.