|
VOZ
HUMANA
A
IBM sonha com a síntese da voz desde 1964, quando da criação
do Shoebox (sintetizador de voz para falar dígitos). em
1993 ela lançaria IBM Personal Dictation System com a dura
missão de reconhecer a voz.
Em
1997 Bill Gates declara que o reconhecimento de voz é a chave
do desenvolvimento da informática, neste mesmo ano nasce o VIA
VOICE da IBM.
O
grande desafio dos aplicativos esta em decodificar a voz humana
num dialogo natural, onde as frases não deixam claro onde
começa e termina uma palavra, é o que chamaremos de fala
contínua. A falta de uma pausa entre as palavras é o
grande obstáculo para os softwares, em distinguir
corretamente o fim de uma palavra e o início da próxima.
Não
encontramos o software capaz de fazer a transcrição na integra
de uma fita cassete (tão comuns em casos de grampo
telefônico), a lenda da transcrição completa ainda não foi
idealizada, contudo algumas tarefas já são possíveis:
-
computador escrevendo aquilo que ditamos;
-
computador falando aquilo que escrevemos;
O
site localizou alguns programas capazes de tratar a voz humana:
Dragon
NaturallySpeaking
IBM
ViaVoice
VoiceXpress
Vamos
abordar o IBM Via Voice (em
especial por que fala nossa língua portuguesa já faz algum
tempo), muito conhecido e com a dura missão de
inaugurar o placar nesta busca de sucesso na transcrição
completa, suas limitações mostram a dimensão do problema das
transcrições:
-
melhor desempenho se falando pausadamente;
-
voz em alto e bom tom;
-
dificuldades em separar sua voz de outra simultânea;
-
uma mudança na pronúncia, e temos perdas;
E
outros...
Enfim
uma série de problemas ainda sem solução, mas o progresso em
relação as gerações anteriores foi grande, pessoas com
problemas visuais já podem se beneficiar, muito aplicativo
ganha nova roupagem, no mundo corporativo as possibilidades de
uso são formidáveis. A IBM em nossa opinião está na frente.
IBM
- VIA VOICE
Extraído
do site
da IBM:
"Folha
Online - janeiro/2002
A
IBM está disponibilizando na internet uma demonstração de seu
software de reconhecimento de voz, o ViaVoice.
A
leitura de texto, uma das funcionalidades do programa, permite
que o computador leia em voz alta o que for digitado ou ditado
ao computador através do ViaVoice.
Usuários
em diversas línguas podem testar o software. Entre os idiomas
possíveis estão, além do Português, Inglês (dos EUA e da
Inglaterra), Espanhol, Francês (da França e do Canadá), Alemão,
Chinês, Tailandês, Italiano, entre outros.
Para
testar a leitura de textos, basta acessar o site do ViaVoice
(www.ibm.com/viavoice/br) e entrar no link "Demonstração
de Leitura de Textos", na coluna à direita. É só digitar
o texto na janela que se abre, escolher o idioma e acionar
"Speak" para ouvir o computador pronunciar o conteúdo.
Este
recurso também integra outras soluções IBM voltadas para
deficientes visuais (SNS — Special Needs Systems).
O
ViaVoice oferece suporte aos aplicativos do Office XP, da
Microsoft, e foi criado com tecnologia de reconhecimento de voz
para diferentes níveis de usuários, do iniciante ao
experiente.
O
aplicativo para Windows, versão 9, está disponível em dois
modelos — Pro USB Edition e Standard Edition.
Todas
as edições oferecem suporte para o ditado direto no Microsoft
Word 2000.
O
ViaVoice da IBM é parte de uma família de produtos de voz que
inclui também o WebSphere Voice Server e outros programas de
infra-estrutura, todos concebidos para ajudar as pessoas a se
comunicarem com suas máquinas do modo mais natural possível, a
voz.
A
IBM capacita a utilização de voz não somente em PCs, mas também
em aparelhos como computadores de mão e telefones, automóveis,
portais de voz e centros de atendimento por telefone
automatizados.
No
Brasil, o ViaVoice 9 está disponível nas versões Standard
Edition e Pro USB Edition. Os preços sugeridos são de R$
213,18 para a versão Standard Edition e R$ 615,85 para a versão
Pro USB Edition.
Mais
informações sobre como adquirir o ViaVoice podem ser
conseguidas pelo www.ibm.com/shop/br ou pelo telefone
0800-784262."
O
texto da matéria da folha deixa claro as possibilidades do
aplicativo e até o onde o Perito Criminal poderá sonhar, pelo
menos por enquanto...
Não
é, e nem será uma tarefa fácil transcrever uma fita de áudio
na integra totalmente assistido por um software, ainda é
necessário que o computador armazene as características da voz
que envia o comando, e somente ela terá o benefício da
transcrição. Uma vantagem é indiscutível, não precisamos
mais digitar,
o que pode ser relevante em uma transcrição que pode
chegar facilmente em cem ou duzentas páginas de dialogo
continuo.
Não
esqueça de acessar o link da IBM falando do VIA VOICE:
IBM
- VIA VOICE
|