TRANSCRICOES.com.br - WhatsApp ou Telegram (11) 94844-3344 - contato@transcricoes.com.br

Transcricoes
Transcricoes

Você está aqui: / Converter áudio para texto grátis com Google
Converter audio para texto

“Converter áudio para texto grátis com Google Docs”… foi o primeiro post do nosso blog por idos de 2014. Entretanto, constantes atualizações vão fazendo criar um monstrinho de remendos. Resolvi reescrever para melhorar a leitura. Confira a atualização sobre o sistema Parli de ditado. Durante minha atuação como transcritor acabei pesquisando várias formas de transcrever áudio automaticamente. O Google Docs tem um recurso chamado SPEECH em Ferramentas que permite fazer isso com bom índice de acertos. Existem outras ferramentas, levando em conta o mesmo motor Google de reconhecimento de fala. Apresento aqui além de vídeo contendo como trabalhar com o recurso Google Speech como outros como Dictano que são bem fáceis de usar.

 

Em ordem não cronológica

Não vou fazer a ordem cronológica para finalmente chegarmos no mais avançado, que é o Google Docs com a ferramenta digitação por voz. , Assim,quem tiver pressa não perde tempo lendo todo o histórico.

Grupos de software de processamento de fala

Existem dois grupos de softwares de reconhecimento de fala . o primeiro é o que apresenta o mais rápido desenvolvimento, pois conta com um banco de dados de vozes e sotaques do mundo inteiro, permitindo aos linguistas aperfeiçoarem as informações referentes às particularidades de cada língua.

Entre esses estão os de celulares smartphones, mecanismos de reconhecimento de fala. Algumas postagens na internet de pseudo-especialistas falam em transcrição usando celular. Nem sabem do que falam, pois o ponto crucial da transcrição não são palavras, mas a pontuação e estrutura gramatical que sustente uma boa leitura. Para esses falsos especialistas, fica esse recado.

O segundo grupo funciona instalado no seu computador e não depende de internet para funcionar, portanto livres do Google como navegador. Talvez por segurança e privacidade, ou talvez por instabilidade de sinal, esses também têm um nicho específico e milionário.

1º grupo – baseado na internet

Web Speech API da Google

É o reconhecimento de voz mais apurado e em rápida evolução em várias línguas. Eu o chamo de “motor Google” de reconhecimento de fala, assim como outras pessoas que lidam com digitação por voz.

Dele derivam a maioria dos “chrome-based online voice to text converters” como o Dictanote e Speechnotes, entre outros. Por estarem baseados no motor Google, fora do ambiente do navegador Chrome não funcionam.

Todos eles funcionam em diversas línguas e no português do Brasil e de Portugal, também. Basta selecionar a língua e a região. O inglês por exemplo está dividido em vários sotaques, Australia, Canada, India, New Zeland, South Africa ,United Kingdom e United States.

WhatsApp converte voz em texto

Para quem tem dificuldade em digitar mensagens longas pelo teclado virtual no WhatsApp, basta instalar o teclado Google com de digitação por voz em seu smartphone. Você pode utilizar um APP no Google Play. Depois basta seguir as orientações no vídeo do provedor. Reporte se houver qualquer problema com o link. O segredo é procurar a figura de um microfone no seu teclado instalado e então começar a ditar em seu smartphone. Ele vai escrever, depois pode pontuar. Abaixo da tecla de espaço (aquela barra grande na parte inferior do teclado google) selecione a linguagem.

digitação por voz no WhatsApp

Dictanote

Dictanote é um chrome-based com um motor Google. Apresenta o inconveniente de mesmo sendo versão paga (experimentado e aprovado), quando aplicamos uma limpeza com o CCleaner, todas as configurações salvas desaparecem. Outro inconveniente é que o microfone fica acesso pouco tempo.

Speechnotes

Speechnotes, também baseada no motor Google, não apresenta flexibilidade de programar os Voice Commands, mas o microfone fica surpreendentemente ligado, experimentei e funcionou por mais de 6 horas de forma estável, enquanto o sinal da internet daqui permaneceu sem cair.

Google Docs

E, como não deixaria de ser, o Google Docs . Em Ferramentas>Digitação por Voz, temos o motor funcionando em sua forma mais pura, conforme abaixo.

Também preparamos uma página que permite a conversão da pontuação. Basta acessar a www.transcricoes.com.br/transcricoes e se gostar, cadastre-se para receber a sua pontuação.

Minimacro pontuador de ditado

Criado a partir de rotinas exaustivamente testadas durante quatro anos, lançamos uma pequena macro que chama minimacro. Ela pode ser instalada em seu Word e fazer as pontuações, sendo expansível. Com uma versão mais robusta e customizada, você pode criar sua própria macro a partir dela e desenvolvê-la.

2º grupo – baseado em software proprietário

Dragon Speech

Dragon Speech pertence à Nuance. O Dragon Speech não está disponível em português, mas em inglês, francês e espanhol.

Voice Interaction

Voice Interacton tem parceiria com a Voicetag. Está desenvolvendo negócios com grandes empresas e também atua na área de transcrição de áudio através do sistema Adminus com um corpus linguístico bem desenvolvido.

Parli

Um novo player chegou no mercado brasileiro. O recurso Parli me chamou a atenção, mas não pude testar pois ainda não tive essa chance. Parece que está suportado pela Nuance, segundo o site. Acho que vale uma visita. http://parli.com.br/

Outros softwares famosos

O Dragon é descendente do Via Voice, famoso software da IBM . A Nuance adquiriu os direitos sobre o programa e desde então comprou o Philips 2000 Speech Recognition. Você pode encontrar artigos interessantíssimos sobre.

Digitação por voz no Mac da Apple

Um artigo do suporte da Apple traz uma matéria sobre como fazer digitação por ditado no Mac. É muito interessante e gostaria de ter dinheiro para adquirir um.

Links converter áudio em texto

(os links foram testados em 15/03/2014, favor reportar quebras)

Distrofia http://distrofico.amplarede.com.br/ – os distróficos dependem de soluções com comando de voz. É um site bem bacana do Estevão Augusto. Houve atualizações constantes. (vistado em 09/02/2016).

FreeSpeech 2000 (Philips) –http://distrofico.amplarede.com.br/2010/02/philips-freespeech-2000-em-portugues/ – traz links para download. Visitado em 09/02/2016 houve atualização em janeiro/2015.

ViaVoicehttp://en.wikipedia.org/wiki/IBM_ViaVoice – trata de um brevíssimo histórico do produto, em inglês. Permanece inalterado. (visitado em 09/02/2016)

ViaVoice Download http://distrofico.amplarede.com.br/2010/02/ibm-viavoice-pro-usb-edition-release-9-portugues-br/ – traz links para 9.0 e 11.0 PT-BR. Apresenta downloads para Windows XP, assim como indicações de como funciona em Win7. (visitado em 09/02/2016)

Projetos Nacionaishttp://www.laps.ufpa.br/falabrasil/referencias.php – projeto da UFPA para reconhecimento de voz com sotaque brasileiro. Visitado em 09/02/2016 – layout não mudou, mas tem informações sobre corpus. Recente visita, não mudou nada. Provavelmente está abandonado.

Projeto Portugal-Brasil http://www.voicetag.com.br. Link validado em 09/02/2016.

Novos Links sobre transcrição por voz

Transcrever por ditado com Dictanote (com vídeo explicativo). https://dictanote.co/ – permite programar sua própria transcrição por ditado. Você dita e programa outras funcionalidades em ferramentas.

Transcrever áudio com Speechnotes é o artigo que selecionamos para você. Speechnotes.co – permite pontuação para transcrição por ditado. Você dita e ele escreve e capitula. Houve instabilidade no decorrer do ano de 2015, mas do terceiro trimestre para cá parece que estabilizou. O ponto forte dele é que não precisa ficar reiniciando o microfone

Google Docs – acessando Ferramentas/digitação por voz você consegue ditar o seu texto e ele escreve. Também não é necessário ficar reiniciando o microfone. O porém é o seguinte: a gramática em inglês é diferente da língua portuguesa. Por exemplo, os dias da semana ou os meses se apresentam capitulados (com letra maiúscula). Nomes de filmes ou obras famosas acabam sendo capituladas também. Outro porém, algumas palavras acabam grudando.

Dragon Speech Recognition – A Nuance comprou o Via Voice da IBM e a derivou para Dragon Speech, que infelizmente não tem ainda disponível em português. Mas o home edition já existe para espanhol e francês. A página está em inglês, mas com o botão inverso do mouse pode pedir a tradução em português da página. Custa ente 79 e 199 dólares.

Converter áudio para texto com Google Docs

Uma das melhores coisas que aconteceu foi conhecer o Web Speech API de reconhecimento de voz da Google. Ele identifica muitas palavras e consegue misturar e contextualizar algumas palavras estrangeiras. Foi uma verdadeira surpresa.

Um detalhe fundamental e importantíssimo que passou a ser condição para o software funcionar: você precisa ter instalado o Chrome, senão ele não funciona.

Naturalmente a Google ganha a cada vez que utilizamos seu API, porque surpreendentemente, em alguns dias ele passa a reconhecer palavras novas que você dita.

É impressionante e achei que valeria como adendo a este artigo, pois quem procura deve estar exatamente procurando esta ferramenta.

Dicas de transcritor

A dica é “fale devagar e pausadamente” e “utilize um bom equipamento, como microfone USB”. É um pouco mais caro, mas o resultado vale a pena. Muitos transcritores me perguntam se disponibilizamos download de programa para transcrição de áudio. Temos algo bem melhor, que aprende com milhares de vozes transcritos todos os dias. É o poderoso API da Google. Acesse o link logo abaixo:

Acesse página: www.software.transcricoes.com.br

Acesse a página: www.transcricoes.com.br/transcricoes/

Dica de leitura: Transcrição Automática de Áudio

Converter áudio em texto e revisar duas vezes

O interessante é fazer sua transcrição por voz, e depois disso, fazer uma boa revisão, que garantirá um serviço bem feito e rápido. Iniciantes poderão transcrever como se fossem profissionais, desde que sejam dedicados e cuidadosos no ditado.

Ao fazer o seu ditado de forma descuidada, o tempo que você gastará na revisão acabará por invalidar o seu esforço em ditar.

Portanto, aprenda a reconhecer como a máquina identifica sua voz, e nesse sentido você poderá economizar seus dedos e contar com uma plataforma que já tem embutida nas acentuações a reforma ortográfica mais recente.

O ganho de produtividade com a transcrição por voz

Durante o mês de junho-julho pedimos ajuda aos transcritores independentes da Rede para que preenchessem uma tabela com os seguintes dados:

Descrição Hora de início Hora finalização Minutos (por hora de trabalho)
Transcrição 20:40 22:14 94 (9,5)
1ª Revisão 22:31 23:04 33 (27,2)
2ª Revisão 23:04 23:21 17 (52,9)
Total de minutos 124 (7,2)

Solicitamos que preenchessem esse quadro quem desejasse participar de uma pesquisa.

A amostra contou com 470 minutos transcritos e resultou na tabela abaixo, sendo dois transcritores iniciantes e quatro seniores (com mais de 300 horas transcritas). O nível de dificuldade do áudio variou de excelente para bom. Foram 28 jobs no total disponibilizados, 16,8 minutos cada em média (mediana 20).

Transcr./Modo Transcrição Revisão1- Revisão2- Média/hora
Iniciante 4,4 26,3 40,3 3,3
Por digitação 4,4 26,3 40,3 3,3
Sênior 19,4 24,7 62,9 8,0
Por ditado 28,4 21,1 67,8 9,7
Por digitação 10,4 28,0 57,5 6,2
Total Geral 16,7 25,0 57,8 7,1

Análise do desempenho da transcrição de áudio dos transcritores iniciantes

Os dados obtidos para essa amostra mostram que os iniciantes apresentam imensas dificuldades na hora de fazer sua transcrição. Produzem em média 3,3 minutos por hora de trabalho, o que torna o progresso do trabalho desanimador.

Análise do desempenho de transcrição de áudio dos transcritores seniores

Os seniores apresentaram uma produtividade de 6,2 minutos de áudio em texto transcritor por hora quando digitaram no teclado. Com a digitação por voz, essa produção subiu para 9,7 minutos.

Tipo de arquivos

Importante: as entrevistas selecionadas foram as acadêmicas, em que perguntas abertas sobre determinado assunto específico foram feitas. Houve fluidez dos falantes, na proporção de P1E1 (um pesquisador e um entrevistado) em ambiente fechado e com tom de voz tranquilo.

Conclusão da experiência

Os transcritores iniciantes produziram em média 3,3 minutos de transcrição de áudio por hora de trabalho. Os seniores alcançaram 6,2 minutos (+87,8%). As transcrições de áudio efetuadas por voz produziram 9,7 minutos de transcrição de áudio para texto por hora-transcritor, Superior aos 6,2 minutos dos seniores que digitaram em 56,4% e por sua vez com produtividade na degravação de áudio de 193,9%.

Transcritores, atenção

Você deseja ter esse ganho de produtividade pessoal? Consulte-nos sobre telefonando para (11) 9-4844-3344. Empresas de degravação também estão convidadas.

Para saber mais sobre transcrição por software

Dividimos as pessoas que participaram em Iniciantes (com menos de 100 horas que foram aprovadas na avaliação final do curso gratuito) e transcritores seniores que passaram a usar o Google Docs para digitar por voz. Para saber mais sobre como o Google Docs funciona. Ninguém melhor do que o Google para explicar.

Depois faça esse teste de funcionalidade da digitação por ditado. Acesse transcrever áudio em texto automaticamente.

Top