Transcrição áudio em texto no tribunal do RS
Publicado por Transcricoes em
Já faz muito tempo que transcrevo, faço transcrição de áudio desde 2012. E desde aquele ano a transcrição automática de áudio sempre me fascinou. Escrevi esta postagem também faz muito tempo. Apaguei tudo pois não valia a pena remendar. Escrevo de novo, pois em se tratando dessa atividade, muita coisa mudou.
Transcrição automática em 2012
Olhando para trás, 2012 ainda era o Windows XP que estava instalado no meu PC. Nem usava notebook, na época era caro demais.
Nessa época ainda conseguia trabalhar com o IBM Via Voice, da IBM. Tratava-se de um app (naquela época não falava app, falava software) em que era necessário ensinar o computador lendo alguns textos, para que ele aprendesse como proferimos as palavras.
Era muito legal, a gente ia ditando e falava vírgula, ponto final, travessão, ponto de interrogação… reticências! E ele ia anotando, surgindo na tela o texto ditado automaticamente.
Não era possível tocar um áudio e a máquina ir anotando o que falávamos, isso ainda estava longe de acontecer.
Portanto, a transcrição automática de áudio não era possível de ser realilzada.
Google Docs tem uma ferramenta de digitação por voz
O ano era 2014: uma transcritora que vim a conhecer me falou dessa dica incrível, que o Google Docs fazia transcrição por ditado.
Estava acostumado com o Via Voice, então não me impressionei.
O que foi impressionante é que o Google Docs Digitação por Voz não porecisava de treinamento. Ou seja, bastava ir falando que o Google Docs anotava.
Em não precisando de treino – pensei comigo – talvez se eu tocasse um áudio, ele transcreveria.
E de fato, a transcrição aconteceu. Mas o índice de erros era grande e não valia a pena, eu tinha que revisar, consertar os erros, colocar a pontuação e por letras maiúsculas em vez de minúsculas após os pontos finais.
Demorava mais tempo corrigindo o que o app fazia, do que se eu transcrevesse do zero, digitalmente.
Mas quando estava cansado, pegava o microfone e ia ditando. E falava “vírgula”, “ponto final”, “nova linha”, “ponto de exclamação”, etc.
Era irritante quando ditava vírgula e aparecia coisas estranhas como ver Goulart, virgula (sem acento) ou vircula. Então parei de ditar o sinal e passei a digitar.
O Google Docs depende de um sinal de internet muito estável e veloz, minha banda aqui na periferia de São Paulo era no mínimo precária, estava sempre dando problema. E às vezes era difícil receber áudios dos clientes pelo Wetransfer, que é um meio de transmissão de áudios e vídeos gratuito e bem fácil de manusear.
Então a experiência de tentar fazer a transcrição automaticamente não deu certo.
Mesmo porque as pontuações são responsáveis por perto de 15% do texto. Isso quer dizer que se você tem 1000 palavras transcritas, terá 150 sinais de pontuação. Guarde esse número: 150 pontuações em 1000 palavras.
Dificuldades com a transcrição automática
As principais dificuldades quando tentafa transcrever automaticamente era a falta de pontuação, palavras erradas transcritas, a falta de identificação dos falantes e a instabilidade de sinal na internet.
Era frustrante toda hora ver que o microfone do Google Docs parava de funcionar.
Ditando a pontuação
Falei para você que o Google Docs não fazia pontuação,né? E isso é verdade. Ele escrevia a palavra vírgula. Eu bolei um conjunto de instruções de macro no Word que trocava através da repetição de comandos em Visual Basic, a palavra “vírgula” ou “virgula” ou “ver Goulart” pelo sinal “,”. E isso acontecia com pontos finais, de exclamação, interrogação e outros sinais gráficos.
Um erro particularmente irritante era que o Google tentava “adivinhar”. Por exemplo, a palavra “barreiras”: ele aparecia “Barreiras” com letra maiúscula, pois havia algo na programação do Google, que ele entendia que era a cidade de Barreiras, na Bahia.
Até então o número de correções aumentava: Primavera, Verão, Outono, Maio, Dezembro, Segunda-Feira, Terça, Sáado, tudo o Google escrevia com a letra maiúscula porque em inglês esses termos eram grafados com letra maiúscula.
Foi então que aconteceu em 2019 o grande passo do Google Docs.
A transcrição automática do Google faz pontuação em português
Passaram-se anos, e a cada seis meses eu ia testando o Google Docs para verificar se a transcrição havia melhorado. E para minha alegria, a cada vez que fazia meus ditados, o nível de reconhecimento de palavras era melhor.
Em 2019, em dezembro, eu me lembro da alegria com que percebi que o Google aceitava transcrever com pontuação ditada em português.
Isso fazia com que após um “ponto final” aparecesse a letra maiúscula! Maravilhoso.
Mas mesmo em 2019 ainda tinha problemas de instabilidade no sinal de internet daqui de onde eu trabalho, meu bairro é muito mal servido pela Vivo.
Transcrição e Pandemia
Se o ano de 2019 trouxe a pontuação em português no Google Docs, no mundo o ano de 2019 trouxe a Pandemia do Covid-19.
Durante o ano de 2020 vi o uso de Google Meets e Zoom aumentar. As entrevistas começaram a chegar como links de encontros realizados entre duas ou mais pessoas.
Atravessar 2020 foi difícil, mas percebi que em meados do segundo semestre para frente, o pessoal havia se voltado às teleconferências pelo Zoom e Google Meets, além da StreamYard.
Vi YouTube bombando e o crescimento do uso dos canais dessa magnífica ferramenta de rede social.
E vi um tremendo esforço de empresas gigantes como Amazon, Google, Microsoft e outros monstros da tecnologia oferecendo transcrição de áudio automática.
Então, vou comentar brevemente sobre cada uma e dizer qual e o melhor software entre esses três, a que mais gosto de usar.
Transcrição automática do Word
O Word, na versão 365, portanto online, oferece a transcrição automática no menu da Página Inicial. Basta procurar o ícone de um microfone, de cor azulada, no menu à direita, selecionando a Página Inicial. jAli você encontrará somente na versão online e portanto que paga anuidade, o recurso: Transcrever ou Ditar texto.
Basta escolher a lingua desejada e sair ditando sem dó.
No recurso Transcrever, basta subir um áudio. O Word aceita transcrever alguns formatos como o mp3, wma, m4a, entre outros que testei. Mas não consegui subir o formato ogg, do WhatsApp, por exemplo.
Exizste a opção de identificar os falantes, deixar marcação de tempo, etc. Basta dar uma fuçada no recurso Transcrever.
O recurso Transcrever do Word é limitado, você tem uma cota mensal se é assinante do Office 365. Após o que, esgotada as cotas do mês, elas são renovadas no dia 1 de cada mês.
Como tenho certa dificuldade com a internet – obrigado, Vivo! – então não uso tanto. Mas penso que se fosse internet por fibra, que ainda não chegou por aqui, acho que teria resultados melhores.
Transcrição automática do Zoom
O Zoom é uma plataforma para fazer reuniões e lives para grupos fechados ou mais tarde abertos.
Ele faz gravação e também já permite baixar as transcrições da reunião.
Não testei ainda, mas talvez você goste de saber que isso existe.
O Zoom é oferecido gratuitamente para um limite de tempo de 40 minutos de sessão.
Não sei se a versão gratuita também transcreve audios automaticamente.
Transcrição de gravações
O Google Docs e o Word fazem transcrição de áudio se você tocar o seu áudio no seu notebook.
O Word é impressionante! Eu não preciso esperar para tocar o áudio, basta subir o arquivo compatível (mp3, m4a, wma) e aguardar a barrinha de progresso chegar até o fim.
Ele tem a opção de mostrar falantes e tempos, assim como suprimir palavrõesW Muito fofo.