Transcrição de áudio
99,6%+ de acurácia

Transcrição de áudio e degravação de audiências para ata notarial, ata literal de reuniões críticas, audiências e gravações de WhatsApp. Mais de 10 anos de experiência na área. Temos também transcrição automática por robô (opção mais barata).

WhatsApp (11) 93095-9547
contato@transcricoes.com.br

Transcrição áudio em texto no tribunal do RS

Publicado por Transcricoes em

transcrição de áudio

Já faz muito tempo que transcrevo, faço transcrição de áudio desde 2012. E desde aquele ano a transcrição automática de áudio sempre me fascinou. Escrevi esta postagem também faz muito tempo. Apaguei tudo pois não valia a pena remendar. Escrevo de novo, pois em se tratando dessa atividade, muita coisa mudou.

Transcrição automática em 2012

Olhando para trás, 2012 ainda era o Windows XP que estava instalado no meu PC. Nem usava notebook, na época era caro demais.

Nessa época ainda conseguia trabalhar com o IBM Via Voice, da IBM. Tratava-se de um app (naquela época não falava app, falava software) em que era necessário ensinar o computador lendo alguns textos, para que ele aprendesse como proferimos as palavras.

Era muito legal, a gente ia ditando e falava vírgula, ponto final, travessão, ponto de interrogação… reticências! E ele ia anotando, surgindo na tela o texto ditado automaticamente.

Não era possível tocar um áudio e a máquina ir anotando o que falávamos, isso ainda estava longe de acontecer.

Portanto, a transcrição automática de áudio não era possível de ser realilzada.

Google Docs tem uma ferramenta de digitação por voz

Transcrição automática Google Docs

O ano era 2014: uma transcritora que vim a conhecer me falou dessa dica incrível, que o Google Docs fazia transcrição por ditado.

Estava acostumado com o Via Voice, então não me impressionei.

O que foi impressionante é que o Google Docs Digitação por Voz não porecisava de treinamento. Ou seja, bastava ir falando que o Google Docs anotava.

Em não precisando de treino – pensei comigo – talvez se eu tocasse um áudio, ele transcreveria.

E de fato, a transcrição aconteceu. Mas o índice de erros era grande e não valia a pena, eu tinha que revisar, consertar os erros, colocar a pontuação e por letras maiúsculas em vez de minúsculas após os pontos finais.

Demorava mais tempo corrigindo o que o app fazia, do que se eu transcrevesse do zero, digitalmente.

Mas quando estava cansado, pegava o microfone e ia ditando. E falava “vírgula”, “ponto final”, “nova linha”, “ponto de exclamação”, etc. 

Era irritante quando ditava vírgula e aparecia coisas estranhas como ver Goulart, virgula (sem acento) ou vircula. Então parei de ditar o sinal e passei a digitar. 

O Google Docs depende de um sinal de internet muito estável e veloz, minha banda aqui na periferia de São Paulo era no mínimo precária, estava sempre dando problema. E às vezes era difícil receber áudios dos clientes pelo Wetransfer, que é um meio de transmissão de áudios e vídeos gratuito e bem fácil de manusear.

Então a experiência de tentar fazer a transcrição automaticamente não deu certo.

Mesmo porque as pontuações são responsáveis por perto de 15% do texto. Isso quer dizer que se você tem 1000 palavras transcritas, terá 150 sinais de pontuação. Guarde esse número: 150 pontuações em 1000 palavras.

Dificuldades com a transcrição automática

Falhas recorrentes na transcrição automática

As principais dificuldades quando tentafa transcrever automaticamente era a falta de pontuação, palavras erradas transcritas, a falta de identificação dos falantes e a instabilidade de sinal na internet.

Era frustrante toda hora ver que o microfone do Google Docs parava de funcionar. 

Ditando a pontuação

Falei para você que o Google Docs não fazia pontuação,né? E isso é verdade. Ele escrevia a palavra vírgula. Eu bolei um conjunto de instruções de macro no Word que trocava através da repetição de comandos em Visual Basic, a palavra “vírgula” ou “virgula” ou “ver Goulart” pelo sinal “,”. E isso acontecia com pontos finais, de exclamação, interrogação e outros sinais gráficos.

Um erro particularmente irritante era que o Google tentava “adivinhar”. Por exemplo, a palavra “barreiras”: ele aparecia “Barreiras” com letra maiúscula, pois havia algo na programação do Google, que ele entendia que era a cidade de Barreiras, na  Bahia.

Até então o número de correções aumentava: Primavera, Verão, Outono, Maio, Dezembro, Segunda-Feira, Terça, Sáado, tudo o Google escrevia com a letra maiúscula porque em inglês esses termos eram grafados com letra maiúscula.

Foi então que aconteceu em 2019 o grande passo do Google Docs.

A transcrição automática do Google faz pontuação em português

Passaram-se anos, e a cada seis meses eu ia testando o Google Docs para verificar se a transcrição havia melhorado. E para minha alegria, a cada vez que fazia meus ditados, o nível de reconhecimento de palavras era melhor.

Em 2019, em dezembro, eu me lembro da alegria com que percebi que o Google aceitava transcrever com pontuação ditada em português.

Isso fazia com que após um “ponto final” aparecesse a letra maiúscula! Maravilhoso.

Mas mesmo em 2019 ainda tinha problemas de instabilidade no sinal de internet daqui de onde eu trabalho, meu bairro é muito mal servido pela Vivo.

Transcrição e Pandemia

Se o ano de 2019 trouxe a pontuação em português no Google Docs, no mundo o ano de 2019 trouxe a Pandemia do Covid-19.

Durante o ano de 2020 vi o uso de Google Meets e Zoom aumentar. As entrevistas começaram a chegar como links de encontros realizados entre duas ou mais pessoas.

Atravessar 2020 foi difícil, mas percebi que em meados do segundo semestre para frente, o pessoal havia se voltado às teleconferências pelo Zoom e Google Meets, além da StreamYard.

Vi YouTube bombando e o crescimento do uso dos canais dessa magnífica ferramenta de rede social.

E vi um tremendo esforço de empresas gigantes como Amazon, Google, Microsoft e outros monstros da tecnologia oferecendo transcrição de áudio automática.

Então, vou comentar brevemente sobre cada uma e dizer qual e o melhor software entre esses três, a que mais gosto de usar.

Transcrição automática do Word

O Word, na versão 365, portanto online, oferece a transcrição automática no menu da Página Inicial. Basta procurar o ícone de um microfone, de cor azulada, no menu à direita, selecionando a Página Inicial. jAli você encontrará  somente na versão online e portanto que paga anuidade, o recurso: Transcrever ou Ditar texto.

Basta escolher a lingua desejada e sair ditando sem dó.

No recurso Transcrever, basta subir um áudio. O Word aceita transcrever alguns formatos como o mp3, wma, m4a, entre outros que testei. Mas não consegui subir o formato ogg, do WhatsApp, por exemplo.

Exizste a opção de identificar os falantes, deixar marcação de tempo, etc. Basta dar uma fuçada no recurso Transcrever.

O recurso Transcrever do Word é limitado, você tem uma cota mensal se é assinante do Office 365. Após o que, esgotada as cotas do mês, elas são renovadas no dia 1 de cada mês.

Como tenho certa dificuldade com a internet – obrigado, Vivo! – então não uso tanto. Mas penso que se fosse internet por fibra, que ainda não chegou por aqui, acho que teria resultados melhores.

Transcrição automática do Zoom

O Zoom é uma plataforma para fazer reuniões e lives para grupos fechados ou mais tarde abertos. 

Ele faz gravação e também já permite baixar as transcrições da reunião.

Não testei ainda, mas talvez você goste de saber que isso existe. 

O Zoom é oferecido gratuitamente para um limite de tempo de 40 minutos de sessão. 

Não sei se a versão gratuita também transcreve audios automaticamente.

Transcrição de gravações

O Google Docs e o Word fazem transcrição de áudio se você tocar o seu áudio no seu notebook.

O Word é impressionante! Eu não preciso esperar para tocar o áudio, basta subir o arquivo compatível (mp3, m4a, wma) e aguardar a barrinha de progresso chegar até o fim.

Ele tem a opção de mostrar falantes e tempos, assim como suprimir palavrõesW Muito fofo.


Transcricoes

Web aprendiz. Iniciou-se em 2012 na internet em busca de conhecimento. Desde então se encantou com transcrição de áudio.