Transcrever áudio ficou mais fácil com Google Docs
Publicado por Transcricoes em
Transcrever áudio ficou mais fácil com Google Docs
Converter áudio para texto grátis com Google Docs Transcrição por Ditado. Neste artigo vou falar sobre como converter áudio para texto grátis com Google Docs através de transcrição por ditado. Trata-se hoje da ferramenta que mais perto chega de uma transcrição de áudio automática e sem dúvida merece uma visita.
Acompanho a transcrição de áudio automática do Google desde 2013, quando tomei conhecimento desse recurso e no começo percebi que alguns erros ocorriam bastante, esses erros eram iguaizinhos ao que o já descontinuado IBM Via Voice fazia até que foi definitivamente descontinuado em 2012. E até hoje esse erro às vezes persiste: trata-se da pontuação “vírgula” que às vezes aparece reconhecida como “ver Goulart”.
Em casos de erros repetitivos assim, que ocorrem desde o ano de 2013 quando conheci o Google em Ferramentas / Digitação por Voz, acabam ocorrendo erros de transcrição.
Aviso muito, muito importante
O Google Docs é um editor de textos totalmente on-line e off-line, e você pode saber como instalar o Google Docs clicando aqui.
Ao instalado o Google Docs na sua máquina, pressione simultaneamente CTRL+SHIFT+S e você ativará o microfone. Se for a primeira vez que você foram utilizar o microfone, o Google solicitará acesso ao microfone de seu dispositivo.
Leve em conta que quando você conceder acesso ao seu microfone, o Google poderá ficar captando o áudio gerado em sua casa ou escritório. Existem algumas questões de segurança que podem surgir, mas você sendo usuário comum, nada a se preocupar se não estiver fazendo nada ilegal ou não recomendado em sua casa. Leia mais sobre a questão de sigilo no artigo que publiquei recentemente em nosso blog sobre o motivo dessa polêmica que ocorre com o escândalo de vazamento de transcrições supostamente não autorizadas no Google, o Facebook e a Apple que ocorreu em julho-agosto de 2019.
Veja então como ficou mais fácil transcrever com o Google Chrome desde que ele começou a aceitar pontuação. Leia o artigo em https://transcricoes.com.br/transcrever-audio-ficou-mais-facil-com-google-docs/
Comentários sobre erros cometidos em transcrição de áudio por ditado
Saiba que um texto contendo 10 mil palavras (o equivalente a uma transcrição de áudio de 1 hora de duração) vai conter cerca de 1.500 (mil e quinhentos) sinais de pontuação. Você as terá que ditar. Então, você terá que ditar cerca de 12 mil a 13 mil palavras para conseguir transcrever 1 hora de áudio e dessas cerca de 10% estarão erradas. Então você gastará um tempo para corrigir e somente uma revisão não será suficiente, você terá que revisar a sua transcrição pelo menos mais uma vez.
Então prepare seu espíritos para um trabalho árduo, que muitas vezes pode levar tanto tempo quanto transcrever por digitação manual, tenha certeza disso, já escrevi vários artigos referentes a isso.
Deixarei o resto de artigo conforme publiquei à época, mas achei que a atualização acima fosse importante, mostrando um resumo do que trata este artigo, mostrando diversos recursos. Todos eles vão funcionar somente no ambiente Chrome pois usam o motor de reconhecimento de fala do Google, que a cada dia está melhor.
Confira o artigo antigo completo abaixo.
Fim do resumo do artigo.
Transcrever áudio ficou ainda mais fácil com o Google Docs porque agora o Google Docs aceita pontuação em português, coisa que ele já fazia em inglês. A mudança agradou muito a nós, que vínhamos testando essa poderosa ferramenta que nos ajudou tanto e agora vai nos ajudar mais ainda, tornando-se o recurso principal quando nós trabalhamos com transcrição de áudio por ditado, que o Google chama de Digitação por Voz.
O Google Docs usado na transcrição de áudio
Para você usar o Google Docs basta pressionar as teclas CTRL+ALT+S pressionando-as simultaneamente. Ou pode-se pressionar as teclas nessa ordem, segurando-as. Isso ativa o microfone, que deve ser ativado em português do Brasil (PT-BR), já que se for a primeira vez que você estiver usando ele vai estar em inglês. Será necessário também configurar o mixer no Painel de Controle do Windows de forma a ele poder captar a sua voz ou ainda capturar o som dos alto falantes (caso deseje fazer uma transcrição de áudio automática de um vídeo do YouTube, por exemplo).
Creio que você encontrará muitas informações no YouTube de como fazer essas configurações, ou o próprio Google pode ajudá-lo nessa tarefa manual um pouco chata.
A pontuação na transcrição de áudio semiautomática do Google Docs
Logicamente a pontuação não aparece sozinha quando você usa o Google Docs para transcrever. Por isso chamamos de transcrição por ditado, que o Google Docs chama de Digitação por Voz. Tal recurso pode ser também encontrado no menu Ferramentas como uma de suas opções. Mas o mais prático é o CTRL+ALT+S para o manuseio do microfone.
Nesse ponto, você precisará de Express Scribe para controlar o seu player de áudio (tocador de áudio) através de atalhos F-1 a F-12 que devem ser configurados nesse programa conforme sua preferência. Assim, você poderá controlar o Express Scribe sem sair da tela do Google Docs. Aí, basta ir repetindo as palavras e ir declarando a pontuação, que pronto, seu texto aparecerá ditado e transcrito no documento, que é salvo em tempo real, portanto você não perderá o documento mesmo que a sua internet caia. Ele fica lá salvo, basta recuperar.
Documento Google Docs deve ficar salvo no browser definitivamente
Use sempre o mesmo documento do Google Docs para fazer suas transcrições de áudio. Copie o conteúdo transcrito e cole no Word. Depois faça a revisão no Word e faça os ajustes necessários de revisão ativando o recurso controlar revisão. Depois salve seu documento revisado, meça a quantidade de erros. Caso os erros superem 4%, realize a revisão novamente salvando como revisão 2 e aceitando todas as revisões realizadas para novamente marcar as revisões. Conte novamente os erros e repita a operação até você obter erros menores que 4%. Teoricamente atingir esse número de erros significa que você conseguiu uma transcrição de áudio com acertos superiores a 99%. A ideia é que a cada revisão que realizamos e medimos, teremos conseguido corrigir 70% dos erros. Isso já foi exaustivamaente comprovado em nossos trabalhos de transcrição de áudio.
A pontuação aceita na transcrição de áudio por ditado no Google Docs
Os comandos aceitos são “vírgula”, “ponto final”, “ponto de exclamação”, “ponto de interrogação”, “-“, “arroba”, “ponto e vírgula”, “dois pontos”, “…” e o comando “nova linha” passa para a linha seguinte. Às vezes a palavra “ponto” pode apresentar como resultado “.”, então pode ocorrer “. De interrogação” ou “. De exclamação” ou “. E vírgula”. Entretanto tem dado certo mais o “ponto final”.
Não conseguimos bom reconhecimento de “ponto e vírgula” e nem localizamos os comandos para ” – “, “abrir e)”, “abrir e fechar colchetes” entre outros.
Google Docs faz transcrição de áudio de fórmulas matemáticas
O Google Docs transcreve as operações matemáticas mais simples como soma, multiplicação, subtração e divisão. Basta experimentar falar “cinco mais um igual a seis” e aparece “5 + 1 = 6”. Entretanto, não identifiquei outras fórmulas matemáticas disponíveis ainda.
Usar o Google Docs para transcrição de áudio requer internet fibra
O Google Docs usado para transcrição de áudio requer internet fibra, ou seja, internet confiável e veloz. Testes indicaram que conexão de fibra ótica oferece maior índice de acertos e menor índice de travamento do aplicativo.
Avaliação Google Docs e Voice Note: qual é melhor?
Voice Note é uma extensão do seu Chrome e pode ser adquirido no Google Play. A partir do momento que o Google Docs começou a pontuar em português, não vejo vantagem em pagar por um aplicativo como extensão para fazer a mesma coisa que o Google Docs passou a fazer. Hoje entendo que como o Google Docs tem a Ferramenta Digitação por Voz já incorporada definitivamente, entendo que ela é totalmente compatível com o funcionamento do Google Docs e portanto não necessita de uma intermediação de uma extensão. É como tentar colocar acessórios em um automóvel: pode ficar mais bonito, mas pode atrapalhar o desempenho geral do carro. Por exemplo, colocar um kit GNV para economizar combustível geralmente afeta o desempenho do carro, ou colocar álcool em vez de gasolina diminui o número de quilômetros rodados. Portanto, hoje não colocaria a extensão Voice Note no Chrome. A minha opinião é essa.
Digitamos no máximo 50 palavras por minuto
Digitamos no máximo 50 palavras por minuto em uma transcrição de áudio. Isso foi medido e confirmado. Então, ao digitar por voz a transcrição de áudio sai na mesma velocidade da fala? Sim. Mas lembrem-se que temos que declarar as pontuações, então isso já exige que de vez em quando paremos a gravação para ditar as pontuações. Outra coisa importante é que pode ocorrer do Google entender incorretamente a palavra ou ainda sua programação linguística prever usar a palavra em.Isso acontecia muito com meses ou estações do ano, por exemplo, em que o Google Docs escrevia com letras maiúsculas, já que em inglês se escrevia dessa forma. Esse protocolo de escrita não funcionava em português, então eu era obrigado a consertar essas capitulações (letras maiúsculas no início da palavra) a cada vez que ocorria isso. Hoje esse erro em particular não ocorre mais, os linguistas do Google corrigiram essa diferença de regras, ou a inteligência artificial do Google aprendeu que em português se escreve dessa forma.
Palavras que derivam de nomes de filmes ou a palavra Era Glacial, “Era” muitas vezes é grafado em maiúscula, quando na verdade pode ser um verbo conjugado. Outros erros como nomes de filme, etc.. são capitulados. Mas não há de ser nada.
Outra questão do Google Docs é quanto à numeração. Às vezes ele usa algarismos arábicos, outras vezes escreve por extenso. Isso ocorre de forma diferente na mesma transcrição de áudio, portanto é um ponto de atenção a se corrigir na revisão.
Quando usar o Google Docs e a Digitação por Voz para transcrição de áudio?
A grande pergunta é: quando usar o Google Docs para transcrição de áudio? Bem, algumas condições são necessárias. Primeiro, que haja pouca interação entre o entrevistador e entrevistado. Há vezes em que o pesquisador interage muito com o entrevistado, obrigando a abertura de novas linhas e declaração de falantes. Portanto, não é toda a transcrição de áudio que é recomendada fazer com Google Docs. Creio que uns 40% dos projetos de transcrição de áudio derivados de entrevistas podem ser transcritas usando o método de transcrição de áudio por ditado. A maioria é mais fácil digitar ainda, fica mais veloz.
Resumindo quando usar o Google Docs para transcrever?
Usamos o Google Docs para transcrever quando temos uma internet estável (mínimo 8 MB de velocidade) e de preferência fibra ótica, que confere maior entendimento e menos travamentos. É necessário prestar bastante atenção quanto à interação dos falantes, se é em demasia, pode ser mais rápido digitar. Não recomendamos eu uso para grupos focais ou entrevistas envolvendo mais de dois falantes. Recomendamos que toda vez que você encontrar palavras em inglês, as digite em vez de ditar. Ajuda bastante.
Para o Google Docs reconhecer melhor a sua fala
Fale pausadamente e sem pressa, com um pequeno soquinho entre as palavras. Digite palavra a palavra. É enfadonho mas dessa forma o Google reconhece melhor o ditado. A dica é não ter pressa, a ideia não é ganhar velocidade, mas sim poupar dedos e prevenir a tendinite. Quanto maior velocidade você tentar imprimir em sua transcrição, maiores serão as quantidades de erros que você terá que revisar. Então cabe a você ir testando até encontrar o melhor jeito de ditar e observar como o Google Docs reage à sua dicção.
Equipamentos necessários
Um bom microfone de mesa pode ser muito importante. Headsets com microfone embutido tipo telefonista, que usam USB pode ser uma boa ideia, mas pode ser que o microfone capte o seu fone e a sua voz ao mesmo tempo, gerando ruído. Prefira microfone de mesa de boa qualidade, com boas marcas como LE SON, que não custa tão caro. Economizar na compra de um microfone pode fazer cair o rendimento e aumentar a quantidade de palavras reconhecidas errado.
Eu acho que essas são as dicas de hoje.
Links recomendados:
https://transcricoes.com.br/softwares-para-converter-audio-em-texto-gratis/
https://transcricoes.com.br/ – mais de 180 postagens sobre transcrição de áudio e degravação