Transcrição humana versus transcrição automática
Transcrição humana versus transcrição automática. Quando usar e quando não usar?
Transcrição automática
Também conhecida por transcrição por máquina, transcrição por computador e outros nomes, uma gravação é submetida a um software de transcrição de áudio automática que processa os sons e devolve um texto transcrito. Ideal para telejornal, o som gravado é transformado em letras que podem ser editadas por editores de texto.
Transcrição por digitação
Simplesmente conhecido como transcrição de áudio, este formato exige a digitação de uma pessoa que ouve o áudio atentamente. Normalmente a acuidade de uma primeira transcrição simples não passa de 60-80 por cento de linhas certas. Revisando-se, eliminam-se 80 por cento dos erros, o que torna a transcrição mais precisa. Revisando-se novamente, eliminam-se outros 80 por cento dos erros.
Transcrição por voz e revisão humana
Trata-se da Técnica do Papagaio. Um transcritor com boa dicção ouve o conteúdo do áudio a ser transcrito, já ditando com pontuação, dizendo “vírgula”, “ponto final”, e outras sinalizações. É muito bom para quem machucou a mão, pois permite trabalhar com uma das mãos, apenas. Depois é necessário revisar pelo menos três vezes o material transcrito, pois os acertos não passam de 40 por cento das linhas, se o transcritor-locutor tiver boa dicção.
Comparando-se as diferentes formas de transcrição em tempo de produção (média empírica)
Para uma hora de áudio | Automática | Digitação | Ditado |
Velocidade transcrição | 60 minutos | 180-240 minutos | 90 minutos |
Revisão 1 | 240 minutos | 180 minutos | 240 minutos |
Revisão 2 | 120 minutos | 90 minutos | 120 minutos |
Revisão 3 | 90 minutos | Desnecessária | 90 minutos |
Índice de acertos em linhas | 97-98 por cento | 98-99.5 por cento | 97-98 por cento |
Tempo total | 570 minutos | 450-510 minutos | 540 minutos |
O que percebemos durante nossas medições é que praticamente há um empate técnico entre a produção de transcrição automática, transcrição por digitação e transcrição por voz.
O número de horas é aproximadamente o mesmo para as três modalidades.
E por que isso acontece?
Notamos uma qualidade sensivelmente superior na qualidade de uma transcrição por digitação. Isso porque o ser humano reconhece alguns termos estrangeiros que são resultados de pesquisa, experiência acumulada e conhecimento de gramática. A modalidade automática não pontua, enquanto a por ditado apresenta erros no reconhecimento dos sinais ditados (algumas vezes o algoritmo apresenta falhas) então nessas duas formas é necessário ficar corrigindo essas falhas. Já a transcrição de áudio por digitação, com um profissional com bons conhecimentos de gramática e familiaridade com o assunto tratado, pode apresentar melhor resultado.
Assim, elencamos as seguintes desvantagens em cada tipo de transcrição.
Transcrição automática
Falta total de pontuação. É necessário na revisão acertar os sinais gramaticais, ajustar as capitulações, etc. (a questão da capitulação pode ser solucionada com macros). Não reconhece sobreposição de vozes e muitas vezes termos estrangeiros, assim como outros fenômenos de ocorrência de fala. Precisa receber uma gravação cristalina (chamamos de dicção Jornal Nacional / William Bonner).
Transcrição por digitação
Exige atenção do transcritor, mas apresenta maior acuidade quando detectamos os erros na revisão final.
Transcrição por ditado
Desde que seja um texto fácil, a pontuação pode ser ditada (existem softwares que reconhecem as pontuações ditadas baseado no motor Google de reconhecimento de fala – Google Speech API).
Transcrição humana versus transcrição automática
Há um empate técnico na questão se devemos usar qual tecnologia. É difícil responder, pois a fase de digitação também pode ser acelerada com a adoção de softwares de atalho e outros mecanismos como Autocorreção do Word, onde cadastramos diversos atalhos para facilitar a digitação, pois com análise linguística é possível perceber no ‘corpus’ da língua portuguesa algumas repetições importantes de palavras na comunicação oral, como por exemplo, o uso da expressão “por que é que você não”, que pode receber um atalho “pqqvn” e deixar reservado, construindo uma linguagem própria que somente você pode estabelecer melhor.
Com essa prática saudável, creio que em pouco tempo você poderá diminuir consideravelmente a fase da transcrição na forma de digitação, conseguindo uma melhor performance.
Assim, pelo menos por enquanto, anterior o empate técnico das três modalidades, temos investido mais tempo e energia no cadastro de atalhos, o que vem acelerando nossa produção diariamente. É penoso no início, requer tempo. Mas para quem quer digitar menos é uma ferramenta muito importante. Transcrição humana versus transcrição automática, cada um vale pelo uso que se dá, se adequadamente aplicado, você sai ganhando como transcritor.