Transcrição de áudio
99,6%+ de acurácia

Transcrição de áudio e degravação de audiências para ata notarial, ata literal de reuniões críticas, audiências e gravações de WhatsApp. Mais de 10 anos de experiência na área. Temos também transcrição automática por robô (opção mais barata).

WhatsApp (11) 93095-9547
contato@transcricoes.com.br

Contagem de palavras em transcrição de áudio

Publicado por Transcricoes em

transcrição de áudio

Contagem de palavras em transcrição de áudio – aula 1 do curso de transcrição

O grande objetivo da contagem de palavras de uma transcrição de áudio é medir a qualidade da transcrição. Após anos de trabalho duro, percebemos uma lóogica: a transcrição contém erros e a revisão também não elimina todos os erros.

A qualidade ideal só pode ser alcançada com 2 revisões.

Contagem de palavras em transcrição de áudio é uma postagem que

traz em detalhes informações de um conjunto de 11 arquivos de áudio MP3 que totalizaram
695 minutos e 3 décimos, ou 695 minutos e 18 segundos de tempo total, equivalente
a perto de 11 horas e meia de entrevistas.

Você, que deseja trabalhar com transcrição de áudio, talvez as
reflexões aqui valham a pena. Como estou com tempo sobrando hoje (é fim de semana,
sábado e estou de folga), resolvi compartilhar com você essa minha brincadeira no
nosso laboratório de transcrição.

Aproveito para reinaugurar o nosso curso de transcrição de áudio, já que não tive muito sucesso com o curso anterior. Vamos ver se esse dá mais certo, tá ok?

Contagem de minutos na transcrição de áudio é feita em formato decimal

Quando a gente vai contar o número de minutos de transcrição
de áudio, nós devemos sempre nos lembrar do seguinte: que 1 minuto e meio são 1
minuto e 30 segundos, o que equivale a 1,5 minuto. Isso é importante e muita gente
se esquece disso. Tem cliente que discute comigo porque fala que o arquivo dele
tem 1,3 minuto porque o áudio tem 1 minuto e 30 segundos. Isso rendeu até troca
de e-mails de cliente desconfiado da gente! Então, não confunda o número em decimais
com horas.

A fração de um minuto deve ser multiplicada por 60 segundos.
Assim, temos que:

1,5 minuto → 1 minto + 0,5*60 segundos → 1 minuto e 30 segundos

Sempre use a regra de 3 para calcular corretamente o número de
minutos e segundos na hora de expressar em decimais o tempo. Porque é com tempo
decimal que a gente vai cobrar do cliente, certo? E você vai receber um repasse
segundo esse cálculo também, se se tornar nosso transcritor.

O símbolo dois pontos – “:” – é que vai dizer que você tem um
arquivo de 1 hora e meia, por exemplo:

01:30:00 (1 hora e 30 minutos) → 1,50 hora (uma hora e meia)

00:01:30 (1 minuto e 30 segundos) → 1,5 minuto (um minuto e meio)

Contagem de
palavras por áudio transcrito

Bem, então, dito isto, vamos ao conjunto de 11 áudios a que me
referi, os áudios tiveram os seguintes tempos decimais e equivalente em formato
hh:mm:ss (hora, minuto e segundo).

Item Minutos hh:mm:ss
208401 81,4 01:21:24
208402 60,0 01:00:00
208403 58,2 00:58:12
208404 60,2 01:00:12
208405 77,5 01:17:30
208406 57,0 00:57:00
208407 84,6 01:24:36
208408 74,3 01:24:18
208409 34,0 00:34:00
208410 45,4 00:45:24
208411 62,5 01:02:30
Soma 695,3 11:35:18

Desse
conjunto de áudios, usei o contador de palavras do Word para levantar o número
de palavras de cada um dos áudios.

Como fazer
a contagem de palavras em uma transcrição
de áudio

A figura abaixo mostra onde você pode encontrar o contador de palavras do Word.
No canto inferior direito do aplicativo Word você vai encontrar o número de palavras
conforme a figura abaixo.

Figura 1: Número de palavras do arquivo Word

Contagem de palavras em transcrição de áudio

Contagem de palavras em transcrição de áudio

Número de
palavras por transcrição de áudio

Feita a contagem de palavras de cada transcrição no Word, então
levantei e organizei a informação obtida na tabela abaixo:

Item Minutos Palavras
01 81,4 9.946
02 60,0 8.696
03 58,2 9.011
04 60,2 9.984
05 77,5 11.791
06 57,0 6.652
07 84,6 12.364
08 74,3 11.349
09 34,0 4.840
10 45,4 5.666
11 62,5 9.693
Soma 695,3 99.992

Calculando o
número de palavras transcritas para cada
minuto de áudio

Se você dividir o número de palavras totais de 99.992 palavras
por 695,3 minutos, você vai encontrar 143,8 palavras por minuto de áudio, é o que
digitamos em média durante
a transcrição desse projeto com 695 minutos (11 horas, 35 minutos e 18 segundos
de áudio).

O número de
palavras por minuto em uma transcrição varia de projeto
a projeto de acordo com vários fatores.

Entrevistas em que o respondente tem que pensar bastante para
responder, o número de palavras é consideravelmente menor. Já se for alguém que
fala rápido, porque domina muito bem o assunto que está falando, como por exemplo,
mamães e papais orgulhosos que falam de seus bebês, o número de palavras faladas
por minuto tende a ser maior. Isso acontece pela empolgação e domínio do assunto.

O tempo de transcrição de áudio também pode variar de acordo
com a qualidade do áudio e os ruídos presentes nele, assim como a estabilidade do
sinal se for uma entrevista via internet, como Google Meetings, Skype ou ainda uma
live em FaceBook ou YouTube.

O número de falantes e a interação entre as pessoas presentes
também influencia bastante.

Há casos em que se produzem 180 palavras por minuto! Nesses casos
parece que a transcrição não rende, mas é porque você estará digitando bem mais
palavras do que uma “Entrevista normal” em que uma pessoa fala 150 palavras por
minuto.

Quantas palavras
você vai digitar por hora de entrevista?

Você veja como varia o número de palavras digitadas por hora
de áudio. Basta multiplicar por 60 o número de palavras faladas por minuto.

150 palavras por minuto → 9 mil palavras por hora de entrevista

180 palavras por minuto → 12 mil palavras por hora de entrevista

Quem fala
mais? Homens ou mulheres?

Eu fui e levantei em cada áudio se era o entrevistado homem ou
mulher. E descobri o seguinte:

Neste projeto, o número 2084, os homens falaram em média 137
palavras por minuto enquanto as mulheres falaram 154 palavras por minuto. A diferença
é de 154 – 137 = 17 palavras por minuto.

E em uma hora de entrevista 17 palavras multiplicado por 60 resultam
em 1.020 palavras ditas a mais por hora de entrevista por mulheres, nesse projeto!

Quanto o
homem e a mulher falam em velocidades
diferentes?

Deixei separado por pessoas do sexo masculino e feminino usando
as siglas H e F, onde F significa feminino, H significa masculino e HH significa
entrevista com 2 homens.

A tabela ficou assim.

Item Minutos HF Palavras Média
01 81,4 H 9.946 122,1
02 60,0 H 8.696 144,9
03 58,2 HH 9.011 154,8
04 60,2 H 9.984 165,8
05 77,5 F 11.791 152,1
06 57,0 H 6.652 116,7
07 84,6 H 12.364 146,2
08 74,3 F 11.349 152,7
09 34,0 H 4.840 142,3
10 45,4 H 5.666 124,7
11 62,5 F 9.693 155,0
Soma 695,3   99.992 143,8

Desse
modo, comecei a calcular por alto o número de palavras transcritas por minuto de
fala e estabeleci um preço tendo por base o número de palavras faladas por mulheres,
que são superiores ao número de palavras produzidas por homens em entrevistas.

Quanto cobrar
por transcrição de grupo focal?

E também entendi que dois homens em uma entrevista conjunta que
se interrompem muitas vezes falam tanto quanto uma mulher em entrevista. Isso foi
para esse projeto, certo? Mas parece valer em todos os demais projetos que fiz nesses
quase 9 anos de transcrição de áudio!

Desse modo, a partir de 4 pessoas no total, portanto chamando
de grupo focal, decidi cobrar 5% a mais por falante extra quando mais de 3 pessoas
estiverem respondendo em uma entrevista a um pesquisador.

Em situação normal, para uma entrevista com 3 pessoas, contando
o entrevistador, temos 4 falantes presentes. No preço final acrescento 5% na hora
transcrita por cada pessoa superior a 3 entrevistados falando durante a entrevista.

Pesquisador + entrevistado → 2 pessoas, sem acréscimo

Pesquisador + 2 entrevistados → 3 pessoas sem acréscimo

Pesquisador + 3 pessoas → 4 pessoas falando, 5% de acréscimo

Pesquisador + 4 pessoas → 5 pessoas falando, 10% de acréscimo.

Eu espero que você tenha gostado dessas informações, agora você
pode definir um valor para a sua transcrição de áudio de acordo com o número de
palavras que você provavelmente vai ter que digitar e revisar.

Aqui nós cobramos também de acordo com a dificuldade do áudio,
se ele tem barulho ou não, se tem muitas falhas na gravação quando é gravado via
Skype ou outro APP como Google Meetings, FaceBook (em lives com mais de duas pessoas)
ou YouTube (também em lives com mais de duas pessoas).

Até a próxima aula, amigos! Te vejo no próximo post.

Se você gostou, solicite a próxima aula por e-mail. Escreva para
contato@transcricoes.com.br


Transcricoes

Web aprendiz. Iniciou-se em 2012 na internet em busca de conhecimento. Desde então se encantou com transcrição de áudio.