Transcrição de áudio e vídeo e seus tipos e formatos
Publicado por Transcricoes em
Uma transcrição de áudio e vídeo, também conhecido como degravação, tem por finalidade a produção de um texto editável sobre o que foi falado em determinado registro visual ou sonoro. É complicadíssimo localizar a fala de um determinado personagem dentro de um filme, por exemplo, ou citar uma frase sem uma transcrição.
E não para por aí. Sem informação de em que exato momento ocorreu aquela fala, fica pior ainda a localização. Como a transcrição hoje, armazenada em arquivos de texto, permite a procura por palavras-chaves justamente porque estar compatível com mecanismos de busca dos computadores (o Google é o maior exemplo disso), permite a busca rápida.
Transcrição de áudio e vídeo: apresentação básica sobre seus tipos e formatos de apresentação.
Transcrição de áudio e vídeo tem diferenças. A de áudio é diferente da de vídeo. Quando comecei a atividade de transcrição de áudio há pouco mais de três anos atrás, fui catalogando e acumulando conhecimento sobre as diversas maneiras de transcrever áudio , como também os tipos e formatos de transcrição e degravação de áudio.
Sim, os termos mais comuns usados são transcrição, decupagem e degravação de áudio.
Tipos: basicamente o que a maior parte dos transcritores , trabalhem eles online ou offline, conhecem dois tipos:
O chamado Ipsis Litteris e o Padrão. Basicamente, o Ipsis Litteris é transcrito com erros não corrigidos e vícios de fala como “né”, “tá”, “uhum”, etc. assim como “pro”, “pra” e “tá bom”. Mesmo assim, tem-se evitado “cê” e “ocê”.
Observando a legendagem das degravações (ou transcrições) da Globo e outras emissoras de TV, vemos que “cê” faz suas aparições, acompanhado de aspas. Em nossos trabalhos, onde não há interesse linguístico em 99,9 por cento dos casos, preferimos reservar as aspas para representação de falas ou pensamentos ou diálogos referenciando falas de outras pessoas.
A outra forma, a padrão, já elimina “né”, “tá”, assim como corta repetições e corrige erros mais comprometedores de Língua Portuguesa. Neste segundo caso , cê e ocê não são admitidos.
Mas existe o terceiro tipo, o científico. Este está baseado nos padrões brasileiro, português e na metodologia do professor Luis Antônio Marcuschi, que publicou um livro em 1986 que se tornaria um clássico no gênero, admitindo sinalizações especiais e toda uma lógica própria na representação
Finalmente, a transcrição que sofre revisão gramatical produz um texto formal pronto para publicação em revistas, jornais etc.
Formatos de transcrição:
Quantas forem existirão formatos de transcrição. Desde uma entrevista individual até mesmo grupos focais. O que são grupos focais? São entrevistadas várias pessoas de uma vez, de modo a tentar encontrar a opinião dominante, um senso comum sobre determinado assunto pesquisado. Os grupos focais são realizados predominantemente por empresas de pesquisa de mercado ou ainda de pesquisa de opinião pública. Já as entrevistas são mais comuns no meio acadêmico.
Normalmente em transcrição de grupos focais, que envolvem muitas pessoas, não se identificam os falantes, apenas se destacam as falas do moderador, sem identificar os respondentes. Às vezes pode se necessitar de identificar os falantes em M: e F: , vozes masculinas e femininas , respectivamente.
O formato é mais ou menos o seguinte:
O moderador faz alguma pergunta sobre determinado produto ou assunto ou ainda características de um produto, opinião ou locais, enfim , o que for pertinente à pesquisa.
- Os respondentes podem responder ‘A’;
- Ou podem responder ‘B’ .
- Ou podem responder ‘C’ .
- Ou ainda algo irrelevante.
As transcrições de audiências normalmente requerem a identificação de cada um dos falantes. Os depoentes podem ser réus ou testemunhas. Todos devem ser identificados, e normalmente as pessoas são fáceis de serem reconhecidas pois uma pessoa apenas é chamada a depor de cada vez.
Juiz: faz uma pergunta.
Depoente: responde alguma coisa.
Advogado de defesa: pede ao juiz para perguntar alguma coisa ao depoente, ou dele deseja saber algo.
Juiz: faz a pergunta diretamente ao depoente.
Depoente: responde .
Advogado de acusação ou Promotor: pode falar alguma coisa.
Finalmente, temos uma entrevista que apresenta a seguinte estrutura básica.
P: o pesquisador faz alguma colocação ou esclarecimento e faz a pergunta ao respondente.
R: responde.
F: eventualmente pode haver vozes femininas identificáveis ou não .
M: ou vozes masculinas, que fazem alguma intervenção, complementando.
M1 ou F1… : podem entrar vozes femininas ou masculinas diferentes sobre algum assunto. Se for pertinente deve-se deixar. Caso contrário podem ser suprimidas.
Estrutura detalhada da transcrição de áudio
Estrutura de apresentação de uma transcrição de áudio com identificação de turnos utilizado para transcrição com análise mais detalhada, utilizada em Análise de Conversação. Também podemos chamar de degravação de áudio.
Turno | Falante | Fala |
001 | Fulano | Cada frase é uma frase. |
002 | Sicrano | Uma fala pode responder à anterior. |
003 | Beltrana | Ou pode complementar um turno. |
Abaixo, variante com acréscimo de marcação de tempo (time stamp) em cada fala, útil para legendagem quando marcada com décimos de segundo.
Turno | Tempo | Falante | Fala |
001 | 00:00:00 | Fulano | Uma pergunta relativamente longa. |
002 | 00:00:06 | Sicrano | Uma resposta curta, por exemplo. |
003 | 00:00:07 | Fulano | Complemento ou pergunta nova. |
Transcrição de vídeo em texto
Curiosa é a transcrição de um vídeo. Normalmente, ao se transcrever um vídeo pode ser necessário descrever na degravação a comunicação verbal e a comunicação corporal. É mais trabalhosa. Não raras vezes a fala do turno é expressa em corpo normal e a descrição em itálico, mas também pode ser que isso não seja exigido.
Turno | Falante | Falante | Descrição da imagem |
001 | Fulano | Uma pergunta relativamente longa. | Está de pé e se debruça ameaçador sobre a mesa. |
002 | Sicrano | Uma resposta curta, por exemplo. | Abaixa a cabeça e fala baixo. |
003 | Beltrano | Complemento ou pergunta nova. | Vira de costas e olhando para a janela, com cigarro na mão, pergunta irritado. |
Pode ser que a transcrição do vídeo também exija marcação de tempo. A marcação de tempo normalmente se apresenta como 00:00:00 representando horas, minutos e segundos.
A legendagem já necessita dos décimos de segundo. 00:00:00,00. Na verdade não se trata de décimos de segundos, mas sim de número de frames por segundo (30 tem sido o padrão mais usual).
Finalmente, existem também marcações 000:00 representando centenas minutos e segundos.
Enfim , procuramos dar um leve apanhado dos tipos e dos formatos de diversas situações. Esperamos ter sido úteis.
Existem outras definições de transcrição de áudio. Saiba mais sobre o que é transcrição de áudio.
Degravação é a mesma coisa que transcrição? O que quer dizer degravação?
Podemos tratar essas duas palavras como sinônimos. Temos percebido regionalismos, pois recebemos pedidos de degravação de todo o País. O que temos notado é que os Estados mais ao Sul tendem mais o termo degravação. Músicos usam decupagem quando se referem à alguma transcrição. Parece depender da faixa etária também, pois os mais jovens têm usado a palavra “transcrição”, enquanto ao atender clientes mais maduros eles usam “degravação”.
Enfim, parece ser crescente usar o termo transcrição de áudio e vídeo em vez de degravação de áudio e vídeo, mas ambos dão o mesmo trabalho medonho de fazer quando o áudio é ruim.