Speech toText IBM Watson Transcrição Automática de Áudio
Publicado por Transcricoes em
Papo 126 – Speech toText IBM Watson Transcrição Automática de Áudio
O speech to text da IBM Watson é a ferramenta de transcrição automática de áudio da IBM que converte áudio em texto automaticamente por inteligência artificial.
Ele funciona com diversas línguas como inglês, espanhol e português do Brasil (Braziliam Portuguese).
Você pode ditar, subir um áudio (fazer upload de áudio) ou ainda fazer pequenos testes com dois áudios já pré-gravados no demonstrativo gratuito do programa, que pode ser encontrado no link IBM Watson Speech to Text clicando em
Você será levado a uma tela que está em inglês. Para começar a usar, selecione a linguagem “Brazilian Portuguese” em uma caixa de menu suspenso “Voice Mode”.
Depois clique no microfone e comece a falar. Pode ser que o Speech to Text IBM Watson solicite autorização para acessar seu microfone. Permita o acesso e então comece a falar e pronto, seu texto aparecerá.
→ Leia mais sobre converter áudio em texto com Dictanote e Speechnotess e Everynote
→ Não se esqueça de visitar nossa homepage
Observações sobre a transcrição
Ele não pontua automaticamente. Durante seu ditado, cada pausa é considerado como um final de frase, portanto a próxima palavra após a pausa será apresentada em. Nomes próprios aparecerão em e palavras podem não ser reconhecidas. Mas elas podem ser cadastradas no campo “Keywords to spot”.
Você pode também fazer upload de um áudio MP3 na opção “Upload Audio File”.
Speech to Text IBM Watson comoparativo com Google Docs Speech to Text
O Google Docs também tem uma ferramenta de Transcrição por Ditado. Você pode ativar o recurso acessando o Google Docs, pressionar simultaneamente as teclas CTRL+SHIFT+S. Caso o microfone não esteja ativado, ele solicitará permissão para acessá-lo.
O Google Docs transcrição por ditado coloca maiúsculas em boa parte dos nomes próprios e permite ditar a pontuação como “ponto final”, “vírgula”, “ponto de interrogação” e aceita o comando “nova linha”.
O Google Docs parece ter uma acuidade maior que o Speech to Text IBM Watson, mas pode ser que depois de bastante utilizado, o IBM passe a reconhecer melhor as palavras, já que você vai formando um vocabulário.
O Speech to Text IBM Watson tem conta gratuita para uso mensal de até 500 minutos para você ir aperfeiçoando seu banco de dados no cloud da IBM. O que exceder será cobrado e caso você assine um plano devem surgir mais vantagens. O que nós testamos foi a versão gratuita.
#speechtotext #IBM #transcriçãodeáudio #transcriçãoautomática #GoogleDocs