Categories: blog

Fala humana já pode ser replicada por robôs; risco de fraudes preocupa

O dispositivo mais antigo para replicar a voz humana que se tem conhecimento foi criado em 1791 pelo austro-húngaro Wolfgang Von Kempelen, oficial da corte austríaca e inventor amador. A máquina falante de Kempelen, como ficou conhecida, usava um fole, tubos, pedaços de madeira, juntamente com uma caixa de ressonância para aplicar a emissão vocal a partir da circulação de ar, processo este bastante similar ao corpo humano.

O sistema, mesmo primitivo, era capaz de reproduzir fonemas e até palavras simples como “mama” e “papa”.

Precisa de um Laudo Pericial?

Análise de Gravação Telefônica, Autenticidade, Transcrição, Degravação, Identificação de Voz, Análise de Plágio Musical, entre outros.

Entre em contato conosco agora mesmo!
Nossa equipe especializada está sempre pronta a lhe auxiliar da melhor maneira possível!

Fone: (11) 4200-8302 – Whatsapp: (11) 91574-5822

Os registros contam que sua “fala” possuía um caráter feminino ou quase infantil e causava grande espanto e surpresa no público. Para maiores detalhes sobre máquina falante de Kempelen clique aqui.

Como podemos perceber, de lá pra cá, a tecnologia de reprodução da voz humana teve um imensurável avanço, sendo praticamente impossível para um leigo diferenciar o discurso de uma pessoa real de outro criado em computador.

Tudo isso deu origem a um mercado bilionário, e, diga-se também bastante perigoso. De acordo com o instituto de pesquisas Markets and Markets, tal setor movimentou 8,3 bilhões de dólares em 2021 e deverá alcançar 22 bilhões de dólares até 2026. Tais resultados já podem ser vistos em sistemas de atendimento virtual de bancos, assistentes virtuais como Alexa, Siri, Cortana entre outros.

Com auxilio de inteligência artificial é possível implantar chatbots (que respondem dúvidas através de texto) e voicebots (que respondem através de fala, imitando a voz humana). O risco ocorre na possibilidade de vozes reais serem “clonadas” para, por exemplo, fins políticos, ataques à reputação ou até mesmo buscando incriminar alguém.

Um exemplo claro da utilização deste recurso é um documentário americano chamado Roadrunner, sobre um cheff já falecido. O diretor pegou textos do chef e fez uso de inteligência artificial para convertê-los em narrações sem ele nunca ter “falado” aquele conteúdo. Mesmo a família dando a devida autorização, o diretor do documentário foi acusado de enganar o público, pois não especificou o que era original e o que era gerado digitalmente.

Para acender o sinal de alerta, o cineasta Jordan Peele, do aclamado filme Corra! elaborou um vídeo utilizando a tecnologia Deepfake, mesclando imagens reais do ex-presidente americano Barack Obama, com falas falsas, o qual envolveu mapeamento do áudio e dos vídeos para recriar o movimento da boca dando muito mais credibilidade ao conteúdo.

Com o mercado em alta, empresas como a Speech Morphing, com sede na Califórnia, oferecem serviços de criação de clones vocais. O cliente grava centenas de frases, algumas delas até mesmo sem sentido em uma conversa normal, mas útil para treinar a máquina. A partir dessas amostras, a inteligência artificial reconhece padrões e particularidades de cada frase, criando uma versão sintética capaz de dizer qualquer coisa, até mesmo com entonações diferenciadas.

Agora imagine o impacto desta tecnologia na área jurídica. A utilização desses recursos para gerar provas. A responsabilidade nas decisões dos magistrados. Por fim, isso seria tema para um novo e extenso artigo.

As novas tecnologias são capazes de realizar feitos únicos, porém, o que não é certo é usá-las maliciosamente. Cada vez mais será preciso manter os olhos e ouvidos bem atentos e análises cada vez mais profundas por parte dos peritos.

O notável desenvolvimento de vozes sintéticas deu origem, por sinal, a um mercado bilionário — e perigoso

comentários

admin

Next O que é protocolo Dante ? »

Previous « Diferença de transcrição e degravação de áudio.