IA do Google derrota especialistas humanos em leitura labial


0

Você sabia que um novo sistema de inteligência artificial (IA) foi desenvolvido pelo gigante da tecnologia Google e pela Universidade de Oxford? Sim, em resumo, é conhecido como WLAS, é um sistema que pode interpretar facilmente após a leitura labial de um videoclipe não editado.

IA do Google derrota especialistas humanos em leitura labial

Os pesquisadores da divisão de inteligência artificial DeepMind do Google são os que desenvolvem pela Universidade de Oxford um sistema de leitura labial que ultrapassa a análise e interpretação que podem fazer os humanos.

Conseqüentemente, a divisão britânica do Google começou a usar centenas de horas de conteúdo de TV da rede BBC simplesmente para ensinar o software DeepMind a ler lábios.

A equipe treinou a inteligência artificial com mais de 5.000 horas de vídeo que incluiu 110.000 frases diferentes e 17.500 palavras diferentes. O objetivo era melhorar a compreensão da linguagem humana com ou sem som.

Os resultados deram uma precisão de 46,8 por cento, uma porcentagem que pode parecer baixa à primeira vista, mas supera os 12,4 por cento que poderiam atingir a especialização em leitura labial com o mesmo profissional individual.

O experimento foi baseado em uma investigação da Universidade de Oxford, um software chamado LipNet que conseguia ler lábios com grande precisão (90% de acerto de palavras), mas analisava apenas 57 palavras diferentes.

De acordo com os pesquisadores, seu sistema Watch, Listen, Attend and Spell (WLAS) excedeu o desempenho de transcrição de todos os trabalhos anteriores no campo por uma margem substancial. O sistema Even, Watch, Listen, Attend and Spell (WLAS) já analisou mais de 118 mil frases diferentes e 17.500 palavras únicas, e entre seus objetivos está o desenvolvimento de sistemas.

Portanto, este tipo de sistema pode ter uma variedade de aplicações que podem facilmente ajudar pessoas com deficiência auditiva simplesmente a ler palavras faladas. Além disso, esse sistema de leitura labial também pode ser usado para simplesmente permitir que os usuários se comuniquem com assistentes virtuais como Siri e Cortana visualmente.


Like it? Share with your friends!

0

0 Comments

Your email address will not be published. Required fields are marked *