Talvez Alexa e o Google Assistente não devam ficar melhores em entendê-lo


0
Um telefone Android com Google Assistente na tela.
Lukmanazis / Shutterstock.com

Assistentes de voz como Google Assistant e Alexa fazem parte da vida cotidiana. Eles estão em telefones, laptops, paredes e controlam casas inteligentes. Mas eles podem ser difíceis de usar, especialmente para qualquer pessoa que fale inglês “fora do padrão”. Compies estão tentando consertar esse problema, mas e se isso for uma coisa ruim?

Ao tornar os assistentes de voz em casas inteligentes e smartphones mais fáceis de usar, as empresas podem, na verdade, estar diminuindo a capacidade de seus usuários funcionarem no mundo todo. Existem cerca de 1,35 bilhão de falantes de inglês no mundo, dos quais 400 milhões são “falantes nativos”.

Portanto, é seguro presumir que aproximadamente 2/3 dos falantes de inglês têm algum grau de sotaque simplesmente porque não é sua primeira língua. Então, com os 400 milhões de pessoas que falam inglês como primeira língua, você tem vários sotaques nacionais (britânico, canadense, americano, australiano etc.). Em cada país, você tem dialetos regionais e assim por diante.

Se as empresas escolhessem e aperfeiçoassem um único dialeto, digamos o inglês padrão americano, seu produto só seria utilizável por uma pequena fração dos falantes de inglês. Por outro lado, se forem longe demais, podem roubar das pessoas o que poderia ser uma ferramenta muito útil para desenvolver suas habilidades de comunicação.

Como as empresas de tecnologia estão tentando melhorar as coisas?

Uma mulher falando com um ponto Amazon Echo enquanto franzia a testa.
Tyler Nottley / Shutterstock.com

Os assistentes de voz têm trabalhado para entender melhor os comandos de seus usuários desde que existem. Microsoft, Apple, Google e Amazon estão entre os grandes nomes que injetaram uma tonelada de recursos em seus respectivos assistentes de voz e desejam torná-los o mais acessíveis e livres de frustrações para o maior número possível de pessoas.

Isso envolveu a contratação de pessoas com sotaques específicos para gravar centenas de comandos de voz e conversas, que podem então ser usados ​​para ensinar dialetos de IA. Durante um dos meus meses mais magros, decidi lucrar com meu sotaque sexy do Norte e passei horas gravando centenas de palavras e frases aparentemente aleatórias para uma empresa chamada Appen.

Essa empresa então pegou minhas gravações e as enviou para a Amazon, Google, Microsoft ou qualquer outra pessoa que as estivesse pagando. Os fragmentos de voz são então teoricamente usados ​​para melhorar qualquer IA que a empresa que os comprou esteja desenvolvendo.

Alguns assistentes de voz podem até ser treinados para entender melhor a voz exata da pessoa que o está usando. Ao contrário de esperar por uma grande tecnologia para melhorar seu jogo, isso produz resultados imediatos e pode ajudar significativamente a precisão do seu assistente de voz. Ele também permite que vários usuários acessem seus perfis de casa inteligente sem ter que alternar manualmente.

Então, por que isso pode ser uma coisa ruim?

Um Amazon Echo em uma mesa de centro da sala de estar.
Juan Ci / Shutterstock.com

Eu poderia me safar dizendo: “Alexer, serruz um alarme para as oito da manhã amanhã”, mas tentar pedir músicas é onde a luta realmente começa. Demorou cerca de três meses para me comunicar com a Amazon Music e alguns milhares de palavrões frustrados, mas agora posso dizer “toque Happy Hour dos Housemartins” tão claramente quanto um leitor de notícias da BBC dos anos 1980. Ainda há ocasiões em que peço por Paul Weller e de alguma forma acabo com Ella Fitzgerald, mas sempre há espaço para melhorar.

O forro de prata que veio com as lutas de sotaque é o fato de que meu inglês melhorou. Agora posso me comunicar com mais clareza do que nunca. Isso é útil porque a tecnologia pode melhorar a ponto de a IA do meu smartphone me entender – mas isso não vai me ajudar muito quando estou usando o telefone para falar com outro ser humano.

Outro benefício é que não abati totalmente meu sotaque no processo. Se eu tivesse optado por pagar por aulas de elocução, eu poderia estar recitando frases na pronúncia recebida. A identidade é importante; sotaques são uma parte importante da cultura e da formação de alguém.

O Reino Unido, por exemplo, tem um sotaque distinto a cada poucos quilômetros. Há um mapa que está voando pela Internet há alguns anos que parece extenso, mas ainda mal arranha a superfície. Uma pequena parte do Nordeste é rotulada como tendo um sotaque “Teesside”, mas os nativos de cada cidade daquela área (Middlesbrough, Hartlepool, Stockton e Billingham) falam de maneira diferente.

Agora imagine as variações em um condado do tamanho de Yorkshire. As pessoas também tendem a se identificar com a origem e a preservar muito de sua cultura. Os acentos são uma grande parte disso; nem todo mundo quer soar como Hugh Grant. Podemos ter sido estragados nos últimos anos, já que muitas pessoas agora ficam felizes em sentar e esperar que a tecnologia compense suas deficiências – e em muitos casos, ela fará exatamente isso. Mas às vezes, encontrar um técnico no meio é mais rápido e melhor no longo prazo.


Os assistentes de voz precisam ser acessíveis ao maior número possível de pessoas. Se você tivesse que falar com uma pronúncia perfeita antes que o Siri lhe desse a hora do dia, um dos sucessos mais significativos da Apple seria inútil para mais de 99,9% dos falantes de inglês.

Mesmo algo como um sotaque americano padrão excluiria a maioria dos usuários nos Estados Unidos, quanto mais no mundo inteiro. Conseqüentemente, é óbvio por que as empresas estão se esforçando muito para ensinar seu software a compreender o máximo de dialetos que puderem. E eles deveriam. Mas eles só deveriam ir até certo ponto.

Seria melhor se Apple, Google, et al. evite adotar uma mentalidade perfeccionista e, em vez disso, busque apenas um padrão que permita a acessibilidade, mas ainda exija um pouco de cuidado por parte dos usuários. Em uma nota pessoal, a relutância de Alexa em ouvir qualquer coisa além de um discurso claro me forçou a pensar sobre como eu pronuncio as coisas.

Minha fala está, sem dúvida, mais clara do que antes. Eu tive que lidar com um assistente de voz várias vezes ao dia. Não foi algo que planejei fazer; foi um efeito colateral não intencional e muito benéfico – e se funcionou para mim, pode funcionar para outras pessoas também.


Like it? Share with your friends!

0

0 Comments

Your email address will not be published. Required fields are marked *