A Microsoft informou na terça-feira (3) que desenvolveu uma nova maneira de seus bots com inteligência artificial falarem e, ao mesmo tempo, analisarem vozes humanas. A ideia é fornecer um fluxo mais natural à conversa, sem a necessidade de usar uma palavra específica para despertar a IA, a não ser que seja necessário. Isso porque será possível prever o que será falado no decorrer da conversa, quando pausar ou quando é apropriado interromper o diálogo.
A estreia será com o Xiaoice, na China, e Rinna, no Japão. Porém, nos próximos 6 meses, a Microsoft planeja distribuir essa tecnologia para outros chatbots da companhia, como o Zo AI, nos EUA.
Como ele consegue prever o que você provavelmente dirá a seguir, também sabe quando interromper você com informações importantes ou falar algo mais quando ambos os lados ficarem quietos de repente, como aquele amigo que sabe quando falar sem ser excessivamente rude.
Como funciona
A maneira mais natural de uma IA falar é conhecida como “senso de voz full duplex” pela Microsoft, ela dá aos bots que se comunicam por voz a capacidade de manter uma conversa usando palavras como “Ei, Cortana” uma única vez, de maneira que o diálogo pareça, realmente, uma conversa ou um telefonema.
O sistema usa o conhecimento extraído das conversas que os bots da Microsoft já tiveram com cerca de 200 milhões de pessoas no mundo nos últimos anos; dessa maneira, a IA saberá quando é apropriado interromper uma pessoa que está falando. A interrupção da conversa vai acontecer dependendo da pergunta ou do comando que for dado ao bot.
“Se Xiaoice estiver contando uma história, ela não será facilmente interrompida por murmúrios e conversas, a menos que haja uma intenção explícita do usuário em parar. O Xiaoice optará por ignorar a intenção não explícita dos usuários, como injeções como 'umm' ou 'huh'”, disse o diretor do Zo AI da Microsoft, Ying Wang.
Fontes
Categorias