fbpx

La voix d’Alexa peut maintenant exprimer des émotions

Par

le

Amazon vient d’annoncer l’arrivée de deux nouvelles fonctionnalités Alexa qui aideront à créer une expérience vocale plus naturelle et intuitive.

Le secteur de la technologie essaie toujours de rendre ses IA comme des humains, et la sophistication sans cesse croissante des assistants virtuels en est la preuve. Ils peuvent maintenant raconter des blagues, avoir de brèves conversations et même répondre à des demandes de courtoisie de base telles que « s’il vous plaît » et « merci ».

Cependant, Amazon n’est pas du genre à laisser assez tranquille, surtout en ce qui concerne son Alexa AI (en quelque sorte). Bien qu’Alexa paraisse déjà étonnamment humaine pour une machine, les ingénieurs d’Amazon ont introduit «Alexa Emotions» et «Speaking Styles» à l’aide virtuelle aujourd’hui.

Alexa Emotions laissait l’assistant proposer des réponses empreintes de joie, d’enthousiasme, de déception et d’empathie, selon différents messages. Ces types de réponses peuvent être utilisés dans les Skills, mais il semble qu’ils aient également été intégrés à l’expérience principale d’Alexa. Vous pouvez entendre quelques exemples de ces différentes réactions émotionnelles (et les comparer au « ton neutre » d’Alexa) ici. Notamment, il existe différentes intensités disponibles pour le test : faible, moyenne et élevée pour chaque émotion.

Les styles de conversation sont similaires dans le sens où ils ont également pour objectif de donner à Alexa un sentiment un peu plus humain et « réel », mais ils accomplissent cette tâche de manière différente. À partir de maintenant, les utilisateurs américains peuvent activer jusqu’à deux styles de conversation différents aux États-Unis: l’actualité et la musique, qui « adaptent la voix d’Alexa » au type de contenu approprié.

Le style de parole « News » met davantage l’accent sur les chiffres ou chiffres importants, comme le ferait un présentateur de JT. Le style de musique a un ton légèrement plus léger et conversationnel, semblable à ce que vous pourriez entendre des hôtes de votre station de musique préférée.

Alexa Speakings Styles et Alexa Emotions tirent parti d’une technologie appelée « Neural TTS » (synthèse vocale), sur laquelle vous pouvez en apprendre davantage ici. En bref, la Neural TTS synthétise la parole à partir de rien, plutôt que de compter sur de petits morceaux de «sons préenregistrés».

Articles recommandés