
Selon Données Microsoft(Ouvre dans une nouvelle fenêtre). Sur les 2 000 personnes interrogées, 72 % des utilisateurs d’assistants numériques ont déclaré préférer les requêtes vocales.
Et tandis qu’Alexa n’a pas vraiment été une vache à lait(Ouvre dans une nouvelle fenêtre) pour Amazon, il est clair que les assistants virtuels font de plus en plus partie intégrante de nos vies numériques.
Mais il y a un problème dans la façon dont ces IA à commande vocale nous sont présentées. Au cas où vous ne l’auriez pas remarqué, les voix par défaut d’Alexa d’Amazon, de Siri d’Apple et de Google Assistant sont toutes féminines. Vous pouvez désormais sélectionner des voix masculines, mais il semble que les technologues aient massivement conçu les assistants vocaux comme “non masculins”.
D’autres exemples industriels incluent AMELIA d’IPSoft et SILVIA de Cognitive Code, qui a été intégré au système de simulation de Northrop Grumman, SADIE. Bien sûr, le précurseur de tous était ÉLISE(Ouvre dans une nouvelle fenêtre)le bot des années 1960 au sein du système de temps partagé du MIT.
Est-ce important qu’ils soient tous sexués ? Eh bien, ils sommes perçus comme de simples “assistants” pour faire notre offre humaine, donc ce n’est pas vraiment stimulant. Les grandes entreprises technologiques perpétuent-elles les stéréotypes et renforcent-elles les préjugés négatifs (cachés ou manifestes) en décrivant leurs IA comme “féminines” ? Sans doute.
Alors la question doit être : existe-t-il une meilleure approche pour créer une IA à commande vocale ? Quelles sont les étapes pour concevoir un assistant qui ne soit pas seulement au-delà du genre, mais ses fonctionnalités sont-elles guidées par des valeurs plus éclairées ? Et existe-t-il des moyens de créer une IA pour des communautés spécifiques, telles que les utilisateurs queer et trans ?
Concevoir une Alexa féministe
(Crédit : Creative Computing Institute)
Telles sont les questions auxquelles les étudiants ont répondu dans le cadre du programme Designing a Feminist Alexa du Institut d’informatique créative(Ouvre dans une nouvelle fenêtre) au sein de l’Université des Arts de Londres. Quarante étudiants de l’UAL se sont réunis avec un tas d’appareils Alexa, et ceux d’Amazon Service vocal Alexa(Ouvre dans une nouvelle fenêtre) outils, pour un atelier de trois jours. Leur mission ? Imaginer et prototyper des assistants personnels intelligents qui répondraient à un besoin humain significatif et incarneraient des valeurs féministes.
Pour lancer le débat sur ce qui constitue un dialogue à tendance féministe pour une assistante en intelligence artificielle, les étudiantes ont utilisé les questions posées dans le Processus de conception de chatbot féministe(Ouvre dans une nouvelle fenêtre). Cela est ressorti d’une recherche effectuée par Josie Jeune(Ouvre dans une nouvelle fenêtre) (maintenant responsable de programme chez Microsoft au sein de l’équipe Xbox Trust) pendant son MSc à Goldsmiths, Université de Londres.
Il couvre tout, de l’examen de l’éthique derrière chaque choix de plate-forme technologique au développement d’un personnage asexué qui rappelle aux utilisateurs qu’il s’agit d’un robot (pour éviter tout parti pris ou préjugé), la protection des magasins de données et l’obtention de commentaires pour former l’IA tout en améliorant sa compréhension du tâche à accomplir.
Ensuite, les étudiantes du cours Feminist Alexa se sont mises au travail et se sont séparées en équipes. Chaque équipe a réfléchi à un personnage pour son assistant, qui répondrait aux besoins des utilisateurs finaux proposés. Il s’agit essentiellement de créer un personnage avec lequel leur public se sentirait à l’aise de parler.
Au cours de ce processus, ils ont également proposé des exemples de modèles de dialogue de requête et de réponse pour renforcer le «caractère» de leur personnage (qui serait développé plus avant dans l’étape de conception de la conversation). Par exemple, comment leur intelligence artificielle réagirait lorsqu’elle ne comprendrait pas une question.
Ensuite, ils se sont dirigés vers la création de toutes les permutations possibles du chat aller-retour entre un bot à tendance féministe et son (note : terminologie non sexiste ici) homologue humain.
(Crédit : Voiceflow)
CxD est un ensemble de compétences en conception multimodale, composé de conception d’interaction utilisateur vocale, de conception d’interface, de conception de mouvement, de conception visuelle et d’écriture UX. Il ne s’agit pas seulement des “invites” (qui incluent des mots-clés pour faire savoir à l’IA que l’humain a posé une question spécifique) ou du flux conversationnel (pour éviter “Je suis désolé, je n’ai pas compris cela”), mais cela renforce également la voix de l’assistant.
Il existe de nombreux outils sur le marché pour la conception de conversation, y compris Flux vocal(Ouvre dans une nouvelle fenêtre)actions spécifiques à la plate-forme pour Assistant Google(Ouvre dans une nouvelle fenêtre)et compétences pour Alexa.(Ouvre dans une nouvelle fenêtre) Les équipes d’UAL ont d’abord cartographié les conversations sous forme d’organigramme, en utilisant Capricieux(Ouvre dans une nouvelle fenêtre)pour s’assurer qu’ils avaient couvert tous les itinéraires et toutes les réponses possibles au cours de l’étape de gestion des dialogues.
CxD ressemble à une écriture de scénario visuelle, mais elle nécessite également une excellente compréhension spatiale, pour « voir » la conversation, avec toutes ses « branches », alors qu’elle s’oriente vers différents sujets, tout en la concevant à l’écran. L’assistant est également aussi bon que la base de connaissances sur laquelle il s’appuie. Il ne peut pas vous dire ce à quoi il ne peut pas accéder sur le Web.
Cathy Perle(Ouvre dans une nouvelle fenêtre)Design Manager pour Google Assistant et auteur de Conception d’interfaces utilisateur vocales(Ouvre dans une nouvelle fenêtre) a un bon vidéo explicative(Ouvre dans une nouvelle fenêtre) pour savoir comment créer un script pour un assistant virtuel, y compris effectuer une « lecture de table » et comment gérer les réponses inattendues des utilisateurs.
Alternativement, on peut coder une IA conversationnelle à partir de zéro, en utilisant Python pour le flux de dialogue(Ouvre dans une nouvelle fenêtre), pour l’exécuter sur un appareil Android équipé de l’Assistant Google. Pour plus d’informations sur la façon dont cela fonctionne, consultez Google Staff Developer Advocate Priyanka Vergadia(Ouvre dans une nouvelle fenêtre)la vidéo ci-dessus.
Tout dépend de votre niveau de complexité requis. Quelque chose comme Voiceflow s’apparente à l’utilisation de WordPress pour créer un site Web, en ce sens que le tableau de bord vous guide à travers le processus sans code et basé sur des blocs. Python est, eh bien, plus difficile.
Choix de voix
Pendant que les chatbots tapent et répondent, les assistants virtuels parlent. Cela signifie qu’ils ont besoin d’un style de vocalisation. Il existe plusieurs façons de procéder. L’option la plus laborieuse et la moins technique consiste à enregistrer toutes les réponses possibles à l’enquête humaine. L’utilisation de la concaténation, qui prend moins de temps, mais n’est pas aussi agréable à l’oreille humaine, consiste à enregistrer des mots individuels puis à les enchaîner pour former des phrases cohérentes.
La plupart des assistants IA utilisent actuellement des voix synthétiques dans les programmes de synthèse vocale, tels que Amazon Polly(Ouvre dans une nouvelle fenêtre). L’IA “lit” le script en arrière-plan et nous entendons la réponse vocalisée. Certains TTS (les plus chers) peuvent être entraînés à moduler leurs modèles de parole pour qu’ils soient plus convaincants que d’autres.
Une méthode plus futuriste consiste à déployer la synthèse vocale pour capturer le spectre complet des phonèmes d’une voix humaine au lieu d’enregistrer des syllabes individuelles. J’ai vu cela en 2016 chez ObEN, une entreprise qui imprime des acteurs pour des robots concierges à Vegas et des talents à l’écran à travers l’Asie. La chose intelligente à propos de la capture de la voix au niveau du phonème est que l’assistant virtuel peut parler n’importe quelle langue – c’est juste des 1 et des 0 pour l’IA.
Exportation vers des plates-formes
Contrairement au Web avec ses normes ouvertes, les assistants IA sont encore une technologie naissante et quelque peu propriétaire, les développeurs doivent donc choisir une plate-forme sur laquelle exécuter leur logiciel. Par exemple, l’utilisation d’Alexa nécessite un Compte développeur Alexa(Ouvre dans une nouvelle fenêtre)puis tester l’IA sur le Console développeur Alexa(Ouvre dans une nouvelle fenêtre) (environnement de simulation) avant de l’exécuter localement sur un appareil Alexa.
Pour les assistants vocaux plus spécifiques, qui s’exécutent en tant qu'”actions” sur Google Assistant (sur tous les appareils Android), les développeurs peuvent s’inscrire à un compte de test(Ouvre dans une nouvelle fenêtre) avec Google et suivez les instructions. Mais revenons (virtuellement) à UAL et à leur cours Feminist Alexa pour la dernière étape.
Prototypes
(Crédit : UAL Creative Computing Institute)
Au final, les étudiantes de l’UAL du cours Feminist Alexa ont proposé huit prototypes, dont Bourgeon(Ouvre dans une nouvelle fenêtre), HiFuture(Ouvre dans une nouvelle fenêtre)et Égami(Ouvre dans une nouvelle fenêtre)qui a fait la démonstration de conseils féministes sur la vie, la carrière, le bien-être et l’éducation sexuelle.
Tous les prototypes affichaient une voix confiante et un ton sans jugement (par exemple « Rien n’est trop bizarre pour moi. Je suis un bot. Qu’est-ce que tu as en tête ? ») ; applaudir face à des abus de la part des utilisateurs (par exemple, « S’il vous plaît, soyez poli. Je ne suis pas un être humain, mais les abus ne sont acceptables d’aucune manière ni sous aucune forme ») et fixer des limites (par exemple, « Bonne chance pour l’utilisation de cette langue dans vos entretiens d’embauche ». )
C’était rafraîchissant d’entendre les différents prototypes en action car ils n’avaient rien à voir avec les IA de facto que j’avais entendues auparavant. Après la fin du programme Designing a Feminist Alexa, UAL a décidé de soutenir une enquête plus approfondie sur les IA progressives et de déterminer si une IA pourrait être conçue spécifiquement pour les personnes trans et / ou non binaires.
Syb : Queering Voice AI
(Crédit : Internet féministe)
En 2020, un autre groupe d’étudiants – dont la majorité s’identifiait comme trans et/ou non binaires – s’est réuni pendant une semaine au Creative Computing Institute pour créer Sib(Ouvre dans une nouvelle fenêtre)un prototype pour accompagner les personnes trans dans le cadre de Queering Voice AI : conception transcentrée(Ouvre dans une nouvelle fenêtre) cours, sous la direction des animateurs de cours Andrew Mallinson, co-fondateur de Internet féministe(Ouvre dans une nouvelle fenêtre)et Cami Rincòn, qui est maintenant Chercheur en éthique de l’IA(Ouvre dans une nouvelle fenêtre) à l’Institut Alan Turing de Londres (que PCMag a visité en 2019).
“L’objectif et le processus de conception des deux cours étaient alignés”, a déclaré Rincòn à PCMag. “Mais le nôtre était assez différent en ce sens que nous avons cherché à développer un prototype, basé sur les exigences de conception suscitées par mon étude universitaire(Ouvre dans une nouvelle fenêtre) sur les besoins et les expériences des utilisateurs trans et/ou non binaires des VAI [Voice Activated AIs].”
À cette fin, la conception conversationnelle de Syb était explicitement avant-gardiste dans son utilisation d’un langage et d’un ton affirmant le genre, ainsi que dans sa base de connaissances. Le cas d’utilisation développé par les étudiants visait à connecter les personnes trans aux médias (films, télévision, etc.) recommandés par leur communauté.
En 2021, Syb a reçu le prix inaugural Nouvelle nouvelle bourse(Ouvre dans une nouvelle fenêtre), ce qui a permis à l’équipe de conception d’affiner le prototype et de le proposer à un public plus large. Bien que les prototypes Feminist Alexa ne soient pas disponibles pour une utilisation publique, Syb a un premier prototype que vous pouvez tester en version bêta(Ouvre dans une nouvelle fenêtre).
Les assistants virtuels du futur
J’ai récemment réalisé que les assistants IA actuels sont conçus pour être des solutions larges pour le grand public. Ils sont destinés à répondre aux questions des bases de données de connaissances collectives, telles que Wikipédia (qui a ses propres problèmes de véracité et de biais), ou à extraire du contenu numérique (détails sur les restaurants, indications cartographiques, météo et actualités).
J’ai utilisé Google Assistant pour lire mon emploi du temps et parfois localiser quelqu’un dans ma liste d’appels ou envoyer un SMS (mais je dois toujours m’assurer qu’il m’a bien entendu). J’aimerais un assistant IA qui s’appuie sur mes propres réserves de connaissances croissantes, afin qu’il puisse grandir et apprendre avec moi.
Non pas parce que je crains spécifiquement de perdre la tête (cliniquement ou autrement), mais parce que je veux une interface d’IA basée sur la voix dans ma vie. Quelque chose qui suggère des films que je pourrais vouloir regarder, des livres à lire (puis demande automatiquement d’emprunter l’ebook à la bibliothèque locale), me rappelle quand les anniversaires et les dates importantes approchent, et me permet de savoir ce que j’ai acheté l’année dernière pour éviter problèmes de re-don.
Un véritable assistant personnel virtuel ; pas un outil générique, mais une IA qui m’est adaptée, avec une très belle voix. En savoir plus sur le travail à l’UAL m’a inspiré à penser au-delà des suspects habituels, vers un avenir où une myriade d’IA désincarnées, véritablement progressistes et au-delà du genre, pourraient fournir une interface vocale vraiment utile à nos vies de plus en plus hybrides.
Recevez nos meilleures histoires !
S’inscrire pour Quoi de neuf maintenant pour recevoir nos meilleures histoires dans votre boîte de réception tous les matins.
Cette newsletter peut contenir des publicités, des offres ou des liens d’affiliation. L’inscription à une newsletter indique votre consentement à notre Conditions d’utilisation et Politique de confidentialité. Vous pouvez vous désabonner des newsletters à tout moment.