Une IA de Google capable d’écrire des articles sur Wikipedia

Par

le

Les chercheurs de Google Brain ont développé un nouveau logiciel capable de générer des articles de type Wikipedia en résumant les informations sur le Web.

Les chercheurs de Google Brain, un projet de recherche d’apprentissage profond (deep Learning) conduit par Google, ont développé un nouveau logiciel capable de générer des articles de type Wikipedia en résumant des informations dénichées sur le Web.

Le logiciel écrit par les ingénieurs de Google récupère d’abord les dix meilleurs pages Web pour un sujet donné, en excluant l’entrée de Wikipedia. Voyez cela comme un résumé de l’information trouvée dans les 10 premiers résultats d’une recherche Google. La plupart de ces pages sont utilisées pour former l’algorithme de machine learning, tandis que quelques unes sont gardées pour tester et valider ce que sortira le logiciel.

Les paragraphes de chaque page sont collectés et classés pour créer un document plus long, qui est ensuite raccourci en étant divisé en 32 000 mots individuels. Ce grand texte est utilisé comme entrée pour un modèle abstrait où les phrases longues sont raccourcies, une astuce pour créer un résumé du texte.

Parce que les phrases sont raccourcies de la phase d’extraction précédente, plutôt que d’être écrit à partir de zéro, le résultat final peut sembler plutôt répétitif et terne. Par exemple, voici ce que produit l’IA par rapport au texte actuellement en ligne édité par des humains sur Wikipedia.

ai_wikipedia1

Mohammad Saleh et ses collègues de Google Brain espèrent pouvoir améliorer leur bot en concevant des modèles et du hardware supportant des séquences d’entrée plus longues. Leur étude sera présentée à la prochaine Conférence internationale sur les représentations de l’apprentissage (ICLR).

En l’état actuel des choses, il serait imprudent d’écrire des entrées Wiki en ayant recours à ce IA, mais les progrès sont encourageants. Peut-être qu’un jour, une solution hybride entre la génération de contenu IA et la supervision humaine pourrait peupler Wikipedia à un rythme sans précédent.

Actuellement, le site Wikipédia en anglais compte à lui seul plus de 5 573 495 articles de toutes les longueurs, et les Wikipédias combinés pour toutes les autres langues dépassent largement la version anglaise, avec plus de 27 milliards de mots dans 40 millions d’articles en 293 langues. C’est beaucoup, mais avec une solution IA, il serait possible de fournir encore plus d’informations, en particulier pour les millions de pages Wiki qui sont vides.

Et si une IA va un jour suffire à peupler Wikipédia, peut-être sera-t-elle assez bonne pour « écrire » toutes sortes d’autres contenus. Vous n’auriez pas à payer quelqu’un pour écrire un papier. Les IA en rédaction d’information sont en réalité assez avancées de nos jours. Par exemple, l’outil de prédiction algorithmique de Reuters aide les journalistes à évaluer l’intégrité d’un tweet, le BuzzBot recueille des informations sur des sources sur le terrain lors d’événements, et le Washington Post utilise Heliograf, un bot qui écrit des brèves.


Articles recommandés