Les scientifiques de données de 20th Century Fox et de Google Cloud ont développé un logiciel de machine learning capable d’analyser les bandes-annonces de films et de prévoir quels films plairont au public.
Le machine learning est au cœur de l’art de trouver des modèles de données. C’est pourquoi les entreprises adorent ça. Les modèles aident à prédire l’avenir, et l’avenir est un excellent moyen de gagner de l’argent. Il est parfois difficile de savoir comment ces éléments vont ensemble, mais voici un exemple parfait tiré du studio de film 20th Century Fox, qui utilise l’IA pour prédire quels films les gens voudront voir.
Les chercheurs de la société ont publié un article le mois dernier expliquant comment ils analysent le contenu des bandes-annonces de films en utilisant le machine learning. Les systèmes de vision artificielle examinent les images d’une bande-annonce, une par une, en étiquetant les objets et les événements, puis les comparent aux données générées pour les autres bandes-annonces. L’idée est que les films portant des ensembles d’étiquettes similaires attireront des ensembles de personnes similaires.
Comme l’expliquent les chercheurs dans l’article, c’est exactement le genre de données que les studios de cinéma adorent. (Ils produisent déjà beaucoup de données similaires en utilisant des méthodes traditionnelles telles que des interviews et des questionnaires.) «Comprendre la composition détaillée du public cible est important pour les studios de cinéma qui investissent dans des histoires au sujet incertain», écrivent-ils. En d’autres termes, s’ils savent qui regarde quoi, ils sauront quels films faire.
C’est encore mieux si cette composition d’audience peut être décomposée en «micro-segments» plus petits et plus précis. Un bon exemple de cela est Logan en 2017. C’est un film de super-héros, oui, mais il a des thèmes plus sombres et une intrigue qui attire un public légèrement différent. Alors, l’IA peut-elle être utilisée pour saisir ces différences? La réponse est: en quelque sorte.
Pour créer son «système expérimental de prévision et de recommandation de la fréquentation des films» (nommé Merlin), 20th Century Fox s’est associé à Google pour utiliser les serveurs de la société et l’infrastructure d’intelligence artificielle open source TensorFlow. Dans un blog, le géant de la recherche explique l’analyse de Logan par Merlin.
Tout d’abord, Merlin scanne le trailer et identifie des objets tels que «poils du visage», «voiture» et «forêt»:
Bien que ce graphique n’enregistre que la fréquence de ces mots, les données générées sont plus complexes, en tenant compte de la durée d’affichage de ces objets à l’écran et du moment où ils apparaissent dans la bande-annonce.
Comme l’ont expliqué les ingénieurs de 20th Century Fox, cette information temporelle est particulièrement riche car elle est en corrélation avec le genre d’un film.
-
«Par exemple, écrivent-ils, une bande-annonce avec une longue vue rapprochée d’un personnage est plus probable pour un film dramatique que pour un film d’action, alors qu’une bande-annonce avec des plans rapides mais fréquents est plus probable pour un film d’action.
«Cela est tout à fait vrai pour Logan, avec sa bande-annonce contenant de nombreux plans lents de Hugh Jackman qui semble sanglant et battu.
En comparant ces informations avec les analyses d’autres bandes-annonces, Merlin peut tenter de prédire quels films pourraient intéresser les personnes qui ont vu Logan. Mais c’est là que les choses deviennent un peu risquées.
Le graphique ci-dessous montre les 20 films les plus visités par les personnes qui sont allées voir Logan. La colonne de droite montre les prévisions de Merlin et la colonne de gauche les données réelles (recueillies, suppose-t-on).
Merlin obtient quelques-uns des films correctement, y compris d’autres films de super-héros comme X Men: Apocalypse, Doctor Strange et Batman v Superman : L’Aube de la justice. Il identifie même correctement John Wick 2 comme un film similaire à Logan. C’est une intuition impressionnante puisque John Wick n’est certainement pas un film de super-héros. Cependant, il comporte un protagoniste tout aussi fatigué et blasé avec une apparence rude. Globalement, Merlin identifie les cinq premiers choix, même s’il ne les classe pas dans le même ordre d’importance.
Ce qui est encore plus révélateur, ce sont les inadéquations. Merlin prédit que Tarzan séduira les fans de Logan, par exemple. Ni Google ni 20th Century Fox n’expliquent cela, mais cela pourrait avoir quelque chose à voir avec les expressions «forêt», «arbre» et «lumière» de Logan, éléments qui figurent également dans la bande-annonce de Tarzan.
20th Century Fox savait probablement déjà tout cela, mais il est intéressant de voir ce que l’intelligence artificielle pourrait ou ne pourrait pas détecter. L’industrie cinématographique a tenu à adopter l’intelligence artificielle pour ce type d’analyse, et plusieurs entreprises affirment déjà qu’elles peuvent prédire le succès d’un film simplement en utilisant le machine learning pour approfondir son scénario. Des analyses comme celles-ci montrent cependant que les ordinateurs ne sont pas encore des cinéphiles. Ils doivent passer plus de temps au cinéma avant de pouvoir vraiment prédire nos préférences.