Page d'accueil du site Navigation principale Début du contenu principal Plan du site Rechercher sur le site

Test de lecture et de compréhension : l'être humain dépassé par des intelligences artificielles

29.01.2018 - 22:32
Deux intelligences artificielles conçues par Alibaba et Microsoft viennent d'obtenir des résultats supérieurs à l'être humain dans un test de lecture et de compréhension. Même si sur ce dernier point, les terriens demeurent devant.

En 2014, l'astrophysicien britannique Stephen Hawking s'alertait d'un possiblement remplacement de l'humanité par les machines. Une mise en garde pouvant faire sourire mais que le spécialiste aura réitérée en novembre dernier. Un récent test de lecture et de compréhension vient d'ajouter un poids à la balance de son alerte.

Ce test a mis en concurrence des êtres humains et deux systèmes d'intelligence artificielle (IA) conçus par le chinois Alibaba et l'Américain Microsoft. Répondant au nom de SQuAD (“Stanford Question Answering Dataset”), il consiste en 100.000 questions générées à partir de 500 articles aux sujets variés provenant eux-mêmes de la plate-forme Wikipédia.

Les IA d'Alibaba et de Microsoft ont fait mieux que des êtres humains…

Cette expérience, pas inédite pour les entreprises développant ce genre de systèmes, a pour but d'établir la quantité de questions auxquelles les IA sont capables de répondre et le taux d'exactitude des propositions données. Comme rapporté par nos confrères des Échos, les interrogations peuvent aller de “Quel est le numéro atomique de l'oxygène ?” à “Quel est le premier grand magasin au monde ?”

Avec 82.440 et 82.650 points à leurs compteurs respectifs, les IA d'Alibaba et de Microsoft ont fait mieux que les humains et leurs 82.304 points. À noter que c'est le système chinois qui a signé la première victoire sur des individus faits de chair et de sang.

… mais restent en-deçà pour ce qui est de la compréhension

Il s'avère malgré tout que les machines demeurent en-deça des êtres humains pour ce qui est de la compréhension. Dans le test “F1”, où était entre autres mesuré “le niveau moyen de recoupement” entre les réponses attendues et celles données de part et d'autre, les humains ont ainsi obtenu un score de 91,221 %, Alibaba 88,607% et Microsoft 88,493%.

Alibaba a depuis déclaré par voie de communiqué son intention de faire profiter ses clients de sa technologie, et Microsoft d'avoir plus ou moins fait de même en citant le moteur de recherche Bing et l'assistant virtuel Cortana.

SBM Logo