Google Books indexerait les mauvais ouvrages écrits par l’IA
Google Books indexerait les mauvais ouvrages écrits par l’IA


Google Books, un outil essentiel pour les universitaires en indexant les documents publiés, a récemment suscité des inquiétudes en raison de l’indexation de livres de qualité médiocre. Cette situation pourrait potentiellement impacter la précision de son outil de suivi linguistique, Ngram.
Selon des rapports de 404Media, Google Books a révélé plusieurs livres qui semblaient avoir été générés par une intelligence artificielle. Une recherche effectuée avec l’expression « à compter de ma dernière mise à jour de connaissances » a révélé une sélection de livres sur Google Books. Bien que la plupart des premiers résultats étaient liés à l’intelligence artificielle, certains ouvrages semblaient aborder des sujets non techniques et semblaient avoir été rédigés de manière automatisée.
404Media a souligné que certains livres découverts, tels que « Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old » de Tristin McIver, semblaient avoir été créés en puisant des informations sur les événements financiers à partir de sources telles que Wikipédia, incluant la phrase « à partir de ma dernière mise à jour de mes connaissances. » D’autres livres, comme ceux traitant de Twitter, contenaient des informations datant de 2021, ce qui pourrait indiquer que certains modèles d’IA utilisés avaient été formés avec des données obsolètes.
Google Books constitue une grande partie des données utilisées par Ngram, un outil de recherche qui analyse l’évolution de la langue au fil du temps. Ngram se base sur des textes écrits pour illustrer les changements linguistiques à travers les époques.
Alors que Google Books a numérisé et indexé des ouvrages remontant jusqu’au 16ème siècle, les données de Ngram sont actuellement basées sur des informations datant de 2019. Malgré ses imperfections, de nombreux linguistes et chercheurs se fient à cet outil pour leurs travaux de recherche.
Google a informé 404Media que les travaux récents indexés sur Google Books ne sont pas encore intégrés aux résultats de Ngram, mais qu’ils pourraient être pris en compte dans les futures mises à jour des données.






