Les outils signalant le texte généré par l’IA peuvent être utiles, mais la prudence est essentielle.
Alors que les étudiants se tournent de plus en plus vers des outils d’IA pour obtenir de l’aide dans leurs devoirs, les enseignants et professeurs ont été invités à assumer un nouveau rôle : des détectives en mission pour garantir l’intégrité académique. Est-ce un élève ou ChatGPT qui a écrit l’essai ? Les détecteurs d’IA sont venus à la rescousse, aidant les enseignants à identifier le texte généré par l’IA dans les soumissions des élèves. Pourtant, ces outils sont loin d’être parfaits.
En tant que scientifique ayant étudié en profondeur les détecteurs d’essais générés par l’IA depuis leur création, je dois réitérer : aucun détecteur d’IA ne peut atteindre une précision parfaite. Différents détecteurs peuvent mal classer les essais — soit en marquant à tort des écrits humains authentiques comme générés par l’IA, soit en échouant carrément à détecter le contenu généré par l’IA — soulignant la nécessité d’une utilisation et d’un examen minutieux.
Informés des recherches menées plus tôt cette année par mes collègues et moi-même, voici quelques conseils sur la manière dont les enseignants et professeurs peuvent utiliser les détecteurs d’IA de manière responsable.
Lisez l’étiquette. Aucun détecteur d’IA n’est infaillible. Lors de l’utilisation d’un outil spécifique, soyez conscient de la précision de détection qu’il rapporte. Par exemple, OpenAI a déclaré que son propre détecteur identifiait correctement le texte généré par l’IA seulement 26 % du temps et a par erreur signalé le texte écrit par un humain comme généré par l’IA 9 % du temps ; ils ont arrêté l’outil six mois plus tard.
La longueur du texte compte. Les textes plus longs donnent généralement des résultats plus fiables grâce aux détecteurs d’IA. En d’autres termes, déterminer si un seul mot ou une phrase courte a été généré par l’IA est pratiquement impossible. Notre étude a suggéré qu’une longueur de texte de 50 mots est une exigence minimale pour une détection fiable.
Les détecteurs d’IA ne signaleront pas de manière fiable le contenu co-créé par des humains et de l’IA. La définition et la détection du texte généré par IA deviennent ambiguës lorsque les humains et l’IA collaborent. Il est important d’établir des directives claires pour les élèves sur la quantité de contenu généré par IA autorisée dans chaque devoir et sur la raison pour laquelle ils doivent déclarer comment ils ont utilisé l’IA dans leur contribution.
Attention : les détecteurs peuvent être biaisés. Les détecteurs d’IA, probablement en raison de leur entraînement, peuvent parfois présenter des biais envers certains groupes démographiques sans schémas clairement prévisibles. Par conséquent, je déconseille de ne pas se fier uniquement aux résultats des détecteurs d’IA pour prendre des décisions à enjeux élevés.
Utilisez plusieurs outils pour améliorer la cohérence des résultats. Différents détecteurs d’IA peuvent donner des résultats variés pour un même texte. L’utilisation de plusieurs détecteurs et le recoupement de leurs résultats peut fournir une évaluation plus complète.
Ne vous fiez pas uniquement aux détecteurs textuels. Considérez d’autres sources d’information, telles que des données de frappes clavier ou des enregistrements vidéo du processus d’écriture, en plus des sorties des détecteurs pour prendre des décisions plus éclairées.
La technologie IA continuera d’évoluer, et les étudiants intégreront inévitablement des outils d’IA dans leurs études. Mes collègues et moi avons apprécié travailler sur TeachAI, et nous attendons avec impatience davantage d’opportunités pour aider les enseignants à soutenir l’utilisation de technologies évolutives par leurs élèves afin de réussir à l’école et dans la vie.
Jiangang est directeur de recherche et se spécialise dans l’évaluation de compétences complexes telles que la résolution collaborative de problèmes, la créativité, la curiosité et la littératie numérique.