Au lycée, décoder ChatGPT avec Vittascience
Dès le plus jeune âge, les enfants peuvent être sensibilisés à la pensée algorithmique, puis au codage. L'éducation aux IA génératives, elle, n'est pas recommandée en France avant la classe de 4è. Il devient dès lors possible d'en expliquer le fonctionnement, ce qui reste un mystère pour une grande partie des utilisateurs. Et en France, nous disposons d'une ressource précieuse pour cela : Vittascience. Retour sur un atelier mené la semaine dernière dans un lycée en Gironde.
D'après le baromètre numérique du Crédoc en février 2026, près d'un Français sur deux aujourd'hui a utilisé une IA générative en 2025 : on la consulte, parfois on s'en méfie, mais on ne la comprend presque jamais. La semaine dernière, j'ai donc mené un atelier de 2 heures dans un lycée girondin, en partant d'un principe simple : comprendre le fonctionnement des IA génératives permet de faire tomber le mythe automatiquement.
Ouvrir la boîte noire
J'ai introduit la pratique avec une video de Class'code, un outil utilisé en éducation numérique avant l'apparition de ChatGPT, qui permet notamment d'entraîner une IA à la reconnaissance d'image. Cet outil reste d'actualité mais il faut faire attention à l'explication sur la reconnaissance d'images avec les GANs car ce fonctionnement diffère de celui de la génération d'images, qui utilise les Algorithmes de diffusion - d'où le nom, Stable Diffusion de l'un des outils les plus connus de génération d'images ;)
Pour soutenir les élèves, j'ai créé une présentation qui, sincèrement, est le fruit de 2 ou 3 années de travail pour la rendre à la fois complète et accessible, avec un mini-quiz pour mobiliser les connaissances et expliquer quelques concepts importants (est-ce qu'une IA apprend vraiment seule ? est-elle neutre?...).
Ensuite, place à la pratique. Les élèves étaient en binômes. Le support choisi : la plateforme Vittascience IA, soutenue par le ministère de l'Éducation Nationale. Elle propose une interface intuitive permettant d'expérimenter et de comprendre le fonctionnement des modèles d'IA gratuitement, sans inscription ni installation.
Le texte, ou l'illusion de la pensée
Première étape de l'atelier : générer du texte. En apparence, rien de plus simple, d'autant que l'outil propose des prompts aléatoires, ce qui permet de se concentrer sur le résultat. En pratique, l'exercice permet de démonter quelques idées reçues.
La première : le modèle "comprend" ce qu'on lui dit. Or une IA générative ne traite pas des mots, mais des tokens — des chaînes de caractères ou des fragments de mots. Ce sont aussi des unités de calcul. Ce que le modèle fait, c'est prédire le token le plus probable à chaque étape, en fonction de ceux qui précèdent — une opération statistique, non sémantique.
L'autre notion clé travaillée est donc l'embedding, c'est-à-dire la vectorisation des mots en fonction de leur proximité avec d'autres mots. "Roi" devient ainsi géographiquement proche de "reine", "chat" est proche de "chien". Là encore, nulle compréhension de sens, mais un calcul de probabilités qui repose sur une base de données. Pour l'expliquer, j'utilise aussi la représentation graphique de cet article du Financial Times : Generative AI exists because of the Transformer.
Et derrière ces textes : des humains. Des humains qui ont écrit, étiqueté, corrigé, filtré les données d'entraînement. Rappeler le rôle central du travail humain dans la chaîne de production de l'IA est essentiel pour ramener l'information et l'IA dans leur parcours citoyen. À noter, l'outil calcule également le coût énergétique de chaque génération de contenu.
Les images, une histoire de bruit
Deuxième séquence : la génération d'images. Les premiers systèmes capables de produire des images réalistes reposaient sur des GANs — Generative Adversarial Networks, réseaux antagonistes génératifs. Le principe : un générateur et un discriminateur s'affrontent dans un jeu continu, le premier cherchant à produire des images "réalistes", le second cherchant à détecter les faux.
Les modèles actuels — Stable Diffusion, DALL-E et leurs successeurs — fonctionnent selon un principe différent : la diffusion. Un réseau de neurones est entraîné à inverser le processus d'ajout de bruit (du 'flou') à une image : il est ainsi capable de générer des images en partant d'un bruit aléatoire et en le "débruitant" progressivement.
Entraîner soi-même une machine
Troisième séquence, peut-être la plus marquante : entraîner un modèle de classification d'images. Vittascience permet d'entraîner son propre modèle à partir d'images, puis d'explorer le fonctionnement du réseau de neurones en "ouvrant la boîte noire".
Les données de base sont fournies par Vittascience, on lance l'entraînement puis on teste les erreurs. Les élèves découvrent ainsi que c'est eux qui définissent ce que la machine "voit" et que derrière chaque modèle, il y a des choix humains sur ce qu'on montre, ce qu'on étiquette, ce qu'on exclut. La classification n'est donc pas neutre mais le reflet des catégories qu'on lui a apprises.
Surtout, il est possible "d'ouvrir la boîte noire" et d'avoir une représentation graphique du traitement des images : pixellisation, calculs effectués via les filtres de couleur RGB, puis via les filtres sur les contours des formes, etc. Là encore, la représentation graphique se transforme en calculs statistiques.
En marge : une tendance qui mérite attention
En filigrane de cet atelier — comme dans d'autres classes rencontrées avant lui — une petite résistance silencieuse : quelques élèves qui refusent d'utiliser l'IA, par conviction. Un phénomène encore marginal, mais qui semble croître.
N'hésitez pas à me contacter pour me partager vos propres idées d'ateliers en AI Literacy, je serais heureuse de les découvrir : celine.boileau@weselect.fr