---
title : Formation IAg MODULE 3 - seconde
author: Stéphane FONTAINE
affiliation:
date: juillet 2025
copyright: Creative Commmons CC BY-NC-SA 4.0
tags : IAg, formation, élèves, lycée, seconde, moteurs de recherche
---
# Module 3 : Moteurs de recherche / IAg, quels outils doit-on mobiliser pour quelles tâches ? (50 min)
*Document réalisé et publié par Stéphane FONTAINE stephane.fontaine@ac-besancon.fr
au format [Markdown](https://fr.wikipedia.org/wiki/Markdown), le 24/07/2025.
<img decoding="async" src="https://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-nc-sa.eu.png" alt="Logo BY-NC-SA" width="150" height="40"> Contenus publiés sous licence [Creative Commons CC BY-NC-SA](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.fr).*
> Ce module de formation est à destination d'élèves de lycée en seconde générale et technologique. Son objectif principal est de sensibiliser au fonctionnement des IAg pour les utiliser à des fins raisonnées.
> Il peut être pris en charge par n'importe quel enseignant qui a un peu travaillé le sujet en amont, soit en cours soit pendant des heures spécifiques comme l'heure de vie de classe. On pourrait imaginer un projet conjoint avec les enseignants-documentalistes pour aller plus loin.
**Sommaire**
[TOC]
## 0. Travail préparatoire (avant la séance)
Visionnez cette vidéo en prenant quelques notes pour répondre à quelques questions. Les notions évoqués sont complexes et nécessitent des explicitations en classe.
<iframe width="100%" height="400" src="https://www.youtube.com/embed/pjtY-es384M?si=vrfmTyqtwX_tHFDv" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
https://www.youtube.com/watch?v=pjtY-es384M
:::info
💡 **A FAIRE : Répondez par écrit succinctement aux 3 questions après avoir consulté la vidéo. On utilisera ces éléments au début de la séance.**
**1. Qu’as-tu retenu de la vidéo ? (Fais un court résumé à ta façon).**
**2. Qu’as-tu trouvé intéressant ou surprenant ?**
**3. Une question que tu te poses après avoir vu cette vidéo ?**
:::
## 1. Définitions (10 min)
#### Moteurs de recherche
Ce sont des outils de recherche automatisés qui permettent de trouver des informations sur le web en entrant des **mots-clés** pour formuler une **requête**. Il utilise des **robots d’exploration** (ou* crawler*) et des **algorithmes** pour parcourir les pages web publiques et les **indexer en temps réel**, afin de fournir des résultats pertinents en réponse à une requête de l’utilisateur.
> Il est intéressant de présenter des **moteurs de recherche protecteurs de leur vie privée**, sans identification ni abonnement, qui intègrent les APIs de certaines itérations d'IA et qui proposent systématiquement un aperçu de leurs sources : [Qwant](https://www.qwant.com), [Brave](https://search.brave.com), [DuckDuckGo](https://duckduckgo.com) et son Chat [Duck.ai](https://duck.ai)
**Tous les mots des pages web et des documents collectés sont indexés automatiquement**, selon des méthodes d’analyse linguistique et statistique. Pour trouver des informations, le moteur de recherche cherche dans sa base de données (son index). Pour afficher les résultats, le moteur compare les mots de la [requête](https://wikinotions.apden.org/notions.php?p=consult\&nom=requ%C3%AAte) avec les chaînes de caractères qu’il a enregistrées dans son index. Il affiche ensuite ces résultats sur une page, selon le classement qu’il a établi. **Il y a donc des sources identifiées et *a priori* identifiables.**
::: info
Pour en savoir plus : voir le cours de SNT - Partie "Le web" sur https://romainjanvier.forge.apps.education.fr/snt/2_web/1_web/5_moteurs_recherche/
:::
#### Les IA génératives
A l’inverse, une IAg** est capable de traiter des données et de générer des contenus** (texte, image, audio, vidéo) en utilisant des techniques d’apprentissage automatique, de reconnaissance de formes, de traitement du langage naturel, etc. Il n’y a aucune source identifiée ou identifiable dans les réponses générées.
**Les chatbots, imitent la conversation humaine** et sont capables de répondre à des questions en traitant des bases de données de connaissances vastes et variées. **Ils peuvent reproduire des biais présents dans les données sur lesquelles elles ont été formées.**
*Attention : Des outils de recherche web combinent, de plus en plus souvent, un moteur de recherche traditionnel, permettant d’aller chercher des résultats, et un modèle de langage (LLM) capable de les organiser et de les mettre en forme.*
> Il y a une **confusion volontaire** lorsque les **moteurs de recherche sont aussi « alimentés » par une IA**. [Wikipédia](https://fr.wikipedia.org/wiki/Perplexity_AI), par exemple, définit [Perplexity AI](https://www.perplexity.ai/) comme « une plateforme de recherche combinant moteur de recherche et agent conversationnel […], un « moteur de réponse » plutôt qu’un moteur de recherche ».
:::info
💡 **A FAIRE : Déterminez 3 mots-clés pour caractériser les moteurs de recherche et 3 mots-clés pour caractériser un chatbot.**
::: spoiler **Réponses :**
* **moteurs : indexation automatique**
* **moteurs : sources identifiées**
* **moteurs : actualisation des données du web en continu**
* **IAg : génération de contenus de manière probabiliste**
* **IAg : pas des sources authentifiées**
* **IAg : pas d'actualisation systématique**
:::
## 2. Comparaison des outils (10 min)
**Les moteurs de recherche traditionnels ont fait leurs preuves** : ils sont rapides, fiables pour les informations factuelles et renvoient vers des sources vérifiables. **Leur limite principale réside dans la difficulté à traiter des requêtes complexes ou ambiguës.**
**Un moteur de recherche a pour but de trouver des informations existantes et sourcées, alors qu’une IAG est utilisée pour générer des contenus sur la base d’une pertinence statistique**.
Donc, la principale différence entre un moteur de recherche et une IAg réside donc dans leur objectif et leur approche.
| Critère | Moteurs de recherche | IA génératives |
| ----------------------- | -------------------------------------------------- | ----------------------------------------------------------------------------- |
| Fonction principale | Trouver et afficher des résultats provenant du web | Générer du contenu original basé sur des modèles d’apprentissage |
| Source des informations | Bases de données et index du web | Données d’entraînement et analyse du contexte |
| Interaction | Répond avec des liens et extraits de texte | Produit du texte, des images, de la vidéo, de l'a'audio ou du code sur mesure |
| Objectif | Fournir des informations existantes | Créer du contenu nouveau et adapté à la demande |
| Exemple d’utilisation | Recherche de faits, d’articles ou de produits | Rédaction de textes, de résumés ou de réponses personnalisées |

<https://fabrice-frossard.com/chatbots-ia-vs-moteurs-de-recherche-ce-que-revelent-deux-ans-de-donnees-mondiales/>
> Sans grande surprise, les moteurs de Chatbot connaissent une croissance fulgurante.\
> Au-delà du buzz et du bruit ambiant suscités par les chatbots, les moteurs de recherche restent encore loin devant.
> **L'un des défis majeurs des moteurs de recherche dopés aux IA est la garantie de la véracité des informations générées. Contrairement aux moteurs traditionnels qui renvoient vers des sources existantes, l'IA générative peut produire du contenu original, ce qui soulève la question de la fiabilité de ces informations.**
:::info
💡 **A FAIRE : Déterminez 5 notions qui permettent de développer une pensée critique concernant les recherches via des IAg ou des moteurs de recherches dopés à l'IAg.**
::: spoiler **Réponses :**
* **biais algorithmiques**
* **hallucinations**
* **non-respect des données personnelles**
* **impact environnemental**
* **désinformation**
:::
## 3. Biais et halluciations (10 min)
Plusieurs éléments sont à prendre en compte au moment d’utiliser une IA générative, et de manière générale avec des moteurs de recherche qui les utilisent :
* **Biais algorithmiques : **les modèles de langages sont formés sur de vastes corpus de données pouvant contenir des biais implicites ou explicites (exemple : [Midjourney & la banlieue](https://www.radiofrance.fr/franceculture/podcasts/le-biais-d-aurelie-jean/midjourney-createur-de-prejuges-ou-miroir-de-nos-propres-biais-8660871)).

https://www.institutmontaigne.org/publications/algorithmes-controle-des-biais-svp
On distingue plusieurs types de biais pouvant survenir lors de la conception d’un système d’IA. Parmi les plus courants, on peut citer :
* les **biais de sélection** : choix, conscient ou non, de données qui confirme des croyances préexistantes ;
* les **biais d’omission** : si certains groupes sont sous-représentés ou absents dans les exemples d’entraînement, le modèle peut "oublier" ou mal représenter ces réalités ;
* les **biais de représentativité** : données d’entraînement « trop homogènes » non représentatives de la diversité ;
* les **biais d’étiquetage** : étiquetage subjectif des données lors des entraînements.
>Tous ces biais peuvent conduire à **des résultats discriminants, déformés ou erronés **dans les outils IA. Par exemple, des images ou des textes produits peuvent renforcer des stéréotypes (genre, race, rôles sociaux…), rendant le discours de l’IA non neutre.
https://drane-versailles.region-academique-idf.fr/spip.php?article1413
* **Hallucinations : **des informations inexactes ou inventées peuvent être générées (exemple : [un avocat américain citant des arrêts inventés](https://www.radiofrance.fr/franceinter/un-avocat-americain-a-utilise-chatgpt-pour-preparer-un-proces-et-n-a-cite-que-des-faux-arrets-3833906)). Actuellement, l’IAg ne dira pas qu’elle ne sait pas, mais inventera des éléments fantaisistes. Cette limite est en forte amélioration.

https://www.it-connect.fr/intelligence-artificielle-et-llm-quest-ce-quune-hallucination/
* **Données personnelles : **les modèles de langages peuvent stocker ou rappeler des informations divulguées au cours des interactions (exemple : [le cas des ingénieurs de Samsung](https://www.journaldugeek.com/2023/04/07/ces-employes-samsung-ont-commis-une-grave-erreur-sur-chatgpt/)).
* **Citation des sources : **les IAg ne savent pas correctement citer leurs sources.
* **Impact environnement **: [importante consommation d’eau au niveau des data centers](https://www.geo.fr/environnement/eau-ia-generative-a-t-elle-fait-exploser-consommation-eau-geants-de-la-tech-openai-microsoft-google-chatgpt-216592).
* **Désinformation **: fake news ou deepfakes simplifiés avec les IA génératives (exemples : la [Tour Eiffel en feu](https://www.courrierinternational.com/stories/video-de-fausses-images-de-la-tour-eiffel-en-feu-agitent-les-reseaux-sociaux) ou [deepfake & « arnaque au président »](https://www.bfmtv.com/economie/international/piege-par-une-fausse-visioconference-en-deepfake-un-employe-transfert-25-millions-de-dollars-a-des-escros_AV-202402040251.html)).
Merci à <https://sup-ubs.fr/faq/quels-sont-les-points-de-vigilances/>
## 4. Cas pratique (10 min)
Visionnez cette vidéo, puis analysez les résultats mis en œuvre par des IAg.
<iframe width="100%" height="400" src="https://www.youtube.com/embed/GSdzr6IrCmA?si=zL-vAQgmkXCJMtGo&start=935" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
<https://youtu.be/GSdzr6IrCmA?si=VBrF2nvYXBKH0M2d&t=935> (de 15' à 28') - juin 2025
:::info 💡
**A FAIRE : Etablissez quelques règles de vigilance pour l'usage de IAg dans vos recherches d'informations.**
::: spoiler **Réponses :**
* **Il faut vérifier les éléments factuels et ne pas faire confiance a priori aux IAg.**
* **Il faut douter des informations en réfléchissant à la manière dont on s'informe.**
* **Attention aux blanchiments d'informations à destination des IAg.**
:::
## 5. Discussion (10 min)
**L’IA transforme radicalement notre manière de rechercher et d’interagir avec l’information.** A l’opposé d’un moteur de recherche classique, l’usager peut, parfois, ne plus faire l’effort de rechercher, trouver, trier, sélectionner, synthétiser les résultats et les informations qui lui sont proposés.
**Le risque est de se contenter *stricto sensu* d’une réponse générée par un agent conversationnel, de faire confiance au gisement de données dans lequel il puise pour élaborer sa réponse.**
> **Les moteurs de recherche basés sur l’IA échouent au test de précision**, avec un taux d’erreur de 60 %, atteignant même 96 % pour Grok-3, selon une étude du Tow Center for Digital Journalism.

https://www.cjr.org/tow_center/we-compared-eight-ai-search-engines-theyre-all-bad-at-citing-news.php (mars 2025)
:::info
💡 **A FAIRE : Analysez le graphique ci-dessus et tirez-en quelques conclusions.**
::: spoiler **Réponses :**
* **Cette étude met en évidence les failles majeures des moteurs de recherche basés sur l’IA et pose une question cruciale : dans quelle mesure pouvons-nous faire confiance à ces outils pour nous informer ?**
* **Les moteurs de recherche traditionnels ne sont pas exempts de critiques, mais ils ont au moins l’avantage d’offrir aux utilisateurs la possibilité de croiser leurs sources.**
* **Lorsqu’une information erronée est introduite dans l’écosystème numérique des LLM, elle peut être dupliquée, amplifiée et reformulée au point de devenir impossible à distinguer d’une vérité vérifiée.**
:::