Résumé de section

  • Ce court module a pour objectif de vous faire comprendre les atouts et limites de l’IA générative dans les différents types de recherche documentaire.


    Objectifs
    • Distinguer les types de recherche documentaire
    • Identifier à quels moments l'IA peut être bénéfique dans une recherche documentaire
    Ce cours est en libre accès !

    Aucune création de compte ou d'inscription n'est nécessaire. Bonne lecture !

    • Auteur(s) / Formateur(s): Formation en BU Toulouse Occitanie Ouest, Élise Pajot, Fabienne Rosier, Marie Moisand - Université de Toulouse, Cécile Morzadec, Agnès Holtzhäusser - ISAE-SUPAERO, Alice Vallart - Toulouse INP
      Production cours: Viet Jeannaud - Fondation Callisto
      Date de publication: 12 juin 2026
      Durée estimée: 30 minutes
      Licence: CC BY-NC-SA
      Open badge: Non
      Catalogue: Oui
      Thématique: Recherche d'informations, Intelligence artificielle
      Durée: Format court (< 1h)
      Type d'accès: Libre accès
      Partenaire: Callisto
      Langue: Français
  • Une recherche documentaire doit être menée selon des objectifs précis. En fonction de ces objectifs, la façon de faire une recherche sera différente. C'est ce que nous allons dans ce préambule.

    • Définitions

      Il existe trois grands types de recherche documentaire :


      La recherche élémentaire

      Il s’agit de rechercher des éléments d’information simples et précis. Par exemple, des dates d’évènement, des définitions, quelques chiffres…


      La recherche exploratoire

      Il s’agit de se familiariser avec un sujet qu’on ne connaît pas bien, d’enrichir notre compréhension. L’objectif est de mieux comprendre, d’acquérir les connaissances de base nécessaires pour appréhender un sujet.


      La recherche bibliographique

      Vise la plus grande exhaustivité possible, doit être méthodique, fiable, transparente… Permet de construire une liste de références bibliographiques fiables et pertinentes.

  • Que valent les Intelligences Artificielles Génératives (IAG) dans le cas de recherches élémentaires, exploratoires et bibliographiques ? Nous verrons ici quand l’utilisation d’une IAG est indiquée et quand elle ne l’est pas.

    • Synopsis

      Pour mieux comprendre et illustrer nos propos, nous allons nous appuyer sur l'exemple de Léa, étudiante en Master Sciences de la Terre et des Planètes, Environnement, à l’Université de Toulouse. Dans le cadre de son mémoire, elle travaille sur :

      « Érosion hydrique des sols en France : cartographie des zones vulnérables et facteurs d'aggravation liés aux changements d'usage des terres »

      Pour avancer dans ses recherches, Léa voudrait utiliser une IA, ChatGPT.

      Les dialogues suivants correspondent aux trois types de recherche documentaire, et montrent ce que l'IA peut (et ne peut pas) lui apporter.

    • 1. Recherche élémentaire : Léa cherche une définition

      La recherche élémentaire vise à trouver des éléments d'information simples et précis : une définition, une date, un chiffre clé. Elle est rapide et ciblée.

    • Débrief

      L’utilisation d’une IAG n’a que peu d’intérêt dans ce contexte. Un moteur de recherche sera tout aussi efficace avec moins d’impact sur l’environnement. Une requête IA consomme 4 à 10 fois plus qu’une recherche Google (source : L'empreinte carbone de l'IA, ANITI). De plus, cela permet de limiter les erreurs possibles.

      Exemple : réponse trompeuse (prompt réalisé le 16/06/2025)

      Même dans une réponse courte et simple, ChatGPT peut se tromper comme dans cet exemple sur la politique américaine qui date de juin 2025.

    • À retenir
      • Pour la recherche élémentaire, l’IA peut aider à formuler rapidement une définition ou un concept, mais les sources doivent toujours être vérifiées avant toute utilisation.
      • Un moteur de recherche (Google, Google Scholar) ou un site institutionnel sont souvent plus sûrs et plus directs pour ce type de requête.
    • 2. Recherche exploratoire : Léa s’informe sur les facteurs d'érosion

      Il s’agit de se familiariser avec un sujet qu’on ne connaît pas bien, d’enrichir notre compréhension. L’objectif est de mieux comprendre, d’acquérir les connaissances de base nécessaires pour appréhender un sujet.

      À ce stade, il n’est pas encore question de construire un plan, mais seulement d’aborder le sujet avec ouverture et objectivité. 

    • Débrief

      Attention, quand le prompt n’est pas assez défini, on laisse une marge d’interprétation à l’outil d’IA. C’est là qu’il peut y avoir un résultat décevant (voir nugget sur les bases du prompt et les techniques avancées).

      Toujours se demander : ma question a-t-elle été bien posée ? Quelles sont les bonnes questions à se poser pour évaluer la réponse de l’IAG ?

      Il est possible de donner à l’IA des critères d’évaluation de l’information. Par exemple, ne pas prendre les résultats de blogs, de réseaux sociaux, de forums etc…

      Exemple : prompt imprécis 

      Ici, le prompt pousse l'IA à donner une réponse dont le degré de fiabilité sera très faible, ce qui va engendrer des hallucinations. Ceci est dû au fait que pour entraîner un LLM, on lui donne une seule consigne : donner la réponse la plus probable. L'IA ne peut pas dire "cela n'existe pas".

      Dans le prompt ci-dessous, demander un article "très cité" est trop vague (le plus cité ? dans les 10 les plus cités ?). L'IA génère une réponse avec un exemple d’une référence qui semble correcte à première vue. Mais quand on clique sur le lien (DOI), c’est un article sur un tout autre thème qui s’ouvre.

    • À retenir
      • La recherche exploratoire est le point fort des IA : elles peuvent aider à structurer une pensée, identifier des concepts-clés et trouver des pistes de lecture.
      • Mais les chiffres, données et références doivent systématiquement être vérifiés dans les sources originales.
      • Risque si tous les étudiants utilisent le même prompt, que les mémoires se ressemblent tous : la valeur du travail vient de la lecture critique et de l'approfondissement.
      • Éviter de suivre à ce stade le plan proposé par l’IA, car cela court-circuite le processus de réflexion personnelle. La recherche exploratoire sert justement à se poser des questions, faire des liens et construire sa propre problématique.
    • 3. Recherche bibliographique : Léa prépare sa bibliographie

      La recherche systématique vise à identifier de façon méthodique, rigoureuse, transparente et reproductible l'ensemble des travaux scientifiques pertinents sur un sujet. 

    • Débrief

      L’IA ne peut pas proposer de façon sûre les articles les plus cités. Elle peut se tromper sur le nom des auteurs, de la revue... Par contre, elle peut aider à écrire des requêtes complexes, pour chercher ensuite dans des bases de données traditionnelles. Elle permet aussi d’identifier des axes de recherche peu explorés et donc de trouver de nouveaux sujets de recherche pertinents, ce qui est utile aussi pour organiser sa veille.

      Exemple : recherche d'un article de référence sur Web of Science comparé à ChatGPT

      Il subsiste aussi un problème d’intégrité par rapport aux citations. Même quand l’IA cite les sources, le paragraphe où elles sont citées ne dit pas forcément la même chose que ce qu’il y a dans les sources. Or, ne pas attribuer correctement les idées à leurs auteurs est assimilable à une fraude : 

      « Sans une vérification scrupuleuse des textes produits par l’IA, il y a un risque de reproduction d’informations imprécises ou incorrectes, et d’attribution de certaines idées à de faux auteurs, ce qui constitue une fraude passible de sanctions. » (Source : Lab&Doc).

      Enfin, l'IA souffre d'un manque de transparence et de reproductibilité. L’impossibilité de reproduire à l’identique une recherche documentaire limite la confiance que l’on peut accorder à l’IA. Surtout dans des domaines sensibles comme la recherche scientifique.

      Pour l’instant au moins, les IAG sont à utiliser en complément des outils de recherche classiques (moteurs de recherche, bases de données…). 

    • À retenir
      • Pour la recherche systématique, l’IA ne doit pas être utilisée pour générer des listes de références bibliographiques : le risque d'hallucination est encore trop élevé.
      • En revanche, elle peut aider à construire des équations de recherche pour les bases de données scientifiques.
      • L'exhaustivité, la transparence et la reproductibilité sont des exigences incompatibles avec le fonctionnement des IA génératives généralistes actuelles.
      • D'autres outils plus académiques (RAG) existent, mais sont encore insuffisants pour une recherche bibliographique exhaustive.
      • On peut utiliser l’IA pour s’aider à condition d'avoir bien lu et vérifié les sources que l’IA propose spontanément ou que l’on a demandées. L’IA ne doit pas se substituer à un travail critique des sources.
  • Quel que soit le type de recherche documentaire, l’évaluation des sources reste une priorité absolue. Si vous utilisez des sources proposées par l’IA, il est essentiel de les évaluer. Voici une checklist pour vous y aider.

    • Checklist d'évaluation de l'IA