Mode visiteur Parcours public

IA-04

Comprendre l’IA générative et les LLM

Bases de l’IA · Débutant

Disponible

Rafiq IA Lab

IA-04 — Comprendre l'IA générative et les LLM

---

1. Titre du module

IA-04 — Comprendre l'IA générative et les LLM

Partie 1 — Comprendre les bases de l'intelligence artificielle

---

2. Objectif pédagogique

À la fin de ce module, l'apprenant doit être capable de :

  • définir l'IA générative et lister ce qu'elle peut produire (texte, image, audio, code…) ;
  • expliquer ce qu'est un LLM (Large Language Model) et ce que signifie ce terme ;
  • comprendre, simplement, le fonctionnement d'un LLM : tokens, prédiction du mot suivant, contexte, fenêtre de contexte ;
  • distinguer un LLM d'un chatbot classique à base de règles ;
  • citer les grandes familles de modèles (GPT, Claude, Gemini, Mistral, LLaMA, Qwen, Gemma…) ;
  • identifier des cas d'usage IT réalistes ;
  • comprendre les limites majeures : hallucinations, réponses plausibles mais fausses, dépendance au contexte, absence d'accès automatique à la vérité.

Prérequis : avoir suivi IA-01 (IA / ML / DL), IA-02 (vocabulaire ML) et IA-03 (Deep Learning, réseaux de neurones, « boîte noire »).

---

3. Niveau

Débutant.

C'est le module le plus directement utile au quotidien : il prépare toute la Partie 2 (utiliser efficacement les assistants IA). Aucune compétence technique préalable n'est nécessaire.

---

4. Durée estimée

Activité Durée indicative
Lecture du cours 45 à 55 minutes
Exemples + cas pratique guidé 25 minutes
Exercice à faire seul 15 minutes
Quiz + flashcards de révision 20 minutes
Mini-projet de fin de module 30 minutes
Total réaliste environ 2h15

---

5. Résumé clair et simple

L'IA générative est une forme d'IA capable de créer du contenu nouveau : du texte, des images, du son, de la vidéo, du code, des résumés, des tableaux, des plans d'action. Elle ne se contente pas de classer ou de prédire une catégorie (comme dans les modules précédents) : elle produit.

Quand cette IA générative s'applique au langage, on parle de LLM, pour Large Language Model (« grand modèle de langage »). C'est la technologie derrière ChatGPT, Claude, Gemini ou Mistral. Un LLM est un très grand réseau de neurones profond (rappel IA-03), entraîné sur d'immenses quantités de texte.

Son principe de base est plus simple qu'il n'y paraît : un LLM prédit le mot (ou morceau de mot) le plus probable pour continuer un texte, encore et encore. Il découpe le texte en petites unités appelées tokens, et il s'appuie sur tout ce qui précède — le contexte — pour deviner la suite la plus plausible.

C'est exactement là qu'est le piège le plus important du parcours : un LLM cherche le texte le plus probable, pas le texte le plus vrai. Il peut donc produire une réponse parfaitement fluide, crédible… et fausse. On appelle cela une hallucination. Un LLM n'a pas d'accès automatique à la vérité et ne « sait » pas quand il se trompe.

D'où le réflexe central, déjà vu et confirmé ici : toujours vérifier. Les risques, la confidentialité et la sécurité des données sont approfondis au module IA-17 ; les méthodes pour bien formuler ses demandes (prompts) et fiabiliser les réponses sont l'objet des modules IA-07 à IA-09.

---

6. Compétences visées

À l'issue de ce module, l'apprenant saura :

  • définir l'IA générative et donner des exemples de contenus produits ;
  • expliquer ce qu'est un LLM et le relier au Deep Learning ;
  • décrire le fonctionnement « prédiction du mot suivant » et le rôle du contexte ;
  • expliquer ce que sont les tokens et la fenêtre de contexte, et pourquoi ils comptent ;
  • distinguer un LLM d'un chatbot à règles ;
  • situer les grandes familles de modèles ;
  • repérer des cas d'usage IT pertinents et leurs limites ;
  • expliquer ce qu'est une hallucination et pourquoi la vérification humaine est obligatoire.

---

7. Notions clés à comprendre

  • IA générative : IA qui produit du contenu nouveau (texte, image, audio, vidéo, code…).
  • LLM (Large Language Model) : grand modèle de langage ; réseau de neurones profond entraîné sur d'énormes volumes de texte pour traiter et générer du langage.
  • Token : petite unité de texte (un mot, un morceau de mot, un signe). Les LLM travaillent en tokens, pas en mots entiers.
  • Prédiction du mot suivant : mécanisme de base d'un LLM, qui choisit la continuation la plus probable, token après token.
  • Contexte : l'ensemble du texte fourni (votre question + l'échange) sur lequel le modèle s'appuie pour répondre.
  • Fenêtre de contexte : la quantité maximale de texte (en tokens) que le modèle peut prendre en compte à la fois.
  • Probabilité : le LLM produit le texte le plus probable, pas forcément le plus vrai.
  • Hallucination : réponse plausible mais fausse, présentée avec assurance.
  • Chatbot classique (à règles) : programme qui répond selon des règles ou des scénarios prédéfinis, sans apprentissage du langage.
  • Multimodal : capable de traiter plusieurs types d'entrées/sorties (texte, image, son…), rappel de IA-01.

---

8. Cours complet structuré

8.1 — Qu'est-ce que l'IA générative ?

L'IA générative est une catégorie d'IA dont le but est de créer du contenu, et non plus seulement de classer ou de prédire une étiquette.

Rappel des modules précédents : en IA-02, un modèle disait « ce mail est un spam » (une catégorie). En IA générative, le modèle produit quelque chose de nouveau : un paragraphe, une image, un bout de code.

Ce qu'une IA générative peut produire, selon les outils :

  • du texte (réponses, articles, e-mails, explications) ;
  • des images ;
  • de l'audio (voix synthétique, sons) ;
  • de la vidéo ;
  • du code ;
  • de la documentation technique ;
  • des résumés de documents longs ;
  • des tableaux structurés ;
  • des plans d'action ou des checklists.

La plupart des outils grand public reposent sur le Deep Learning (rappel IA-03), et beaucoup sont aujourd'hui multimodaux (rappel IA-01) : ils acceptent et produisent plusieurs types de contenu.

8.2 — Qu'est-ce qu'un LLM ?

LLM signifie Large Language Model, soit « grand modèle de langage ». C'est l'IA générative appliquée au langage.

Décortiquons le terme :

  • Large : « grand » — le modèle a énormément de paramètres et a été entraîné sur d'immenses quantités de texte.
  • Language : il traite le langage (le texte).
  • Model : c'est un modèle au sens de IA-02 (le résultat d'un entraînement).

Un LLM est donc un très grand réseau de neurones profond (IA-03) qui a « lu » d'énormes corpus de texte et qui a appris à manipuler le langage. C'est la brique derrière ChatGPT, Claude, Gemini, Mistral, etc.

Important : un LLM ne contient pas une base de données de faits qu'il « consulterait ». Il a appris des régularités statistiques du langage. C'est pourquoi il peut être très éloquent tout en se trompant sur un fait précis.

8.3 — Comment fonctionne un LLM (en simple)

Le principe fondamental tient en une phrase : un LLM prédit, encore et encore, la suite la plus probable d'un texte.

Étape par étape, simplifié :

  1. Vous écrivez une question (un « prompt »).
  2. Le modèle découpe le texte en tokens (petites unités).
  3. À partir de tout le contexte, il calcule quel token est le plus probable ensuite.
  4. Il ajoute ce token, puis recommence pour le suivant, et ainsi de suite.
  5. Le résultat est une réponse fluide, construite token après token.

Les tokens. Un token n'est pas toujours un mot entier. Par exemple, « administrateur » peut être découpé en plusieurs tokens. Retenez surtout que les LLM raisonnent en tokens, et que la longueur des échanges se mesure en tokens (ce qui a un impact sur les coûts et les limites — voir IA-19 sur les API IA).

Le contexte. Le modèle s'appuie sur tout le texte fourni (votre question et l'historique de l'échange). Mieux vous décrivez le contexte, meilleure est la réponse — c'est la base du prompt engineering (IA-07, IA-08).

La fenêtre de contexte. C'est la quantité maximale de texte que le modèle peut prendre en compte d'un coup. Au-delà, le modèle « oublie » le début. C'est pourquoi, dans une très longue conversation ou un très long document, des informations du début peuvent être perdues.

Analogie. Imaginez quelqu'un qui complète une phrase en choisissant à chaque fois le mot le plus naturel, en se basant sur tout ce qui a été dit avant — mais avec une mémoire de travail limitée (la fenêtre de contexte). Il sera souvent juste et fluide, mais rien ne garantit qu'il dise la vérité : il vise le plausible, pas le vrai.

8.4 — Probabilité ≠ vérité : la clé du module

C'est le point le plus important. Un LLM optimise la plausibilité linguistique, pas l'exactitude factuelle.

Conséquences directes :

  • il peut écrire une réponse parfaitement crédible et pourtant fausse ;
  • il peut inventer des références, des commandes, des chiffres, des citations (une hallucination) ;
  • il n'a pas, par défaut, d'accès automatique à la vérité ni aux informations récentes (sauf outil de recherche connecté) ;
  • il ne « sait » pas qu'il a tort : il n'a pas de mécanisme interne de doute fiable.

C'est exactement pour cela que ce parcours répète, module après module : une réponse d'IA est un point de départ à vérifier, pas une vérité. Les méthodes de vérification sont détaillées en IA-09, et les risques/confidentialité en IA-17.

8.5 — LLM vs chatbot classique

On confond souvent les deux. Pourtant :

Chatbot classique (à règles) LLM (modèle de langage)
Fonctionnement Règles et scénarios prédéfinis Apprentissage statistique du langage
Souplesse Faible : ne sort pas des scénarios prévus Élevée : répond à des formulations variées
Réponses Toujours les mêmes pour un cas donné Variables, formulées à la volée
Risque principal Ne comprend pas la demande hors script Peut répondre… faux (hallucination)
Exemple Menu « tapez 1 pour… » d'un service client ChatGPT, Claude, Gemini

Un chatbot classique est prévisible mais rigide ; un LLM est souple mais faillible. Beaucoup d'outils modernes combinent les deux : un cadre à règles qui encadre un LLM.

8.6 — Les grandes familles de modèles

Quelques familles de LLM répandues (liste non exhaustive, qui évolue vite) :

  • GPT (OpenAI) — derrière ChatGPT.
  • Claude (Anthropic).
  • Gemini (Google).
  • Mistral (Mistral AI, acteur français), avec des modèles ouverts.
  • LLaMA (Meta), modèles ouverts très utilisés.
  • Qwen (Alibaba), modèles ouverts.
  • Gemma (Google), modèles ouverts légers.
  • Phi (Microsoft), petits modèles.

On distingue souvent les modèles propriétaires (accessibles surtout via une interface ou une API, comme GPT, Claude, Gemini) et les modèles ouverts (téléchargeables et exécutables localement, comme LLaMA, Mistral, Qwen, Gemma) — sujet de l'IA locale, approfondi au module IA-15.

Le paysage des modèles change très vite : versions, performances et disponibilités évoluent en permanence. Pour des informations à jour, il faut consulter les sources officielles des éditeurs au moment voulu.

8.7 — Cas d'usage dans le monde IT

Les LLM sont utiles pour de nombreuses tâches IT (toutes approfondies en Partie 2 et Partie 3) :

  • expliquer un message d'erreur, une commande, un concept ;
  • rédiger une procédure, un compte rendu, un e-mail ;
  • résumer un long document ou un fil de tickets ;
  • reformuler un ticket support de façon claire ;
  • proposer un brouillon de script (à comprendre et tester, voir IA-11) ;
  • brainstormer des pistes de diagnostic ;
  • traduire une documentation technique ;
  • structurer des notes en tableau ou en checklist.

Le LLM fait gagner du temps sur la mise en forme, l'explication et la première ébauche. Il ne remplace ni l'expertise, ni les tests, ni la vérification.

8.8 — Les limites des LLM (synthèse)

  • Hallucinations : réponses fausses mais plausibles, parfois avec des détails inventés.
  • Erreurs techniques : commandes, chemins ou paramètres incorrects.
  • Pas d'accès automatique à la vérité ni aux faits récents (sauf recherche connectée).
  • Dépendance au contexte : sans informations précises, le modèle généralise et peut se tromper.
  • Fenêtre de contexte limitée : il peut « oublier » le début d'un long échange.
  • Sensibilité à la formulation : une question floue donne une réponse floue (d'où le prompt engineering).
  • Confiance trompeuse : un ton assuré ne garantit rien.
  • Faible explicabilité : héritée du Deep Learning (« boîte noire », IA-03).

Ces limites n'enlèvent rien à l'utilité des LLM ; elles définissent un mode d'emploi responsable, que toute la suite du parcours va outiller.

---

9. Exemples concrets liés au monde IT

  1. Expliquer une erreur Linux. Vous collez (après anonymisation) un message d'erreur et demandez ce qu'il signifie. Le LLM propose une explication claire — à confirmer dans la documentation officielle et par un test.
  2. Rédiger une procédure. À partir de notes brutes, le LLM produit une procédure structurée. Vous vérifiez les commandes, les chemins et les versions (rappel : il peut en inventer).
  3. Résumer un fil de tickets. Le LLM condense 30 échanges en un résumé. Utile, mais à relire pour éviter qu'un détail important soit déformé.
  4. Brouillon de script PowerShell. Le LLM propose un script ; vous le lisez ligne par ligne, le comprenez et le testez en lab avant tout usage réel (voir IA-11).
  5. Traduire une doc technique. Pratique, mais les termes spécialisés sont parfois mal traduits : à recouper.
  6. Reformuler un message au client. Le LLM clarifie un message technique. Vous gardez la responsabilité du fond et de l'exactitude.
  7. Hallucination en situation réelle. Vous demandez « quelle commande pour faire X sur tel outil ? » et le LLM invente une option qui n'existe pas. Sans vérification, vous perdez du temps — ou pire, vous appliquez une mauvaise commande.

Schéma constant du parcours : le LLM assiste et accélère ; l'humain vérifie, teste et décide.

---

10. Cas pratique guidé

Objectif : observer concrètement la différence entre « plausible » et « vrai », et acquérir le réflexe de vérification.

Contexte. Vous utilisez un assistant IA pour vous aider sur une tâche IT. Vous allez apprendre à traiter sa réponse comme une hypothèse.

Étape 1 — Poser une question vague, puis précise. Comparez mentalement (ou en testant) deux formulations :

  • Vague : « Comment réparer le réseau ? »
  • Précise : « Sur un poste Windows 11, je n'ai plus d'accès Internet alors que les autres postes du même réseau fonctionnent. Donne-moi des hypothèses classées par probabilité et les commandes pour les vérifier. »
  • La seconde donne une réponse bien plus exploitable : c'est l'effet du contexte (8.3).

Étape 2 — Repérer les éléments à vérifier. Dans la réponse, surlignez tout ce qui est factuel et vérifiable : noms de commandes, options, chemins, valeurs. Ce sont les candidats aux hallucinations.

Étape 3 — Vérifier au moins un élément. Prenez une commande proposée et vérifiez-la : documentation officielle, aide intégrée (--help), ou test en environnement isolé. Notez si elle est exacte, approximative ou inventée.

Étape 4 — Tester l'effet « fenêtre de contexte ». Dans une conversation longue, donnez une information au début (ex. « le serveur s'appelle SRV-01 »), puis posez beaucoup d'autres questions, et enfin redemandez quelque chose lié à cette info. Observez si le modèle l'a « gardée » ou « oubliée ».

Étape 5 — Conclure. Rédigez 3 phrases : (1) ce que le contexte a changé dans la qualité de la réponse, (2) un élément que vous avez dû vérifier, (3) ce que vous retenez sur « plausible ≠ vrai ».

Résultat du cas pratique : vous savez formuler une demande riche en contexte, repérer les éléments à vérifier et constater par vous-même les limites d'un LLM.

---

11. Exercice pratique à faire seul

Consigne. Choisissez une tâche IT simple (ex. expliquer une commande, rédiger une mini-procédure, résumer un texte). Rédigez deux versions de votre demande à un assistant IA : une version pauvre en contexte et une version riche en contexte (rôle, situation, format attendu, contraintes). Puis listez 3 éléments de la réponse que vous devriez vérifier avant de les utiliser.

Contexte. Vous préparez le terrain pour la Partie 2 (prompt engineering) en prenant conscience du rôle du contexte et de la vérification.

Résultat attendu. Les deux formulations + une liste de 3 points à vérifier + une phrase expliquant pourquoi un ton assuré ne suffit pas à faire confiance.

Critères de réussite :

  • la version « riche » apporte un contexte clair et un format attendu ;
  • les 3 points à vérifier sont des éléments factuels (commandes, valeurs, références) ;
  • vous reliez explicitement le risque d'erreur à la notion d'hallucination et de « probabilité ≠ vérité » ;
  • vous mentionnez au moins une méthode de vérification concrète (doc officielle, test en lab…).

---

12. Quiz de 10 questions QCM

Une seule bonne réponse par question.

Q1. L'IA générative se distingue par sa capacité à :

  • A. Seulement classer des données
  • B. Créer du contenu nouveau (texte, image, code…)
  • C. Remplacer le matériel informatique
  • D. Garantir des réponses toujours vraies

Q2. Que signifie LLM ?

  • A. Large Logic Machine
  • B. Long Language Method
  • C. Large Language Model
  • D. Local Learning Module

Q3. Quel est le mécanisme de base d'un LLM ?

  • A. Consulter une base de données de faits vérifiés
  • B. Prédire la suite la plus probable d'un texte, token après token
  • C. Copier des phrases existantes à l'identique
  • D. Suivre des règles écrites à la main

Q4. Qu'est-ce qu'un token ?

  • A. Un mot de passe
  • B. Une petite unité de texte traitée par le modèle
  • C. Une clé API
  • D. Un type de réseau de neurones

Q5. La « fenêtre de contexte » désigne :

  • A. La quantité maximale de texte que le modèle peut prendre en compte à la fois
  • B. La fenêtre du navigateur
  • C. Le temps de réponse
  • D. Le nombre de modèles disponibles

Q6. Qu'est-ce qu'une hallucination d'un LLM ?

  • A. Une panne du serveur
  • B. Une réponse plausible mais fausse, présentée avec assurance
  • C. Une image générée
  • D. Une mise à jour du modèle

Q7. Pourquoi un LLM peut-il se tromper tout en paraissant sûr de lui ?

  • A. Parce qu'il vise le texte le plus probable, pas le plus vrai
  • B. Parce qu'il est toujours connecté à Internet
  • C. Parce qu'il ment volontairement
  • D. Parce qu'il manque de mémoire vive

Q8. Quelle est une différence clé entre un LLM et un chatbot classique à règles ?

  • A. Le chatbot classique apprend le langage tout seul
  • B. Le LLM répond de façon souple à des formulations variées, mais peut se tromper
  • C. Le LLM ne peut traiter qu'un seul scénario
  • D. Il n'y a aucune différence

Q9. Parmi ces noms, lesquels sont des familles de modèles de langage ?

  • A. GPT, Claude, Gemini, Mistral
  • B. Apache, Nginx, IIS
  • C. Windows, Linux, macOS
  • D. Docker, Kubernetes, Ansible

Q10. Quelle est la bonne attitude face à une réponse d'un LLM sur un point technique ?

  • A. L'appliquer immédiatement en production
  • B. La traiter comme une hypothèse à vérifier (doc officielle, test en lab)
  • C. La croire car le ton est assuré
  • D. Ne jamais utiliser de LLM

---

13. Réponses corrigées du quiz avec explications

Q1 → B. L'IA générative crée du contenu nouveau. A décrit les modèles « classants » (IA-02), C est hors sujet, D est faux (aucune garantie de vérité).

Q2 → C. LLM = Large Language Model (grand modèle de langage). Les autres propositions sont des inventions.

Q3 → B. Le LLM prédit le token suivant le plus probable, de façon répétée. A est faux (il ne consulte pas une base de faits), C est faux (il génère, il ne recopie pas), D décrit un chatbot à règles.

Q4 → B. Un token est une petite unité de texte (mot, morceau de mot, signe). A, C et D confondent avec d'autres notions.

Q5 → A. La fenêtre de contexte est la quantité maximale de texte prise en compte à la fois. Les autres réponses sont hors sujet.

Q6 → B. Une hallucination est une réponse plausible mais fausse, énoncée avec assurance. A, C et D ne correspondent pas.

Q7 → A. Le LLM optimise la plausibilité du texte, pas sa vérité ; il peut donc être fluide et faux. B, C et D sont incorrects (il ne « ment » pas au sens humain, et n'est pas toujours connecté).

Q8 → B. Le LLM est souple mais faillible ; le chatbot classique est rigide mais prévisible. A est inversé, C est faux, D est faux.

Q9 → A. GPT, Claude, Gemini, Mistral sont des familles de LLM. B liste des serveurs web, C des systèmes d'exploitation, D des outils DevOps.

Q10 → B. On traite la réponse comme une hypothèse à vérifier. A et C sont dangereux ; D est excessif (le LLM reste utile, à condition de vérifier).

Barème indicatif : 8/10 ou plus = notions acquises. 5 à 7 = relisez les sections 8.3 et 8.4. Moins de 5 = reprenez le cours, en insistant sur « probabilité ≠ vérité ».

---

14. Flashcards de révision

Carte 1 Q : Qu'est-ce que l'IA générative ? R : Une IA qui crée du contenu nouveau : texte, image, audio, vidéo, code, etc.

Carte 2 Q : Que signifie LLM ? R : Large Language Model — grand modèle de langage.

Carte 3 Q : Sur quelle technologie repose un LLM ? R : Un très grand réseau de neurones profond (Deep Learning), entraîné sur d'immenses volumes de texte.

Carte 4 Q : Quel est le mécanisme de base d'un LLM ? R : Prédire la suite la plus probable d'un texte, token après token.

Carte 5 Q : Qu'est-ce qu'un token ? R : Une petite unité de texte (mot, morceau de mot, signe) traitée par le modèle.

Carte 6 Q : Qu'est-ce que le contexte ? R : Tout le texte fourni (question + échange) sur lequel le modèle s'appuie pour répondre.

Carte 7 Q : Qu'est-ce que la fenêtre de contexte ? R : La quantité maximale de texte (en tokens) que le modèle peut prendre en compte à la fois.

Carte 8 Q : Probabilité ou vérité : que vise un LLM ? R : La plausibilité (le texte le plus probable), pas la vérité.

Carte 9 Q : Qu'est-ce qu'une hallucination ? R : Une réponse plausible mais fausse, présentée avec assurance.

Carte 10 Q : LLM vs chatbot classique ? R : Le LLM est souple mais faillible ; le chatbot à règles est rigide mais prévisible.

Carte 11 Q : Cite quatre familles de LLM. R : GPT, Claude, Gemini, Mistral (aussi LLaMA, Qwen, Gemma…).

Carte 12 Q : Que faire d'une réponse de LLM sur un point technique ? R : La traiter comme une hypothèse à vérifier (doc officielle, test en lab).

---

15. Erreurs fréquentes

  • Croire que le LLM « sait » la vérité. Il produit du plausible, pas du vrai.
  • Faire confiance au ton assuré. L'assurance d'une réponse ne dit rien de son exactitude.
  • Donner trop peu de contexte. Une demande vague donne une réponse vague ou inventée.
  • Oublier la fenêtre de contexte. Dans un long échange, le modèle peut « oublier » le début.
  • Confondre LLM et moteur de recherche. Par défaut, un LLM n'accède pas aux faits récents ni à des sources vérifiées.
  • Appliquer une commande générée sans la comprendre ni la tester (danger réel, voir IA-11).
  • Confondre IA générative et Deep Learning. L'IA générative utilise le Deep Learning, ce n'est pas un synonyme.
  • Coller des données sensibles dans un outil cloud (mots de passe, données personnelles) — voir IA-17.

---

16. Bonnes pratiques

  • Donner du contexte : rôle, situation, format attendu, contraintes (préparation au prompt engineering, IA-07/IA-08).
  • Traiter chaque réponse comme une hypothèse à valider, surtout les éléments factuels.
  • Vérifier les commandes, chemins, valeurs et références à une source fiable.
  • Tester en environnement isolé avant tout usage réel.
  • Surveiller les conversations longues et rappeler au besoin les informations clés (fenêtre de contexte).
  • Ne jamais transmettre de données sensibles à un service cloud sans précaution (IA-17).
  • Comprendre la différence entre un LLM et un moteur de recherche : pour des faits récents, privilégier une source à jour ou un outil de recherche connecté.

---

17. Point vigilance : limites, risques, sécurité et vérification humaine

Bloc obligatoire à lire attentivement.

Ce qu'il faut vérifier :

  • tout élément factuel d'une réponse (commande, option, chemin, valeur, référence, date) ;
  • l'adéquation de la réponse à votre contexte réel ;
  • la fraîcheur de l'information (un LLM n'a pas, par défaut, accès aux faits récents).

Ce qu'il ne faut pas faire :

  • prendre une réponse fluide pour une vérité ;
  • appliquer une commande générée sans la comprendre ni la tester ;
  • coller dans un outil cloud des secrets (mots de passe, clés API, tokens) ou des données personnelles/sensibles.

Risques de mauvaise utilisation :

  • erreurs techniques appliquées en production à cause d'une hallucination ;
  • diffusion d'une information fausse présentée comme vraie ;
  • décisions importantes fondées sur une réponse non vérifiée.

Risques de confidentialité :

  • les données saisies peuvent être traitées par un service externe ;
  • l'usage de données personnelles est encadré par le RGPD. Ces aspects (hallucinations, biais, données sensibles, RGPD, éthique, confidentialité) sont approfondis au module IA-17.

Limites des LLM :

  • ils visent le plausible, pas le vrai ;
  • ils n'ont pas d'accès automatique à la vérité ni aux faits récents ;
  • leur fenêtre de contexte est limitée ;
  • ils sont peu explicables (« boîte noire », IA-03).

Cas où une validation humaine est indispensable :

  • toute action technique sur un système réel (surtout en production) ;
  • toute information destinée à un client ou à un document officiel ;
  • toute décision touchant la sécurité, les personnes, l'argent ou la conformité.

Principe à retenir : un LLM propose une réponse probable ; l'humain vérifie et reste responsable. Les méthodes pour bien formuler (IA-07, IA-08) et pour fiabiliser (IA-09) sont l'objet de la Partie 2.

---

18. Mini-projet de fin de module

Titre : « Mon mode d'emploi personnel des LLM »

Objectif. Synthétiser le module en une fiche pratique réutilisable, qui servira de base à toute la Partie 2.

Contexte. Vous créez votre propre « mode d'emploi » des assistants IA, à garder sous la main. Aucun outil technique requis.

Prérequis. Avoir lu le cours (section 8) et fait le quiz.

Étapes :

  1. Définir, avec vos mots, l'IA générative et un LLM (3 phrases maximum).
  2. Expliquer en une phrase le mécanisme « prédiction du mot suivant » et pourquoi « probabilité ≠ vérité ».
  3. Lister 5 cas d'usage IT où vous comptez utiliser un LLM.
  4. Pour chacun, indiquer ce qu'il faudra vérifier (commande, valeur, référence…).
  5. Rédiger 3 règles personnelles de sécurité (ex. ne jamais coller de mot de passe, anonymiser les logs, tester en lab — renvoi IA-17).
  6. Noter une limite que vous avez vraiment comprise et un exemple concret d'hallucination possible.

Résultat attendu. Une fiche d'une page, claire et personnelle, prête à être réutilisée.

Critères de réussite :

  • les définitions sont justes et exprimées avec vos mots ;
  • le lien « probabilité ≠ vérité » est explicite ;
  • les 5 cas d'usage sont accompagnés d'un point de vérification chacun ;
  • les 3 règles de sécurité sont concrètes ;
  • une limite est illustrée par un exemple réaliste.

Amélioration possible. Transformez vos 3 règles de sécurité en une mini-affiche à partager avec votre équipe — premier pas vers la charte IA interne (vue plus tard en Partie 4).

---

19. Ressources gratuites recommandées

Ne recommander que des ressources gratuites ou accessibles gratuitement. Toute ressource dont la gratuité ou la disponibilité n'est pas certaine est signalée par la mention « À vérifier avant publication. »

  • « Elements of AI » (version française)course.elementsofai.com/fr/ — cours gratuit de l'Université d'Helsinki et MinnaLearn/Reaktor, utile pour consolider les bases de l'IA avant d'aborder les LLM. (Gratuit, vérifié.)
  • « Objectif IA : initiez-vous à l'intelligence artificielle » (OpenClassrooms)openclassrooms.com/fr/courses/6417031-objectif-ia-initiez-vous-a-l-intelligence-artificielle — MOOC francophone gratuit ; aborde notamment ChatGPT et l'IA générative. (Gratuit, vérifié ; un compte gratuit peut être demandé.)
  • Documentation officielle des éditeurs (OpenAI, Anthropic, Google, Mistral) — pages d'aide gratuites pour comprendre les capacités et limites des modèles. Indispensable pour des informations à jour, car le paysage évolue vite. À vérifier avant publication (liens et contenus changent souvent).
  • Wikipédia (articles « Grand modèle de langage » et « Intelligence artificielle générative ») — bon panorama des notions, à recouper. (Gratuit.)
  • France Université Numérique (FUN-MOOC)fun-mooc.fr — propose régulièrement des MOOC gratuits sur l'IA et le traitement du langage. À vérifier avant publication (sessions ouvertes variables).

Remarque : ce module ne promet aucune certification. Ces ressources sont des compléments d'apprentissage.

---

20. Résumé final du module

  • L'IA générative crée du contenu nouveau (texte, image, audio, vidéo, code, résumés, tableaux, plans).
  • Un LLM (Large Language Model) est l'IA générative appliquée au langage : un très grand réseau de neurones profond (rappel IA-03).
  • Mécanisme de base : prédire le token suivant le plus probable, en s'appuyant sur le contexte, dans la limite de la fenêtre de contexte.
  • Point capital : un LLM vise le plausible, pas le vrai. Il peut halluciner, n'a pas d'accès automatique à la vérité, et ne « sait » pas qu'il se trompe.
  • Un LLM est souple mais faillible ; un chatbot classique est rigide mais prévisible.
  • Familles de modèles : GPT, Claude, Gemini, Mistral, LLaMA, Qwen, Gemma… (propriétaires ou ouverts ; l'IA locale est vue en IA-15).
  • Usages IT nombreux (expliquer, rédiger, résumer, reformuler, brouillonner du code), à condition de vérifier systématiquement et de garder la validation humaine (méthodes en IA-07 à IA-09, risques en IA-17).

---

21. Validation demandée avant le module suivant

Validation demandée avant le module suivant

Souhaites-tu que je passe au module suivant ou que je corrige/améliore ce module d'abord ?

(Module suivant prévu : IA-05 — Données, entraînement, modèles et évaluation, qui clôture la Partie 1.)