Graph RAG avec LightRAG : structurer la connaissance
Pourquoi et comment utiliser LightRAG pour relier concepts et acteurs — au-delà du RAG vectoriel classique.
Le RAG vectoriel cherche des passages similaires. Le Graph RAG modélise aussi les relations entre entités — idéal pour la veille IA où OpenAI, GPT-5, régulation et agents forment un réseau.
RAG vectoriel vs Graph RAG
| Approche | Force | Limite |
|---|---|---|
| Vectoriel | Similarité sémantique rapide | Peu de raisonnement relationnel |
| Graphe | Traversée entité → relation → entité | Coût d’indexation plus élevé |
LightRAG combine les deux : extraction d’entités/relations + retrieval hybride.
Déploiement LightRAG
Sur AI-Automate, LightRAG tourne en Docker (:9621), exposé via nginx sous /graph-rag/.
Étapes :
- Ingérer des documents (wiki Markdown, articles veille).
- Laisser LightRAG extraire nœuds et arêtes.
- Interroger en langage naturel — le graphe enrichit le contexte LLM.
Alimenter le graphe
Sources efficaces :
- articles de veille datés ;
- fiches glossaire (concepts + acteurs) ;
- notes wiki avec liens explicites.
Fréquence : ré-ingestion après chaque batch de contenu nouveau (pipeline Hermes).
Cas d’usage concrets
- Glossaire auto-enrichi : nouvel acteur détecté dans la veille → fiche liée aux concepts existants.
- Neo / assistant portail : réponses ancrées dans le graphe, pas seulement dans le dernier article.
- Questions relationnelles : « Quel lien entre MCP et les agents autonomes ? »
Bonnes pratiques
- Nommer les entités de façon stable (éviter « Open AI » vs « OpenAI »).
- Dédoublonner après import.
- Surveiller la taille du graphe ; archiver les nœuds obsolètes.
- Combiner avec RAG vectoriel sur les citations longues (articles complets).
Ressources
- LightRAG sur GitHub
- Glossaire AI-Automate : 150+ définitions
- Guide RAG de base : Mettre en place un RAG