Aller au contenu

Recherche RAG

La recherche RAG est le cœur de Myeline : poser une question en langage naturel, recevoir une réponse synthétisée avec citations des sources.

Pipeline

Question utilisateur
Embedding bge-m3 (Ollama local)
ChromaDB hybrid search (RRF + MMR sur les scopes sélectionnés)
HyDE / multi-query / contextual retrieval (LLM auxiliaire)
Cross-encoder reranking (LLM auxiliaire)
Synthèse (Ollama local OU API externe BYOK selon édition)
Réponse + citations [1], [2], [3]…

L'embedding est toujours local, peu importe l'édition. La synthèse :

  • En souverain pur : Ollama local (Mistral-Nemo, Llama 3.1, Mixtral selon ce que vous hostez)
  • En souverain-hybride : Ollama local par défaut, ou bascule par organisation vers Mistral / Claude / OpenAI / Gemini avec votre clé (BYOK)

Citations

Chaque réponse cite ses sources sous forme de [1], [2], cliquables. La source affiche :

  • Titre du document ou de l'article
  • Auteur / source quand disponible
  • Date quand disponible
  • Extrait (chunk de ~500 tokens) qui a contribué à la réponse
  • Score de pertinence

Si une réponse n'a pas de citation, c'est que le LLM n'a pas trouvé de support dans les documents — soit la base ne contient pas l'information, soit votre question est trop vague.

Mode strict

Toggle dans l'interface : si activé, le LLM est forcé à ne répondre que sur la base des sources retrouvées (prompt système explicite + post-validation). Si aucune source ne couvre la question, la réponse est : « Je n'ai pas trouvé l'information dans les sources disponibles. »

Recommandé pour :

  • Recherche réglementaire / juridique
  • Recherche médicale
  • Tout contexte où une hallucination serait un risque

Single-document

Depuis la bibliothèque, cliquer sur un document ouvre un chat scopé à ce seul document. Utile pour :

  • Interroger un long rapport (« quelles sont les recommandations ? »)
  • Comparer des sections (« les conclusions de la partie 3 contredisent-elles la partie 1 ? »)
  • Extraire des données chiffrées (« quel est le CA 2024 mentionné ? »)

Conseils d'écriture

  • Questions précises > questions vagues. « Quelles sont les exceptions au consentement explicite RGPD selon l'art. 6 ? » marche mieux que « parle-moi du RGPD ».
  • Contexte : préciser le domaine si vos sources couvrent plusieurs sujets (« en droit du travail français, … »).
  • Itérer : raffiner la question en multi-tours (voir Conversations) plutôt que tout dire en une fois.

Limites connues

  • Documents > 200 pages : le chunking peut diluer les liens entre sections distantes. Préférer single-document chat avec contextual retrieval activé.
  • Tableaux complexes : extraction PDF imparfaite (limites des parseurs pdfplumber/docx). Préférer un export CSV quand possible.
  • Langues mixtes dans une même base : bge-m3 est multilingue (100+ langues), mais la qualité de retrieval dégrade quand FR et EN se mélangent dans une même question.