Aller au contenu

Quotas et plans

En éditions on-prem (souverain et souverain-hybride), la licence couvre l'opérateur — il n'y a pas de notion de plan utilisateur interne. Toutes les fonctionnalités sont activées : multi-turn, conversations, alertes, historique, single-document chat.

Les quotas existent quand même, mais comme garde-fous techniques (éviter qu'un utilisateur monopolise le serveur), pas comme levier commercial.

Quotas par défaut

Métrique Limite Périmètre
Requêtes RAG 300 / jour par utilisateur
Sources RSS / scrapers 50 / org par organisation
Documents personnels 10 GB / utilisateur par utilisateur
Connexions cloud actives 10 / utilisateur par utilisateur
Historique conversations illimité

Les valeurs sont définies dans app/services/quotas.py et peuvent être surchargées via variables d'environnement (voir Pré-requis serveur).

Surveillance

Le cron check_quotas s'exécute quotidiennement à 04:00 UTC :

  • 80 % d'usage atteint → email d'avertissement au owner de l'org
  • 100 % atteint → blocage soft (HTTP 429 jusqu'au lendemain)
  • En souverain pur, le mailer est en log-only — vérifier logs/mailer/ ou brancher un MTA interne.

Surcharge admin

Un admin global peut lever ponctuellement un quota depuis /admin/users/<id> (champ « override quota », expire après 24 h). Action tracée dans le journal d'audit.

Métriques exposées

/metrics (Prometheus) expose :

  • myeline_quota_usage{user_id, metric} (gauge)
  • myeline_rag_queries_total{user_id, status} (counter)
  • myeline_quota_blocks_total (counter)

Brancher Grafana ou votre stack obs pour les dashboards.