Déployer une stack agentique sur VPS

Docker, nginx, SSL, Hermes, Dify, n8n et supervision — checklist pour mettre en production une stack IA auto-hébergée.

Une stack agentique en production repose sur une infra simple, observable et reproductible. Voici l’architecture AI-Automate sur VPS Hostinger.

Vue d’ensemble

Internet → nginx (:443)
  → portail.ai-automate.fr (BFF + UI)
  → /hermes/  /graph-rag/  /n8n/  /apps/ (Dify)
  → dev.ai-automate.fr (site Astro statique)

Tous les services sensibles en 127.0.0.1 ; seul nginx est exposé.

Checklist déploiement

1. Base système

  • Ubuntu LTS, utilisateur sudo, pare-feu (80/443).
  • Docker + Compose pour Hermes, Dify, LightRAG, GLPI, n8n.
  • Certbot pour SSL Let’s Encrypt.

2. Reverse proxy nginx

  • Un fichier server par domaine.
  • Headers X-Forwarded-*, timeouts adaptés aux LLM (60–120 s).
  • Redirect HTTP → HTTPS, HSTS.

3. Services IA

ServiceRôle
HermesOrchestration agents, veille, rédaction
DifyApps LLM, RAG, agents configurables
n8nWorkflows, cron, webhooks
LightRAGGraph RAG
GLPIITSM (tickets, SSO portail)

4. Site public Astro

  • Sources dans /opt/ai-automate/sites/ai-automate-astro.
  • Build : SITE_URL=https://ai-automate.fr npm run build.
  • Publish : rsync dist/ → /var/www/….

Script idempotent : deploy/scripts/deploy-ai-automate-production.sh.

5. Supervision agentique

Agent autonome qui :

  • sonde les services toutes les 30 s ;
  • envoie SMS + pré-diagnostic en moins d’une minute si anomalie ;
  • journalise pour post-mortem.

Ne pas attendre qu’un utilisateur signale la panne.

Sécurité

  • Pas d’outils admin (Dify, n8n) en public sans auth.
  • Portail = point d’entrée unique avec SSO GLPI.
  • Sauvegardes : volumes Docker, wiki, certificats.
  • Secrets dans .env, permissions 600.

MLOps léger

  • Versionner les scripts deploy dans Git.
  • Rebuild site après sync contenu Hermes (site-astro-rebuild.sh).
  • Tester sur dev.ai-automate.fr avant bascule DNS prod.

Aller plus loin