Technical blueprintv1.0 · 2026

Une architecture pensée pour la criticité pharma.

Microservices événementiels, 7 agents IA spécialisés orchestrés via un superviseur LLM, data lake validé GxP, knowledge graph qualité et chiffrement de bout en bout. Conçu pour passer un audit FDA sans documentation supplémentaire.

Latence p95
< 800ms
appels copilot
Disponibilité
99.95%
SLA enterprise
Scope conformité
21 CFR 11 · EU Annex 11 · GAMP 5
validé CSV
01Vue d'ensemble

Architecture modulaire event-driven, séparation stricte des plans.

5 plans découplés communiquent via un bus d'événements (Kafka). Chaque plan est indépendamment scalable, déployable et auditable. Les modèles IA n'ont jamais d'accès direct aux systèmes de production.

Layer 01
Experience
Next.js · React · Tailwind

Web app QA, copilot conversationnel, dashboards temps réel.

Layer 02
API Gateway
Kong · GraphQL Federation

AuthN/Z, rate-limit, schéma fédéré, observabilité OpenTelemetry.

Layer 03
Domain Services
Node · Python · gRPC

Bounded contexts : Deviation, CAPA, Audit, Document, Risk.

Layer 04
AI Mesh
LangGraph · vLLM · MCP

7 agents spécialisés + superviseur orchestrateur + RAG pharma.

Layer 05
Data Plane
Postgres · Iceberg · Neo4j

OLTP, data lake versionné, knowledge graph qualité, vector store.

Pattern
Event sourcing + CQRS

Toute mutation est un événement immuable signé. Reconstruction de l'état possible à n'importe quel instant — exigence ALCOA+ « Original ».

Isolation
Single-tenant par défaut

Cluster Kubernetes dédié par client pharma. Isolation réseau VPC, KMS dédié, base Postgres dédiée. Multi-tenant disponible pour offre Pilot.

Observabilité
Trace IA bout-en-bout

Chaque réponse IA porte un trace_id liant prompt, contexte RAG, modèle, tokens, coût et utilisateur. Rejouable pour audit.

02Frontend

Next.js 15 App Router, RSC pour la performance critique.

Stack
  • Next.js 15 — RSC, streaming, edge runtime
  • React 19 — Server Actions pour mutations qualité
  • TanStack Query — cache + optimistic updates
  • Zustand — état UI (filtres, modals, copilot)
  • tRPC — type-safety end-to-end
  • Tailwind + shadcn/ui — design system QA
Performance
  • • LCP < 1.2s sur dashboards 10k+ déviations (virtualisation)
  • • Streaming SSE pour copilot (token-by-token)
  • • Service Worker pour mode dégradé (lecture audit offline)
  • • CSP stricte, SRI sur tous les assets
  • • Bundle < 180KB gzip (route principale)
  • • A11y AAA — exigence audit utilisateur QA
03Backend

Domain-driven microservices, GraphQL fédéré en façade.

Chaque bounded context (Deviation, CAPA, Audit…) est un service autonome avec sa base de données. La fédération GraphQL expose un schéma unifié au frontend sans couplage.

deviation-svc
Node 22 / NestJS
Postgres + Outbox
capa-svc
Node 22 / NestJS
Postgres + Temporal
audit-svc
Python 3.13 / FastAPI
Postgres append-only
document-svc
Python / FastAPI
S3 + Postgres meta
risk-svc
Python / FastAPI
Postgres + TimescaleDB
production-svc
Go / Connect-RPC
TimescaleDB
ai-orchestrator
Python / LangGraph
Redis + Postgres
iam-svc
Node / NestJS
Postgres + Vault
Orchestration longue durée

Temporal.io pour CAPA multi-mois, escalades d'audit, workflows réglementaires. Garantit l'exécution exactly-once même en cas de crash.

Bus d'événements

Kafka + Schema Registry. Schémas Avro versionnés, compatibilité backward forcée. Topics par domaine.

API contract

GraphQL pour le frontend, gRPC inter-services, REST OpenAPI 3.1 pour partenaires ERP/LIMS.

04AI Layer

LLM + ML + RAG pharma, chacun à sa juste place.

Aucun usage générique. Chaque modèle est sélectionné, fine-tuné et évalué pour un cas d'usage précis avec garde-fous métier.

LLM
Raisonnement & rédaction
  • • Modèles frontier (Claude, GPT) pour rédaction réglementaire
  • • Modèles open (Llama, Mistral) self-hosted pour traitement sensible
  • • Routage par criticité + budget
  • • Garde-fous : Guardrails AI + Pydantic structured output
ML classique
Détection & scoring
  • Isolation Forest — anomalies process
  • XGBoost — scoring risque déviation
  • Prophet — prédiction dérive paramètres production
  • • MLflow pour tracking, registry et déploiement validé
RAG pharma
Knowledge retrieval
  • • Hybrid search : BM25 + dense (BGE-M3 fine-tuné pharma)
  • • Re-ranking Cohere Rerank
  • • Citation obligatoire — pas de réponse sans source
  • • Corpus : SOPs, ICH, FDA warning letters, historique déviations
Prompt management
Tous les prompts sont du code versionné.
Versioning

Git + tag sémantique. Aucun prompt en clair en base. Promotion via PR review QA.

Évaluation

Suite eval Promptfoo + golden set 500 cas pharma. Régression bloquante en CI.

Observabilité

Langfuse self-hosted. Trace, coût, latence, score utilisateur par prompt.

05Multi-agent system

7 agents spécialisés, un superviseur, zéro improvisation.

Orchestration via LangGraph. Le superviseur décompose, route, vérifie et compose. Chaque agent a un scope étroit, des outils MCP limités et un schéma de sortie strict.

Agent 01
Deviation Agent

Classifie, qualifie et propose investigation root cause.

Inputs

Déviation brute, contexte lot, historique 24 mois

Outputs

Catégorie GMP, criticité, hypothèses RCA pondérées, SOPs liées

Logique

ReAct + RAG SOP + Ishikawa structuré

Agent 02
CAPA Agent

Génère plan d'actions correctives/préventives mesurables.

Inputs

RCA validée, historique CAPA similaires, contraintes site

Outputs

Plan SMART, owners suggérés, KPIs efficacité, deadline

Logique

Tree-of-thoughts + lookup CAPA passées + scoring faisabilité

Agent 03
Compliance Agent

Vérifie conformité dossier vs réglementations applicables.

Inputs

Dossier qualité, marché cible, version réglementation

Outputs

Gap analysis ligne par ligne, citations 21 CFR / EU GMP

Logique

Constrained generation + matrice exigences vs preuves

Agent 04
Audit Agent

Prépare audit FDA/EMA, simule questions inspecteur.

Inputs

Périmètre audit, historique inspections industrie

Outputs

Dossier audit consolidé, Q&R simulées, gaps critiques

Logique

Multi-step planning + adversarial Q-generation

Agent 05
Document Agent

Lit, structure et indexe SOPs, BMR, BPR, certificats.

Inputs

PDF, DOCX, XML, scans (OCR)

Outputs

Document structuré JSON-LD, entités extraites, version comparée

Logique

Layout-aware parsing + LLM extraction + diff sémantique

Agent 06
Production Agent

Surveille temps réel, détecte dérives avant déviation.

Inputs

Flux IoT MES, paramètres lot, données environnement

Outputs

Alertes pré-déviation, suggestion ajustement, score risque lot

Logique

ML anomaly detection + LLM contextualisation

Agent 07
Risk Agent

Évalue risque qualité agrégé site, fournisseur, produit.

Inputs

Tous événements qualité, supply chain, audits fournisseurs

Outputs

Heatmap risque, ICH Q9 scoring, recommandations mitigation

Logique

Bayesian network + LLM synthèse exécutive

Orchestration
Supervisor pattern + Human-in-the-loop forcé

Le superviseur LangGraph décompose la requête, route vers les agents pertinents en parallèle, agrège, détecte conflits, et présente le résultat avec niveau de confiance. Toute action ayant impact qualité requiert validation humaine explicite — l'IA ne signe jamais à la place du QP.

06Data architecture

4 stores complémentaires, une seule vérité.

OLTP
PostgreSQL 16

Transactionnel : déviations, CAPA, utilisateurs. RLS multi-tenant. PITR 35j.

Data lake
Apache Iceberg + S3

Historique complet versionné, time-travel queries, format ouvert. Trino pour analytics.

Documents
S3 + chiffrement KMS

PDF, BMR, certificats. Worm/object-lock pour preuves audit. Versioning natif.

Knowledge graph
Neo4j

Liens lots ↔ matières ↔ équipements ↔ déviations ↔ CAPA. Requêtes causales sub-seconde.

Vector store
pgvector + Qdrant

Embeddings SOPs, déviations, réglementations. Hybrid search.

Time-series
TimescaleDB

Paramètres production IoT, downsampling auto, rétention 10 ans.

Cache
Redis Cluster

Sessions, rate-limit, queues légères, cache RAG re-rank.

Search
OpenSearch

Full-text BM25, agrégations, logs sécurité immuables.

07Data pipeline

De la donnée brute au signal qualité, en minutes.

01Ingestion
Kafka Connect · Airbyte · MQTT
  • APIs ERP/MES/LIMS
  • Fichiers CSV/XML/PDF
  • Streams IoT bioréacteurs
  • Webhooks partenaires
02Parsing
Unstructured.io · Tika · Layout LLM
  • OCR multilingue
  • Tableaux complexes (BMR)
  • Schémas XML SAP
  • Extraction entités GMP
03Transformation
dbt · Spark · Pandera
  • Normalisation taxonomie
  • Validation contrats schéma
  • Enrichissement référentiels
  • Scoring qualité données
04Activation
Reverse ETL · Event bus
  • Push agents IA
  • Hydratation knowledge graph
  • Indexation vector store
  • Notifications temps réel
08Sécurité & conformité

ALCOA+ par construction. Pas en couche d'audit a posteriori.

RBAC + ABAC

Rôles QA/Production/QP + attributs (site, produit, criticité). Casbin policy engine. SoD enforcée.

Audit trail immuable

Append-only ledger Postgres + miroir OpenSearch + ancrage hash quotidien. Chaque événement signé Ed25519.

Signature électronique

21 CFR Part 11 § 11.50/11.70 — double facteur, intent, raison, identité non-répudiable.

Versioning

Tout objet (SOP, déviation, prompt, modèle ML) versionné. Diff sémantique. Rollback contrôlé.

Chiffrement

TLS 1.3 in-transit · AES-256 at-rest · KMS dédié client · BYOK option · column-level pour PII patient.

ALCOA+

Attributable, Legible, Contemporaneous, Original, Accurate + Complete, Consistent, Enduring, Available.

GAMP 5 cat. 4

Validation CSV livrée : URS, FS, DS, IQ, OQ, PQ. Matrice traçabilité auto-générée.

Data residency

EU (Francfort/Paris), US (Virginia), Suisse. Aucun transfert hors juridiction sans consentement.

Certifications

SOC 2 Type II · ISO 27001 · ISO 27701 · HIPAA-ready · roadmap GxP-attested.

09Intégrations

Brancher l'existant, pas le remplacer.

ERP
SAP S/4HANA, Oracle, Microsoft Dynamics
OData · IDoc · BAPI
MES
Werum PAS-X, Körber, Rockwell, Siemens Opcenter
ISA-95 · OPC-UA · REST
LIMS
LabWare, STARLIMS, Thermo SampleManager
REST · SQL views
QMS legacy
Veeva Vault, MasterControl, TrackWise
API + connecteur certifié
DMS
SharePoint, Veeva Vault, OpenText
CMIS · Graph API
Identity
Okta, Entra ID, Ping
SAML 2.0 · OIDC · SCIM
IoT
Bioréacteurs, sondes T°/HR, balances
MQTT · OPC-UA · Modbus
Réglementaire
ICH, FDA, EMA, PMDA feeds
RSS · API · ingestion auto
10Scale & performance

De 1 site pilote à 80 sites mondiaux, sans réécriture.

Cloud foundation
  • • Multi-cloud : AWS (primaire), Azure (option pharma EU)
  • • Kubernetes (EKS/AKS) + Karpenter autoscaling
  • • Multi-AZ par défaut, multi-région pour Tier Enterprise
  • • IaC complet : Terraform + Crossplane
Patterns de scale
  • • CQRS — lecture massivement scalable (read replicas)
  • • Sharding par tenant pour Postgres > 50 sites
  • • Inférence LLM batchée (vLLM continuous batching)
  • • CDN edge pour assets et docs publics
FinOps IA
  • • Routage modèle par criticité (cascade nano → frontier)
  • • Cache sémantique (GPTCache) — 35% hit rate moyen
  • • Quotas par utilisateur + alertes coût
  • • Self-hosted vLLM pour gros volume répétitif
11Risques & mitigations

Les risques sont nommés. Les parades sont implémentées.

Risque
Hallucinations LLM
Impact

Élevé — décisions qualité fausses, risque rejet lot

Mitigation

RAG obligatoire avec citation · structured output Pydantic · LLM-as-judge cross-vérification · seuil confiance bloquant · validation humaine systématique sur action critique

Risque
Qualité données entrantes
Impact

Élevé — garbage in/out, scoring biaisé

Mitigation

Contrats schéma Pandera · profiling Great Expectations · scoring qualité par source · quarantine + alerte data steward · refus ingestion sous seuil

Risque
Latence inférence LLM
Impact

Moyen — UX copilot dégradée

Mitigation

Streaming SSE token-by-token · cache sémantique · routing modèle léger pour interactions courtes · pré-calcul async dashboards

Risque
Dérive modèle ML
Impact

Moyen — détection anomalies devient inefficace

Mitigation

Monitoring Evidently AI · alertes PSI/KS · re-training planifié + sur trigger · A/B shadow deployment · rollback automatique

Risque
Fuite données pharma sensibles
Impact

Critique — sanctions, perte client

Mitigation

Chiffrement bout-en-bout · BYOK · DLP egress · interdiction modèles tiers sur données critiques · self-hosted Llama pour scope confidentiel · SOC 24/7

Risque
Vendor lock-in IA
Impact

Moyen — dépendance fournisseur LLM

Mitigation

Abstraction LiteLLM · prompts portables · évaluation continue 3+ providers · capacité bascule self-hosted en 48h

Risque
Non-conformité audit FDA
Impact

Critique — interdiction commerciale

Mitigation

Validation CSV livrée · audit trail immuable · scope GAMP 5 cat. 4 documenté · pre-audit interne trimestriel · QA officer dédié AI Quality Brain

12Roadmap technique

De la fondation au système nerveux qualité industrie.

Q1–Q2 2026
Foundation
  • Mono-cluster Kubernetes EU
  • 5 agents IA (Deviation, CAPA, Document, Compliance, Audit)
  • Postgres + pgvector + S3
  • Validation CSV GAMP 5 cat. 4
  • 1er déploiement pilote single-site
Q3–Q4 2026
Scale
  • Multi-tenant + sharding Postgres
  • Knowledge graph Neo4j en GA
  • Production + Risk Agent
  • Connecteurs SAP / Werum / Veeva certifiés
  • Self-hosted vLLM pour scope confidentiel
2027+
Industrialization
  • Multi-région actif/actif
  • Federated learning inter-sites (sans partage donnée)
  • Agents proactifs (déclenchement workflow autonome avec HITL)
  • Marketplace agents tiers (CRO, fournisseurs API)
  • GxP-attested by independent body
Architecture review

Échanger avec notre équipe ingénierie.

Session technique 60 min avec notre Chief Architect : revue des intégrations ERP/MES/LIMS, modèle de menace, stratégie de validation CSV, dimensionnement.

Planifier une revue d'architecture →