Technical blueprintv1.0 · 2026

Une architecture pensée pour la criticité pharma.

Microservices événementiels, 7 agents IA spécialisés orchestrés via un superviseur LLM, data lake validé GxP, knowledge graph qualité et chiffrement de bout en bout. Conçu pour passer un audit FDA sans documentation supplémentaire.

Latence p95

< 800ms

appels copilot

Disponibilité

99.95%

SLA enterprise

Scope conformité

21 CFR 11 · EU Annex 11 · GAMP 5

validé CSV

01Vue d'ensemble

Architecture modulaire event-driven, séparation stricte des plans.

5 plans découplés communiquent via un bus d'événements (Kafka). Chaque plan est indépendamment scalable, déployable et auditable. Les modèles IA n'ont jamais d'accès direct aux systèmes de production.

Layer 01

Experience

Next.js · React · Tailwind

Web app QA, copilot conversationnel, dashboards temps réel.

Layer 02

API Gateway

Kong · GraphQL Federation

AuthN/Z, rate-limit, schéma fédéré, observabilité OpenTelemetry.

Layer 03

Domain Services

Node · Python · gRPC

Bounded contexts : Deviation, CAPA, Audit, Document, Risk.

Layer 04

AI Mesh

LangGraph · vLLM · MCP

7 agents spécialisés + superviseur orchestrateur + RAG pharma.

Layer 05

Data Plane

Postgres · Iceberg · Neo4j

OLTP, data lake versionné, knowledge graph qualité, vector store.

Pattern

Event sourcing + CQRS

Toute mutation est un événement immuable signé. Reconstruction de l'état possible à n'importe quel instant — exigence ALCOA+ « Original ».

Isolation

Single-tenant par défaut

Cluster Kubernetes dédié par client pharma. Isolation réseau VPC, KMS dédié, base Postgres dédiée. Multi-tenant disponible pour offre Pilot.

Observabilité

Trace IA bout-en-bout

Chaque réponse IA porte un trace_id liant prompt, contexte RAG, modèle, tokens, coût et utilisateur. Rejouable pour audit.

02Frontend

Next.js 15 App Router, RSC pour la performance critique.

Stack

• Next.js 15 — RSC, streaming, edge runtime
• React 19 — Server Actions pour mutations qualité
• TanStack Query — cache + optimistic updates
• Zustand — état UI (filtres, modals, copilot)
• tRPC — type-safety end-to-end
• Tailwind + shadcn/ui — design system QA

Performance

• LCP < 1.2s sur dashboards 10k+ déviations (virtualisation)
• Streaming SSE pour copilot (token-by-token)
• Service Worker pour mode dégradé (lecture audit offline)
• CSP stricte, SRI sur tous les assets
• Bundle < 180KB gzip (route principale)
• A11y AAA — exigence audit utilisateur QA

03Backend

Domain-driven microservices, GraphQL fédéré en façade.

Chaque bounded context (Deviation, CAPA, Audit…) est un service autonome avec sa base de données. La fédération GraphQL expose un schéma unifié au frontend sans couplage.

deviation-svc

Node 22 / NestJS

Postgres + Outbox

capa-svc

Node 22 / NestJS

Postgres + Temporal

audit-svc

Python 3.13 / FastAPI

Postgres append-only

document-svc

Python / FastAPI

S3 + Postgres meta

risk-svc

Python / FastAPI

Postgres + TimescaleDB

production-svc

Go / Connect-RPC

TimescaleDB

ai-orchestrator

Python / LangGraph

Redis + Postgres

iam-svc

Node / NestJS

Postgres + Vault

Orchestration longue durée

Temporal.io pour CAPA multi-mois, escalades d'audit, workflows réglementaires. Garantit l'exécution exactly-once même en cas de crash.

Bus d'événements

Kafka + Schema Registry. Schémas Avro versionnés, compatibilité backward forcée. Topics par domaine.

API contract

GraphQL pour le frontend, gRPC inter-services, REST OpenAPI 3.1 pour partenaires ERP/LIMS.

04AI Layer

LLM + ML + RAG pharma, chacun à sa juste place.

Aucun usage générique. Chaque modèle est sélectionné, fine-tuné et évalué pour un cas d'usage précis avec garde-fous métier.

LLM

Raisonnement & rédaction

• Modèles frontier (Claude, GPT) pour rédaction réglementaire
• Modèles open (Llama, Mistral) self-hosted pour traitement sensible
• Routage par criticité + budget
• Garde-fous : Guardrails AI + Pydantic structured output

ML classique

Détection & scoring

• Isolation Forest — anomalies process
• XGBoost — scoring risque déviation
• Prophet — prédiction dérive paramètres production
• MLflow pour tracking, registry et déploiement validé

RAG pharma

Knowledge retrieval

• Hybrid search : BM25 + dense (BGE-M3 fine-tuné pharma)
• Re-ranking Cohere Rerank
• Citation obligatoire — pas de réponse sans source
• Corpus : SOPs, ICH, FDA warning letters, historique déviations

Prompt management

Tous les prompts sont du code versionné.

Versioning

Git + tag sémantique. Aucun prompt en clair en base. Promotion via PR review QA.

Évaluation

Suite eval Promptfoo + golden set 500 cas pharma. Régression bloquante en CI.

Observabilité

Langfuse self-hosted. Trace, coût, latence, score utilisateur par prompt.

05Multi-agent system

7 agents spécialisés, un superviseur, zéro improvisation.

Orchestration via LangGraph. Le superviseur décompose, route, vérifie et compose. Chaque agent a un scope étroit, des outils MCP limités et un schéma de sortie strict.

Agent 01

Deviation Agent

Classifie, qualifie et propose investigation root cause.

Inputs

Déviation brute, contexte lot, historique 24 mois

Outputs

Catégorie GMP, criticité, hypothèses RCA pondérées, SOPs liées

Logique

ReAct + RAG SOP + Ishikawa structuré

Agent 02

CAPA Agent

Génère plan d'actions correctives/préventives mesurables.

Inputs

RCA validée, historique CAPA similaires, contraintes site

Outputs

Plan SMART, owners suggérés, KPIs efficacité, deadline

Logique

Tree-of-thoughts + lookup CAPA passées + scoring faisabilité

Agent 03

Compliance Agent

Vérifie conformité dossier vs réglementations applicables.

Inputs

Dossier qualité, marché cible, version réglementation

Outputs

Gap analysis ligne par ligne, citations 21 CFR / EU GMP

Logique

Constrained generation + matrice exigences vs preuves

Agent 04

Audit Agent

Prépare audit FDA/EMA, simule questions inspecteur.

Inputs

Périmètre audit, historique inspections industrie

Outputs

Dossier audit consolidé, Q&R simulées, gaps critiques

Logique

Multi-step planning + adversarial Q-generation

Agent 05

Document Agent

Lit, structure et indexe SOPs, BMR, BPR, certificats.

Inputs

PDF, DOCX, XML, scans (OCR)

Outputs

Document structuré JSON-LD, entités extraites, version comparée

Logique

Layout-aware parsing + LLM extraction + diff sémantique

Agent 06

Production Agent

Surveille temps réel, détecte dérives avant déviation.

Inputs

Flux IoT MES, paramètres lot, données environnement

Outputs

Alertes pré-déviation, suggestion ajustement, score risque lot

Logique

ML anomaly detection + LLM contextualisation

Agent 07

Risk Agent

Évalue risque qualité agrégé site, fournisseur, produit.

Inputs

Tous événements qualité, supply chain, audits fournisseurs

Outputs

Heatmap risque, ICH Q9 scoring, recommandations mitigation

Logique

Bayesian network + LLM synthèse exécutive

Orchestration

Supervisor pattern + Human-in-the-loop forcé

Le superviseur LangGraph décompose la requête, route vers les agents pertinents en parallèle, agrège, détecte conflits, et présente le résultat avec niveau de confiance. Toute action ayant impact qualité requiert validation humaine explicite — l'IA ne signe jamais à la place du QP.

06Data architecture

4 stores complémentaires, une seule vérité.

OLTP

PostgreSQL 16

Transactionnel : déviations, CAPA, utilisateurs. RLS multi-tenant. PITR 35j.

Data lake

Apache Iceberg + S3

Historique complet versionné, time-travel queries, format ouvert. Trino pour analytics.

Documents

S3 + chiffrement KMS

PDF, BMR, certificats. Worm/object-lock pour preuves audit. Versioning natif.

Knowledge graph

Neo4j

Liens lots ↔ matières ↔ équipements ↔ déviations ↔ CAPA. Requêtes causales sub-seconde.

Vector store

pgvector + Qdrant

Embeddings SOPs, déviations, réglementations. Hybrid search.

Time-series

TimescaleDB

Paramètres production IoT, downsampling auto, rétention 10 ans.

Cache

Redis Cluster

Sessions, rate-limit, queues légères, cache RAG re-rank.

OpenSearch

Full-text BM25, agrégations, logs sécurité immuables.

07Data pipeline

De la donnée brute au signal qualité, en minutes.

01Ingestion

Kafka Connect · Airbyte · MQTT

• APIs ERP/MES/LIMS
• Fichiers CSV/XML/PDF
• Streams IoT bioréacteurs
• Webhooks partenaires

02Parsing

Unstructured.io · Tika · Layout LLM

• OCR multilingue
• Tableaux complexes (BMR)
• Schémas XML SAP
• Extraction entités GMP

03Transformation

dbt · Spark · Pandera

• Normalisation taxonomie
• Validation contrats schéma
• Enrichissement référentiels
• Scoring qualité données

04Activation

Reverse ETL · Event bus

• Push agents IA
• Hydratation knowledge graph
• Indexation vector store
• Notifications temps réel

08Sécurité & conformité

ALCOA+ par construction. Pas en couche d'audit a posteriori.

RBAC + ABAC

Rôles QA/Production/QP + attributs (site, produit, criticité). Casbin policy engine. SoD enforcée.

Audit trail immuable

Append-only ledger Postgres + miroir OpenSearch + ancrage hash quotidien. Chaque événement signé Ed25519.

Signature électronique

21 CFR Part 11 § 11.50/11.70 — double facteur, intent, raison, identité non-répudiable.

Versioning

Tout objet (SOP, déviation, prompt, modèle ML) versionné. Diff sémantique. Rollback contrôlé.

Chiffrement

TLS 1.3 in-transit · AES-256 at-rest · KMS dédié client · BYOK option · column-level pour PII patient.

ALCOA+

Attributable, Legible, Contemporaneous, Original, Accurate + Complete, Consistent, Enduring, Available.

GAMP 5 cat. 4

Validation CSV livrée : URS, FS, DS, IQ, OQ, PQ. Matrice traçabilité auto-générée.

Data residency

EU (Francfort/Paris), US (Virginia), Suisse. Aucun transfert hors juridiction sans consentement.

Certifications

SOC 2 Type II · ISO 27001 · ISO 27701 · HIPAA-ready · roadmap GxP-attested.

09Intégrations

Brancher l'existant, pas le remplacer.

ERP

SAP S/4HANA, Oracle, Microsoft Dynamics

OData · IDoc · BAPI

MES

Werum PAS-X, Körber, Rockwell, Siemens Opcenter

ISA-95 · OPC-UA · REST

LIMS

LabWare, STARLIMS, Thermo SampleManager

REST · SQL views

QMS legacy

Veeva Vault, MasterControl, TrackWise

API + connecteur certifié

DMS

SharePoint, Veeva Vault, OpenText

CMIS · Graph API

Identity

Okta, Entra ID, Ping

SAML 2.0 · OIDC · SCIM

IoT

Bioréacteurs, sondes T°/HR, balances

MQTT · OPC-UA · Modbus

Réglementaire

ICH, FDA, EMA, PMDA feeds

RSS · API · ingestion auto

10Scale & performance

De 1 site pilote à 80 sites mondiaux, sans réécriture.

Cloud foundation

• Multi-cloud : AWS (primaire), Azure (option pharma EU)
• Kubernetes (EKS/AKS) + Karpenter autoscaling
• Multi-AZ par défaut, multi-région pour Tier Enterprise
• IaC complet : Terraform + Crossplane

Patterns de scale

• CQRS — lecture massivement scalable (read replicas)
• Sharding par tenant pour Postgres > 50 sites
• Inférence LLM batchée (vLLM continuous batching)
• CDN edge pour assets et docs publics

FinOps IA

• Routage modèle par criticité (cascade nano → frontier)
• Cache sémantique (GPTCache) — 35% hit rate moyen
• Quotas par utilisateur + alertes coût
• Self-hosted vLLM pour gros volume répétitif

11Risques & mitigations

Les risques sont nommés. Les parades sont implémentées.

Risque

Hallucinations LLM

Impact

Élevé — décisions qualité fausses, risque rejet lot

Mitigation

RAG obligatoire avec citation · structured output Pydantic · LLM-as-judge cross-vérification · seuil confiance bloquant · validation humaine systématique sur action critique

Risque

Qualité données entrantes

Impact

Élevé — garbage in/out, scoring biaisé

Mitigation

Contrats schéma Pandera · profiling Great Expectations · scoring qualité par source · quarantine + alerte data steward · refus ingestion sous seuil

Risque

Latence inférence LLM

Impact

Moyen — UX copilot dégradée

Mitigation

Streaming SSE token-by-token · cache sémantique · routing modèle léger pour interactions courtes · pré-calcul async dashboards

Risque

Dérive modèle ML

Impact

Moyen — détection anomalies devient inefficace

Mitigation

Monitoring Evidently AI · alertes PSI/KS · re-training planifié + sur trigger · A/B shadow deployment · rollback automatique

Risque

Fuite données pharma sensibles

Impact

Critique — sanctions, perte client

Mitigation

Chiffrement bout-en-bout · BYOK · DLP egress · interdiction modèles tiers sur données critiques · self-hosted Llama pour scope confidentiel · SOC 24/7

Risque

Vendor lock-in IA

Impact

Moyen — dépendance fournisseur LLM

Mitigation

Abstraction LiteLLM · prompts portables · évaluation continue 3+ providers · capacité bascule self-hosted en 48h

Risque

Non-conformité audit FDA

Impact

Critique — interdiction commerciale

Mitigation

Validation CSV livrée · audit trail immuable · scope GAMP 5 cat. 4 documenté · pre-audit interne trimestriel · QA officer dédié AI Quality Brain

12Roadmap technique

De la fondation au système nerveux qualité industrie.

Q1–Q2 2026

Foundation

• Mono-cluster Kubernetes EU
• 5 agents IA (Deviation, CAPA, Document, Compliance, Audit)
• Postgres + pgvector + S3
• Validation CSV GAMP 5 cat. 4
• 1er déploiement pilote single-site

Q3–Q4 2026

Scale

• Multi-tenant + sharding Postgres
• Knowledge graph Neo4j en GA
• Production + Risk Agent
• Connecteurs SAP / Werum / Veeva certifiés
• Self-hosted vLLM pour scope confidentiel

2027+

Industrialization

• Multi-région actif/actif
• Federated learning inter-sites (sans partage donnée)
• Agents proactifs (déclenchement workflow autonome avec HITL)
• Marketplace agents tiers (CRO, fournisseurs API)
• GxP-attested by independent body

Architecture review

Échanger avec notre équipe ingénierie.

Session technique 60 min avec notre Chief Architect : revue des intégrations ERP/MES/LIMS, modèle de menace, stratégie de validation CSV, dimensionnement.

Planifier une revue d'architecture →