Nouveau · 2026

Votre IA chez vous.
Aussi puissante que ChatGPT,
jamais en dehors de vos murs.

Gemma 4 (Google DeepMind, avril 2026, licence Apache 2.0) tourne sur un Mac Studio M-series (mémoire unifiée 64-192 Go) ou sur une workstation RTX 4090/5090, et rivalise avec GPT-4 sur la plupart des tâches PME. Nous l'installons sur votre infrastructure, ajoutons une couche RAG sur vos documents internes, et vous obtenez un assistant IA aussi capable que ChatGPT — sauf qu'aucune donnée ne sort de vos murs. Idéal cabinets juridiques, médicaux, comptables, éditeurs SaaS.

RGPD / AI Act simplifiés
100 % on-premise
Zéro fuite vers l'extérieur
Apache 2.0

Mission

Mot à mot, ce que nous faisons.

Du premier diagnostic à la maintenance mensuelle. Pas de jargon, pas de surprise.

1

Audit d'opportunité

1 jour · 1 290 € HT

Nous venons sur place ou en visio. Analyse de vos cas d'usage IA (rédaction, synthèse de documents, Q&A sur dossiers, traduction interne, code), démo live de Gemma 4 sur votre matériel ou un standby, rapport écrit de 15-20 pages avec ROI estimé, reco hardware et architecture cible. À la fin de la journée, vous savez exactement quoi installer et combien ça coûte.

2

Setup Starter / Pro / Enterprise

Installation Ollama + Gemma 4 sur votre Mac Studio M-series, votre workstation RTX 4090/5090 ou votre serveur GPU existant, interface de chat web sécurisée, comptes utilisateurs, documentation admin, formation 2h équipe. À la livraison, votre équipe se connecte à un ChatGPT interne — même ergonomie, mais privé.

3

Setup Pro (option) — couche RAG

Recommandé

Ajout d'une couche RAG — l'IA répond en s'appuyant sur vos documents internes (PDF contrats, base de connaissances, procédures). API REST pour brancher d'autres outils, SSO pour la connexion unique avec votre annuaire, monitoring complet. C'est le moment où Gemma 4 devient vraiment votre IA.

4

Setup Enterprise

Cluster GPU dimensionné pour votre charge réelle, fine-tuning sur votre vocabulaire métier (jurisprudence, codes médicaux, plan comptable, conventions internes), intégration ERP/CRM via API, dossier AI Act prêt à présenter à votre référent ou à l'auditeur, runbook redondance pour les opérations critiques.

5

Hardware

2 500 – 5 500 € HT

Option Mac Studio M-series (mémoire unifiée 64-192 Go) — souvent le meilleur choix PME : silencieux, compact, basse consommation, large mémoire unifiée. Ou workstation RTX 4090/5090 si vous préférez NVIDIA. Si vous avez déjà un serveur GPU compatible, nous installons directement dessus. Pendant l'audit nous mesurons votre charge réelle et choisissons la config qui passe sans surdimensionner.

6

Maintenance mensuelle

150 – 450 €/mois

Mises à jour modèle (nouvelles versions Gemma), monitoring, optimisation continue, support incidents. Vous nous écrivez quand quelque chose cloche, nous intervenons.

Tarifs

Trois paliers clairs.

Tous les prix sont HT. Hardware et maintenance en option, séparés. Audit d'opportunité obligatoire avant tout setup.

Audit d'opportunité

1 jour sur place ou en visio. Analyse cas d'usage, démo Gemma 4, rapport 15-20 pages avec ROI estimé et reco hardware.

Prix forfait

1 290 € HT

Setup Starter

3 900 € HT

Tout ce qu'il faut pour démarrer.

  • Ollama + Gemma 4
  • Interface chat web
  • Comptes utilisateurs
  • Documentation admin
  • Formation 2h équipe
Le plus choisi

Setup Pro

6 900 € HT

Avec RAG sur vos documents internes.

  • Tout le Starter, plus :
  • RAG documents internes
  • API REST
  • SSO (annuaire)
  • Monitoring complet

Setup Enterprise

9 900 € HT

Cluster, fine-tuning, intégration ERP/CRM.

  • Tout le Pro, plus :
  • Cluster GPU
  • Fine-tuning métier
  • Intégration ERP/CRM
  • Dossier AI Act + runbook

Hardware — option

Mac Studio M-series (mémoire unifiée 64-192 Go) ou workstation RTX 4090/5090, assemblé et configuré. Ou installation sur votre serveur GPU existant compatible.

2 500 – 5 500 € HT

Maintenance mensuelle

Mises à jour modèle, monitoring, optimisation, support incidents.

150 – 450 € / mois

Pour qui

Quatre métiers où ça change tout.

Là où la donnée est sensible, le LLM souverain n'est pas un confort — c'est la condition pour utiliser l'IA du tout.

Cabinets juridiques

Clauses confidentielles, dossiers contentieux, conventions clients. Avec un LLM hébergé chez un cloud américain, chaque prompt = potentielle violation du secret professionnel. Gemma 4 sur votre serveur permet de rédiger, résumer, comparer des contrats sans qu'aucune ligne ne sorte du cabinet.

Cabinets médicaux

Dossiers patients, antécédents, courriers confraternels. Le RGPD article 9 impose un cadre strict aux données de santé, et le secret médical n'autorise pas leur transit chez un tiers non encadré. Avec Gemma 4 local, l'IA aide aux comptes-rendus et à la recherche bibliographique sans jamais quitter le cabinet.

Cabinets comptables

Bilans, comptes, fiscalité, secrets de stratégie financière. Vos clients ne veulent pas voir leurs chiffres analysés par un service tiers — et l'ITAA pose des règles de confidentialité claires. Le LLM souverain transforme Gemma 4 en assistant fiscal interne qui parle votre plan comptable.

Éditeurs SaaS

Code propriétaire, schémas de base de données, secrets d'architecture. Coller un fichier dans ChatGPT, c'est potentiellement le diffuser. Gemma 4 local permet à vos développeurs d'utiliser un copilote IA puissant sans risquer la fuite d'IP, et de l'intégrer dans vos pipelines internes via API.

Capacités

Ce que Gemma 4 sait faire.

Liste honnête. Ce qui n'est pas listé ici n'est pas dans le scope de ce service.

Rédaction

Courriers, emails, propositions, comptes-rendus, contenu marketing. Style ajustable.

Synthèse de documents

PDF longs, contrats, rapports, transcriptions de réunions résumés en quelques lignes utiles.

Q&A sur base interne (RAG)

L'IA répond à vos questions en s'appuyant sur vos procédures, contrats, manuels — citations à l'appui.

Traduction FR / NL / EN

Idéal pour la Belgique trilingue. Documents internes traduits sans transit cloud.

Génération de code

Aide aux développeurs sur du code interne — sans exposer votre dépôt à un service tiers.

Analyse de tableaux

Lecture de CSV, extraction d'insights, génération de résumés et de questions à partir de données tabulaires.

Gemma 4 dans cette offre est un modèle texte. Pas de génération d'images native, pas de génération vidéo, pas de synthèse vocale dans ce périmètre — pour ces usages, nous proposons d'autres briques (agent vocal IA, automatisation IA) qui s'articulent avec votre LLM souverain.

FAQ

Questions fréquentes.

Gemma 4 est-il vraiment au niveau de GPT-4 ?
Gemma 4 (Google DeepMind, sortie avril 2026, licence Apache 2.0) rivalise avec GPT-4 sur la plupart des tâches PME : rédaction, synthèse de documents, Q&A sur base interne, traduction FR/NL/EN, génération de code. Pour des cas extrêmes (raisonnement très complexe, créativité longue), GPT-4 ou Claude restent parfois devant — mais la majorité des usages PME tiennent largement avec Gemma 4. Et l'avantage souveraineté change la donne sur les données sensibles.
Quel matériel est nécessaire ?
Un Mac Studio M-series (mémoire unifiée 64-192 Go) ou une workstation RTX 4090/5090 suffit pour faire tourner Gemma 4 en local pour une équipe PME. Le Mac Studio est souvent le meilleur choix PME : silencieux, compact, basse consommation, large mémoire unifiée. Si vous préférez NVIDIA ou avez déjà un serveur GPU compatible, nous installons directement dessus. Comptez 2 500 à 5 500 € HT pour le matériel si vous n'avez rien (Mac Mini M4 Pro entrée → Mac Studio milieu de gamme ou RTX 4090). Pendant l'audit nous mesurons votre charge réelle et choisissons la config qui passe sans surdimensionner. Pour les configurations Enterprise, nous montons un cluster GPU (ou Mac Studio M-series multi-machines) adapté à votre charge.
Et si on doit redémarrer ou mettre à jour ?
L'installation Ollama est conçue pour redémarrer toute seule au boot — coupure de courant, reboot serveur, le service revient seul. Les mises à jour modèle et logicielles sont incluses dans la maintenance mensuelle (150-450 €/mois). Vous recevez un runbook simple pour les opérations courantes, et nous restons joignables pour les incidents.
Combien d'utilisateurs simultanés ?
Sur un Mac Studio M-Ultra ou une workstation RTX 4090, on couvre confortablement 5 à 20 utilisateurs PME simultanés sur Gemma 4 selon la taille des prompts et l'usage (chat conversationnel vs. RAG longs documents). Au-delà, nous passons en Setup Enterprise avec cluster GPU (ou Mac Studio M-series multi-machines) dimensionné pour votre charge réelle, mesurée pendant l'audit d'opportunité.
Et si Google retire Gemma 4 ?
Gemma 4 est publié sous licence Apache 2.0. Une fois le modèle téléchargé sur votre serveur, il vous appartient — vous pouvez continuer à l'utiliser indéfiniment, même si Google arrête sa distribution publique. C'est exactement la promesse du LLM souverain : pas de dépendance à un fournisseur cloud, pas de risque de coupure de service du jour au lendemain. Et si un meilleur modèle open source sort plus tard, nous le swappons sans casser votre setup.

Souvent demandé avec

Vos clients combinent ce service avec :

Prêt à reprendre la main sur vos données ?

Une journée d'audit, un rapport clair, et vous saurez exactement combien coûte votre IA souveraine et ce qu'elle vous apportera.

Audit forfait 1 290 € HT — toute la journée, rapport 15-20 pages livré.