
API d'inférence · Compatible OpenAI
La puissance d'un grand modèle de langage, d'un moteur d'embeddings et d'un reranker — au même endroit, sous droit français, sans que vos données ne quittent jamais le territoire.
Pas de portail en libre-service à l'aveugle : nous ouvrons votre accès à la plateforme après un premier échange, le temps de cadrer ensemble vos besoins, votre volumétrie et la formule la plus adaptée.
ai.3gks.cloud · Qualité • Réactivité • Accompagnement
Une API d'intelligence artificielle française, hébergée sur l'infrastructure 3GK, sans aucune dépendance à un fournisseur extra-européen — la chaîne complète (grand modèle de langage, embeddings, reranking) sous droit français, sans que vos données ne quittent jamais le territoire.
En résumé
Souveraineté
La plupart des API d'IA reposent sur des infrastructures soumises à un droit extra-européen. Vos prompts, vos documents, vos données clients y transitent — et y sont parfois conservés. L'approche 3GK est l'inverse, par construction.
Secteurs sensibles
Une réponse directe aux exigences RGPD et aux contraintes de souveraineté — finance, immobilier, santé, secteur public.
Le modèle
Un choix simple et assumé : servir un seul modèle de langage, le meilleur de sa catégorie, plutôt qu'un catalogue dispersé. Le Qwen3.6-27B, retenu pour trois raisons.
27 Md
Paramètres · dense
201
Langues
128k
Tokens contexte
3×
Texte · image · vidéo
Pourquoi c'est décisif
En juin 2026, deux modèles propriétaires de premier plan ont été rendus indisponibles en quelques heures, pour l'ensemble de leurs utilisateurs dans le monde, sur directive d'une autorité étatique étrangère. Des clients en production se sont retrouvés sans service, sans préavis ni recours. Un modèle à poids ouverts servi sur une infrastructure souveraine vous met structurellement à l'abri de ce risque.
Chaîne RAG
3GK ne fournit pas seulement un « chat ». L'offre couvre toute la chaîne technique pour interroger vos propres documents en langage naturel — un pipeline RAG (Retrieval-Augmented Generation) — chez un seul fournisseur français.
01 · Embeddings
Chaque document devient une représentation vectorielle qui capture son sens. Vos contenus deviennent « cherchables » par similarité, au-delà du mot-clé.
02 · Reranking
Parmi les documents candidats, le reranker replace les plus pertinents en tête. L'étape qui fait passer un résultat « correct » à « précis ».
03 · LLM Qwen3.6-27B
À partir des documents pertinents, le modèle rédige la réponse, en extrait l'information structurée, ou produit une synthèse.
Exemple concret
Une société dispose de milliers de documents internes — contrats, comptes-rendus, fiches techniques. Ses équipes posent une question en langage naturel : les embeddings identifient les documents proches, le reranking sélectionne les plus pertinents, le LLM rédige une réponse sourcée — ou en extrait les données utiles (JSON, tableau…). Sans qu'aucun document ne quitte l'infrastructure souveraine.
Vous n'avez pas à assembler trois prestataires aux régimes juridiques différents : tout au même endroit, sous le même cadre de conformité, une seule facture.
Migration
L'API 3GK est compatible avec le standard OpenAI. Si vous utilisez déjà une bibliothèque cliente OpenAI (ou tout outil qui s'y conforme), la bascule se résume à deux changements.
Changer l'URL de base (base_url) pour pointer vers ai.3gks.cloud.
Remplacer votre clé d'API par une clé 3GK (préfixe sk-3gk-).
Aucune réécriture de code applicatif. La friction de migration est quasi nulle.
# client OpenAI existant
base_url = "…/v1"
# vers 3GK — souverain
base_url = "https://ai.3gks.cloud/v1"
api_key = "sk-3gk-••••••••"Continuité
Aucune infrastructure n'est à l'abri d'une opération de maintenance ou d'un incident matériel. 3GK l'assume par conception : en cas d'indisponibilité de l'infrastructure principale, le service bascule automatiquement sur une infrastructure de repli, elle aussi souveraine.
Nominal
Infrastructure GPU 3GK
Datacenter français
Repli
Partenaire français (Scaleway)
Sol français, même conformité
La continuité prime, sans jamais compromettre la souveraineté : le repli reste sur le territoire, sous droit français. Vos appels continuent de répondre, de façon transparente.
Tarification
Deux formules au choix, selon votre usage — à l'usage (au token), ou forfait mensuel pour les volumes réguliers.
Au token · prépayé · sans abonnement
Pour démarrer et pour les volumes variables : vous ne payez que ce que vous consommez.
Crédit prépayé, prix figé à l'appel : le tarif appliqué est celui en vigueur au moment exact de l'appel, sans révision rétroactive.
Volume · usage régulier
Sans engagement, reconductible.
Tarifs HT. Reranking facturé sur requête + documents, sans tokens de sortie.
Sécurité & conformité
RGPD by design
Aucune journalisation du contenu, pas d'entraînement sur vos données, hébergement et traitement en France.
Rétention maîtrisée
Métadonnées techniques conservées 6 mois ; le contenu échangé n'est jamais conservé.
Authentification renforcée
Authentification à deux facteurs (TOTP) disponible et activable sur votre compte.
Clés d'API dédiées
Préfixe sk-3gk-, révocables à tout moment.
Le partenaire
3GK n'est pas qu'un fournisseur d'API. C'est un hébergeur et infogérant français, et un éditeur de logiciels métier. Pour vous, cela signifie :
Là où les API extra-européennes vous laissent seul face à un portail en libre-service, 3GK vous accompagne.
FAQ
Les modèles tournent sur l'infrastructure GPU que 3GK possède et opère, colocalisée dans un datacenter français. Vos requêtes ne quittent pas le territoire. En cas de maintenance, le repli automatique reste lui aussi sur le sol français (Scaleway), sous droit français.
Oui. L'API 3GK respecte le standard OpenAI : la migration se résume à changer l'URL de base (base_url vers https://ai.3gks.cloud/v1) et la clé d'API (préfixe sk-3gk-). Aucune réécriture du code applicatif n'est nécessaire.
Le Qwen3.6-27B, un modèle dense de 27 milliards de paramètres à poids ouverts (licence Apache 2.0), multimodal (texte, image, vidéo), gérant 201 langues et une fenêtre de contexte allant jusqu'à 128 000 tokens. L'offre inclut aussi les embeddings (qwen3-embedding-4b) et le reranking (qwen3-reranker-4b) pour une chaîne RAG complète.
Non. Vos données ne servent ni à entraîner ni à affiner aucun modèle. Le contenu des prompts et des réponses n'est jamais journalisé ; seules des métadonnées techniques (volumétrie, horodatage) sont conservées 6 mois, jamais le texte échangé. L'ensemble est RGPD by design, sous droit français.
Deux formules HT au choix. À l'usage : LLM 0,80 €/M de tokens en entrée et 1,80 €/M en sortie, embeddings 0,12 €/M, reranking 2,00 €/M. Ou forfait mensuel sans engagement à 450 € HT/mois incluant 500 millions de tokens.
En cas d'indisponibilité de l'infrastructure principale, le service bascule automatiquement et de façon transparente sur une infrastructure de repli souveraine (Scaleway), sur le sol français et sous la même conformité. Vos appels API continuent de répondre sans intervention de votre part.
Passons à l'action
Parlons de votre cas d'usage : nous ouvrons votre accès à la plateforme après un premier échange, le temps d'affiner ensemble vos besoins et votre volumétrie. Migration accompagnée, sans réécriture de code.
Découvrez aussi nos dernières actualités IA et souveraineté.
Tarifs hors taxes. Conditions détaillées dans les CGU / DPA.