Aller à la navigationAller à la connexionAller au contenu principalAller au pied de page

Tarifs Model-as-a-service

Servez des modèles d'IA générative et payez pour une infrastructure dédiée ou pour des milliers de tokens.

Generative APIs - Serverless

Utilisez les derniers modèles d'IA, payez par millier de tokens.
Testez les nouveaux modèles avec notre free tier: 1 million de tokens et 60 minutes de transcription audio.
Toutes les requêtes effectuées via l'API Batches bénéficient d'un prix réduit de 50%.

Generative API
qwen3.5-397b-a17bChat et code0,60 € /million de tokens3,60 € /million de tokensEssayer
qwen3.6-35b-a3bChat et Vision0,25 € /million de tokens1,50 € /million de tokensEssayer
gemma-4-26b-a4b-itChat et Vision0,25 € /million de tokens0,50 € /million de tokensEssayer
mistral-small-3.2-24b-instruct-2506Chat et Vision0,15 € /million de tokens0,35 € /million de tokensEssayer
gpt-oss-120bChat0,15 € /million de tokens0,60 € /million de tokensEssayer
mistral-medium-3.5-128bChat et Vision1,50 € /million de tokens7,50 € /million de tokensEssayer
whisper-large-v3Transcription audio0,003 € /Minute audioGratuitEssayer
llama-3.3-70b-instructChat0,90 € /million de tokens0,90 € /million de tokensEssayer
qwen3-235b-a22b-instruct-2507Chat0,75 € /million de tokens2,25 € /million de tokensEssayer
qwen3-coder-30b-a3b-instructChat et code0,20 € /million de tokens0,80 € /million de tokensEssayer
qwen3-embedding-8bEmbeddings0,10 € /million de tokensGratuitEssayer
pixtral-12b-2409Chat et Vision0,20 € /million de tokens0,20 € /million de tokensEssayer
voxtral-small-24b-2507Transcription audio et Chat0,15 € /million de tokens0,35 € /million de tokensEssayer
devstral-2-123b-instruct-2512Chat et code0,40 € /million de tokens2,00 € /million de tokensEssayer
gemma-3-27b-itChat et Vision0,25 € /million de tokens0,50 € /million de tokensEssayer
bge-multilingual-gemma2Embeddings0,10 € /million de tokensGratuitEssayer
holo2-30b-a3bChat et Vision0,30 € /million de tokens0,70 € /million de tokensEssayer
InformationOutlineIconMentions légalesArrowDownIcon

Prix HT.
Vous bénéficiez d'un essai gratuit de 1 000 000 tokens. Vous ne paierez qu'à partir de 1 000 001 token.

Generative APIs - Dedicated Deployment

Choisissez un modèle prêt à l'emploi et obtenez immédiatement un point d'accès dédié pour son inférence. Vous êtes facturé en fonction de l'utilisation du GPU que vous choisissez.

Managed Inference (trié par hourlyPrice croissant)
L4-1-24G0,93 €678,90 €
L40S-1-48G1,72 €1 255,31 €
H100-1-80G3,40 €2 481,71 €
H100-2-80G6,68 €4 876,25 €
H100-SXM-2-80G7,95 €5 803,50 €
H100-SXM-4-80G15,22 €11 110,57 €
H100-SXM-8-80G30,06 €21 943,80 €
InformationOutlineIconMentions légalesArrowDownIcon

Prix hors taxes
La facturation commence lorsque au moins un point de terminaison dédié est prêt à être utilisé.