Tarifs solutions d'Inférence d'IA

Generative APIs - Serverless

Utilisez les derniers modèles d'IA, payez par millier de tokens.
Testez les nouveaux modèles avec notre free tier: 1 million de tokens et 60 minutes de transcription audio.
Toutes les requêtes effectuées via l'API Batches bénéficient d'un prix réduit de 50%.

Sélectionner une région

Generative API

glm-5.2	Chat et code	1,80 € /^{million de tokens}	5,50 € /^{million de tokens}	Essayer
qwen3.5-397b-a17b	Chat, code et Vision	0,60 € /^{million de tokens}	3,60 € /^{million de tokens}	Essayer
qwen3.6-35b-a3b	Chat, code et Vision	0,25 € /^{million de tokens}	1,50 € /^{million de tokens}	Essayer
gemma-4-26b-a4b-it	Chat, code et Vision	0,25 € /^{million de tokens}	0,50 € /^{million de tokens}	Essayer
mistral-medium-3.5-128b	Chat, code et Vision	1,50 € /^{million de tokens}	7,50 € /^{million de tokens}	Essayer
whisper-large-v3	Transcription audio	0,003 € /^{Minute audio}	Gratuit	Essayer
llama-3.3-70b-instruct	Chat	0,90 € /^{million de tokens}	0,90 € /^{million de tokens}	Essayer
qwen3-235b-a22b-instruct-2507	Chat	0,75 € /^{million de tokens}	2,25 € /^{million de tokens}	Essayer
qwen3-coder-30b-a3b-instruct	Chat et code	0,20 € /^{million de tokens}	0,80 € /^{million de tokens}	Essayer
qwen3-embedding-8b	Embeddings	0,10 € /^{million de tokens}	Gratuit	Essayer
pixtral-12b-2409	Chat et Vision	0,20 € /^{million de tokens}	0,20 € /^{million de tokens}	Essayer
voxtral-small-24b-2507	Transcription audio et Chat	0,15 € /^{million de tokens}	0,35 € /^{million de tokens}	Essayer
mistral-small-3.2-24b-instruct-2506	Chat et Vision	0,15 € /^{million de tokens}	0,35 € /^{million de tokens}	Essayer
devstral-2-123b-instruct-2512	Chat et code	0,40 € /^{million de tokens}	2,00 € /^{million de tokens}	Essayer
gpt-oss-120b	Chat	0,15 € /^{million de tokens}	0,60 € /^{million de tokens}	Essayer
gemma-3-27b-it	Chat et Vision	0,25 € /^{million de tokens}	0,50 € /^{million de tokens}	Essayer
bge-multilingual-gemma2	Embeddings	0,10 € /^{million de tokens}	Gratuit	Essayer
holo2-30b-a3b	Chat et Vision	0,30 € /^{million de tokens}	0,70 € /^{million de tokens}	Essayer

Mentions légales

Prix HT.
Vous bénéficiez d'un essai gratuit de 1 000 000 tokens. Vous ne paierez qu'à partir de 1 000 001 token.

Managed Inference (trié par hourlyPrice croissant)

L4-1-24G	0,93 €	678,90 €
L40S-1-48G	1,72 €	1 255,31 €
H100-1-80G	3,40 €	2 481,71 €
H100-2-80G	6,68 €	4 876,25 €
H100-SXM-2-80G	7,95 €	5 803,50 €
H100-SXM-4-80G	15,22 €	11 110,57 €
H100-SXM-8-80G	30,06 €	21 943,80 €

L4-1-24G

0,93 €

678,90 €

L40S-1-48G

1,72 €

1 255,31 €

H100-1-80G

3,40 €

2 481,71 €

H100-2-80G

6,68 €

4 876,25 €

H100-SXM-2-80G

7,95 €

5 803,50 €

H100-SXM-4-80G

15,22 €

11 110,57 €

H100-SXM-8-80G

30,06 €

21 943,80 €

Tarifs Model-as-a-service

FiltresModel-as-a-service

Generative APIs - Serverless

Generative APIs - Dedicated Deployment