Model-as-a-service Solutions Pricing

Generative APIs - Serverless

Use the latest AI models via API, pay by thousand tokens.
Try out new models with our free tier: 1 million tokens and 60 minutes of audio transcription.
All requests performed using Batches API are priced with a -50% discount.

Select Region

Generative API

qwen3.5-397b-a17b	Chat and code	€0.60 /^{million tokens}	€3.60 /^{million tokens}	Try
qwen3.6-35b-a3b	Chat and Vision	€0.25 /^{million tokens}	€1.50 /^{million tokens}	Try
gemma-4-26b-a4b-it	Chat and Vision	€0.25 /^{million tokens}	€0.50 /^{million tokens}	Try
mistral-small-3.2-24b-instruct-2506	Chat and Vision	€0.15 /^{million tokens}	€0.35 /^{million tokens}	Try
gpt-oss-120b	Chat	€0.15 /^{million tokens}	€0.60 /^{million tokens}	Try
mistral-medium-3.5-128b	Chat and Vision	€1.50 /^{million tokens}	€7.50 /^{million tokens}	Try
whisper-large-v3	Audio transcription	€0.003 /^{Audio minute}	Free	Try
llama-3.3-70b-instruct	Chat	€0.90 /^{million tokens}	€0.90 /^{million tokens}	Try
qwen3-235b-a22b-instruct-2507	Chat	€0.75 /^{million tokens}	€2.25 /^{million tokens}	Try
qwen3-coder-30b-a3b-instruct	Chat and code	€0.20 /^{million tokens}	€0.80 /^{million tokens}	Try
qwen3-embedding-8b	Embeddings	€0.10 /^{million tokens}	Free	Try
pixtral-12b-2409	Chat and Vision	€0.20 /^{million tokens}	€0.20 /^{million tokens}	Try
voxtral-small-24b-2507	Audio transcription and Chat	€0.15 /^{million tokens}	€0.35 /^{million tokens}	Try
devstral-2-123b-instruct-2512	Chat and code	€0.40 /^{million tokens}	€2.00 /^{million tokens}	Try
gemma-3-27b-it	Chat and Vision	€0.25 /^{million tokens}	€0.50 /^{million tokens}	Try
bge-multilingual-gemma2	Embeddings	€0.10 /^{million tokens}	Free	Try
holo2-30b-a3b	Chat and Vision	€0.30 /^{million tokens}	€0.70 /^{million tokens}	Try

Legal notice

Prices before tax.
You benefit from a free tier on the first 1,000,000 tokens. You'll be charged from token number 1,000,001.

Managed Inference (sorted by column hourlyPrice ascending)

L4-1-24G	€0.93	€678.90
L40S-1-48G	€1.72	€1,255.31
H100-1-80G	€3.40	€2,481.71
H100-2-80G	€6.68	€4,876.25
H100-SXM-2-80G	€7.95	€5,803.50
H100-SXM-4-80G	€15.22	€11,110.57
H100-SXM-8-80G	€30.06	€21,943.80

Managed Inference (sorted by column hourlyPrice ascending)

L4-1-24G

€0.93

€678.90

L40S-1-48G

€1.72

€1,255.31

H100-1-80G

€3.40

€2,481.71

H100-2-80G

€6.68

€4,876.25

H100-SXM-2-80G

€7.95

€5,803.50

H100-SXM-4-80G

€15.22

€11,110.57

H100-SXM-8-80G

€30.06

€21,943.80

Model-as-a-service Pricing

FiltersModel-as-a-service

Generative APIs - Serverless

Generative APIs - Dedicated Deployment