Performances polyvalentes
Gérez des charges de travail variées sur une architecture unique, allant de l'inférence des LLMs et de l'IA générative au rendering 3D et à l'encodage vidéo.
L'inférence à prix abordable.

Gérez des charges de travail variées sur une architecture unique, allant de l'inférence des LLMs et de l'IA générative au rendering 3D et à l'encodage vidéo.
Commencez à mettre en place votre infrastructure IA à partir 0,79€ par GPU et par heure : le L4 est la solution idéale pour les start-ups qui souhaitent réaliser des prototypes sans frais initiaux.
Profitez d'une inférence et d'un rendering plus rapides grâce à l'architecture Ada Lovelace et à ses 24 Go de mémoire GDDR6.
Que vous utilisiez des modèles d'IA, traitiez des flux vidéo ou effectuiez le rendering de scènes 3D, l'instance GPU L4 offre une base équilibrée et économique. Elle vous évite de payer pour une capacité GPU superflue pour vos tâches les moins exigeantes, tout en vous garantissant les performances dont vous avez besoin.
Déployez à grande échelle les derniers LLMs et modèles de diffusion tout en évitant la consommation énergétique excessive des GPU d'entraînement haut de gamme.
Traitez des vidéos à grande échelle grâce à des encodeurs dédiés. Avec une prise en charge native de l'encodage AV1 et des performances jusqu'à trois fois supérieures à celles du T4 pour le H264, le L4 est optimisé pour le transcodage, la diffusion en direct et les applications de computer vision en temps réel.
Accélérez le développement des jumeaux numériques industriels et du cloud gaming. Les cœurs RT de troisième génération offrent des capacités de ray tracing en temps réel, permettant aux équipes d'ingénieurs de visualiser plus rapidement des modèles 3D et des simulations complexes.

GPU
NVIDIA L4 Tensor Core.
Architecture
NVIDIA Lovelace 2022.
VRAM
24 GB GDDR6 par GPU (300GB/s).
CPU
8-64 vCPUs AMD EPYC™ 7413.
Fréquence processeur
2.65 Ghz.
RAM
48-384 GB.
Type de RAM
DDR4.
Bande passante réseau
Jusqu'à 20 Gbps.
Stockage
Block Storage.
Performance GPU
Tensor Cores 4ème génération, RT Cores 3ème génération.
SLA
99.5%.
| Option and value | Price |
|---|---|
| ZoneParis 2 | |
| Instance1x | 0€ |
| Volume10GB | 0€ |
| IPv4 flexibleNon | 0€ |
DC5 est l'un des centres de données les plus écologiques d'Europe, entièrement alimenté par de l'énergie éolienne et hydraulique renouvelable (certifiée GO), avec un système de refroidissement ultra-efficace utilisant la ventilation directe et le refroidissement adiabatique. Avec un PUE de 1,16 (vs. 1,55 en moyenne dans l'industrie), il réduit la consommation d'énergie jusqu'à 30% par rapport aux centres de données traditionnels.

Managed Inference - Dedicated Deployments
Déployez des modèles d'IA dans une infrastructure dédiée, avec une sécurité sur mesure et un débit prévisible.

L40S
Accélérez le développement de la prochaine génération d'applications basées sur l'IA grâce à l'instance GPU universelle L40S.

H100 PCIe
Accélérez vos applications d'IA grâce aux GPUs H100.
La dépendance est l'ennemi de la résilience. Vos clients souhaitent que leurs données soient hébergées par un fournisseur régional. Gagnez en souveraineté avec nos outils et notre infrastructure multi-cloud.
Nous recyclons notre matériel, utilisons uniquement des énergies renouvelables, et minimisons notre consommation d'eau. En outre, notre efficacité énergétique (PUE) est disponible en ligne et en temps réel pour que puissiez vous en rendre compte par vous-même.
Tout écosystème cloud complet se doit d'être entièrement fiable. C'est pourquoi nous proposons 10 zones de disponibilité dans quatre régions différentes.
Les tarifs de nos instances GPU incluent les vCPU et la mémoire vive nécessaires pour des performances optimales.
Pour lancer l'instance GPU L4, vous devrez provisionner au minimum du Block Storage et une adresse IP flexible, à vos frais.
Si vous avez des doutes concernant le prix, utilisez le calculateur, il est fait pour ça !
Avant de louer une infrastructure GPU, vous devez faire correspondre vos besoins techniques au type d'instance approprié afin d'éviter tout surprovisionnement. Tenez compte des facteurs suivants :
Cas d'usage principal : effectuez-vous de l'encodage vidéo en temps réel, de l'inférence IA d'entrée de gamme ou du traitement graphique de base ne nécessitant pas une puissance de calcul extrême ?
Coût vs performances : évaluez si votre application nécessite réellement du matériel haut de gamme, ou si une architecture optimisée en termes de coûts offrira la même latence pour l'utilisateur final.
Contraintes de mémoire : vérifiez la taille des modèles que vous comptez prendre en charge. Pour les modèles plus petits ou les flux vidéo, 24 Go de VRAM sont souvent suffisants.
Équilibre entre CPU et RAM : assurez-vous que les ressources système associées peuvent gérer votre trafic web ou le pré-traitement des données sans créer de ralentissement sur votre GPU cloud.
Pour vous aider à prendre la bonne décision technique, consultez notre guide complet sur l'évaluation des instances GPU ici