Instances GPU H100 PCIe

Des performances fiables pour toutes les charges de travail liées à l'IA.

Une puissance accessible

Bénéficiez de l'architecture NVIDIA Hopper sans la complexité d'un cluster de supercalculateurs. Idéal pour affiner les modèles et exécuter des tâches d'inférence à haut débit.

Une évolutivité efficace

Déployez des nœuds à un ou deux GPUs en fonction de votre charge de travail. Les H100 PCIe garantissent un transfert des données rapide entre le CPU et le GPU, notamment pour les applications gourmandes en ressources.

Des instances souveraines et sécurisées

Entraînez vos modèles comme vous le souhaitez : hébergés en Europe (à Paris et à Varsovie), vos modèles et données restent sous juridiction européenne et ne sont pas soumis aux réglementations extraterritoriales.

La référence en matière d'IA d'entreprise

Les instances H100 PCIe intègrent la puissance du H100 de manière polyvalente. Conçues pour les entreprises ayant besoin de puissance de calcul brute pour affiner des LLMs, exécuter des simulations scientifiques, ou faire fonctionner des modèles d'IA générative à grande échelle, ces instances allient performance et flexibilité de déploiement.

: Adaptez les modèles de base à vos données. Avec 80 GB de mémoire par carte, les H100 PCIe sont idéales pour affiner des modèles 7B (et jusqu'à 70B avec une quantification poussée) bien plus rapidement que sur les précédentes générations de hardware.

: Exécutez des modèles complexes à grande échelle. Profitez du Transformer Engine pour automatiser la précision FP8, obtenant ainsi des performances d'inférence jusqu'à 30 fois plus rapides pour les applications d'IA générative par rapport à l'A100.

: Les H100 PCIe offrent des gains de performances considérables en double précision (FP64), accélérant ainsi les simulations en matière de dynamique des fluides, de modélisation climatique et de dynamique moléculaire.

Fonctionnalités

Consulter nos tarifs

gpu
GPU
NVIDIA H100 PCIe5.
processor_type
Architecture
NVIDIA Hopper 2022.
gpu_memory
VRAM
80 GB HBM2E par GPU (2TB/s).
processor
CPU
24-48 vCPUs AMD EPYC™ 9334.
bandwidth
Fréquence processeur
2.7 Ghz.
memory
RAM
240-480 GB.
memory_type
Type de RAM
DDR5.
bandwidth
Bande passante réseau
Jusqu'à 20 Gbps.
storage
Stockage
Block Storage et Scratch Local NVMe.
threads_cores
Performance GPU
1513 TFLOPS FP16 Tensor Cores.
service_level
SLA
99.5%.

Témoignages clients

Temps d'exécution réduit de 40 % par rapport aux autres fournisseurs

Les spécialistes de l'IA souveraine Golem.ai ont mené une étude comparative rigoureuse entre Replicate.com et l'infrastructure de Scaleway. Après avoir réalisé plus de 100 tests, leur analyse technique approfondie a révélé un gain de vitesse d'exécution de 40% en faveur des Instances H100 PCIe de Scaleway.

Lisez l'analyse complète

Estimez vos coûts GPUs

Choisissez votre forfait

Coût estimé

Option and value	Price
ZoneParis 2
Instance1x	0€
Volume10GB	0€
IPv4 flexibleNon	0€

Créez votre GPU H100 PCIe aujourd'hui

Innovation verte : jusqu'à 30% d’énergie en moins, 100% renouvelable

DC5 est l'un des centres de données les plus écologiques d'Europe, entièrement alimenté par de l'énergie éolienne et hydraulique renouvelable (certifiée GO), avec un système de refroidissement ultra-efficace utilisant la ventilation directe et le refroidissement adiabatique. Avec un PUE de 1,16 (vs. 1,55 en moyenne dans l'industrie), il réduit la consommation d'énergie jusqu'à 30% par rapport aux centres de données traditionnels.

En savoir plus Nos engagements environnementaux

Besoin de plus de puissance ? Découvrez notre gamme de GPUs

H100-SXM
Accélérez le développement d'applications d'IA grâce aux instances GPU H100-SXM.
Découvrez la gamme
B300-SXM
Repoussez les limites de la performance grâce à l'architecture Blackwell de NVIDIA.
Découvrez la gamme
Managed Inference - Dedicated Deployments
Déployez des modèles d'IA dans une infrastructure dédiée, avec une sécurité sur mesure et un débit prévisible.
Découvrez Managed Inference

Choisissez la plateforme cloud prête pour l'avenir

Souveraineté des données clients

La dépendance est l'ennemi de la résilience. Vos clients souhaitent que leurs données soient hébergées par un fournisseur régional. Gagnez en souveraineté avec nos outils et notre infrastructure multi-cloud.

Des data centers durables

Nous recyclons notre matériel, utilisons uniquement des énergies renouvelables, et minimisons notre consommation d'eau. En outre, notre efficacité énergétique (PUE) est disponible en ligne et en temps réel pour que puissiez vous en rendre compte par vous-même.

Faible latence

Tout écosystème cloud complet se doit d'être entièrement fiable. C'est pourquoi nous proposons 10 zones de disponibilité dans quatre régions différentes.

Foire aux questions

Quelle est la différence entre le H100-1-80G et le H100-2-80G ?

Il s'agit de deux formats d'une même instance équipée d'un GPU NVIDIA H100 PCIe Tensor Core.

L'instance H100-1-80G intègre un GPU NVIDIA H100 PCIe Tensor Core, offrant une mémoire GPU de 80 Go
H100-2-80G intègre 2 GPU NVIDIA H100 PCIe Tensor Core, offrant une mémoire GPU de 2 fois 80 Go. Cette instance permet un temps d'entraînement plus rapide pour les modèles Transformers plus volumineux qui utilisent 2 GPUs à la fois.

Comment puis-je utiliser MIG pour exploiter pleinement mon GPU ?

La technologie Multi-Instance GPU (MIG) est une technologie mise au point par NVIDIA pour améliorer l'utilisation et la flexibilité de ses GPUs ; elle est spécialement conçue pour les environnements de virtualisation et les environnements multi-locataires. Elle permet de diviser un seul GPU physique en sept instances distinctes au maximum, chacune fonctionnant comme une partition MIG indépendante dotée de ses propres ressources dédiées, telles que la mémoire, les cœurs de calcul et les sorties vidéo.
Consultez notre documentation dédiée pour utiliser MIG su votre instance GPU.

Comment choisir le GPU adapté à mes besoins ?

Il existe de nombreux critères à prendre en compte pour choisir l'instance GPU adaptée :

Exigences de la charge de travail
Exigences de performance
Type de GPU
Mémoire GPU
CPU et RAM
Compatibilité des pilotes GPU et des logiciels
Évolutivité

Pour plus d'informations, consultez la documentation dédiée.

Qu'est-ce que NVLink ?

NVLink est une technologie d'interconnexion haut débit développée par NVIDIA qui permet d'accélérer le transfert de données entre les GPU, ainsi qu'entre GPU et CPU.
Elle est conçue pour augmenter considérablement la bande passante et réduire la latence des transferts de données par rapport aux connexions PCIe (Peripheral Component Interconnect Express) traditionnelles. C'est particulièrement utile dans les environnements de calcul haute performance (HPC) et les datacenters où plusieurs GPU sont utilisés en parallèle pour accélérer les calculs.
Pour en savoir plus, cliquez ici.

En combien de temps puis-je commencer à louer un GPU dans le cloud ?

Vous pouvez déployer des ressources en quelques minutes : créez un compte Scaleway, configurez vos autorisations IAM, puis suivez les instructions dans la console pour déployer votre GPU cloud H100 PCIe.

Fine-tuning précis et efficace

Inférence complexe

Calcul scientifique