Une puissance accessible
Bénéficiez de l'architecture NVIDIA Hopper sans la complexité d'un cluster de supercalculateurs. Idéal pour affiner les modèles et exécuter des tâches d'inférence à haut débit.
Des performances fiables pour toutes les charges de travail liées à l'IA.

Bénéficiez de l'architecture NVIDIA Hopper sans la complexité d'un cluster de supercalculateurs. Idéal pour affiner les modèles et exécuter des tâches d'inférence à haut débit.
Déployez des nœuds à un ou deux GPUs en fonction de votre charge de travail. Les H100 PCIe garantissent un transfert des données rapide entre le CPU et le GPU, notamment pour les applications gourmandes en ressources.
Entraînez vos modèles comme vous le souhaitez : hébergés en Europe (à Paris et à Varsovie), vos modèles et données restent sous juridiction européenne et ne sont pas soumis aux réglementations extraterritoriales.
Les instances H100 PCIe intègrent la puissance du H100 de manière polyvalente. Conçues pour les entreprises ayant besoin de puissance de calcul brute pour affiner des LLMs, exécuter des simulations scientifiques, ou faire fonctionner des modèles d'IA générative à grande échelle, ces instances allient performance et flexibilité de déploiement.
Adaptez les modèles de base à vos données. Avec 80 GB de mémoire par carte, les H100 PCIe sont idéales pour affiner des modèles 7B (et jusqu'à 70B avec une quantification poussée) bien plus rapidement que sur les précédentes générations de hardware.
Exécutez des modèles complexes à grande échelle. Profitez du Transformer Engine pour automatiser la précision FP8, obtenant ainsi des performances d'inférence jusqu'à 30 fois plus rapides pour les applications d'IA générative par rapport à l'A100.
Les H100 PCIe offrent des gains de performances considérables en double précision (FP64), accélérant ainsi les simulations en matière de dynamique des fluides, de modélisation climatique et de dynamique moléculaire.

GPU
NVIDIA H100 PCIe5.
Architecture
NVIDIA Hopper 2022.
VRAM
80 GB HBM2E par GPU (2TB/s).
CPU
24-48 vCPUs AMD EPYC™ 9334.
Fréquence processeur
2.7 Ghz.
RAM
240-480 GB.
Type de RAM
DDR5.
Bande passante réseau
Jusqu'à 20 Gbps.
Stockage
Block Storage et Scratch Local NVMe.
Performance GPU
1513 TFLOPS FP16 Tensor Cores.
SLA
99.5%.

Temps d'exécution réduit de 40 % par rapport aux autres fournisseurs
Les spécialistes de l'IA souveraine Golem.ai ont mené une étude comparative rigoureuse entre Replicate.com et l'infrastructure de Scaleway. Après avoir réalisé plus de 100 tests, leur analyse technique approfondie a révélé un gain de vitesse d'exécution de 40% en faveur des Instances H100 PCIe de Scaleway.
| Option and value | Price |
|---|---|
| ZoneParis 2 | |
| Instance1x | 0€ |
| Volume10GB | 0€ |
| IPv4 flexibleNon | 0€ |
DC5 est l'un des centres de données les plus écologiques d'Europe, entièrement alimenté par de l'énergie éolienne et hydraulique renouvelable (certifiée GO), avec un système de refroidissement ultra-efficace utilisant la ventilation directe et le refroidissement adiabatique. Avec un PUE de 1,16 (vs. 1,55 en moyenne dans l'industrie), il réduit la consommation d'énergie jusqu'à 30% par rapport aux centres de données traditionnels.

H100-SXM
Accélérez le développement d'applications d'IA grâce aux instances GPU H100-SXM.

B300-SXM
Repoussez les limites de la performance grâce à l'architecture Blackwell de NVIDIA.

Managed Inference - Dedicated Deployments
Déployez des modèles d'IA dans une infrastructure dédiée, avec une sécurité sur mesure et un débit prévisible.
La dépendance est l'ennemi de la résilience. Vos clients souhaitent que leurs données soient hébergées par un fournisseur régional. Gagnez en souveraineté avec nos outils et notre infrastructure multi-cloud.
Nous recyclons notre matériel, utilisons uniquement des énergies renouvelables, et minimisons notre consommation d'eau. En outre, notre efficacité énergétique (PUE) est disponible en ligne et en temps réel pour que puissiez vous en rendre compte par vous-même.
Tout écosystème cloud complet se doit d'être entièrement fiable. C'est pourquoi nous proposons 10 zones de disponibilité dans quatre régions différentes.
Il s'agit de deux formats d'une même instance équipée d'un GPU NVIDIA H100 PCIe Tensor Core.
La technologie Multi-Instance GPU (MIG) est une technologie mise au point par NVIDIA pour améliorer l'utilisation et la flexibilité de ses GPUs ; elle est spécialement conçue pour les environnements de virtualisation et les environnements multi-locataires. Elle permet de diviser un seul GPU physique en sept instances distinctes au maximum, chacune fonctionnant comme une partition MIG indépendante dotée de ses propres ressources dédiées, telles que la mémoire, les cœurs de calcul et les sorties vidéo.
Consultez notre documentation dédiée pour utiliser MIG su votre instance GPU.
Il existe de nombreux critères à prendre en compte pour choisir l'instance GPU adaptée :
Pour plus d'informations, consultez la documentation dédiée.
NVLink est une technologie d'interconnexion haut débit développée par NVIDIA qui permet d'accélérer le transfert de données entre les GPU, ainsi qu'entre GPU et CPU.
Elle est conçue pour augmenter considérablement la bande passante et réduire la latence des transferts de données par rapport aux connexions PCIe (Peripheral Component Interconnect Express) traditionnelles. C'est particulièrement utile dans les environnements de calcul haute performance (HPC) et les datacenters où plusieurs GPU sont utilisés en parallèle pour accélérer les calculs.
Pour en savoir plus, cliquez ici.
Vous pouvez déployer des ressources en quelques minutes : créez un compte Scaleway, configurez vos autorisations IAM, puis suivez les instructions dans la console pour déployer votre GPU cloud H100 PCIe.