Puis-je obtenir de plus amples informations avant de m'inscrire ?

Bien sûr ! Rejoignez notre [communauté slack] (https://scaleway-community.slack.com/ssb/redirect) dans le canal #ai et posez votre question.

Le produit est-il déjà disponible ? Quand le produit sera-t-il lancé ?

Nous menons présentement un bêta test avec des partenaires sélectionnés afin de nous assurer que notre plateforme est parfaitement adaptée au marché européen. Une version bêta publique, accessible à un public plus large, est prévue pour la fin du deuxième trimestre 2024. Pour rester informé des mises à jour ou des développements liés à cette solution, nous vous encourageons vivement à vous inscrire et à exprimer votre intérêt. Nous vous remercions de votre patience !

Puis-je servir mon modèle privé avec cette solution ?

C'est prévu, oui ! mais l'hébergement de modèles privés ne sera pas disponible pendant dans la phase de bêta du produit. Nous vous tiendrons au courant de l'évolution - si vous vous inscrivez sur notre liste ;)

Accueil LLM inference

LLM Inference

Servez des modèles d'IA générative et répondez à tous les prompts de vos utilisateurs européens en toute sécurité.

Intéressé ? Inscrivez-vous !Soyez informé de la sortie du produit

Choisissez parmi les LLM prêts à être servis

Qu'est-ce qui accelère l'inférence ? L'optimisation du modèle d'IA utilisé est un leviers. Pour être utilisé rapidement, un modèle doit être optimisé pour les machines (GPU) qui l'exécutent.
Ce n'est pas toujours une mince affaire, et le processus peut prendre beaucoup de temps. C'est pourquoi Scaleway fournit une bibliothèque de modèles évolutifs, avec des LLM optimisés.

Bénéficier d'une infrastructure H100-PCIe dédiée

Les Instances GPU H100 PCIe excellent pour inférer les modèles les plus exigeants. En s'appuyant sur des formats de données avancés et sur son moteur "transformer Engine" innovant, les Instances GPU H100 PCIe multiplient par 30 la vitesse d'inférence par rapport à leur prédécesseur, le GPU NVIDIA A100.

Utilisez un Cloud Européen complétement sécurisé

Bénéficiez d'une sécurité sur mesure pour votre infrastructure : des environnements VPC hautement sécurisés aux configurations accessibles depuis Internet et des tokens IAM.
Contrôle total des données : aucun stockage ni accès d'un tiers à vos données (prompts et réponses), ce qui garantit qu'elles restent exclusivement les vôtres et qu'elles se trouvent en Europe.

Zones disponibles :

Paris:PAR 2

Les meilleurs LLMs Open-Weights

Mixtral-8x7B-Instruct-v0.1

Entrainé sur Nabuchodonosor 2023 de Scaleway, Mixtral-8x7B est un modèle de type Sparse Mixture of Experts génératif de pointe. Il a été travaillé pour surpasser les performances du modèle Llama 2 70B dans une cas d'usage.

Bénéficier d'un écosystème Cloud européen sécurisé

Réseau privé

Vos LLMs sont accessibles via une connexion sécurisée grâce à un réseau privé régional résilient.

Gestion des accès

Nous rendons les terminaux d'IA générative compatibles avec la gestion des identités et des accès de Scaleway (IAM), afin que vos déploiements soient conformes aux exigences de votre architecture d'entreprise.

Observabilité

Identifiez les goulots d'étranglement dans vos déploiements, visualisez les demandes d'inférence en temps réel et faites même état de votre consommation d'énergie grâce à l'intégration de solution d'observabilité entièrement managée (Cockpit)

Scaleway est un Partenaire Elite de NVIDIA

LLM Inference

Choisissez parmi les LLM prêts à être servis

Bénéficier d'une infrastructure H100-PCIe dédiée

Utilisez un Cloud Européen complétement sécurisé

Les meilleurs LLMs Open-Weights

Mixtral-8x7B-Instruct-v0.1

Llama-2-70B

WizardLM-70B-V1.0

Bénéficier d'un écosystème Cloud européen sécurisé

Réseau privé

Gestion des accès

Observabilité

Scaleway est un Partenaire Elite de NVIDIA