Customer Success Story: Octopeek

Qui est Octopeek ?

Octopeek est une société de la deep tech qui fournit des logiciels d’analyse de données basés sur le Big Data et des solutions d’IA de pointe pour accompagner les entreprises dans leur transformation digitale. Son objectif est de faciliter et d’optimiser la prise de décisions fondée sur les données pour améliorer la productivité et les performances des entreprises de divers secteurs (e-commerce, des télécommunications, de l’automobile, de l’industrie, de l’énergie, des transports, de la banque, des assurances, du luxe, etc.).

Depuis sa création, Octopeek puise sa force de ses investissements en R&D et de ses partenariats actifs avec des universités et des laboratoires de recherche.

Octopeek propose plusieurs types et niveaux de services : Smart Data (plateforme Enrich), Big Data as a Service (plateforme Big Data managée – BDaaS) et AI as a Service (marketplace IA et outils commerciaux – AIaaS). Ces services permettent aux clients de collecter, stocker, sécuriser les données et d’en tirer pleinement parti grâce aux workflows de Data Science (nettoyage, enrichissement, analyse, modélisation, visualisation, traitement IA).

Octopeek Academ’AI complète l’offre de produit en assurant un accompagnement rigoureux basé sur les dernières technologies et un savoir-faire unique en matière de transformation des données.

Lors des formations, les participants ont accès à un cluster Hadoop managé, mis à disposition sur les serveurs Scaleway Dedibox, sur lequel ils peuvent passer de la théorie à la pratique.

Pour ses instances, l’entreprise utilise 14 serveurs dédiés Scaleway Dedibox sur lesquels sont installées les plateformes Proxmox et Cloudera. Ses machines virtuelles (VM) sont managées via Proxmox associé à KVM comme backend de virtualisation, et Ceph comme moteur de stockage, pour fournir une plateforme d’hébergement hyperconvergée. Consciente des besoins réseau, l’entreprise utilise le RPNv2 afin de bénéficier d’une large bande passante de manière continue, un besoin essentiel pour ses applications de Big Data. L’utilisation d’OpenvSwitch lui permet également de créer une architecture SDN. Octopeek expose uniquement les applications frontend sur le réseau public (comme le site Web d’Octopeek) et héberge toutes les autres ressources sur un réseau privé, disponible via un VPN.

Le schéma ci-dessus explique l’architecture en 3 niveaux d’Octopeek : au niveau inférieur, l’entreprise utilise les serveurs dédiés Scaleway Dedibox avec deux interfaces de réseau physique (Internet public et RPNv2 privé). Au second niveau, deux types de clusters ont été déployés :

  • Un cluster hyperconvergé managé à l’aide de Proxmox, qui utilise KVM pour la gestion des instances (machines virtuelles). Pour ses besoins de stockage, l’entreprise a choisi Ceph comme moteur de stockage persistant et un stockage local pour les machines virtuelles qui ne nécessitent pas ce degré de persistance. Ceph utilise uniquement le réseau RPNv2 pour ses communications et l’accès à son stockage ; il n’est pas accessible depuis le réseau public pour des raisons de sécurité. L’allocation de ressources de stockage peut se faire en local (si une VM est associée à un hyperviseur unique) ou via Ceph (pour autoriser le déplacement automatique ou volontaire des VM entre les nœuds). KVM permet la configuration d’un réseau public et d’un réseau privé (managé en mode bridge) et alloue des ressources réseau selon les besoins des différentes VM, avec des ressources réseau publiques ou privées, voire parfois les deux : Octopeek dispose de VM d’entraînement qui sont dotées d’interfaces réservées au réseau public, et d’autres au réseau privé.
  • Un cluster « Container As a Service » fonctionnant sous Kubernetes avec un stockage local. Les nœuds Kubernetes autorisent les connexions sur le réseau public ou privé et l’accès aux ressources depuis un système compute vers un autre est possible via un réseau privé commun avec le cluster Proxmox. Kubernetes possède son propre SDN sur son réseau privé utilisé par ses espaces de noms/pods.
    Chaque cluster a accès aux réseaux public et privé depuis le niveau inférieur, et chacun de ces clusters est responsable de l’allocation des ressources réseau et de stockage requises par le service qu’il héberge.

Le troisième et dernier niveau est le résultat de ce qui peut être déployé sur l’un ou l’autre des clusters pour concevoir une plateforme unifiée. L’entreprise utilise une plateforme sous-jacente pour fournir deux types d’hébergement différents :

  • « Academ’AI Hosting » pour ses ressources d’entraînement (VM et Container), qui dispose de ressources de réseau public uniques.
  • « Octopeek Hosting » pour ses ressources protégées/internes (VM ou Container), ses besoins de développement/intégration/production et les services d’hébergement dédiés à ses clients.

L’avantage Scaleway

La performance et la fiabilité de Scaleway Dedibox ont permis à Octopeek de proposer des cours et d’héberger des services pour ses clients depuis 2014. C’est sur la base de cette confiance que l’entreprise a décidé de continuer à évoluer et à se développer avec Scaleway.

Octopeek envisage actuellement de créer une nouvelle plateforme sur Scaleway Dedibox. Pour gérer les besoins de ses différentes équipes (Architecture, Infrastructure, Développement, Data Science) et stocker de grandes quantités de données. Une réflexion est également en cours sur l’utilisation de Kubernetes pour l’infrastructure et GPU afin de répondre aux besoins de traitement d’images.

Bertrand Laporte, CTO d’Octopeek, nous a confié avoir apprécié ses relations avec l’équipe commerciale de Scaleway qui vise à créer des liens durables : « L’équipe Scaleway est toujours à l’écoute et tient compte de nos intérêts. Nous avons travaillé ensemble afin de définir quelles branches de notre infrastructure s’intégreraient le mieux dans l’écosystème Scaleway, et l’équipe nous a aidés à trouver la solution la plus appropriée, ce qui nous a permis de nous concentrer davantage sur notre valeur ajoutée. »