Customer Success Story: EarthCube

Qui est Earthcube ?

Fondée en 2016, Earthcube propose des solutions d’ Intelligence Artificielle (IA) révolutionnaires qui ouvrent de nouvelles perspectives aux secteurs de la veille économique, de la sécurité, de l’environnement et de la défense.
Cette start-up française réunit actuellement plus de 50 experts du traitement d’images et de Machine Learning. Les solutions de surveillance qu’elle développe sont basées sur une analyse automatisée d’informations géospatiales.

Leur projet

Earthcube propose, sous licence, un logiciel de reconnaissance et d’analyse approfondie d’images satellites. Ses solutions sont à l’image de sa clientèle, c’est-à-dire riche et variée. Par exemple, l’entreprise propose des solutions de contrôle à distance de programmes de constructions. Avec de nombreuses agences gouvernementales en guise clients, ils offrent également des solutions qui répondent aux exigences de sécurité plus spécifiques à ce secteur.

En effet, l’un des produits phares d’Earthcube est un modèle permettant d’identifier des aéronefs à partir d’images et de modèles satellites (civils et militaires) avec un taux de précision de 94 %. L’ensemble des données d’apprentissage regroupe 200 000 avions identifiés dans 2 000 aéroports, avec une précision au pixel près.

Earthcube offre également des produits plus généraux, notamment une plate-forme complète de reconnaissance d’images « IA as a service », qui recoupe des informations géospatiales-clés. Cette plate-forme logicielle peut être déployée on premises ou consommée en mode SaaS.
Pour en savoir plus sur sa vision du Deep Learning et suivre son actualité, consultez la page Média ou la chaîne YouTube de l’entreprise.

La solution

Pour garantir une reconnaissance d’images très précise, le logiciel d’Earthcube a recours aux techniques de Deep Learning les plus récentes et à différents réseaux neuronaux, tels que le « Capsule Neural Network».

Concernant l’apprentissage de l’algorithme (le Deep Learning repose sur l’apprentissage automatique), l’entreprise s’appuie sur plusieurs méthodes, augmentation du temps de test ou inférence bayésienne, par exemple, et se sert de Tensorboard pour surveiller ses indicateurs.
Basées sur RetinaNet, les solutions d’Earthcube traitent des dizaines de millions de paramètres requis pour le traitement d’images (reconnaissance, classification et détection). Les résultats font ensuite l’objet d’un traitement global.

Pour garantir la haute qualité du modèle, de nombreux tests sont effectués sur environ 10 % des ensembles de données ‑ ces données ne sont jamais utilisées pendant les phases d’apprentissage ni même en validation croisée.

Pour la couche de persistance, l’entreprise s’appuie largement sur ses clients, car elle doit se connecter à leurs images pour les comparer ses modèles.
Chaque client a sa propre configuration et sa propre solution de stockage hétérogène, ce qui exige une parfaite interconnexion de son logiciel et une large variété de scénarios.
Par exemple, il est possible d’interconnecter de nombreux moteurs de base de données propriétaires, tels que MarkLogic ou des logiciels Open Source tels que PostGIS.

Pour les bases de données géographiques propriétaires, Earthcube utilise principalement min.io comme solution de stockage, mais a, parfois et exclusivement en interne, recours au moteur Google Earth Engine.
Dans tous les cas, ces sources de données se connectent toujours à sa plate-forme afin que ses équipes scientifiques disposent d’un environnement intégré facile à utiliser.

Figure 1 : Infrastructure d’acquisition des modèles de Deep Learning



Concernant l’environnement logiciel, l’entreprise favorise les solutions Open Source ou développées en interne. Celles-ci peuvent être déployées dans le cloud, ou directement sur les infrastructures du client si le logiciel doit être exécuté sur site. Certains clients ne sont pas encore passés au SaaS et préfèrent recourir au modèle traditionnel. La plate-forme de données internes de l’entreprise est donc construite à l’aide de Python et de logiciels Open Source tels que PyTorch.

Les tâches et les files d’attente d’Earthcube sont gérées à l’aide de Celery et de RabbitMQ. Les solutions sont généralement fournies sous forme de conteneurs, Docker servant d’environnement d’exécution.

Fig 2: Figure 2 : Workflow de l’application


ScaLes atouts de Scaleway

La valeur ajoutée d’Earthcube est principalement issue de ses modèles. Pour que le niveau de qualité recherché soit atteint, leur production nécessite une phase de calcul d’apprentissage intensive qui s’etend de 4 à 5 semaines. Pour réduire les temps de calcul et contrôler les coûts, Earthcube exécute en continu 10 instances Scaleway RENDER-S GPU.

Earthcube s’appuie sur l’écosystème cloud complet de Scaleway Elements pour exécuter ses tâches et mener à bien ses projets de recherche et développement, exécution de nombreux tests d’algorithmes et mise au point de maquettes exclusivement dédiées aux projets internes de l’entreprise, entre autres. Pour sécuriser ce type d’activités, un VPN a été configuré entre son pool RENDER-S et ses bases de données internes.

La consommation des ressources d’Earthcube est stable. Ses équipes doivent soumettre rapidement leurs modèles à un apprentissage et les tester en parallèle.
L’entreprise gère un nombre constant de nœuds avec un système de file d’attente pour les tâches. Le prix très compétitif des instances de RENDER-S l’autorise.
Par ailleurs, les analystes de données apprécient la disponibilité d’une instance avec processeur graphique dédié, sur lequel ils peuvent effectuer des réglages très fins et procéder à un débogage précis.

Renaud ALLIOUX, co-fondateur d’Earthcube, explique : « Nous sommes très satisfaits des instances RENDER-S, car elles offrent une interface simplifiée à des machines puissantes. Comme nous faisons partie des premiers utilisateurs GPU, nous avons également pu établir une relation privilégiée avec l’équipe IA via Slack pendant les différentes phases de tests ».

Earthcube attribue également une grande importance au fait que Scaleway soit une entreprise française, qui mène ses activités en France et respecte les lois en vigueur sur le territoire national. Cela rassure les clients locaux, et montre aux autres qu’il existe des alternatives aux géants de l’industrie.