Customer Success Story: EarthCube

Was ist Earthcube?

Earthcube wurde 2016 gegründet und bietet revolutionäre KI-Lösungen an, um Branchen in den Bereichen wirtschaftliche Intelligenz, Sicherheit, Umwelt und Verteidigung zu unterstützen.
Das französische Start-up versammelt derzeit ein Team von fast 50 Experten für Bildverarbeitung und Machine Learning. Earthcube entwickelt Überwachungslösungen, die auf einer automatisierten Analyse von Geodaten basieren.

Ihr Projekt

Earthcube lizenziert Software für die Erkennung und Tiefenanalyse von Satellitenbildern. Das Unternehmen richtet sich an unterschiedliche Zielgruppen, was das breite Angebot an Lösungen erklärt.
Diese ermöglichen zum Beispiel die Remote-Überwachung von Bauprojekten für Entwicklungsagenturen.

Mit vielen Regierungsbehörden als Kunden bietet das Unternehmen auch Lösungen an, die den speziellen Sicherheitsanforderungen des Sektors gerecht werden.

Eines der Vorzeigeprodukte ist ein Flugzeugerkennungsmodell, das die Identifizierung von Flugzeugen auf Satelliten Images und Modellen (zivil und militärisch) mit einer Genauigkeitsrate von 94 Prozent ermöglicht.
Der Trainingsdatensatz enthält 200.000 Flugzeuge, die an 2.000 Flughäfen auf den Pixel genau gelabelt wurden.

Das Angebot umfasst auch allgemeinere Produkte wie eine komplette „Intelligence as a Service“ Bilderkennungsplattform, die Querverweise auf wichtige Geodaten enthält und die entweder als On-Premise-Software oder als SaaS-Lösung genutzt werden kann.
Um mehr über ihre Vision von Deep Learning und ihre Neuheiten zu erfahren, können Sie die entsprechende Medien-Seite oder den YouTube-Kanal besuchen.

Ihre Lösung

Um Präzision und Genauigkeit bei der Bilderkennung zu erreichen, verwendet die Software von Earthcube die neuesten Deep-Learning-Techniken und eine Vielzahl von neuronalen Netzwerken wie das „Capsule Neural Network“.
Hinsichtlich des Trainings des Algorithmus (Deep Learning zeichnet sich durch Machine Learning aus) setzt das Unternehmen auf viele Methoden wie Test-Time Augmentation oder Bayesian Inference. Das Unternehmen nutzt Tensorboard zur Überwachung seiner Indikatoren.
Die Lösungen von Earthcube basieren auf RetinaNet, mit dem sie Dutzende von Millionen von Parametern verarbeiten können, die für die Bildverarbeitung (Erkennung, Klassifizierung und Erfassung) erforderlich sind, gefolgt von einer globalen Nachbearbeitung der Ergebnisse.

Um die hohe Qualität des Modells aufrechtzuerhalten, werden zahlreiche Tests auf etwa 10 Prozent ihrer Datensätze durchgeführt. Diese Daten werden niemals während der Lernphasen oder gar in der Vergleichsprüfung verwendet.

Für die Persistenzschicht ist das Unternehmen stark von seinen Kunden abhängig, da es sich mit deren Images verbinden muss, um Modelle zu vergleichen.
Jeder Kunde hat seine eigene Konfiguration und heterogene Speicherlösung, die dafür sorgen, dass ihre Software gut miteinander verbunden ist.
Zum Beispiel können viele proprietäre Datenbank-Systeme wie MarkLogic oder Open-Source-Software wie PostGIS miteinander verbunden werden.

Für proprietäre geografische Datenbanken verwendet Earthcube hauptsächlich min.io als Speicherlösung, aber sie verwenden auch gelegentlich, und ausschließlich intern, die Google Earth Engine.
In jedem Fall sind alle diese Datenquellen mit ihrer Plattform verbunden, um ihren wissenschaftlichen Teams eine integrierte, benutzerfreundliche Umgebung zu bieten.

Abb. 1: Zeigt die Infrastruktur, die verwendet wird, um Deep-Learning-Modelle zu trainieren, die in ihrer Anwendung eingesetzt werden



Was die Softwareumgebung betrifft, so favorisiert das Unternehmen Open-Source- oder selbst entwickelte Lösungen. Diese können sowohl in der Cloud bereitgestellt werden, als auch vor Ort, für Kunden, die die Software On-Premise ausführen müssen. Aus Sicherheitsgründen bevorzugen einige Kunden On-Premise-Infrastrukturen, weshalb der Großteil der internen Data-Science-Plattform mit Python und Open-Source-Software wie PyTorch aufgebaut ist.

Die Aufgaben und Warteschlangen von Earthcube werden mit Celery und RabbitMQ verwaltet. Lösungen werden in der Regel in Form von Containern bereitgestellt, mit Docker als Laufzeitumgebung.

Abb. 2: Erläutert den Arbeitsablauf der Anwendung


Scaleway-Vorteile

Der Hauptmehrwert von Earthcube sind die Modelle. Daher erfordert die Produktion dieser Modelle eine intensive Trainingsberechnungsphase von 4 bis 5 Wochen, um die Qualitätsstufe zu gewährleisten. Um den Berechnungszeitraum zu reduzieren und die Kosten zu kontrollieren, betreibt Earthcube kontinuierlich 10 leistungsstarke RENDER-S GPU Instances, die Scaleway preiswert zur Verfügung stellt.

Earthcube nutzt das vielfältige Cloud-Ökosystem von Scaleway Elements zur Ausführung von Aufgaben und Projekten im Bereich Forschung und Entwicklung, wie z. B. die Durchführung zahlreicher Algorithmustests und mehrerer Modelle, und zur ausschließlichen Entwicklung interner Projekte des Unternehmens. Für diese Tätigkeit wurde ein VPN zwischen dem RENDER-S-Pool und den internen Datenbanken konfiguriert.

Der Ressourcenverbrauch von Earthcube ist konstant und die Teams müssen fleißig ihre Modelle trainieren und parallel testen.
Sie verwalten eine konstante Anzahl von Nodes mit einem Warteschlangensystem für Aufgaben, was durch die besonders preiswerten RENDER-S Instances ermöglicht wird.
Darüber hinaus schätzen Datenwissenschaftler den Zugriff auf eine Instance mit dedizierter GPU, auf der sie Feinabstimmungen und präzises Debugging durchführen können.

Renaud ALLIOUX, der Mitgründer von Earthcube, erklärt: „Wir sind sehr zufrieden mit den RENDER-S Instances, sie bieten eine einfache Schnittstelle für leistungsstarke Maschinen. Auch das Kundenbetreuungsteam von Scaleway ist sehr gut erreichbar.“ Er fügt hinzu: „Als einer der ersten GPU-Benutzer hatten wir auch die Möglichkeit, durch Slack eine ausgezeichnete Beziehung mit dem KI-Team von Scaleway aufzubauen.“

Das Start-up legt auch großen Wert darauf, dass Scaleway ein französisches Unternehmen ist, das in Frankreich ansässig ist und sich an französisches Recht hält. Das beruhigt ihre Kunden, zeigt aber vor allem deutlich, dass es Alternativen zu den meist ausländischen Branchenriesen gibt.