Wayve implementiert End-to-End-MLOps mit W&B

„Wir nutzen W&B aktiv zur Nachverfolgung aller unserer Experimente. Dadurch konnten wir tief in Vergleiche eintauchen und in Echtzeit genau überwachen, was im Training passiert.“
Peter Matev
Technischer Leiter, Wayve

Volle Kraft voraus 

Das Rennen in eine autonome Zukunft ist hart. In einem Markt, der von Technologiegiganten und traditionellen Automobilherstellern dominiert wird, gibt ein KI-Unternehmen Vollgas, um sich von der Konkurrenz abzuheben. 

Wayve hat seinen Hauptsitz in London, Großbritannien, und ein zweites Büro in Kalifornien. Ziel des Unternehmens ist es, autonome Mobilität durch verkörperte Intelligenz neu zu definieren. Dies bedeutet, KI-Systeme zu entwickeln, die es Fahrzeugen ermöglichen, zu lernen, zu interagieren und sich an das Fahren in komplexen, realen Umgebungen anzupassen. 

Dies zu erreichen ist keine leichte Aufgabe. Wayve benötigt robuste Lösungen und Infrastruktur, damit seine Machine-Learning-Ingenieure (ML) effizient vom Experimentieren zur Produktion übergehen können. Obwohl sich interne Tools als erfolgreich erwiesen haben, arbeitet Wayve mit Weights & Biases zusammen, um sicherzustellen, dass der gesamte ML-Lebenszyklus unterstützt wird. 

Optimierung der Entwicklererfahrung 

Es erfordert viel Geduld, Mühe und Ressourcen, Modelle in die Produktion zu bringen. 

Bei Wayve gibt es ein ganzes Team, das sich der Verbesserung der Produktivität seiner ML-Ingenieure widmet. Das Team unter der Leitung von Peter Matev, Engineering Manager bei Wayve, konzentriert sich auf die Entwicklung von Tools und Pipelines für seine internen Benutzer – und alles beginnt mit der Datenexploration. 

Die Datenaufbereitung ist ein entscheidender Schritt im ML-Workflow. Allerdings kann es schwierig sein, Muster und Beziehungen in einem Datensatz zu erkennen, insbesondere wenn dieser groß ist. „Die Tools, die wir entwickeln, helfen unseren ML-Ingenieuren, die Daten schnell und auf unterschiedliche Weise zu durchforsten“, erklärt Peter. „Sie ermöglichen ein besseres Verständnis der Daten, sodass sie problemlos hochwertige Trainingsdatensätze erstellen können.“ 

Sobald die Daten verarbeitet sind, fährt Wayve mit dem Modelltraining fort – und hier kommt W&B ins Spiel. 

ML ist von Natur aus iterativ. Es erfordert die sorgfältige Verfolgung mehrerer Variablen. Mit W&B werden sich entwickelnde Informationen wie Hyperparameter, Metriken und Artefakte automatisch protokolliert und an einem Ort gespeichert, sodass sich Läufe leicht vergleichen und Problembereiche während des Trainings identifizieren lassen.

„Wir nutzen W&B aktiv zur Nachverfolgung aller unserer Experimente. Dadurch konnten wir tief in Vergleiche eintauchen und in Echtzeit genau überwachen, was im Training passiert“, sagte Peter. 

Darüber hinaus hilft W&B Wayve auch dabei, die Systemauslastung (GPU, CPU, Netzwerk, IO usw.) zu überwachen und in mehreren Diagrammen darzustellen. Diese Visualisierungen geben Einblick in mögliche Trainingsengpässe und stellen sicher, dass das Team die Computerressourcen effizient nutzt. 

„Mit W&B können wir unsere GPUs und Rechenknoten optimal nutzen“, sagte Peter. „Es bietet ein gewisses Maß an Überwachung unserer Infrastruktur, sodass wir unsere Modelle weiterhin in großem Maßstab trainieren können.“ 

Um alles zu dokumentieren, was hinter den Kulissen passiert, und einen Kontext für die Arbeit zu schaffen, verwendet Wayve umfassend W&B-Berichte. Das dynamische Tool hilft dabei, die gesamte Geschichte der vom Team durchgeführten Experimente zu erzählen, einschließlich dessen, was gut funktioniert hat, was nicht und was verbessert werden muss. 

„Unser Team nutzt die Berichtsfunktion recht häufig“, sagte Peter. „Sie war für sie hilfreich, um über ein bestimmtes Experiment zu sprechen, das sie durchgeführt hatten, und die Details mit einer größeren Gruppe zu teilen.“ 

Azurblau mit Gewichten und Biases 

Um ihren ML-Workflow für Trainings- und Inferenz-Workloads zu unterstützen, nutzt Wayve Microsoft Azure. Das Team verwendet eine Kombination aus AzureML, Azure Kubernetes Service und nativen Azure-Datenbanken und Netzwerkinfrastruktur. Microsoft Azure ermöglicht es Wayve, seine Modelle flexibel, sicher und in enormem Umfang bereitzustellen. 

W&B lässt sich nahtlos in ML-Workloads integrieren, die auf Microsoft Azure ausgeführt werden, einschließlich aller Trainings- und Inferenz-Workloads, die auf AzureML ausgeführt werden. Durch die Integration kann Wayve W&B schnell und einfach in seinem gesamten ML-Workflow nutzen. 

Der Weg in die Zukunft 

Da das Rennen um die AV-Technologie immer intensiver wird, wird die Rationalisierung und Optimierung der Prozesse, die mit der Entwicklung und Bereitstellung von KI-Systemen verbunden sind, für Wayve immer wichtiger. Neben seinen internen Tools setzt Wayve auf W&B, um die betrieblichen Anforderungen des gesamten ML-Lebenszyklus zu unterstützen. Durch die Integration von W&B in den Workflow kann Wayve Experimente in Echtzeit protokollieren und visualisieren, den Ressourcenverbrauch verbessern und die Kosten senken sowie die Erfahrung der KI-Entwickler optimieren, um die Produktivität zu steigern. 

„Wir sehen definitiv einen großen Vorteil in der Verwendung von W&B“, sagte Peter. „Die Anzahl der Experimente, die wir parallel durchführen können, ist exponentiell gewachsen, und es ist wertvoll, um sicherzustellen, dass wir aus diesen Experimenten die richtigen Erkenntnisse gewinnen.“