Hugging Face startet offenes Robotik-Projekt

Die KI-Plattform Hugging Face ruft ein Open-Source-Robotikprojekt ins Leben. Leiten soll es der zuvor bei Tesla angestellte Wissenschaflter Remi Cadene.

In Pocket speichern vorlesen Druckansicht

(Bild: Tatiana Shepeleva/Shutterstock.com)

Lesezeit: 2 Min.

Die offene KI-Plattform Hugging Face startet ihr nächstes ambitioniertes Projekt: eine offene Robotikumgebung. Aufbauen soll sie der Wissenschaftler Remi Cadene, wie dieser über X (vormals Twitter) mitteilte. Zuvor arbeitet Cadene bei Tesla an der Entwicklung des Autopiloten und des humanoiden Allzweckroboters Optimus. Wissenschaftlich befasst er sich mit den Mechanismen, die der Intelligenz zugrunde liegen und insbesondere damit, menschliche Verhaltensweisen mithilfe künstlicher neuronaler Netze nachzubilden. Dazu erforscht er neue Architekturen, Lernmethoden, theoretische Frameworks und insbesondere auch Ansätze, die Ergebnisse und Entscheidungswege von KI-Systemen erklärbar zu machen.

Für das neue Projekt hat Hugging Face bereits eine weitere Stelle ausgeschrieben: Gesucht wird ein Robotik-Ingenieur, der ein kostengünstiges Robotiksystem auf Basis von Open Source und Deep Learning entwickeln soll. Zu dessen Aufgaben soll unter anderem die Entwicklung von Algorithmen für Bewegungsplanung und -steuerung sowie Wahrnehmung und Navigation gehören.

Huggingface ist seit seiner Gründung im Jahr 2016 zu der Plattform schlechthin für die Entwicklung, den Austausch und das Benchmarking offener Machine-Learning-Systeme herangewachsen. Betrieben wird die Infrastruktur vom gleichnamigen französisch-amerikanischen Unternehmen. Ein wichtiger Service ist die Transformers-Library, die Huggingface-Nutzern Open-Source-Implementierungen von Modellen für Bild-, Text- und Audio-Aufgaben zur Verfügung stellt. 2021 rief Huggingface die BigScience-Initiative ins Leben, um ein Open-Source-LLM (Large Language Model) als Gegengewicht zu den proprietären Sprach-KIs von OpenAI, Meta oder Google zu entwickeln. Ein Jahr später präsentierte der Verbund aus unabhängigen Forschern und kleineren Unternehmen das 176-Milliarden-Parameter-Modell BLOOM.

Mit seinem geplanten Robotikprojekt geht Hugging Face den logischen nächsten Schritt. Denn maschinell trainierte Systeme werden zunehmend multimodal, verarbeiten also immer mehr Arten von Eingabedaten simultan und geben sie auf unterschiedliche Arten aus. Derzeit kombinieren sie vor allem Bild und Text, aber auch Audio, Video und Sensordaten fließen zunehmend in die Trainings multimodaler Modelle ein. Zentraler Baustein der multimodalen KIs sind große Sprachmodelle wie GPT oder LLaMA, weil sie bereits recht umfangreiches Weltwissen verinnerlicht haben und dieses häufig bereits erstaunlich gut anwenden können. Deshalb wird auch in der Robotik zunehmend mit LLMs experimentiert, die etwa kurze Anweisungen von Nutzern in detaillierte Ablaufpläne für Roboter übersetzen sollen.

(atr)