ChatGPT-Alternative OpenAssistant: Eine Konversations-KI für alle

Die LAION-Community hat mit Andreas Köpf und Yannic Kilcher eine Open-Source-Alternative zu ChatGPT gebaut: OpenAssistant ist samt Datensätzen frei verfügbar.

In Pocket speichern vorlesen Druckansicht 47 Kommentare lesen

(Bild: Photobank gallery / Shutterstock.com)

Lesezeit: 14 Min.
Von
  • Silke Hahn
Inhaltsverzeichnis

Unter dem Motto "Conversational AI for everyone" (Konversations-KI für alle) ist OpenAssistant erschienen: Laut seinen Herausgebern handele es sich um das erste vollständig quelloffene, auf Instruktionen abgestimmte Modell, das anhand menschlicher Daten trainiert wurde (eine einschränkende Anmerkung dazu weiter unten). Der quelloffene KI-Chatbot geht als offene Alternative zu ChatGPT ins Rennen. Hinter dem Projekt steht der Verein für Open-Source-KI LAION e.V. (Large-Scale Artificial Intelligence Network), dessen Datensätze unter anderem Stable Diffusion ermöglichten, ein seit August 2022 verbreitetes offenes KI-System zur Bildsynthese. Neben dem Chatbot übergeben die Herausgeber den zum Training verwendeten Datensatz sowie mehrere vortrainierte Modelle der Öffentlichkeit als Open Source. Der Code und die Daten stehen auf Hugging Face frei zur Verfügung.

Mehr zu ChatGPT und KI-Textgeneratoren
Mehr zu KI-Tools

Treibende Kraft des Projekts sind der Entwickler Andreas Köpf und der von YouTube bekannte Technik-Influencer Yannic Kilcher. Gemeinsam mit der LAION-Community hatten sie in den vergangenen Monaten textbasierten Input und Feedback gesammelt, um einen hochwertigen Datensatz zum Training zu erstellen. Den Herausgebern zufolge handelt es sich um ein Entwicklerwerkzeug zum Erstellen weiterer zeitgemäßer (State-of-the-Art, SOTA) Modelle.

Die Daten decken eine breite Spanne an Themen und Schreibstilen ab, über 600.000 von Menschen erstellte Datenpunkte sollen laut Kilcher in den Datensatz und das Modelltraining eingeflossen sein. Wie die großen Bilddatensätze von LAION sei der auf Konversation geeichte Datensatz als Ausgangsbasis zum Trainieren weiterer Sprachmodelle und KI-Anwendungen gedacht, und Entwicklerprojekte können frei darauf zugreifen. Alle Modelle stehen unter der Apache-2.0-Lizenz (ausgenommen die auf LLaMA basierenden, die das Projekt wegen Lizenzproblemen bislang nicht veröffentlicht hat).

(This article is also available in English.)