Internetwerkstatt

Eine Arena für KI-Kämpfe

von Christina Quast

Welche KI hilft mir am besten? (Foto: AdobeStock/Vaidotas)
Welche KI hilft mir am besten? (Foto: AdobeStock/Vaidotas)

Mehr als 300 KI-Modelle von zahlreichen Unternehmen aus den USA, Asien und Europa sind mittlerweile online. Und ständig kommen neue hinzu. So hat OpenAI seit dem Start von ChatGPT schon Dutzende KI-Modelle veröffentlicht – zuletzt GPT-5.2 in den Varianten instant, thinking und pro.

Das Vergleichs-Tool
Die beste KI für sich in dieser Masse finden, möchte die LMArena, und zwar auf verschiedenen Wegen: dem Battle- oder Side-by-Side-Modus und einem Leaderboard. Das KI-Werkzeug ermöglicht es, die Antworten von zwei selbst oder zufällig ausgewählten KI-Modellen zu vergleichen und zu bewerten.

LMArena ist übersichtlich und ähnelt anderen bekannten KIs: Es gibt ein Eingabefeld mit Buttons für den Prompt, um die Websuche zu aktivieren oder das Generieren von Bildern oder Videos auszuwählen. Im Menü am linken Rand finden sich zunächst nur die Optionen
„New Chat“ und „Leaderboard“, darunter werden die eingegebenen Prompts archiviert. Der wichtigste Unterschied zu einer üblichen KI ist, dass man einen Modus auswählen muss: Battle, Side by Side oder Direct Chat.

  • Battle-Modus: Für einen Prompt werden Antworten von zwei zufällig ausgewählten und anonymisierten KI-Modellen gegeben. Erst wenn man die Ergebnisse verglichen und bewertet hat, werden die Namen eingeblendet.
  • Side-by-Side-Modus: Für einen Prompt kann man selbst zwei verschiedene KI-Modelle auswählen, um deren Antworten nebeneinanderzustellen und zu beurteilen.
  • Direct Chat: ist mit einer Multi-KI identisch, denn man kann ein KI-Modell von verschiedenen Anbietern auswählen, um einen Prompt zu bearbeiten.
LMArena: Start und Side-by-Side-Modus
LMArena: Los geht's

Ergebnisse
Für die journalistische Arbeit sind der Battle- und Side-by-Side-Modus besonders interessant, weil man Antworten von zwei KI-Modellen erhält, die bei LMArena direkt nebeneinander angezeigt werden und sich so leicht vergleichen lassen, um Übereinstimmungen und Unterschiede festzustellen. Das kann die Recherche mit KI verbessern und schon ein erster Schritt der Überprüfung sein. Bei beiden Modi kann man den Chat auch fortsetzen, um die Antworten der zufälligen oder gewählten KI-Modelle zu verfeinern und nachzufragen.

Das KI-Werkzeug, das von Wissenschaftlern der University of California in Berkeley entwickelt wurde, ist kostenlos und ohne Anmeldung zugänglich. Zu beachten ist jedoch, dass die eingegebenen Prompts anonymisiert für die KI-Forschung verwendet werden können.

Leaderboards
Wer keine eigenen Prompts bei LMArena eingeben möchte, kann direkt das Leaderboard anklicken, um das derzeitbeste KI-Modell zu finden. Und es gibt nicht nur eine Rangliste, sondern mehrere nach Kategorien: von Text und Search über Bild- und Videogenerierung bis zu Image-to-Video und WebDev. Diese Leaderboards listen die KI- Modelle mit dem zugehörigen Unternehmen und einer Punktzahl auf, die für den aktuellen Rang verantwortlich ist.

Die Punkte ergeben sich aus dem Battle- und Side-by-Side-Modus, bei denen man die Antworten über vier Buttons beurteilen kann – möglich sind „A ist besser“, „B ist besser“, „unentschieden“ und „beide schlecht“. Die Methodik für die Leaderboards ist auch ausführlich im Blog von LMArena erläutert. Und im sogenannten Changelog wird vermerkt, welche KI-Modelle neu bei LMArena verfügbar sind. Nahezu täglich gibt es solche Meldungen und das Leaderboard für Text KI-Modelle umfasst schon rund 300 Einträge.

Ein weiteres Modell
Eine simple Alternative zu LMArena ist „Gemini vs ChatGPT vs Claude“, eine Website der US-Firma AE Studio. Hier kann man für einen Prompt an die Modelle der genannten KIs auswählen, um gleich drei Antworten nebeneinander zu erhalten. Sonst ist das KI-Tool aber recht eingeschränkt, weil nur drei Anfragen pro Tag möglich sind, ein Prompt maximal 500 Zeichen lang sein darf und der Chat nicht fortgesetzt werden kann.

Fazit
LMArena ist ein praktisches Werkzeug, um einen Prompt gleichzeitig an mehrere KI-Modelle zu schicken und die nebeneinanderstehenden Antworten gut vergleichen zu können. In Lokalredaktionen kann so ein Setup die Recherche mit KI erleichtern, weil Übereinstimmungen und Unterschiede eher auffallen, zumal LMArena auch kostenlos funktioniert.

ZUM NACHLESEN

Wie können KI-Tools den Redaktionsalltag noch unterstützen?
Mehr dazu in diesen Internetwerkstatt-Beiträgen:

Weiterführende Links

LMArena
Gemini

Christina Quast

Christina Quast

berichtet als freie Journalistin über digitale Tools und Themen und ist seit Mitte 2018 für den Blog „Journalisten Tools“ verantwortlich. Für Journalisten gibt sie auch Seminare und organisiert Barcamps.

E-Mail: quast@journalisten-tools.de
Internet: journalisten-tools.de

Veröffentlicht am

Zurück

Kommentare

Einen Kommentar schreiben

Kommentieren

Bei den mit Sternchen (*) markierten Feldern handelt es sich um Pflichtfelder.