
LMArena
LMArena, früher oft als LMSYS Chatbot Arena/Chatbot Arena bezeichnet, ist ein Human-Preference-Leaderboard zum Vergleich von AI-Modellen. Es ist wertvoll für Modellreputation, sollte aber mit privaten Evaluierungen kombiniert werden.


whichllm hilft Entwicklern, den lokalen LLM zu finden, der wirklich zur vorhandenen Hardware passt, statt nur nach Modellgroesse oder alten Ranglisten zu raten.
0
Views
0
Likes
Jun 2026
Added
github.com
Website
A quick visual look at whichllm before you visit the official site.

Editorial Review
whichllm ist ein CLI fuer Menschen, die lokale Modelle nutzen wollen, aber keine Lust haben, GGUF-Varianten, Speichergrenzen und veraltete Modelltipps manuell gegeneinander zu halten.
Das Projekt bekommt gerade viel Aufmerksamkeit, weil lokale Inferenz zwar normaler wird, die Modellauswahl aber chaotisch bleibt. whichllm veroeffentlichte am 10. Juni 2026 die Version v0.5.9 und trifft mit seinem praktischen Auswahlfokus einen echten Bedarf.
Gut ankommt, dass whichllm unpraezise Modelltipps durch hardwarebezogene Empfehlungen ersetzt. Die Skepsis liegt darin, dass jede Rangfolge am Ende von der Benchmark-Abdeckung und deren Aussagekraft fuer reale Workloads abhaengt.
whichllm spart Auswahlzeit, ersetzt aber keine echte Validierung auf eigenen Prompts, Quantisierungen oder privaten Daten. Gerade Mehrsprachigkeit, Tool Use und lange Kontexte muessen separat geprueft werden.
Naheliegende Alternativen sind LM Studio, Ollama plus eigene Recherche, Artificial Analysis, LMArena und hausinterne Vergleichstabellen.
Visit the official website to get started
Have an AI tool to share?
Get your product in front of people actively exploring AI tools.
Submit Your Tool
LMArena, früher oft als LMSYS Chatbot Arena/Chatbot Arena bezeichnet, ist ein Human-Preference-Leaderboard zum Vergleich von AI-Modellen. Es ist wertvoll für Modellreputation, sollte aber mit privaten Evaluierungen kombiniert werden.

Artificial Analysis ist eine unabhängige Benchmark- und Vergleichsplattform für KI-Modelle und Anbieter. Sie verfolgt Intelligenz, Geschwindigkeit, Preis, Kontext, Latenz, Qualität und Verfügbarkeit für bessere Modellentscheidungen.

LiveCodeBench is a holistic and contamination-free evaluation benchmark of LLMs for code that continuously collects new problems over time. - Intelligentes KI-Tool für mehr Produktivität.

Compare LLM API pricing across 200+ models from OpenAI, Anthropic, Google, and more. Includes token counters, cost calculators, and benchmark comparisons. - Intelligentes KI-Tool für mehr Produktivität.