
LMArena
LMArena,也就是过去常被称为 LMSYS Chatbot Arena / Chatbot Arena 的平台,是一个基于人类偏好的 AI 模型排行榜,覆盖文本和更多新模态。它适合追踪模型口碑,但不应作为唯一选型依据。

0
Views
0
Likes
Jun 2026
Added
github.com
Website
A quick visual look at whichllm before you visit the official site.

Editorial Review
whichllm 是一个给本地模型用户准备的命令行工具,解决的不是“模型够不够大”,而是“这台机器到底跑什么最合适”。
它现在热起来,是因为本地推理已经进入主流,但选模型依旧很乱。whichllm 在 2026 年 6 月 10 日发布了 v0.5.9,新鲜 release 加上持续增长的 GitHub 热度,说明开发者需要的是实用的选型层,而不是又一个泛泛排行榜。
社区最买账的一点,是它把模糊的“你试试这个 8B 吧”变成了和硬件绑定的可操作建议。主要保留意见则是,排序结果仍然依赖基准覆盖范围,以及这些分数和真实任务之间的映射程度。
whichllm 的结论始终依赖硬件识别和基准输入本身。它不能替代你在真实 prompt、量化版本和私有任务上的实测。快速推荐也可能掩盖多语言表现、长上下文或工具调用能力上的差异。
常见替代方向包括 LM Studio 的模型发现流程、Ollama 配合人工调研、Artificial Analysis、LMArena,以及团队自己维护的对比表。
Visit the official website to get started
Have an AI tool to share?
Get your product in front of people actively exploring AI tools.
Submit Your Tool
LMArena,也就是过去常被称为 LMSYS Chatbot Arena / Chatbot Arena 的平台,是一个基于人类偏好的 AI 模型排行榜,覆盖文本和更多新模态。它适合追踪模型口碑,但不应作为唯一选型依据。

Artificial Analysis 是独立 AI 模型评测和对比平台,用于选择 LLM、图像模型和 AI 服务商。它追踪模型智能、速度、价格、上下文、延迟、质量和服务商可用性,帮助团队在接入模型前做决策。

LiveCodeBench is a holistic and contamination-free evaluation benchmark of LLMs for code that continuously collects new problems over time. - 智能 AI 工具,助力您的工作效率。

Compare LLM API pricing across 200+ models from OpenAI, Anthropic, Google, and more. Includes token counters, cost calculators, and benchmark comparisons. - 智能 AI 工具,助力您的工作效率。