
Artificial Analysis
Artificial Analysis는 LLM, 이미지 모델, AI 제공업체를 비교하는 독립 AI 모델 벤치마크 플랫폼입니다. 모델 지능, 속도, 가격, 컨텍스트, 지연 시간, 품질, 제공업체 가용성을 추적해 도입 전 모델 선택을 돕습니다.


LMArena는 LMSYS Chatbot Arena / Chatbot Arena로 알려진 인간 선호 기반 AI 모델 비교 리더보드입니다. 모델 평판을 추적하는 데 유용하지만 자체 평가와 함께 사용해야 합니다.
47
Views
0
Likes
Jan 2026
Added
lmarena.ai
Website
A quick visual look at LMArena before you visit the official site.

Editorial Review
Chatbot Arena 논문은 크라우드소싱 인간 쌍대 비교로 LLM을 평가하는 공개 플랫폼이라고 설명합니다. LMSYS 방법론 업데이트는 더 안정적인 점수와 신뢰구간을 위해 Elo식 점수에서 Bradley-Terry 모델로 이동했다고 설명합니다.
Chatbot Arena 논문은 크라우드소싱 인간 쌍대 비교로 LLM을 평가하는 공개 플랫폼이라고 설명합니다. LMSYS 방법론 업데이트는 더 안정적인 점수와 신뢰구간을 위해 Elo식 점수에서 Bradley-Terry 모델로 이동했다고 설명합니다.
The platform has evolved from LMSYS Chatbot Arena/LMArena branding toward Arena-style leaderboards, but the core idea is human-preference model comparison.
The Chatbot Arena paper and LMSYS updates describe blind pairwise comparisons and Bradley-Terry/Elo-like rating methodology.
No. Use it as one signal and also evaluate cost, latency, safety, context length, tool use, and your own domain tasks.
Visit the official website to get started
Have an AI tool to share?
Get your product in front of people actively exploring AI tools.
Submit Your Tool
Artificial Analysis는 LLM, 이미지 모델, AI 제공업체를 비교하는 독립 AI 모델 벤치마크 플랫폼입니다. 모델 지능, 속도, 가격, 컨텍스트, 지연 시간, 품질, 제공업체 가용성을 추적해 도입 전 모델 선택을 돕습니다.

LiveCodeBench is a holistic and contamination-free evaluation benchmark of LLMs for code that continuously collects new problems over time. - 스마트 AI 도구로 생산성 향상.

Compare LLM API pricing across 200+ models from OpenAI, Anthropic, Google, and more. Includes token counters, cost calculators, and benchmark comparisons. - 스마트 AI 도구로 생산성 향상.

whichllm은 모델 크기만 보고 고르는 대신, 하드웨어 감지와 최신성 있는 벤치마크를 바탕으로 내 장비에 맞는 로컬 LLM을 빠르게 찾게 해주는 도구입니다.