TensorRT-LLM
TensorRT-LLM
Active

TensorRT-LLM

LLM 추론을 위한 최적화 라이브러리.

46

Views

0

Likes

Mar 2026

Added

github.com

Website

Tags

추론가속화

Editorial Review

About TensorRT-LLM

소개

추론 성능 최적화.

주요 기능

  • TensorRT 최적화

사용 사례

고성능 추론.

코멘트

사용자: '추론 성능 최고.'

Ready to try TensorRT-LLM?

Visit the official website to get started

Visit TensorRT-LLM

Quick Info

Added
3/13/2026
Published
3/19/2026
Updated
6/12/2026

Share This Tool

Have an AI tool to share?

Submit it to AI Dreamhub

Get your product in front of people actively exploring AI tools.

Submit Your Tool

Related Tools

Together.ai

Together.ai

The AI Acceleration Cloud. Train, fine-tune and run inference on AI models blazing fast, at low cost, and at production scale. - 스마트 AI 도구로 생산성 향상.

ai-cloudfree
350
General Compute

General Compute

General Compute는 지연 시간에 민감한 AI 워크로드를 위한 추론 클라우드로, ASIC 기반 속도 향상과 OpenAI 호환 API를 내세워 코딩·음성 에이전트 팀을 겨냥합니다.

AI 추론ASIC 클라우드OpenAI 호환 API
160
OpenRouter

OpenRouter

OpenRouter는 여러 주요 모델 공급자를 하나의 API로 묶고 가격, 지연 시간, 품질을 비교하면서 라우팅할 수 있게 해주는 멀티모델 AI 게이트웨이입니다.

LLM 게이트웨이모델 라우팅멀티모달 API
70
Supermemory

Supermemory

Supermemory는 지속 메모리, 검색, 프로필, 커넥터, 파일 추출을 하나의 저지연 개발 플랫폼으로 묶은 에이전트용 context cloud / memory API입니다.

메모리 APIRAGAI 인프라
120