TensorRT-LLM
TensorRT-LLM
Active

TensorRT-LLM

Optimierte Bibliothek für LLM-Inferenz.

43

Views

0

Likes

Mar 2026

Added

github.com

Website

Tags

InferenzPerformance

Editorial Review

About TensorRT-LLM

Über

Optimierung der LLM-Performance.

Hauptmerkmale

  • TensorRT-Optimierung

Anwendungsfälle

Hochleistungs-Inferenz.

Comment

Nutzer: 'Leistungssieger.'

Ready to try TensorRT-LLM?

Visit the official website to get started

Visit TensorRT-LLM

Quick Info

Added
3/13/2026
Published
3/19/2026
Updated
6/10/2026

Share This Tool

Have an AI tool to share?

Submit it to AI Dreamhub

Get your product in front of people actively exploring AI tools.

Submit Your Tool

Related Tools

Together.ai

Together.ai

The AI Acceleration Cloud. Train, fine-tune and run inference on AI models blazing fast, at low cost, and at production scale. - Intelligentes KI-Tool für mehr Produktivität.

ai-cloudfree
340
General Compute

General Compute

General Compute ist eine Inferenz-Cloud für latenzkritische AI-Workloads und wirbt mit ASIC-basierten Geschwindigkeitsvorteilen sowie einer OpenAI-kompatiblen API für Coding- und Voice-Agent-Teams.

AI-InferenzASIC CloudOpenAI-kompatible API
150
OpenRouter

OpenRouter

OpenRouter ist ein Multi-Model-Gateway fur KI, mit dem Teams viele Modellanbieter uber eine API ansteuern und Preis, Latenz und Qualitat zentral vergleichen konnen.

LLM GatewayModel Routingmultimodale API
90
Supermemory

Supermemory

Supermemory ist eine Context Cloud und Memory-API fur Agenten, die persistente Memory, Retrieval, Profile, Konnektoren und Dateiextraktion in einer latenzarmen Plattform bundelt.

Memory-APIRAGAI-Infrastruktur
120