Version history — Text Generation Inference

15 data points across 4 dates

2026-04-15

Soc2 Type2 Yes initial source ↗

2026-04-14

Pricing Model usage_based source ↗

2026-04-13

Github Url https://github.com/huggingface/text-generation-inference initial source ↗

Pricing Model usage initial source ↗

Website Url https://huggingface.co initial source ↗

Hq Country US initial source ↗

Geo Origin US initial source ↗

2026-04-12

Website Url — initial source ↗

Description Production inference server for LLMs by Hugging Face. Optimized for transformers with continuous batching, tensor parallelism, and OpenAI-compatible API. Powers HuggingChat, HF Inference API, and Inference Endpoints. v1.0+ licensed under HFOIL (commercial SaaS use requires license). Now in maintenance mode. initial source ↗

Open Source No initial source ↗

Free Yes initial source ↗

Enterprise Ready Yes initial source ↗

Api Available Yes initial source ↗

Github Stars — initial source ↗

Tool Archetype specialist initial source ↗

← Back to Text Generation Inference