Бесплатные API для LLM: полный список провайдеров с постоянным free-тарифом

Обложка: Бесплатные API для LLM: полный список провайдеров с постоянным free-тарифом

Собрали актуальный список провайдеров, которые дают бесплатный доступ к API языковых моделей на постоянной основе. Никаких пробных периодов, временных кредитов или промоакций — только постоянные free-тарифы. Все эндпоинты совместимы с OpenAI SDK.

RPM = запросов в минуту, RPD = запросов в день. Список быстро меняется — актуальную версию смотрите на Reddit.

Провайдеры с собственными моделями

  • Google Gemini — Gemini 2.5 Pro, Flash, Flash-Lite + ещё 4 модели. 10 RPM, 20 RPD
  • Cohere — Command A, Command R+, Aya Expanse 32B + ещё 9. 20 RPM, 1K запр./мес
  • Mistral AI — Mistral Large 3, Small 3.1, Ministral 8B + ещё 3. 1 запр./с, 1B ток./мес
  • Zhipu AI — GLM-4.7-Flash, GLM-4.5-Flash, GLM-4.6V-Flash. Лимиты не документированы

Инференс-платформы

  • GitHub Models — GPT-4o, Llama 3.3 70B, DeepSeek-R1 + др. 10–15 RPM, 50–150 RPD
  • NVIDIA NIM — Llama 3.3 70B, Mistral Large, Qwen3 235B + др. 40 RPM
  • Groq — Llama 3.3 70B, Llama 4 Scout, Kimi K2 + ещё 17. 30 RPM, 14 400 RPD
  • Cerebras — Llama 3.3 70B, Qwen3 235B, GPT-OSS-120B + ещё 3. 30 RPM, 14 400 RPD
  • Cloudflare Workers AI — Llama 3.3 70B, Qwen QwQ 32B + ещё 47. 10K нейронов/день
  • LLM7.io — DeepSeek R1, Flash-Lite, Qwen2.5 Coder + ещё 27. 30 RPM (120 с токеном)
  • Kluster AI — DeepSeek-R1, Llama 4 Maverick, Qwen3-235B + 2. Лимиты не документированы
  • OpenRouter — DeepSeek R1, Llama 3.3 70B, GPT-OSS-120B + ещё 29. 20 RPM, 50 RPD
  • Hugging Face — Llama 3.3 70B, Qwen2.5 72B, Mistral 7B + много др. $0,10/мес в кредитах

На что обратить внимание

  • Самый щедрый по лимитам — Mistral AI: 1 миллиард токенов в месяц бесплатно, включая Mistral Large 3
  • Самый быстрый — Groq и Cerebras: оба дают 14 400 запросов/день на специализированном железе
  • Самый разнообразный — Cloudflare Workers AI: 50+ моделей, но лимит в нейронах, а не запросах
  • Для прода эти лимиты маловаты, но для прототипов, учебы и пет-проектов — более чем достаточно

Источник: r/LLM — Awesome Free LLM APIs