Simple, Transparent Pricing

Pay only for what you use. No hidden fees or commitments.

Special Offers

Limited time promotions and special deals.

Special Deal

Claude 3.7 Sonnet

$2.00 per 1M input tokens
$2.00 per 1M output tokens

Limited time promotion!

Anthropic's latest model
Superior reasoning & coding
Excellent comprehension
500 requests/minute

Free

Gemini 2.5 Pro Exp

$2.00 per 1M input tokens
$5.00 per 1M output tokens

Limited time promotion!

Google's experimental model
Superior reasoning
Excellent for complex tasks
500 requests/minute

Free

LLaMA 4 17B 12E (Scout)

$0.50 per 1M input tokens
$1.00 per 1M output tokens

Limited time promotion!

Meta's experimental model
12-expert architecture
Fast response times
500 requests/minute

Standard Models

Our full lineup of AI models at competitive prices

New Release

GPT-4.1

$1.80 per 1M input tokens
$5.40 per 1M output tokens

70% cheaper than retail

OpenAI's latest model
Enhanced reasoning capabilities
Improved content generation
500 requests/minute

New Release

Gemini 2.5 Pro

$0.50 per 1M input tokens
$2.00 per 1M output tokens

80% cheaper than retail

Google's latest model
Superior context handling
Advanced reasoning
1,000 requests/minute

New Release

LLaMA 3.3 70B

$0.25 per 1M input tokens
$0.75 per 1M output tokens

High-performance open model

Meta's most powerful model
Exceptional reasoning
8K context window
750 requests/minute

Most Popular

GPT-4o

$2.50 per 1M input tokens
$10.00 per 1M output tokens

Up to 75% cheaper than retail

OpenAI's best model
Superior reasoning
Advanced code generation
500 requests/minute

DeepSeek Reasoner

$0.55 per 1M input tokens
$2.19 per 1M output tokens

Best value for reasoning

Excellent reasoning
Math & logic focused
Great price/performance
Unlimited requests

Gemini 2.0 Flash

$0.10 per 1M input tokens
$0.40 per 1M output tokens

90% cheaper than retail

Google's fastest model
Excellent for chat
Multi-modal support
2,000 requests/minute

Also Popular

GPT-4o Mini

$0.15 per 1M input tokens
$0.60 per 1M output tokens

Efficient GPT-4
Great for most tasks
750 requests/minute

Gemini 1.5 Pro

$0.10 per 1M input tokens
$0.35 per 1M output tokens

Production ready
Reliable performance
1,500 requests/minute

DeepSeek Coder

$0.20 per 1M input tokens
$0.80 per 1M output tokens

Specialized for coding
Efficient code generation
1,000 requests/minute

Free

Gemini 2.0 Flash Lite

$0.00 per 1M input tokens
$0.00 per 1M output tokens

Completely free!

Google's efficient model
Good for general tasks
Limited rate: 50 req/min
No credit card required

Free

LLaMA 3 8B

$0.00 per 1M input tokens
$0.00 per 1M output tokens

Completely free!

Meta's compact model
Good reasoning ability
Limited rate: 50 req/min
No credit card required

All Available Models

Complete list of all models available on TokenCheap

Model Name	Vendor	Input Price (per 1M tokens)	Output Price (per 1M tokens)
Anthropic Models
Claude-3.7-Sonnet	Anthropic	$2.00	$2.00
OpenAI Models
GPT-4.1	OpenAI	$1.80	$5.40
GPT-4o	OpenAI	$2.50	$10.00
GPT-4o-Mini	OpenAI	$0.15	$0.60
GPT-4-Turbo	OpenAI	$2.00	$6.00
GPT-3.5-Turbo	OpenAI	$0.50	$1.50
O3-Mini	OpenAI	$0.15	$0.60
Gemini Models
Gemini-2.5-Pro-Exp	Google	$0.00	$0.00
Gemini-2.5-Pro	Google	$0.50	$2.00
Gemini-2.0-Flash	Google	$0.10	$0.40
Gemini-2.0-Flash-Lite	Google	$0.00	$0.00
Gemini-1.5-Pro	Google	$0.10	$0.35
Gemini-1.5-Flash	Google	$0.075	$0.30
Gemini-1.5-Flash-8B	Google	$0.05	$0.20
DeepSeek Models
DeepSeek-Chat	DeepSeek	$0.40	$1.60
DeepSeek-Coder	DeepSeek	$0.20	$0.80
DeepSeek-Reasoner	DeepSeek	$0.55	$2.19
LLaMA Models (via Groq)
LLaMA-4-17B-12E-Scout	Meta/Groq	$0.00	$0.00
LLaMA-3.3-70B-Versatile	Groq	$0.25	$0.75
LLaMA3-70B-8192	Groq	$0.20	$0.60
LLaMA3-8B-8192	Groq	$0.00	$0.00
DeepSeek-R1-Distill-LLaMA-70B	Groq	$0.55	$2.10

Available Model API IDs

Complete list of model IDs for API access

Anthropic Models

claude-3-5-haiku-20240307
claude-3-5-sonnet-20240620
claude-3-7-sonnet-20250219
claude-3-haiku-20240307
claude-3-opus-20240229

DeepSeek Models

deepseek-chat
deepseek-coder
deepseek-reasoner

Gemini Models

gemini-1.5-flash
gemini-1.5-flash-8b
gemini-1.5-pro
gemini-2.0-flash
gemini-2.0-flash-lite
gemini-2.5-pro-exp-03-25

Groq Models

deepseek-r1-distill-llama-70b
llama-3.3-70b-versatile
llama3-70b-8192
llama3-8b-8192

OpenAI Models

chatgpt-4o-latest
gpt-3.5-turbo
gpt-3.5-turbo-0125
gpt-4
gpt-4-0125-preview
gpt-4-0613
gpt-4-1106
gpt-4-turbo
gpt-4-turbo-2024-04-09
gpt-4-vision-preview
gpt-4o
gpt-4o-2024-05-13
gpt-4o-2024-08-06
gpt-4o-mini
gpt-4o-mini-2024-07-18
gpt-4o-mini-search-preview
gpt-4o-search-preview
o3-mini
o3-mini-2025-01-31