Fastest AI Models

28 LLMs ranked by speed (tokens per second). For latency-sensitive applications like chatbots, real-time coding, and interactive agents.

Note: Speed ratings are relative estimates. For production latency data, we recommend Artificial Analysis. See also: Full Speed Comparison with TTFT and provider endpoint data.

Ultra Fast (100+ tok/s)

Fast (50–99 tok/s)

Moderate (20–49 tok/s)

Slower (<20 tok/s)

Speed Ranking

1 Gemini 2.0 Flash Lite

450 tok/s

2 Gemini 2.0 Flash

400 tok/s

3 Gemini 2.5 Flash

350 tok/s

4 GPT-4.1 Nano

200 tok/s

5 GPT-4.1 Mini

160 tok/s

6 GPT-4o-mini

150 tok/s

7 Mistral Small 3.1 24B

150 tok/s

8 Llama 4 Scout

120 tok/s

9 Claude 3.5 Haiku

120 tok/s

10 GPT-4.1

110 tok/s

11 GPT-4o (2024-05-13)

100 tok/s

12 Llama 4 Maverick

95 tok/s

13 Claude Sonnet 4.6

90 tok/s

14 Gemini 2.5 Pro

90 tok/s

15 GPT-5.2

85 tok/s

16 Claude Sonnet 4

80 tok/s

17 Mistral Large

80 tok/s

18 Llama 3.3 70B Instruct

80 tok/s

19 GPT-5

75 tok/s

20 O4 Mini

65 tok/s

21 Qwen2.5 72B Instruct

65 tok/s

22 o3 Mini

60 tok/s

23 Claude Opus 4.6

50 tok/s

24 DeepSeek V3.2

49 tok/s

25 Qwen3 235B A22B

40 tok/s

Full Table

#	Model	Speed	Quality	Context	Price
1	Gemini 2.0 Flash Lite Google	450 tok/s	75.0	1.0M	$0.07
2	Gemini 2.0 Flash Google	400 tok/s	81.0	1.0M	$0.10
3	Gemini 2.5 Flash Google	350 tok/s	78.0	1.0M	$0.30
4	GPT-4.1 Nano OpenAI	200 tok/s	75.0	1.0M	$0.10
5	GPT-4.1 Mini OpenAI	160 tok/s	75.0	1.0M	$0.40
6	GPT-4o-mini OpenAI	150 tok/s	74.0	128K	$0.15
7	Mistral Small 3.1 24B OSS Mistral	150 tok/s	72.0	128K	$0.35
8	Llama 4 Scout OSS Meta	120 tok/s	79.0	10M	$0.08
9	Claude 3.5 Haiku Anthropic	120 tok/s	76.0	200K	$0.80
10	GPT-4.1 OpenAI	110 tok/s	77.0	1.0M	$2.00
11	GPT-4o (2024-05-13) OpenAI	100 tok/s	75.0	128K	$5.00
12	Llama 4 Maverick OSS Meta	95 tok/s	76.0	1.0M	$0.15
13	Claude Sonnet 4.6 Anthropic	90 tok/s	86.0	1M	$3.00
14	Gemini 2.5 Pro Google	90 tok/s	83.0	1.0M	$1.25
15	GPT-5.2 OpenAI	85 tok/s	90.0	400K	$1.75
16	Claude Sonnet 4 Anthropic	80 tok/s	79.0	1M	$3.00
17	Mistral Large OSS Mistral	80 tok/s	73.0	128K	$2.00
18	Llama 3.3 70B Instruct OSS Meta	80 tok/s	71.0	131.1K	$0.10
19	GPT-5 OpenAI	75 tok/s	87.0	400K	$1.25
20	O4 Mini OpenAI	65 tok/s	90.0	200K	$1.10
21	Qwen2.5 72B Instruct OSS Alibaba	65 tok/s	71.0	131.1K	$0.36
22	o3 Mini OpenAI	60 tok/s	84.0	200K	$1.10
23	Claude Opus 4.6 Anthropic	50 tok/s	89.0	1M	$15.00
24	DeepSeek V3.2 OSS DeepSeek	49 tok/s	77.0	163.8K	$0.20
25	Qwen3 235B A22B OSS Alibaba	40 tok/s	87.0	131.1K	$0.46
26	DeepSeek R1 OSS DeepSeek	30 tok/s	85.0	163.8K	$0.70
27	Claude Opus 4 Anthropic	30 tok/s	84.0	200K	$15.00
28	O3 OpenAI	15 tok/s	88.0	200K	$2.00