AI Leaderboard Desk

This page separates three different questions. Frontier now answers what is current. Reliability Floor asks whether everyday basics are covered. Evaluated composite ranks models inside the benchmark-backed scored set.

Important

The old “composite leaderboard” confusion came from treating one scored table as the answer to everything. The frontier lane keeps newer launches visible immediately, while the evaluated composite only ranks models once there is enough public evidence to score them with some confidence.

Model	State	Evidence	Released	Price
Claude Opus 5 Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	24 Jul 2026	$5.00 / $25.00
GPT-5.6 Sol OpenAI / 1.1M context	tracking tracking	tracking official release Awaiting quality score	9 Jul 2026	$5.00 / $30.00
Claude Fable 5 Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	9 Jun 2026	$10.00 / $50.00
Gemini 3.6 Flash Google / 1.0M context	tracking tracking	tracking official release Awaiting quality score	21 Jul 2026	$1.50 / $7.50
Claude Sonnet 5 Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	30 Jun 2026	$2.00 / $10.00
GPT-5.6 Terra OpenAI / 1.1M context	tracking tracking	tracking official release Awaiting quality score	9 Jul 2026	$2.50 / $15.00
GPT-5.5 OpenAI / 1.1M context	tracking tracking	tracking official release Awaiting quality score	23 Apr 2026	$5.00 / $30.00
Claude Opus 4.8 Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	28 May 2026	$5.00 / $25.00
Gemini 3.5 Flash Google / 1.0M context	tracking tracking	tracking official release Awaiting quality score	19 May 2026	$1.50 / $9.00
GPT-5.4 OpenAI / 1.1M context	tracking tracking	tracking official release Awaiting quality score	5 Mar 2026	$2.50 / $15.00
Grok 4.20 xAI / 2.0M context	tracking tracking	tracking official release Awaiting quality score	31 Mar 2026	$1.25 / $2.50
Qwen 3.6 Plus Alibaba / 1.0M context	tracking tracking	tracking official release Awaiting quality score	2 Apr 2026	$0.33 / $1.95
Claude Opus 5 (Fast) Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	24 Jul 2026	$10.00 / $50.00
Gemini 3.5 Flash Lite Google / 1.0M context	tracking tracking	tracking official release Awaiting quality score	21 Jul 2026	$0.30 / $2.50
GPT-5.6 Luna OpenAI / 1.1M context	tracking tracking	tracking official release Awaiting quality score	9 Jul 2026	$1.00 / $6.00
Claude Opus 4.8 (Fast) Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	28 May 2026	$10.00 / $50.00
GPT-5.5 Pro OpenAI / 1.1M context	tracking tracking	tracking official release Awaiting quality score	23 Apr 2026	$30.00 / $180.00
Claude Opus 4.7 Anthropic / 1.0M context	tracking tracking	tracking official release Awaiting quality score	16 Apr 2026	$5.00 / $25.00

The frontier lane is intentionally not a synthetic score. It keeps the current flagship and launch watchlist visible even when benchmark coverage is still catching up.

Model	Floor	Evidence	Facts	Instructions	Coverage
GPT-5.2 OpenAI / active	Not rankable	Partial evidence 1/5 dimensions	58.0	Missing	20%
GPT-5 OpenAI / active	Not rankable	Partial evidence 1/5 dimensions	52.0	Missing	20%
Claude Opus 4 Anthropic / active	Not rankable	Partial evidence 1/5 dimensions	44.0	Missing	20%
Claude Sonnet 4 Anthropic / active	Not rankable	Partial evidence 1/5 dimensions	41.0	Missing	20%
O3 OpenAI / active	Not rankable	Partial evidence 1/5 dimensions	49.0	Missing	20%
Gemini 2.5 Pro Google / active	Not rankable	Partial evidence 1/5 dimensions	47.0	Missing	20%
GPT-4.5 OpenAI / tracking	Not rankable	Partial evidence 1/5 dimensions	62.5	Missing	20%
GPT-4o (2024-05-13) OpenAI / active	Not rankable	Partial evidence 1/5 dimensions	38.2	Missing	20%
Claude Opus 5 Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Opus 5 (Fast) Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Gemini 3.5 Flash Lite Google / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Gemini 3.6 Flash Google / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
GPT-5.6 Luna OpenAI / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
GPT-5.6 Sol OpenAI / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
GPT-5.6 Terra OpenAI / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Sonnet 5 Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Fable 5 Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Opus 4.8 Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Opus 4.8 (Fast) Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Gemini 3.5 Flash Google / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
GPT-5.5 OpenAI / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
GPT-5.5 Pro OpenAI / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Opus 4.7 Anthropic / tracking	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%
Claude Mythos Preview Anthropic / preview	Not rankable	Tracking 0/5 dimensions	Missing	Missing	0%

Reliability Floor is a gated everyday-trust view. It records prompt and harness context where known, shows missing benchmark dimensions explicitly, and does not rank a model as reliable until all critical evidence is present. Open the full Reliability Floor page.

#	Model	Composite	Bench	Coverage	Price
1	Llama 4 Maverick Meta / Coding / 1.0M context	57.6	77.0 / 10	28%	$0.20 / $0.80
2	DeepSeek V3.2 DeepSeek / General use / 164K context	56.3	74.6 / 6	21%	$0.27 / $1.12
3	GPT-5.2 OpenAI / multilingual / 400K context	55.1	78.5 / 22	67%	$1.75 / $14.00
4	Claude Opus 4.6 Anthropic / Chat / 1.0M context	54.6	75.9 / 16	49%	$5.00 / $25.00
5	Mistral Large Mistral / General use / 128K context	50.4	70.6 / 6	20%	$2.00 / $6.00
6	Llama 4 Scout Meta / Coding / 1.3M context	50.1	80.4 / 4	13%	$0.10 / $0.30
7	Phi-4 Reasoning Microsoft / Coding / 33K context	49.2	79.9 / 4	15%	$0.07 / $0.14
8	Claude Sonnet 4.6 Anthropic / Chat / 1.0M context	44.8	82.3 / 5	19%	$3.00 / $15.00
9	GPT-5.2 Pro OpenAI / Chat / 400K context	44.1	91.3 / 4	16%	$21.00 / $168.00
10	R1 0528 DeepSeek / Chat / 164K context	40.8	82.4 / 6	23%	$0.50 / $2.15
11	O3 OpenAI / multilingual / 200K context	39.8	80.6 / 21	64%	$2.00 / $8.00
12	Qwen3 Max Alibaba / Coding / 262K context	39.7	86.1 / 4	15%	$0.78 / $3.90
13	Gemini 2.5 Pro Google / multilingual / 1.0M context	38.1	77.1 / 25	75%	$1.25 / $10.00
14	Mistral Small 3.1 24B Mistral / Coding / 128K context	36.7	76.1 / 3	9%	$0.35 / $0.56
15	Claude Opus 4 Anthropic / multilingual / 200K context	36.6	75.5 / 17	49%	$15.00 / $75.00
16	Grok 4 xAI / Chat / 256K context	35.2	74.4 / 15	47%	$3.00 / $15.00
17	DeepSeek R1 DeepSeek / General use / 164K context	34.5	70.9 / 19	58%	$0.70 / $2.50
18	Claude Sonnet 4 Anthropic / General use / 1.0M context	34.0	76.5 / 13	38%	$3.00 / $15.00
19	Command A Cohere / Coding / 256K context	32.9	82.4 / 3	9%	$2.50 / $10.00
20	Grok 3 xAI / General use / 131K context	32.6	84.7 / 7	24%	$3.00 / $15.00
21	GPT-5 Pro OpenAI / Chat / 400K context	32.5	88.5 / 4	16%	$15.00 / $120.00
22	Claude Opus 4.5 Anthropic / Chat / 200K context	32.4	84.3 / 4	16%	$5.00 / $25.00
23	Grok 4 Fast xAI / Coding / 2.1M context	32.2	87.0 / 2	7%	$0.20 / $0.50
24	GPT-4o (2024-05-13) OpenAI / General use / 128K context	31.8	69.6 / 18	50%	$5.00 / $15.00

#	Model	Value	Composite	Price
1	Mistral Nemo Mistral	26422.0	4.6	$0.02 / $0.03
2	Llama 3.1 8B Instruct Meta	9379.0	4.4	$0.05 / $0.08
3	Phi-4 Reasoning Microsoft	6531.0	49.2	$0.07 / $0.14
4	Phi 4 Microsoft	6041.0	30.8	$0.07 / $0.14
5	Nova Micro 1.0 Amazon	5978.0	4.4	$0.04 / $0.14
6	Command R7B (12-2024) Cohere	5328.0	4.3	$0.04 / $0.15
7	Phi-4 Multimodal Microsoft	4343.0	8.3	$0.10 / $0.20
8	Reka Flash 3 Reka	4229.0	8.2	$0.10 / $0.20
9	Nova Lite 1.0 Amazon	3692.0	3.8	$0.06 / $0.24
10	Qwen3 32B Alibaba	3609.0	5.7	$0.08 / $0.28
11	DeepSeek V2.5 DeepSeek	3306.0	4.9	$0.14 / $0.28
12	Gemini 1.5 Flash Google	3200.0	3.9	$0.07 / $0.30
13	Llama 4 Scout Meta	3160.0	50.1	$0.10 / $0.30
14	GPT-5 Nano OpenAI	2496.0	5.2	$0.05 / $0.40
15	GPT-4.1 Nano OpenAI	2308.0	4.5	$0.10 / $0.40
16	Gemini 2.5 Flash Lite Google	2277.0	20.0	$0.10 / $0.40
17	Nemotron 70B NVIDIA	2200.0	26.7	$0.20 / $0.40
18	Llama 3.3 70B Instruct Meta	2135.0	30.1	$0.13 / $0.40
19	Grok 4.1 Fast xAI	2024.0	9.1	$0.20 / $0.50
20	Jamba 1.5 Mini AI21 Labs	2000.0	6.5	$0.20 / $0.40
21	Grok 4 Fast xAI	1976.0	32.2	$0.20 / $0.50
22	Qwen3 30B A3B Alibaba	1941.0	5.7	$0.13 / $0.52
23	Llama 3.1 70B Instruct Meta	1925.0	4.9	$0.40 / $0.40
24	Grok 3 Mini xAI	1844.0	21.5	$0.30 / $0.50

#	Model	Input	Output	Composite
1	Mistral Nemo Mistral	$0.019	$0.030	4.6
2	Nova Micro 1.0 Amazon	$0.035	$0.140	4.4
3	Command R7B (12-2024) Cohere	$0.038	$0.150	4.3
4	Llama 3.1 8B Instruct Meta	$0.050	$0.080	4.4
5	GPT-5 Nano OpenAI	$0.050	$0.400	5.2
6	Nova Lite 1.0 Amazon	$0.060	$0.240	3.8
7	Phi-4 Reasoning Microsoft	$0.070	$0.140	49.2
8	Phi 4 Microsoft	$0.070	$0.140	30.8
9	Gemini 1.5 Flash Google	$0.075	$0.300	3.9
10	Qwen3 32B Alibaba	$0.080	$0.280	5.7
11	Phi-4 Multimodal Microsoft	$0.100	$0.200	8.3
12	Reka Flash 3 Reka	$0.100	$0.200	8.2
13	Llama 4 Scout Meta	$0.100	$0.300	50.1
14	Gemini 2.5 Flash Lite Google	$0.100	$0.400	20.0
15	GPT-4.1 Nano OpenAI	$0.100	$0.400	4.5
16	Llama 3.3 70B Instruct Meta	$0.130	$0.400	30.1
17	Qwen3 30B A3B Alibaba	$0.130	$0.520	5.7
18	DeepSeek V2.5 DeepSeek	$0.140	$0.280	4.9
19	GPT-4o-mini (2024-07-18) OpenAI	$0.150	$0.600	20.4
20	Command R (08-2024) Cohere	$0.150	$0.600	4.7
21	Nemotron 70B NVIDIA	$0.200	$0.400	26.7
22	Jamba 1.5 Mini AI21 Labs	$0.200	$0.400	6.5
23	Grok 4 Fast xAI	$0.200	$0.500	32.2
24	Grok 4.1 Fast xAI	$0.200	$0.500	9.1

Evaluated composite now uses a weighted blend of normalized benchmark results, the existing quality layer, and a freshness signal. It also penalizes thin evidence, stale provider generations, and beta or compact variants so older benchmark saturation does not dominate the story.

Explore the field

Search and filter the full ranked dataset

The top tables are quick reads. This table is for actual decision-making when you want a specific lab, use case, release window, or pricing posture.

Model	Composite	Coverage	Best for	Released	Price
Llama 4 Maverick Meta / 1.0M context	57.6	28%	Coding Open API	5 Apr 2025	$0.20 / $0.80
DeepSeek V3.2 DeepSeek / 164K context	56.3	21%	General use Open API	29 Sept 2025	$0.27 / $1.12
GPT-5.2 OpenAI / 400K context	55.1	67%	multilingual API	10 Dec 2025	$1.75 / $14.00
Claude Opus 4.6 Anthropic / 1.0M context	54.6	49%	Chat API	5 Feb 2026	$5.00 / $25.00
Mistral Large Mistral / 128K context	50.4	20%	General use Open API	1 Jun 2025	$2.00 / $6.00
Llama 4 Scout Meta / 1.3M context	50.1	13%	Coding Open API	5 Apr 2025	$0.10 / $0.30
Phi-4 Reasoning Microsoft / 33K context	49.2	15%	Coding Open API	1 May 2025	$0.07 / $0.14
Claude Sonnet 4.6 Anthropic / 1.0M context	44.8	19%	Chat API	17 Feb 2026	$3.00 / $15.00
GPT-5.2 Pro OpenAI / 400K context	44.1	16%	Chat API	10 Dec 2025	$21.00 / $168.00
R1 0528 DeepSeek / 164K context	40.8	23%	Chat Open API	28 May 2025	$0.50 / $2.15
O3 OpenAI / 200K context	39.8	64%	multilingual API	16 Apr 2025	$2.00 / $8.00
Qwen3 Max Alibaba / 262K context	39.7	15%	Coding Open API	1 Sept 2025	$0.78 / $3.90
Gemini 2.5 Pro Google / 1.0M context	38.1	75%	multilingual API	25 Mar 2025	$1.25 / $10.00
Mistral Small 3.1 24B Mistral / 128K context	36.7	9%	Coding Open API	18 Mar 2025	$0.35 / $0.56
Claude Opus 4 Anthropic / 200K context	36.6	49%	multilingual API	22 May 2025	$15.00 / $75.00
Grok 4 xAI / 256K context	35.2	47%	Chat API	9 Jul 2025	$3.00 / $15.00
DeepSeek R1 DeepSeek / 164K context	34.5	58%	General use Open API	20 Jan 2025	$0.70 / $2.50
Claude Sonnet 4 Anthropic / 1.0M context	34.0	38%	General use API	22 May 2025	$3.00 / $15.00
Command A Cohere / 256K context	32.9	9%	Coding Open API	13 Mar 2025	$2.50 / $10.00
Grok 3 xAI / 131K context	32.6	24%	General use API	10 Jun 2025	$3.00 / $15.00
GPT-5 Pro OpenAI / 400K context	32.5	16%	Chat API	6 Oct 2025	$15.00 / $120.00
Claude Opus 4.5 Anthropic / 200K context	32.4	16%	Chat API	24 Nov 2025	$5.00 / $25.00
Grok 4 Fast xAI / 2.1M context	32.2	7%	Coding API	19 Sept 2025	$0.20 / $0.50
GPT-4o (2024-05-13) OpenAI / 128K context	31.8	50%	General use API	13 May 2024	$5.00 / $15.00
Gemini 3.1 Pro Google / 1.0M context	31.0	9%	Chat API	19 Feb 2026	$2.00 / $12.00
Phi 4 Microsoft / 16K context	30.8	13%	General use Open API	12 Dec 2024	$0.07 / $0.14
GPT-4.5 OpenAI / 128K context	30.3	22%	Coding API	27 Feb 2025	$75.00 / $150.00
Llama 3.3 70B Instruct Meta / 131K context	30.1	14%	Coding Open API	6 Dec 2024	$0.13 / $0.40
GPT-5 OpenAI / 400K context	30.0	16%	Chat API	7 Aug 2025	$1.25 / $10.00
O3 Pro OpenAI / 200K context	29.8	20%	Reasoning API	10 Jun 2025	$20.00 / $80.00
o1 OpenAI / 200K context	29.8	21%	General use API	17 Dec 2024	$15.00 / $60.00
GPT-4.1 OpenAI / 1.0M context	29.5	21%	General use API	14 Apr 2025	$2.00 / $8.00
Gemini 3 Pro Google / 1.0M context	28.5	13%	Chat API	18 Nov 2025	$2.00 / $12.00
Qwen3 235B A22B Alibaba / 131K context	27.5	12%	Chat Open API	1 Apr 2025	$0.46 / $1.82
Claude 3.5 Sonnet Anthropic / 200K context	27.5	24%	General use API	22 Oct 2024	$3.00 / $15.00
Claude Sonnet 4.5 Anthropic / 1.0M context	26.7	13%	Chat API	29 Sept 2025	$3.00 / $15.00
QwQ 32B Alibaba / 131K context	26.7	15%	Coding Open API	6 Mar 2025	$1.20 / $1.20
Nemotron 70B NVIDIA / 131K context	26.7	7%	General use Open API	1 Oct 2024	$0.20 / $0.40
DeepSeek V3 DeepSeek / 164K context	26.6	17%	Coding Open API	25 Dec 2024	$0.20 / $0.80
Claude 3.7 Sonnet Anthropic / 200K context	26.0	16%	Chat API	24 Feb 2025	$3.00 / $15.00
O4 Mini OpenAI / 200K context	25.5	15%	Coding API	16 Apr 2025	$1.10 / $4.40
Qwen2.5 72B Instruct Alibaba / 33K context	25.2	17%	Coding Open API	19 Sept 2024	$0.36 / $0.40
Gemini 3 Flash Preview Google / 1.0M context	24.3	11%	Chat API	17 Dec 2025	$0.50 / $3.00
Gemini 1.5 Pro Google / 2.1M context	24.3	13%	General use API	15 Feb 2024	$1.25 / $5.00
Gemini 2.5 Flash Google / 1.0M context	23.6	17%	Coding API	1 May 2025	$0.30 / $2.50
Claude 3 Opus Anthropic / 200K context	23.5	17%	General use API	4 Mar 2024	$15.00 / $75.00
Llama 3.1 405B Meta / 131K context	23.1	14%	Coding Open API	23 Jul 2024	$3.00 / $3.00
o3 Mini OpenAI / 200K context	23.0	15%	Coding API	31 Jan 2025	$1.10 / $4.40
Qwen2.5 Coder 32B Instruct Alibaba / 33K context	22.4	6%	Coding Open API	12 Nov 2024	$0.66 / $1.00
Grok 3 Mini xAI / 131K context	21.5	11%	Coding API	10 Jun 2025	$0.30 / $0.50
Grok 2 xAI / 131K context	21.4	7%	General use API	13 Aug 2024	$2.00 / $10.00
Claude Haiku 4.5 Anthropic / 200K context	20.9	11%	Chat API	15 Oct 2025	$1.00 / $5.00
GPT-4.1 Mini OpenAI / 1.0M context	20.9	14%	General use API	14 Apr 2025	$0.40 / $1.60
GPT-4o-mini (2024-07-18) OpenAI / 128K context	20.4	13%	Coding API	18 Jul 2024	$0.15 / $0.60
Claude 3.5 Haiku Anthropic / 200K context	20.1	13%	Coding API	22 Oct 2024	$0.80 / $4.00
Gemini 2.5 Flash Lite Google / 1.0M context	20.0	9%	Coding API	1 May 2025	$0.10 / $0.40
o1-mini OpenAI / 128K context	18.9	11%	Coding API	12 Sept 2024	$3.00 / $12.00
Command A Reasoning Cohere / 256K context	11.8	0%	Frontier tracking Open API	1 Aug 2025	$2.50 / $10.00
Nova 2 Lite Amazon / 1.0M context	10.4	0%	Frontier tracking API	2 Dec 2025	$0.30 / $2.50
Mistral Medium 3 Mistral / 131K context	10.4	0%	Frontier tracking Open API	1 Jun 2025	$0.40 / $2.00
Nemotron Ultra NVIDIA / 131K context	9.8	0%	Frontier tracking Open API	1 Mar 2025	Open / free
Grok 4.1 Fast xAI / 2.1M context	9.1	0%	Frontier tracking API	1 Nov 2025	$0.20 / $0.50
Sonar Pro Perplexity / 200K context	8.8	0%	Frontier tracking API	1 Feb 2025	$3.00 / $15.00
Sonar Perplexity / 127K context	8.6	0%	Frontier tracking API	1 Feb 2025	$1.00 / $1.00
Qwen3 Coder 480B A35B Alibaba / 262K context	8.5	0%	Frontier tracking Open API	1 Sept 2025	$0.30 / $1.00
Jamba 1.5 Large AI21 Labs / 256K context	8.5	0%	Frontier tracking API	22 Aug 2024	$2.00 / $8.00
Phi-4 Multimodal Microsoft / 128K context	8.3	0%	Frontier tracking Open API	26 Feb 2025	$0.10 / $0.20
Reka Flash 3 Reka / 66K context	8.2	0%	Frontier tracking API	1 Jun 2025	$0.10 / $0.20
Yi Lightning 01.AI / 16K context	8.0	0%	Frontier tracking Open API	1 Sept 2024	$0.99 / $0.99
Yi Vision 01.AI / 16K context	7.2	0%	Frontier tracking Open API	1 Aug 2024	$1.99 / $1.99
Jamba 1.5 Mini AI21 Labs / 256K context	6.5	0%	Frontier tracking API	22 Aug 2024	$0.20 / $0.40
Pixtral Large Mistral / 131K context	6.3	0%	Frontier tracking API	18 Nov 2024	$2.00 / $6.00
Codestral 2508 Mistral / 256K context	6.2	0%	Frontier tracking API	14 Jan 2025	$0.30 / $0.90
Codestral 25.01 Mistral / 256K context	6.1	0%	Frontier tracking API	14 Jan 2025	$0.30 / $0.90
Yi Large 01.AI / 33K context	5.8	0%	Frontier tracking Open API	1 May 2024	$3.00 / $3.00
Qwen3 32B Alibaba / 131K context	5.7	0%	Frontier tracking Open API	29 Apr 2025	$0.08 / $0.28
Qwen3 30B A3B Alibaba / 131K context	5.7	0%	Frontier tracking Open API	29 Apr 2025	$0.13 / $0.52
Nova Premier 1.0 Amazon / 1.0M context	5.6	0%	Frontier tracking API	1 Mar 2025	$2.50 / $12.50
Claude Haiku 4 Anthropic / 200K context	5.2	0%	Frontier tracking API	1 Oct 2025	$0.80 / $4.00
GPT-5 Nano OpenAI / 400K context	5.2	0%	Frontier tracking API	7 Aug 2025	$0.05 / $0.40
Command R+ (08-2024) Cohere / 128K context	5.0	0%	Frontier tracking Open API	1 Aug 2024	$2.50 / $10.00
Mistral Large 2407 Mistral / 131K context	4.9	0%	Frontier tracking Open API	24 Jul 2024	$2.00 / $6.00
DeepSeek V2.5 DeepSeek / 128K context	4.9	0%	Frontier tracking Open API	5 Sept 2024	$0.14 / $0.28
MiniMax-01 MiniMax / 1.0M context	4.9	0%	Frontier tracking API	15 Jan 2025	$0.20 / $1.10
Nova Pro 1.0 Amazon / 300K context	4.9	0%	Frontier tracking API	3 Dec 2024	$0.80 / $3.20
Llama 3.1 70B Instruct Meta / 131K context	4.9	0%	Frontier tracking Open API	23 Jul 2024	$0.40 / $0.40
Reka Core Reka / 128K context	4.8	0%	Frontier tracking API	15 Apr 2024	$3.00 / $15.00
Command R (08-2024) Cohere / 128K context	4.7	0%	Frontier tracking Open API	11 Mar 2024	$0.15 / $0.60
Mistral Nemo Mistral / 131K context	4.6	0%	Frontier tracking Open API	18 Jul 2024	$0.02 / $0.03
GPT-4.1 Nano OpenAI / 1.0M context	4.5	0%	Frontier tracking API	14 Apr 2025	$0.10 / $0.40
Llama 3.1 8B Instruct Meta / 131K context	4.4	0%	Frontier tracking Open API	23 Jul 2024	$0.05 / $0.08
Nova Micro 1.0 Amazon / 128K context	4.4	0%	Frontier tracking API	3 Dec 2024	$0.04 / $0.14
Command R7B (12-2024) Cohere / 128K context	4.3	0%	Frontier tracking Open API	1 Jun 2024	$0.04 / $0.15
Gemini 1.5 Flash Google / 1.0M context	3.9	0%	Frontier tracking API	24 May 2024	$0.07 / $0.30
Nova Lite 1.0 Amazon / 300K context	3.8	0%	Frontier tracking API	3 Dec 2024	$0.06 / $0.24