---
issue_number: W20260524
title: "GPT-Next千元解决80年数学难题，AI成本超雇佣真人员工"
url: https://ai.daily.yangsir.net/weekly?date=2026-05-24T00:00:00.000Z
week_start: 2026-05-18T00:00:00.000Z
week_end: 2026-05-24T00:00:00.000Z
publish_date: 2026-05-24T00:00:00.000Z
---

# GPT-Next千元解决80年数学难题，AI成本超雇佣真人员工

> 这周挺有意思的事：OpenAI用GPT-Next花千元就解决了80年的数学难题；微软报告却说AI成本比雇佣真人员工还高。另外还有几个新模型，比如能终身学习的SOLAR，能降低40%训练成本的ACC，还有评估AI隐私的POLAR-Bench，都是些挺实用的进展。

## 本周精选（9 条）

### 1. OpenAI GPT-Next千元成本解决80年数学难题

**推荐理由**：AI攻克数学猜想，科研范式级突破。

**来源**：Latent Space
https://www.latent.space/p/ainews-openai-gpt-next-disproves

**分类**：news

---

### 2. 微软报告：AI成本高于雇佣真人员工

**推荐理由**：打破AI降本神话，企业决策必读。

**来源**：HN AI 精选
https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tokens-agents/

---

### 3. SOLAR：终身学习的自我优化AI代理

**推荐理由**：解决概念漂移，终身学习架构突破。

**来源**：arXiv cs.AI
https://arxiv.org/abs/2605.20189

**分类**：research

---

### 4. ACC：代理轨迹编译实现长上下文训练

**推荐理由**：低成本长上下文方案，训练降本40%。

**来源**：arXiv cs.CL (NLP)
https://arxiv.org/abs/2605.21850

---

### 5. CP-MoE：持续学习的混合专家模型

**推荐理由**：解决灾难性遗忘，持续学习新解法。

**来源**：arXiv cs.LG (ML)
https://arxiv.org/abs/2605.20247

---

### 6. 开放世界评估：衡量前沿AI能力新标准

**推荐理由**：打破基准测试局限，定义评估新标准。

**来源**：arXiv cs.AI
https://arxiv.org/abs/2605.20520

---

### 7. 基于代理的长上下文推理方法：仅需部分输入

**推荐理由**：推理减负70%，长文本处理新思路。

**来源**：arXiv cs.CL (NLP)
https://arxiv.org/abs/2605.20201

**分类**：research

---

### 8. LBW-Guard训练控制系统：高压力下保持模型稳定性

**推荐理由**：解决训练崩溃，大模型稳态训练保障。

**来源**：arXiv cs.AI
https://arxiv.org/abs/2605.19008

**分类**：research

---

### 9. POLAR-Bench：首个评估LLM代理隐私-效用权衡的基准测试

**推荐理由**：填补隐私评测空白，安全落地关键。

**来源**：arXiv cs.AI
https://arxiv.org/abs/2605.19127

**分类**：research

---

**周报详情页**：https://ai.daily.yangsir.net/weekly?date=2026-05-24T00:00:00.000Z

---

*智语观潮 · 每周深读 — https://ai.daily.yangsir.net/llms.txt*