2026.03.25DAILY REPORT

new.website并入v0，加速AI驱动软件开发

16 条·2026.03.25

DAILY BRIEF

01new.website并入v0，加速AI驱动软件开发 02材料发现为何没有AlphaFold？十年AI科研经验谈 03Hugging Face推出语音助手评估框架EVA 04OpenAI发布青少年安全提示词政策 05Claude新增面试功能，交互方式变革 06GitHub使用Copilot SDK构建AI驱动的issue分类系统 07OpenAI Codex发布0.117.0-alpha.14版本 08AgenticGEO：面向搜索引擎优化的自主进化智能体 09Meta 超级智能实验室聘请 Dreamer 加入，推进个人超级智能研究 10OpenAI 基金会承诺投资至少 10 亿美元用于疾病治疗和 AI 韧性 11ProMAS：多智能体系统主动错误预测方法 12ChatGPT 推出沉浸式购物功能，集成智能商业协议 13Plug-and-Play 预测器实现领域专用思维树，提升推理效率 14FactorSmith：通过马尔可夫分解生成智能体模拟 15LLM自我反思能力评估：新研究揭示其可靠性问题 16多体AI协作面临通信压力测试，真实环境表现存疑

01 / 发布2026.03.25 00:00

new.website并入v0，加速AI驱动软件开发

v0宣布与网站构建平台new.website合并。new.website专注于提供内置表单、SEO等功能的完整网站解决方案，此次合并将共同推进AI驱动软件开发的愿景。合并后，团队将整合技术资源，帮助开发者更高效地创建生产级软件产品。目前具体财务条款未披露，但双方已确认技术团队将统一整合。

SOURCE

Vercel Blog

02 / 观点2026.03.25 00:53

材料发现为何没有AlphaFold？十年AI科研经验谈

麻省理工学院教授Heather Kulik分享材料科学AI应用的十年经验。她指出，虽然AlphaFold在蛋白质结构预测取得突破，但材料发现仍面临数据稀疏、实验验证周期长等独特挑战。Kulik提出需要建立材料科学专属的AI方法论，并强调跨学科合作的重要性。访谈中还探讨了近期材料AI研究的进展与未来方向。

SOURCE

Latent Space

03 / 工具2026.03.24 10:01

Hugging Face推出语音助手评估框架EVA

Hugging Face发布语音助手评估框架EVA（Evaluation of Voice Agents）。该框架提供标准化的评估指标，包括对话流畅度、任务完成准确率、响应延迟等关键维度。EVA支持多种语音模型对比测试，开发者可快速评估模型性能。目前支持英语评估，后续计划扩展多语言支持。框架已在GitHub开源，采用MIT许可证。

SOURCE

Hugging Face Blog

04 / 发布2026.03.24 19:00

OpenAI发布青少年安全提示词政策

OpenAI面向开发者推出gpt-oss-safeguard的青少年安全提示词政策。新政策通过定制化提示词，帮助AI系统识别并过滤青少年相关风险内容，包括不适宜信息和隐私保护措施。政策将集成到OpenAI的API中，开发者可轻松调用。这是OpenAI青少年安全计划的一部分，此前已推出内容分类年龄评级等功能。

SOURCE

OpenAI News

052026.03.24 22:01

Claude新增面试功能，交互方式变革

Claude模型新增面试式交互功能，通过提问方式获取更精准的用户需求。该功能允许AI在回答前先提出澄清问题，类似人类对话中的互动流程。Ben’s Bites分析认为，这可能是Claude与OpenClaw竞争策略的一部分，通过提升交互自然度吸引用户。目前该功能逐步向用户开放，但尚未公布全面上线时间表。

SOURCE

Ben's Bites

06 / 工具2026.03.25 00:00

GitHub使用Copilot SDK构建AI驱动的issue分类系统

GitHub教程展示如何使用Copilot SDK在React Native应用中实现AI驱动的issue自动分类系统。该系统可自动生成issue摘要，并提供优雅降级和缓存机制。实现方案采用模块化设计，支持多种issue类型识别，并集成了GitHub原生API。代码示例已开源，开发者可直接参考实现类似功能。此案例展示了Copilot SDK在实际生产环境中的应用模式。

SOURCE

GitHub Blog

07 / 发布2026.03.25 06:08

OpenAI Codex发布0.117.0-alpha.14版本

OpenAI Codex发布测试版本0.117.0-alpha.14。本次更新包括多项性能优化和错误修复，具体变更未详细披露。根据更新日志，该版本延续了之前的快速迭代节奏，每1-2周发布一个alpha版本。Codex是OpenAI的代码生成模型，支持多种编程语言，是GitHub Copilot背后的核心技术之一。开发者可通过OpenAI API访问最新版本。

SOURCE

OpenAI Codex Releases

08 / 研究2026.03.24 12:00

AgenticGEO：面向搜索引擎优化的自主进化智能体

arXiv发布论文AgenticGEO，提出面向生成式搜索引擎优化的自主进化智能体系统。传统搜索引擎依赖排序优化，而生成式引擎转向内容包含优化。该系统通过持续学习和自我调整，动态优化内容生成策略。研究展示了在特定搜索场景下的有效性，但尚未公开实际部署数据。论文为生成式搜索引擎优化提供了新思路。

SOURCE

arXiv cs.AI

09 / 资讯2026.03.24 14:50

Meta 超级智能实验室聘请 Dreamer 加入，推进个人超级智能研究

Meta 超级智能实验室聘请了 Dreamer 加入，距离其 Latent Space 播客发布仅 11 天。Dreamer 将在 MSL 推进个人超级智能研究，结合其前期工作，有望在 AI 能力和效率方面取得突破。

SOURCE

Latent Space

102026.03.24 17:00

OpenAI 基金会承诺投资至少 10 亿美元用于疾病治疗和 AI 韧性

OpenAI 基金会宣布将投资至少 10 亿美元，用于疾病治疗、经济机会、 AI 韧性和社区项目。这笔资金旨在将 AI 技术应用于解决全球性挑战，并确保 AI 系统的安全可靠。

SOURCE

OpenAI News

11 / 研究2026.03.24 12:00

ProMAS：多智能体系统主动错误预测方法

研究人员提出 ProMAS 方法，使用马尔可夫转移动力学预测多智能体系统中的错误。该方法通过分析智能体间的状态转移，提前识别潜在故障点，提高系统稳定性。适用于需要高可靠性的协作任务，如自动驾驶和机器人协作。

SOURCE

arXiv cs.AI

12 / 发布2026.03.24 17:00

ChatGPT 推出沉浸式购物功能，集成智能商业协议

ChatGPT 推出全新购物体验，通过智能商业协议支持商品发现和对比。用户可直接在对话中进行商品浏览、比较和购买，界面更加可视化。该功能整合了多家商户，为消费者提供一站式购物解决方案。

SOURCE

OpenAI News

13 / 研究2026.03.24 12:00

Plug-and-Play 预测器实现领域专用思维树，提升推理效率

研究人员提出一种新的思维树方法，通过即插即用预测器实现领域专用推理。该方法解决了传统思维树在探索深度和计算效率之间的权衡问题，在保持推理质量的同时降低了计算成本，适用于专业领域的复杂任务。

SOURCE

arXiv cs.AI

142026.03.24 12:00

FactorSmith：通过马尔可夫分解生成智能体模拟

研究人员提出 FactorSmith 方法，通过马尔可夫决策过程分解生成智能体模拟。该方法从自然语言规范生成可执行模拟，解决了大模型在处理大型互联代码库时的推理限制，适用于复杂系统的模拟和测试。

SOURCE

arXiv cs.AI

152026.03.24 12:00

LLM自我反思能力评估：新研究揭示其可靠性问题

一篇新论文评估了大语言模型的自我反思能力，发现当前评估方法存在缺陷。研究者通过Me, Myself, and $\pi$基准测试，揭示LLM在评估自身认知过程时表现不稳定，尤其在处理复杂推理任务时容易出现过度自信或自我怀疑。该研究指出了现有LLM自我评估机制的局限性，为改进模型元认知能力提供了新方向。

SOURCE

arXiv cs.AI

162026.03.24 12:00

多体AI协作面临通信压力测试，真实环境表现存疑

AgentComm-Bench基准测试评估了多体AI在延迟、丢包和带宽受限条件下的协作表现。研究显示，在理想通信环境下表现良好的合作多体系统，在模拟真实网络条件时性能急剧下降，可能导致机器人团队或自动驾驶车队在复杂环境中协作失败。该研究揭示了当前多体AI在非理想通信条件下的脆弱性。

SOURCE

arXiv cs.AI

chat_bubble对今日内容有什么想法？