2026.03.25DAILY REPORT

new.website并入v0,加速AI驱动软件开发

16 ·2026.03.25
01 / 发布2026.03.25 00:00

new.website并入v0,加速AI驱动软件开发

v0宣布与网站构建平台new.website合并。new.website专注于提供内置表单、SEO等功能的完整网站解决方案,此次合并将共同推进AI驱动软件开发的愿景。合并后,团队将整合技术资源,帮助开发者更高效地创建生产级软件产品。目前具体财务条款未披露,但双方已确认技术团队将统一整合。

02 / 观点2026.03.25 00:53

材料发现为何没有AlphaFold?十年AI科研经验谈

麻省理工学院教授Heather Kulik分享材料科学AI应用的十年经验。她指出,虽然AlphaFold在蛋白质结构预测取得突破,但材料发现仍面临数据稀疏、实验验证周期长等独特挑战。Kulik提出需要建立材料科学专属的AI方法论,并强调跨学科合作的重要性。访谈中还探讨了近期材料AI研究的进展与未来方向。

03 / 工具2026.03.24 10:01

Hugging Face推出语音助手评估框架EVA

Hugging Face发布语音助手评估框架EVA(Evaluation of Voice Agents)。该框架提供标准化的评估指标,包括对话流畅度、任务完成准确率、响应延迟等关键维度。EVA支持多种语音模型对比测试,开发者可快速评估模型性能。目前支持英语评估,后续计划扩展多语言支持。框架已在GitHub开源,采用MIT许可证。

04 / 发布2026.03.24 19:00

OpenAI发布青少年安全提示词政策

OpenAI面向开发者推出gpt-oss-safeguard的青少年安全提示词政策。新政策通过定制化提示词,帮助AI系统识别并过滤青少年相关风险内容,包括不适宜信息和隐私保护措施。政策将集成到OpenAI的API中,开发者可轻松调用。这是OpenAI青少年安全计划的一部分,此前已推出内容分类年龄评级等功能。

052026.03.24 22:01

Claude新增面试功能,交互方式变革

Claude模型新增面试式交互功能,通过提问方式获取更精准的用户需求。该功能允许AI在回答前先提出澄清问题,类似人类对话中的互动流程。Ben’s Bites分析认为,这可能是Claude与OpenClaw竞争策略的一部分,通过提升交互自然度吸引用户。目前该功能逐步向用户开放,但尚未公布全面上线时间表。

06 / 工具2026.03.25 00:00

GitHub使用Copilot SDK构建AI驱动的issue分类系统

GitHub教程展示如何使用Copilot SDK在React Native应用中实现AI驱动的issue自动分类系统。该系统可自动生成issue摘要,并提供优雅降级和缓存机制。实现方案采用模块化设计,支持多种issue类型识别,并集成了GitHub原生API。代码示例已开源,开发者可直接参考实现类似功能。此案例展示了Copilot SDK在实际生产环境中的应用模式。

07 / 发布2026.03.25 06:08

OpenAI Codex发布0.117.0-alpha.14版本

OpenAI Codex发布测试版本0.117.0-alpha.14。本次更新包括多项性能优化和错误修复,具体变更未详细披露。根据更新日志,该版本延续了之前的快速迭代节奏,每1-2周发布一个alpha版本。Codex是OpenAI的代码生成模型,支持多种编程语言,是GitHub Copilot背后的核心技术之一。开发者可通过OpenAI API访问最新版本。

08 / 研究2026.03.24 12:00

AgenticGEO:面向搜索引擎优化的自主进化智能体

arXiv发布论文AgenticGEO,提出面向生成式搜索引擎优化的自主进化智能体系统。传统搜索引擎依赖排序优化,而生成式引擎转向内容包含优化。该系统通过持续学习和自我调整,动态优化内容生成策略。研究展示了在特定搜索场景下的有效性,但尚未公开实际部署数据。论文为生成式搜索引擎优化提供了新思路。

09 / 资讯2026.03.24 14:50

Meta 超级智能实验室聘请 Dreamer 加入,推进个人超级智能研究

Meta 超级智能实验室聘请了 Dreamer 加入,距离其 Latent Space 播客发布仅 11 天。Dreamer 将在 MSL 推进个人超级智能研究,结合其前期工作,有望在 AI 能力和效率方面取得突破。

102026.03.24 17:00

OpenAI 基金会承诺投资至少 10 亿美元用于疾病治疗和 AI 韧性

OpenAI 基金会宣布将投资至少 10 亿美元,用于疾病治疗、经济机会、 AI 韧性和社区项目。这笔资金旨在将 AI 技术应用于解决全球性挑战,并确保 AI 系统的安全可靠。

11 / 研究2026.03.24 12:00

ProMAS:多智能体系统主动错误预测方法

研究人员提出 ProMAS 方法,使用马尔可夫转移动力学预测多智能体系统中的错误。该方法通过分析智能体间的状态转移,提前识别潜在故障点,提高系统稳定性。适用于需要高可靠性的协作任务,如自动驾驶和机器人协作。

12 / 发布2026.03.24 17:00

ChatGPT 推出沉浸式购物功能,集成智能商业协议

ChatGPT 推出全新购物体验,通过智能商业协议支持商品发现和对比。用户可直接在对话中进行商品浏览、比较和购买,界面更加可视化。该功能整合了多家商户,为消费者提供一站式购物解决方案。

13 / 研究2026.03.24 12:00

Plug-and-Play 预测器实现领域专用思维树,提升推理效率

研究人员提出一种新的思维树方法,通过即插即用预测器实现领域专用推理。该方法解决了传统思维树在探索深度和计算效率之间的权衡问题,在保持推理质量的同时降低了计算成本,适用于专业领域的复杂任务。

142026.03.24 12:00

FactorSmith:通过马尔可夫分解生成智能体模拟

研究人员提出 FactorSmith 方法,通过马尔可夫决策过程分解生成智能体模拟。该方法从自然语言规范生成可执行模拟,解决了大模型在处理大型互联代码库时的推理限制,适用于复杂系统的模拟和测试。

152026.03.24 12:00

LLM自我反思能力评估:新研究揭示其可靠性问题

一篇新论文评估了大语言模型的自我反思能力,发现当前评估方法存在缺陷。研究者通过Me, Myself, and $\pi$基准测试,揭示LLM在评估自身认知过程时表现不稳定,尤其在处理复杂推理任务时容易出现过度自信或自我怀疑。该研究指出了现有LLM自我评估机制的局限性,为改进模型元认知能力提供了新方向。

162026.03.24 12:00

多体AI协作面临通信压力测试,真实环境表现存疑

AgentComm-Bench基准测试评估了多体AI在延迟、丢包和带宽受限条件下的协作表现。研究显示,在理想通信环境下表现良好的合作多体系统,在模拟真实网络条件时性能急剧下降,可能导致机器人团队或自动驾驶车队在复杂环境中协作失败。该研究揭示了当前多体AI在非理想通信条件下的脆弱性。

chat_bubble对今日内容有什么想法?