2026.05.21DAILY REPORT

GitHub遭未授权访问内部仓库

15 条·2026.05.21

DAILY BRIEF

01GitHub遭未授权访问内部仓库 02Grok Build 0.1上线Vercel AI Gateway 03OpenClaw更新2026.5.20-beta.1版 04Railway获3M用户，周增10万 05Google发布Gemini 3.5 Flash与Omini 06Google I/O 2026发布100项更新 07Google Beam推出新实验，让虚拟会议更真实 08Google投资密苏里州人才培养 09OpenAI发布Codex 0.133.0-alpha.3 10DecisionBench评估代理任务委派能力 11代理网络信任机制需原生设计 12POLAR-Bench：首个评估LLM代理隐私-效用权衡的基准测试 13HELLoRA：专家模型参数高效微调新方案 14D-PACE：提升LLM推理速度的并行解码技术 15UCCI：LLM级联路由的校准不确定度优化方案

01 / 资讯2026.05.21 05:07

GitHub遭未授权访问内部仓库

GitHub正在调查内部仓库遭受的未授权访问事件。公司表示如发现用户数据受影响，将通过既定渠道通知客户。目前尚未确认泄露范围，事件响应程序已启动。

SOURCE

GitHub Blog

02 / 发布2026.05.20 15:00

Grok Build 0.1上线Vercel AI Gateway

xAI推出的Grok Build 0.1已在Vercel AI Gateway上线。这是首个专为代理编程训练的Beta版模型，早期访问权限通过Grok Build CLI应用提供。该模型无推理模式切换选项，目前支持xai/grok-build-0调用。开发者可用它构建自动化编程工具。

SOURCE

Vercel Blog

032026.05.21 08:33

OpenClaw更新2026.5.20-beta.1版

OpenClaw发布2026.5.20-beta.1版，新增Discord语音会话跟随功能，支持多用户交接和DAVE恢复机制。改进包括用户身份验证与频道权限检查，修复了同步冲突问题。

SOURCE

OpenClaw Releases

04 / 资讯2026.05.21 06:42

Railway获3M用户，周增10万

开发者平台Railway宣布达到300万用户规模，每周新增10万注册。该平台自建金属数据中心，AI编程代理支出超20万美元，并取消PR流程，完全转向代理原生架构。

SOURCE

Latent Space

05 / 发布2026.05.20 11:34

Google发布Gemini 3.5 Flash与Omini

Google I/O 2026发布Gemini 3.5 Flash模型，新增视频处理Omni（原NanoBanana）和后台代理Spark功能。Antigravity 2.0同步亮相，具体参数未公开。

SOURCE

Latent Space

06 / 资讯2026.05.21 03:30

Google I/O 2026发布100项更新

Google在I/O 2026大会上公布100多项更新，重点包括Gemini Omni模型、Antigravity技术和通用购物车Universal Cart。此次更新聚焦AI视频处理与多代理协作能力。

SOURCE

Google AI Blog

07 / 发布2026.05.21 00:45

Google Beam推出新实验，让虚拟会议更真实

Google Beam推出新实验，让虚拟参会者以真实大小和音量呈现，提升混合会议的包容感和连接性。用户可在沉浸式环境中与远程同事互动，模拟面对面交流的体验。该技术通过优化空间音频和视觉比例，减少远程参会者的疏离感，尤其适用于跨国团队协作和大型混合会议场景。目前该功能已在Google Workspace测试版中开放试用。

SOURCE

Google AI Blog

08 / 资讯2026.05.21 04:40

Google投资密苏里州人才培养

Google宣布在密苏里州进行社区投资，重点建设新一代劳动力培养项目，同时投入能源相关项目。具体投资金额未披露，但明确指向技术人才培养与清洁能源发展。

SOURCE

Google AI Blog

09 / 发布2026.05.21 07:11

OpenAI发布Codex 0.133.0-alpha.3

OpenAI Codex更新至0.133.0-alpha.3版本，同时发布了0.133.0-alpha.2和0.133.0-alpha.1版本。该版本主要针对代码生成模型的性能优化，暂无新功能说明。

SOURCE

OpenAI Codex Releases

10 / 研究2026.05.20 12:00

DecisionBench评估代理任务委派能力

arXiv论文提出DecisionBench基准，用于评估长周期代理工作流中的 emergent delegation。该基准包含GAIA等任务套件，测试11个模型家族的委派性能，提供标准化评估接口。

SOURCE

arXiv cs.AI

112026.05.20 12:00

代理网络信任机制需原生设计

arXiv论文指出，随着LLM代理向协作生态系统演进，信任机制必须原生设计而非后期添加。研究分析了11个模型在长周期任务中的协作缺陷，提出网络级信任框架的必要性。

SOURCE

arXiv cs.AI

122026.05.20 12:00

POLAR-Bench：首个评估LLM代理隐私-效用权衡的基准测试

研究人员发布POLAR-Bench基准测试，专门评估LLM代理在处理用户隐私数据时的表现。该基准测试模拟代理与第三方系统交互的场景，检测代理是否能严格遵守用户的数据共享规则，即使面临系统诱导时也能保持隐私保护。测试包含多个典型案例，覆盖医疗、金融等敏感领域，旨在帮助开发更可靠、更安全的AI代理系统。论文已在arXiv发布。

SOURCE

arXiv cs.AI

132026.05.20 12:00

HELLoRA：专家模型参数高效微调新方案

研究人员提出HELLoRA方法，针对MoE模型的稀疏激活特性进行层级化低秩适配。该方法在保持MoE计算效率的同时，显著降低了微调参数量（减少40%），并在多个基准测试中提升了模型性能。相比传统LoRA，HELLoRA专门优化了专家模型的权重分配，使其在专业领域任务中表现更好。该方案为MoE模型的高效定制提供了新思路，论文已在arXiv发表。

SOURCE

arXiv cs.LG (ML)

142026.05.20 12:00

D-PACE：提升LLM推理速度的并行解码技术

研究人员开发D-PACE技术，通过动态位置感知交叉熵优化并行解码过程。该方法将大模型验证阶段的计算量减少35%，同时保持输出质量不变。相比现有方案，D-PACE能够更准确预测下一个token块，显著降低了验证阶段的计算开销。该技术特别适合需要快速响应的LLM应用场景，如实时翻译和代码生成。论文已在arXiv发布。

SOURCE

arXiv cs.LG (ML)

152026.05.20 12:00

UCCI：LLM级联路由的校准不确定度优化方案

研究人员提出UCCI方法，解决LLM级联路由中的置信度校准问题。该技术通过动态调整查询难度阈值，使小模型处理65%的常规任务，大模型专注于复杂查询，总体推理成本降低42%。相比现有方案，UCCI无需人工调参，能自动适应不同工作负载。该方案特别适合云服务提供商优化AI推理成本，论文已在arXiv发表。

SOURCE

arXiv cs.LG (ML)

chat_bubble对今日内容有什么想法？