OpenAI收购AI安全平台Promptfoo
OpenAI收购AI安全平台Promptfoo
OpenAI宣布收购AI安全公司Promptfoo。该平台能检测开发阶段AI系统的安全漏洞,已在Fortune 100企业中部署。此次收购后,Promptfoo将整合进OpenAI的企业安全套件,支持模型微调和API调用时的漏洞扫描。交易金额未披露,预计年内完成。
Messenger 推出高级浏览保护功能
Meta 详细介绍了 Messenger 的高级浏览保护(ABP)技术。该功能通过实时分析聊天中的链接,在保护用户隐私的同时警告恶意链接。系统使用混合加密和沙箱环境处理链接数据,确保不泄露用户聊天内容。此功能已在全球范围内上线,每天可拦截数百万个潜在威胁链接。
LangChain GPT代理提升销售转化250%
LangChain开发的GTM销售代理通过分析客户对话历史和产品数据库,自动生成个性化跟进方案。该代理已帮助销售团队每月节省40小时工作时间,线索转化率提升250%。系统采用混合检索增强生成架构,支持实时更新产品信息。
Claude Code v2.1.72 版本更新
Claude Code 发布 v2.1.72 版本,主要更新包括:工具搜索支持绕过第三方代理网关,新增 /copy 命令的 w 键可直接将选中内容写入文件,优化了 SSH 环境下的性能。同时移除了 CLAUDE_CODE_PROXY_SUPPORTS_TOOL_REFERENCE 环境变量。
OpenAI Codex 0.113.0-alpha.2发布
本次alpha版本优化了代码补全的上下文窗口至64k,支持Python 3.12和Rust 1.71的语法分析。新增CLI参数--strict-type-check加强类型检查。修复了在Windows环境下的路径解析问题,性能提升约15%。
OpenClaw 2026.3.8发布备份功能
新增openclaw backup create和openclaw backup verify命令,支持配置和工作空间分离备份。提供--only-config和--no-include-workspace选项,支持SHA256校验。Mac平台复用v2026.3.8-beta.1的构建产物,体积减少12%。
RoboLayout:可微分 3D 场景生成模型
RoboLayout 是一种可微分 3D 场景生成模型,可根据语言指令为具身智能生成语义连贯且物理可行的布局。该模型基于视觉语言模型(VLM)的空间推理能力,支持开放式指令输入。实验表明,该模型生成的场景在语义一致性和物理可行性上优于现有方法,适用于机器人导航和虚拟环境构建。
LLM 驱动的浏览器扩展检测假新闻
研究人员推出基于 LLM 的浏览器扩展“Verify as You Go”,可在浏览时实时检测假新闻。该工具通过分析文本内容、来源可信度和用户反馈进行判断,检测结果透明可解释。测试显示,其准确率比现有扩展高 23%,支持多语言检测。目前适用于 Chrome 和 Firefox 浏览器。
Traversal-as-Policy:LLM 智能体安全框架
Traversal-as-Policy 是一种新的智能体安全框架,通过提取 OpenHands 执行日志生成可验证的门控行为树。该方法将长期策略显式化,避免传统 LLM 智能体的隐式策略导致的安全问题。实验表明,该框架在保持任务完成率的同时,将越界行为减少 67%。代码已在 GitHub 开源。
实时AI服务经济跨设备边云框架
arXiv论文提出实时AI服务需在设备-边缘-云全域运行,自主AI代理需处理延迟敏感任务、编排多阶段流水线,并受政策和治理约束。该框架为代理计算提供统一资源调度方案,支持动态负载均衡,可提升AI系统跨域协同效率。开发者可基于此框架构建低延迟的分布式AI应用,解决边缘计算资源竞争问题。
注意力机制结合可达性优化语法解码
arXiv研究证明语法约束解码(GCD)在自回归模型与下推系统可达性查询间存在不变性定理。该技术将语言等价性分解为结构等价性,使语法解码效率提升30%,尤其在自然语言生成任务中减少重复输出。对比传统解码方法,新方案在保持语法正确的同时,降低了计算复杂度。
JAWS通过雅可比正则化稳定神经算子
arXiv论文提出JAWS方法,通过空间自适应雅可比正则化解决神经算子长期 rollout 的不稳定问题。该技术缓解了谱爆炸现象,使连续动力学系统仿真误差降低40%。实验显示,在流体力学模拟中,JAWS比全局正则化方法收敛速度更快,适用于长时间序列预测场景。
推理模型难以控制思维链输出
arXiv研究发现,现代推理模型的思维链(CoT)存在可控漏洞。若模型能操纵思维链的显式表达,将削弱CoT监控机制的有效性。实验中,经过特殊提示的模型可隐藏错误推理步骤,使传统监控方法失效。这对构建可靠的可解释AI系统提出新挑战。
NOTAI.AI通过曲率检测AI生成文本
NOTAI.AI是Fast-DetectGPT的改进版,集成17种可解释特征(曲率信号、神经特征、文体特征),在监督学习中实现机器生成文本检测。该系统在论文检测任务中准确率达92%,能高亮显示影响判断的关键特征,为内容审核提供具体依据。
VDCook视频数据操作系统支持MLLMs
VDCook是自进化视频数据操作系统,支持自然语言查询和参数化配置(规模、分辨率等),为研究者和垂直领域团队提供视频数据构建方案。平台包含自动清洗、标注工具,支持增量更新。用户可快速定制多模态数据集,降低大语言模型训练的数据准备成本。
PostgreSQL 18 将支持无生产数据查询计划
PostgreSQL 18 将新增 pg_restore_relation_stats() 和 pg_restore_attribute_stats() 函数。这两个函数允许数据库在不访问生产数据的情况下生成查询计划,帮助优化器决定最佳执行策略。新功能将于 2025 年 9 月发布,可降低生产环境访问风险。开发者可在开发阶段使用此功能验证查询性能。
大模型可能不会扼杀编程新技术
西蒙·威利森指出,编程领域的大模型曾因训练数据偏差,让新技术难以突围,但现状正在改变。两年前,大模型确实更倾向于推荐训练数据中的主流工具,但近期新模型已能支持更多小众技术。开发者反馈,像Haskell、Rust等语言在GitHub上的代码生成请求增长显著。大模型开始主动学习新兴技术,帮助开发者突破工具选择的限制。