230年历史企业STADler用ChatGPT提升知识工作
230年历史企业STADler用ChatGPT提升知识工作
拥有230年历史的STADler公司引入ChatGPT提升知识工作效率,650名员工的生产力得到加速。该企业通过定制化AI工具优化文档处理、客户服务等工作流程,节省大量时间。
2026年产品经理必备AI工具推荐
产品经理现在使用两类AI工具:生产力工具和能力扩展工具。Claude、Grammarly等写作工具帮助提高文案效率,而Notion AI、Replit则扩展了产品规划和技术实现能力。这些工具已形成完整工作流。
高管追捧AI但基层员工反应冷淡
调查显示,企业高管对AI工具热情高涨,但普通员工使用率却很低。高管希望通过AI提升战略决策,而基层员工更关注实际工作流程的改善。这种差距反映出AI落地过程中的沟通和培训问题。
Claude Code新增会话聚合代理功能
Claude Code v2.1.86新增X-Claude-Code-Session-Id头部,支持代理按会话聚合请求。同时修复了Jujutsu和Sapling目录自动完成问题,以及–resume参数的工具调用错误。
OpenAI Codex发布0.118.0-alpha.3版
OpenAI Codex发布0.118.0-alpha.3版本,这是系列更新中的最新测试版。此前已发布0.118.0-alpha.2和rust-v0.118.0-alpha.1版本。
LLM代理通过经验反思实现自我改进
新研究提出经验反思学习法,让LLM代理通过回顾过去经验提升性能。该方法解决了当前代理难以适应专业环境、无法利用历史经验的问题,在复杂任务测试中表现优异。
Anthropic内部测试更强AI模型Claude Mythos,文件泄露曝光
一份泄露文件显示Anthropic正在内部测试名为Claude Mythos的新模型。该模型据称在推理和代码生成方面显著超越现有Claude版本,目前处于内部评估阶段,尚未确定发布时间。泄露细节暗示Mythos可能采用了全新的训练架构,性能提升幅度超出常规迭代。
FinMCP-Bench:首个金融工具调用基准,测试LLM代理真实交易能力
论文提出FinMCP-Bench基准测试,基于MCP协议评估LLM代理在真实金融场景中的工具调用能力。测试覆盖市场数据查询、交易执行、风险评估等多个维度,结果显示当前最强模型在复杂多步金融操作中的准确率仍不到60%,暴露了代理在真实交易环境中的可靠性短板。