---
id: 20260520-T0-09
title: "CHI-Bench：评测AI自动化医疗工作流能力"
title_en: "CHI-Bench: Evaluating AI Healthcare Workflow Automation"
url: https://ai.daily.yangsir.net/daily/20260520-T0-09
issue_date: 2026-05-20
publish_date: 2026-05-19T04:00:00.000Z
category: research
source_name: "arXiv cs.CL (NLP)"
source_url: https://arxiv.org/abs/2605.16679
---

# CHI-Bench：评测AI自动化医疗工作流能力

研究人员推出了医疗AI工作流自动化基准测试CHI-Bench，专注于评测AI端到端自动化医疗运营的能力。该基准测试强调政策密度、多角色协作和长期决策三大能力，填补了现有评测标准的空白。这一工具将推动医疗AI的实用化发展。

## English Version

**CHI-Bench: Evaluating AI Healthcare Workflow Automation**

Researchers introduced CHI-Bench, a benchmark for evaluating end-to-end automation of healthcare operations. It focuses on three key capabilities: policy density, multi-role collaboration, and long-horizon decision-making, addressing gaps in existing standards. This tool will advance the practical application of AI in healthcare.

---

**来源**：[arXiv cs.CL (NLP)](https://arxiv.org/abs/2605.16679)

**详情页**：https://ai.daily.yangsir.net/daily/20260520-T0-09

---

*智语观潮 · Daily — https://ai.daily.yangsir.net/llms.txt*