---
id: 20260317-T0-20
title: "研究从用户交互中对齐语言模型"
title_en: "Study Aligns Language Models from User Interactions"
url: https://ai.daily.yangsir.net/daily/20260317-T0-20
issue_date: 2026-03-17
publish_date: 2026-03-16T04:00:00.000Z
source_name: "arXiv cs.CL (NLP)"
source_url: https://arxiv.org/abs/2603.12273
---

# 研究从用户交互中对齐语言模型

arXiv研究提出从多轮用户交互中学习对齐语言模型的新方法。研究表明，通常被丢弃的用户后续消息包含重要反馈信息，可用于纠正模型行为。该方法在对话数据集上测试，将有害输出减少63%，同时保持任务完成率。该研究为利用海量真实用户数据改进模型对齐提供了可行路径。

## English Version

**Study Aligns Language Models from User Interactions**

arXiv study proposes new method to align language models from multi-turn user interactions. Found follow-up messages contain valuable feedback to correct model behavior. Reduced harmful outputs by 63% while maintaining task completion rates on dialogue datasets.

---

**来源**：[arXiv cs.CL (NLP)](https://arxiv.org/abs/2603.12273)

**详情页**：https://ai.daily.yangsir.net/daily/20260317-T0-20

---

*智语观潮 · Daily — https://ai.daily.yangsir.net/llms.txt*