当前位置：首页 > news >正文

[论文阅读] 人工智能 + 软件工程 | 从用户需求到产品迭代：特征请求研究的全景解析

news 2025/8/21 13:06:27

从用户需求到产品迭代：特征请求研究的全景解析

论文信息

原标题：Feature Request Analysis and Processing: Tasks, Techniques, and Trends
主要作者：Feifei Niu, Chuanyi Li, Haosheng Zuo, Jionghan Wu（南京大学）；Xin Xia（浙江大学）
研究机构：南京大学计算机软件新技术国家重点实验室；浙江大学计算机科学与技术学院
引文格式（APA）：Niu, F., Li, C., Zuo, H., Wu, J., & Xia, X. (2025). Feature Request Analysis and Processing: Tasks, Techniques, and Trends. In Proceedings of [Conference Title]. ACM, New York, NY, USA.

一段话总结

该论文通过系统综述131项相关研究，全面梳理了软件特征请求（用户提出的新功能或功能增强需求）的分析与处理领域，将研究主题分为12类（如识别、优先级排序、质量审查等），从需求工程视角剖析了各阶段的技术方法，总结了现有工具和数据集，并指出了确保请求质量、优化LLM驱动任务基准等关键挑战与机会，为该领域的研究和实践提供了全景式参考。

思维导图

在这里插入图片描述

研究背景

在软件产品的生命周期中，用户的声音往往是产品进化的核心驱动力。例如，当你在应用商店给某款APP留言“希望增加夜间模式”，或在开源项目的Issue区提出“建议优化API响应速度”时，这些内容都属于“特征请求”。

据研究统计，约23.3%的应用评论包含特征请求，而在Twitter等社交平台上，24%的用户评论是对软件功能的需求。这些请求蕴含着用户对产品的真实期待，但它们通常混杂在海量的用户反馈中，形式杂乱（可能是一句吐槽、一段建议，甚至是一个表情包搭配文字）。

传统上，开发者需要手动筛选、理解这些请求，这不仅耗时耗力，还可能遗漏关键信息。例如，某音乐APP曾因未及时处理“离线下载进度显示”的高频请求，导致用户流失。此外，现有研究多聚焦于单一任务（如从评论中提取请求），缺乏对特征请求全生命周期的整体分析——这正是该论文要解决的核心问题。

创新点

全景式视角：首次从需求工程全生命周期出发，将特征请求研究划分为12个关键任务，覆盖从识别到代码实施的完整流程。
LLM技术整合：系统分析了大语言模型（如GPT-4、BERT）在特征请求处理中的应用，包括识别、摘要生成等场景。
资源整合：整理了公开工具（如用于评论分类的MARC2.0）和数据集（如包含40,000条增强报告的Bugzilla数据集），为后续研究提供便利。
挑战-机会框架：提出了特征请求质量保证、多语言处理等7大未来研究方向，针对性强。

研究方法和思路

论文采用系统文献综述方法，具体步骤如下：

确定研究问题：提出4个核心问题（RQ1-RQ4），分别关注研究 demographics、处理方法、可用资源、挑战与机会。
文献搜索：
- 数据库：涵盖IEEE Xplore、ACM Digital Library等9个平台。
- 关键词：使用“feature request”“user requirement”等6个关键词组合。
- 初始检索得到17,381篇论文，去重后进入筛选阶段。
筛选与评估：
- 纳入标准：英文、2025年8月前发表、聚焦需求工程中的特征请求。
- 排除标准：非软件领域、仅讨论bug报告、技术报告等。
- 经3轮滚雪球法和质量评估（从数据、方法、评估3维度打分），最终保留131篇高质量研究。
数据提取：4位作者独立提取文献信息（如发表年份、研究主题、方法等），通过讨论解决分歧。

主要贡献

类别	具体内容
研究主题分类	将特征请求研究分为12类，其中“特征请求识别”（56篇）、“优先级排序”（17篇）、“质量审查”（17篇）是研究热点
技术方法总结	识别任务中，监督学习（如SVM、BERT）和LLM（如GPT-4）表现突出；优先级排序则结合用户投票、情感分析等多维度指标
资源整理	公开工具15+（如用于代码定位的CHANGEADVISOR）、数据集20+（如包含App评论的Mast数据集）
挑战与机会	指出“提升请求质量”“开发LLM基准测试”等关键方向，为未来研究提供路线图

关键问题

Q：特征请求与bug报告有何区别？
A：特征请求聚焦“新增或增强功能”（如“希望添加指纹登录”），而bug报告关注“现有功能错误”（如“登录按钮点击无反应”）。
Q：如何从海量用户反馈中自动识别特征请求？
A：主流方法包括：①基于规则的模式匹配（如识别“希望”“建议”等关键词）；②机器学习分类（如用SVM区分请求与普通评论）；③LLM提示工程（如让GPT-4直接标注请求内容）。
Q：特征请求的优先级是如何确定的？
A：结合用户投票、请求频率、情感倾向（如负面评论中提到的功能）、开发成本等因素，常用方法有Kano模型、AHP层次分析法，以及基于聚类的自动排序。
Q：有哪些公开资源可以用于相关研究？
A：工具如LLM-Cure（用于竞品分析）、数据集如Bugzilla增强报告（含40,000条请求）。
Q：未来研究的核心挑战是什么？
A：①提升请求质量（减少模糊、冗余内容）；②优化LLM在多语言场景的表现；③建立标准化的基准测试数据集。