REASONING ELICITATION IN LANGUAGE MODELSVIA COUNTERFACTUAL FEEDBACK
ICLR 2025
Reasoning Elicitation in Language Models via Counterfactual Feedback | OpenReviewhttps://openreview.net/forum?id=VVixJ9QavY
1. 概述
大型语言模型(LLMs)已被证明能够在各个领域执行众多任务并表现出色。示例包括写作助手(Gan 等人,2023)、社交媒体情感分析(Simmering 和 Huovila,2023),甚至在医疗保健中的应用(González 等人,2023;Wong 等人,2023)。