大语言模型提示工程与应用:提示工程-提升模型准确性与减少偏见的方法
语言模型可靠性优化
学习目标
在本课程中,我们将学习通过提示工程提升模型事实准确性、减少偏见的有效方法。
相关知识点
- 语言模型可靠性优化
学习内容
1 语言模型可靠性优化
1.1 事实准确性增强
LLM可能生成看似合理但实际虚构的内容。优化策略包括:
1.提供真实背景材料
原理:通过提供权威参考资料(如维基百科段落、论文摘要等)作为上下文,将模型输出约束在已知事实范围内
示例提示:
根据维基百科段落回答问题:
[量子力学是研究物质世界微观粒子运动规律的物理学分支...]问:量子力学的研究对象是什么?
答:
-
优势:降低"幻觉"(hallucination)现象,特别适用于医疗/法律等专业领域
-
局限:需确保提供材料本身的准确性,且可能受版权限制
2.调整概率参数
核心参数:
-
temperature=0.3:降低随机性,优先选择高概率词元
-
top_p=0.9:限定核采样范围,避免长尾分布干扰
建议设置:
response = openai.Completion.create(temperature=0.3, # 降低输出随机性top_p=0.9
)
3.未知应答机制
设计要点:
-
明确设置拒绝回答的触发条件(如置信度<80%)
-
标准化响应模板:“该信息未经核实”、“据现有资料无法确定”
示例对话流:
Q: 阿尔万·芒茨是谁?
A: 未知人物Q: 火星有多少卫星?
A: 2个,火卫一和火卫二
1.2 偏见消减技术
样本分布均衡化
测试案例显示:
-
当负面样本占比90%时,"我有感觉"被分类为负面
-
调整为正负样本8:2后,相同语句被分类为正面
最佳实践:
-
保持正负样本比例接近1:1
-
对主观性强的任务需额外验证
样本顺序优化
实验发现:
-
连续排列同类样本会导致标签偏向
-
随机化样本顺序可降低顺序效应
示例优化方案:
Positive: 今天阳光真好
Negative: 方案被否决了
Positive: 升职加薪了
Negative: 电脑突然死机
...
# 大语言模型提示工程与应用
1. 提示工程入门指南
2. 提示词基础使用方式
3. 大语言模型进阶提示工程技术
4. LLMs文本生成与数据标注实践:情感分析与葡萄酒品鉴
5. ChatGPT提示工程技术指南
6. 大语言模型对抗性提示安全防御指南
7. 提示工程:提升模型准确性与减少偏见的方法
8. 前沿提示工程技术探索