当前位置: 首页 > news >正文

吴恩达【prompt提示词工程】学习笔记

 两种类型llm

  • base llm预测下一个此
  • instruction tuned llm 根据指令回答

     在大量文本上训练的基本LLM,接着用输入和输出的指令微调它,更好地遵循这些指令

RLHF:用人类反馈强化学习

pip install openaiimport openaiopenai.api_key = "sk-" #设置openapi的密钥,openai网站得到api密钥

原则

1. principle 1:write clear and specific instruction.

  • use delimiters:''', <>;
  • ask for structured output:json, html规定格式,输出的内容python可读可用;
  • check the conditions are satisfied,检查条件或假设是否满足
  • few-shot prompting, 少量的示例是模型遵循

2. principle 2: give the model time to think

  1. specify the steps to complete a task 
  2. instruct the model to work out its own solution before rushing to a conclusion模型在给出答案之前先给出自己的分析

3. Limitations

     幻觉hallucination。找到相关的引用,并基于引用回答问题

迭代

根据需求不断完善

摘要

summrize 

prompt为特定对象,具体特定长度(数量在可接受范围)

构建循环处理多个内容

推理

收集标签,对不同的任务训练不同的模型。但对llm,可以用一个模型,通过提示完成不同的任务

http://www.lryc.cn/news/608628.html

相关文章:

  • MCP革命:Anthropic如何重新定义AI与外部世界的连接标准
  • 2.4.1-2.4.3控制范围-控制进度-控制成本
  • STM32复位电路解析
  • Rustdesk中继服务器搭建(windows 服务器)
  • 蜂群优化算法:智能优化新突破
  • 联想笔记本安装系统之后一直转圈圈的问题了?无法正常进入到系统配置界面,原来是BIOS中的VMD问题
  • VUE2 学习笔记16 插槽、Vuex
  • 09.Redis 常用命令
  • C++23 Concepts:用类型约束重构泛型编程的终极方案
  • 选择排序原理与C语言实现详解
  • redis的Java客户端(SpringDataRedis)
  • 深入掌握 ExcelJS:Node.js 中强大的 Excel 操作库
  • 2、docker容器命令 | 信息查看
  • 关于Web前端安全之XSS攻击防御增强方法
  • RAG-Semantic Chunking
  • cursor 使用方法
  • CVE-2025-5947 漏洞场景剖析
  • Claude Code氛围编程经历: 6周干了三年的活
  • vscode的Remote-SSH插件配置SSH主机方法
  • python工具方法51 视频数据的扩充(翻转、resize、crop、re_fps)
  • N1——one-hot编码
  • ABAP SQL更新DB小技巧 WITH INDICATORS
  • [硬件电路-151]:数字电路 - 模拟电路与数字电路的本质
  • MySQL Redo Log
  • GitLab 代码管理平台部署及使用
  • lua中 list.last = last 和list[last]=value区别
  • JavaScript:编程世界中的“语盲”现象
  • 回归的wry
  • 关于vllm【常见问题解决方案】
  • vllm0.8.5:自定义聊天模板qwen_nonthinking.jinja,从根本上避免模型输出<think>标签