当前位置: 首页 > news >正文

Gradio导入AIGC大模型创建web端智能体聊天机器人,python(2)

Gradio导入AIGC大模型创建web端智能体聊天机器人,python(2)

选用这个大模型:

https://huggingface.co/HuggingFaceTB/SmolLM-1.7B-Instructicon-default.png?t=O83Ahttps://huggingface.co/HuggingFaceTB/SmolLM-1.7B-Instruct原因是该模型相对比较小(3~4GB),不必下载太多太大的模型文件(效果好些的大模型动辄几十GB甚至上百GB,参数多嘛),仅作跑通Gradio结合大模型制作聊天机器人示例。

import gradio as gr
from transformers import AutoModelForCausalLM, AutoTokenizercheckpoint = "HuggingFaceTB/SmolLM-1.7B-Instruct"
device = "cpu"  # "cpu" for CPU usage, "gpu" for GPU usage
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint).to(device)def my_response(message, history):msgs = [{"role": "user", "content": message}]input_text = tokenizer.apply_chat_template(msgs, tokenize=False)print(input_text)inputs = tokenizer.encode(input_text, return_tensors="pt").to(device)outputs = model.generate(inputs, max_new_tokens=50, temperature=0.2, top_p=0.9, do_sample=True)result = tokenizer.decode(outputs[0])print(result)return resultdef mychat():gr.ChatInterface(my_response).launch()if __name__ == '__main__':mychat()

运行后,输出: Running on local URL:  http://127.0.0.1:7860

直接打开  http://127.0.0.1:7860

提问:

AIGC大模型回答:

Gradio快速部署构建AIGC的web应用 ,python-CSDN博客文章浏览阅读873次,点赞23次,收藏9次。webui-user.bat启动stable-diffusion-webui报错:RuntimeError: Torch is not able to use GPU,AIGC,Python。webui-user.bat启动stable-diffusion-webui报错:RuntimeError: Torch is not able to use GPU,AIGC,Python-CSDN博客。2、设置 - 系统 - 可选功能 - 更多Windows功能 - 启用或关闭Windows功能。https://blog.csdn.net/zhangphil/article/details/141999273

http://www.lryc.cn/news/440186.html

相关文章:

  • PEM 格式
  • Android前台服务如何在后台启动activity?
  • c#visionpro开发 方法统计
  • dedecms——四种webshell姿势
  • GO GIN 推荐的库
  • YOLOv9改进策略【卷积层】| GnConv:一种通过门控卷积和递归设计来实现高效、可扩展、平移等变的高阶空间交互操作
  • 如何在Linux下升级R版本和RStudio
  • npm安装时候报错certificate has expired
  • CSP-J_S第一轮复习资料1·计算机硬件
  • oracle 表的外键
  • 加密与安全_优雅存储二要素(AES-256-GCM )
  • 【C++高阶】解锁C++的深层魅力——探索特殊类的奥秘
  • Vue学习记录之三(ref全家桶)
  • 第二十六篇——九地篇:九种形势的应对之道
  • 学习记录:js算法(三十七): 搜索二维矩阵
  • 拥控算法BBR入门1
  • [Python数据可视化]Plotly Express: 地图数据可视化的魅力
  • windows C++ 并行编程-PPL 中的取消操作(四)
  • 【数据结构】字符串与JSON字符串、JSON字符串及相应数据结构(如对象与数组)之间的相互转换
  • LeetcodeTop100 刷题总结(一)
  • Next-ViT: 下一代视觉Transformer,用于现实工业场景中的高效部署
  • C++知识点示例代码助记
  • Java 入门指南:JVM(Java虚拟机)垃圾回收机制 —— 垃圾回收算法
  • 苍穹外卖Day01-2
  • 软考中级软件设计师——数据结构与算法基础学习笔记
  • 虚幻引擎 | (类恐鬼症)玩家和NPC语音聊天(中)
  • 整流电路的有源逆变工作状态
  • Android 签名、空包签名 、jarsigner、apksigner
  • java基础(小技巧)
  • Android Studio 安装配置教程(Windows最详细版)