当前位置: 首页 > news >正文

reader-lm:小模型 html转markdown

参考:
https://huggingface.co/jinaai/reader-lm-0.5b

在线demo:
https://colab.research.google.com/drive/1wXWyj5hOxEHY6WeHbOwEzYAC0WB1I5uA#scrollTo=0mG9ISzHOuKK

输入网址:https://www.galaxy-geely.com/E5
结果:
在这里插入图片描述
在这里插入图片描述

代码:

# pip install transformers
from transformers import AutoModelForCausalLM, AutoTokenizer
checkpoint = "jinaai/reader-lm-0.5b"device = "cuda" # for GPU usage or "cpu" for CPU usage
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint).to(device)# example html content
html_content = "<html><body><h1>Hello, world!</h1></body></html>"messages = [{"role": "user", "content": html_content}]
input_text=tokenizer.apply_chat_template(messages, tokenize=False)print(input_text)inputs = tokenizer.encode(input_text, return_tensors="pt").to(device)
outputs = model.generate(inputs, max_new_tokens=1024, temperature=0, do_sample=False, repetition_penalty=1.08)print(tokenizer.decode(outputs[0]))
http://www.lryc.cn/news/436603.html

相关文章:

  • 进击J6:ResNeXt-50实战
  • 新代机床采集数据
  • 景联文科技:专业数据标注公司,推动AI技术革新
  • k8s以及prometheus
  • android 权限说明
  • <winsock>重叠IO模型
  • Android Tools | 如何使用Draw.io助力Android开发:从UI设计到流程优化
  • Java 每日一刊(第5期):变量守护者
  • 【C++二分查找】2517. 礼盒的最大甜蜜度
  • 【详解】数据库E-R图——医院计算机管理系统
  • 分类预测|基于改进的灰狼IGWO优化支持向量机SVM的数据分类预测matlab程序 改进策略:Cat混沌与高斯变异
  • 圆锥曲线练习
  • STM32时钟树
  • NX—UI界面生成的文件在VS上的设置
  • Wine容器内程序执行sh脚本问题研究
  • 《深度学习》OpenCV轮廓检测 模版匹配 解析及实现
  • Java XML
  • 好用的视频压缩工具有哪些?这4款千万不要错过
  • 【Python爬虫系列】_016.关于登录和验证码
  • 基于opencv实现双目立体匹配点云距离
  • RabbitMQ高级篇,进阶内容
  • STM32重定义printf,实现串口打印
  • 项目进度
  • Android的内核
  • Github Wiki 超链接 转 码云Gitee Wiki 超链接
  • Android10源码刷入Pixel2以及整合GMS
  • wpf触发与模板的使用示例:批量生产工具
  • brew install node提示:Error: No such keg: /usr/local/Cellar/node
  • 记录一下gitlab社区版的安装教程
  • 20. 如何在MyBatis中处理多表关联查询?常见的实现方式有哪些?