当前位置: 首页 > news >正文

pytorch实现文本摘要

  人工智能例子汇总:AI常见的算法和例子-CSDN博客 

import numpy as npfrom modelscope.hub.snapshot_download import snapshot_download
from transformers import BertTokenizer, BertModel
import torch# 下载模型到本地目录
model_dir = snapshot_download('tiansz/bert-base-chinese', cache_dir='./bert-base-chinese')
print(f"模型已下载到: {model_dir}")# 本地模型路径
model_path = model_dir  # 使用下载的模型路径# 从本地加载分词器和模型
tokenizer = BertTokenizer.from_pretrained(model_path)
model = BertModel.from_pretrained(model_path)def get_sentence_embeddings(text):"""获取输入文本的句子级别嵌入(BERT模型的输出)用于摘要任务"""inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)with torch.no_grad():outputs = model(**inputs)# 获取最后一层的[CLS] token的嵌入向量作为句子的表示return outputs.pooler_output.detach().numpy()def summarize(text, num_sentences=3):"""使用抽取式摘要从输入文本中提取最重要的句子"""sentences = text.split("。")  # 以句号分割句子sentence_embeddings = []for sentence in sentences:embedding = get_sentence_embeddings(sentence)sentence_embeddings.append(embedding)# 使用句子得分来排序sentence_scores = np.array([embedding[0][0] for embedding in sentence_embeddings])ranked_sentences = [sentences[i] for i in sentence_scores.argsort()[-num_sentences:][::-1]]# 返回排名靠前的句子return "。".join(ranked_sentences)# 示例中文文本
text = """
机器学习(Machine Learning,简称 ML)是人工智能(AI)领域的一个分支,重点研究开发能够使计算机在没有明确编程指令的情况下进行任务的算法和统计模型。机器学习通过从数据中学习,识别模式,并根据少量人为干预做出决策。 
近年来,深度学习(Deep Learning)作为机器学习的一个子集,取得了显著的进展,尤其是在计算机视觉、自然语言处理和语音识别等领域。 
深度学习技术使用多层神经网络结构,能够通过处理大量的数据来自动提取特征,从而提高机器学习的性能。 
目前,人工智能已经在多个行业中得到广泛应用,包括医疗健康、金融、自动驾驶等领域。
"""# 获取摘要
summary = summarize(text)
print("原文:\n", text)
print("\n摘要:\n", summary)

~困了🥱,通宵写了一个晚上

结果:

Downloading Model to directory: ./bert-base-chinese/tiansz/bert-base-chinese
模型已下载到: ./bert-base-chinese/tiansz/bert-base-chinese
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.
原文:机器学习(Machine Learning,简称 ML)是人工智能(AI)领域的一个分支,重点研究开发能够使计算机在没有明确编程指令的情况下进行任务的算法和统计模型。机器学习通过从数据中学习,识别模式,并根据少量人为干预做出决策。 
近年来,深度学习(Deep Learning)作为机器学习的一个子集,取得了显著的进展,尤其是在计算机视觉、自然语言处理和语音识别等领域。 
深度学习技术使用多层神经网络结构,能够通过处理大量的数据来自动提取特征,从而提高机器学习的性能。 
目前,人工智能已经在多个行业中得到广泛应用,包括医疗健康、金融、自动驾驶等领域。摘要:目前,人工智能已经在多个行业中得到广泛应用,包括医疗健康、金融、自动驾驶等领域。机器学习通过从数据中学习,识别模式,并根据少量人为干预做出决策。 
深度学习技术使用多层神经网络结构,能够通过处理大量的数据来自动提取特征,从而提高机器学习的性能

http://www.lryc.cn/news/530409.html

相关文章:

  • C++基础day1
  • 从TinyZero的数据与源码来理解DeepSeek-R1-Zero的强化学习训练过程
  • 爬虫基础(四)线程 和 进程 及相关知识点
  • 【自开发工具介绍】SQLSERVER的ImpDp和ExpDp工具01
  • 队列—学习
  • SpringBoot的配置(配置文件、加载顺序、配置原理)
  • 如何本地部署DeepSeek?DeepThink R1 本地部署全攻略:零基础小白指南。
  • 陆游的《诗人苦学说》:从藻绘到“功夫在诗外”(中英双语)mastery lies beyond poetry
  • Golang —协程池(panjf2000/ants/v2)
  • 在 crag 中用 LangGraph 进行评分知识精炼-下
  • 基于springboot+vue的哈利波特书影音互动科普网站
  • Cypher入门
  • 使用Z-score进行数据特征标准化
  • 初级数据结构:栈和队列
  • 【思维导图】java
  • Redis脑裂问题详解及解决方案
  • 玩转大语言模型——配置图数据库Neo4j(含apoc插件)并导入GraphRAG生成的知识图谱
  • 【Windows Server实战】生产环境云和NPS快速搭建
  • [ESP32:Vscode+PlatformIO]新建工程 常用配置与设置
  • 【NLP251】Transformer精讲 残差链接与层归一化
  • 康德哲学与自组织思想的渊源:从《判断力批判》到系统论的桥梁
  • SpringBoot 整合 SpringMVC:SpringMVC的注解管理
  • 松灵机器人 scout ros2 驱动 安装
  • 使用 Numpy 自定义数据集,使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
  • MapReduce简单应用(一)——WordCount
  • c语言(关键字)
  • 蓝桥杯思维训练营(一)
  • 【C语言】结构体对齐规则
  • 2025-工具集合整理
  • 快速提升网站收录:利用网站用户反馈机制