当前位置: 首页 > news >正文

cs*n 网页内容转为html 加入 onenote

csdn上有好用的内容,我们怎么将它们加到 onenote 里吃灰呢。

一、创建 新html

create_html.py

import sysdef create_html_file(filename):# 检查是否提供了文件名if not filename:print("请提供HTML文件名")return# 创建HTML内容html_content = f"""<!DOCTYPE html>
<html lang="zh-CN">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>{filename}</title>
</head>
<body>
</body>
</html>
"""# 写入文件with open(filename, 'w', encoding='utf-8') as file:file.write(html_content)print(f"文件 {filename} 已创建")if __name__ == "__main__":if len(sys.argv) != 2:print("用法: python create_html.py <html文件名>")else:create_html_file(sys.argv[1])

使用命令 创建html
在这里插入图片描述

二、网页找内容

在这里插入图片描述
content_views 里就是真正内容了。
copy-> copy outerhtml
粘贴到 创建的html 的 body 中。

三、替换内容

modify_html.py

import sys
import os
from bs4 import BeautifulSoupdef modify_html_file(filename):# 检查是否提供了文件名if not filename:print("请提供HTML文件名")return# 查找当前目录下的HTML文件if not os.path.exists(filename):print(f"文件 {filename} 不存在")return# 读取HTML内容with open(filename, 'r', encoding='utf-8') as file:html_content = file.read()# 使用BeautifulSoup解析HTMLsoup = BeautifulSoup(html_content, 'html.parser')# 替换指定的divdivs_to_remove = soup.find_all('div', class_='hljs-button {2}')for div in divs_to_remove:new_tag = soup.new_tag('p')  # 创建一个新的标签new_tag.string = "----------------------------------------------------------------------------------------------------------------"div.replace_with(new_tag)  # 替换原标签# 替换指定的divdivs_to_remove = soup.find_all('div', class_='hide-preCode-box')for div in divs_to_remove:# 在原位置添加“------------------”new_tag = soup.new_tag('p')  # 创建一个新的标签new_tag.string = "----------------------------------------------------------------------------------------------------------------"div.replace_with(new_tag)  # 替换原标签# 删除指定的ululs_to_remove = soup.find_all('ul', class_='pre-numbering')for ul in uls_to_remove:ul.decompose()# 写回修改后的HTML内容with open(filename, 'w', encoding='utf-8') as file:file.write(str(soup))print(f"文件 {filename} 已修改")if __name__ == "__main__":if len(sys.argv) != 2:print("用法: python modify_html.py <html文件名>")else:modify_html_file(sys.argv[1])

因为拷贝的 html 有以下内容
在这里插入图片描述
太不美观了,要把它们删除掉

在这里插入图片描述
再打开就好看多了
在这里插入图片描述
现在 html 的内容也可以直接复制到 onenote 里吃灰了

http://www.lryc.cn/news/539387.html

相关文章:

  • 平板作为电脑拓展屏
  • Pytorch实现论文之一种基于扰动卷积层和梯度归一化的生成对抗网络
  • 关系数据库标准语言SQL
  • AI工具篇:利用DeepSeek+Kimi 辅助生成综述汇报PPT
  • 学习总结2.18
  • electron下载文件,弹窗选择下载路径,并通知下载进度
  • 【Docker】容器被停止/删除的方式及命令:全面解析与实践指南
  • 线上就医全流程医药机构接入文档接口代码-医保就医接口php-demo版本
  • 缓存三大问题及其解决方案
  • 大语言模型常用微调与基于SFT微调DeepSeek R1指南
  • LabVIEW的吞雨测控系统
  • redis基础命令
  • 基于Java+SpringBoot+Vue的前后端分离的校园闲置物品交易网站
  • K8s 证书认知(K8s Certificate Awareness)
  • 前x-ai首席科学家karpathy的从零构建ChatGPT视频学习笔记--8000字长图文笔记预警(手打纯干货,通俗易懂)
  • 【智慧校园】分体空调节能监管:打造高效节能的学习环境
  • 深度学习-1.简介
  • 【Rust中级教程】1.10. 引用及内部可变性(简单回顾):引用、内部可变性、`Cell`类型及相关操作
  • Docker 安装和配置 Nginx 详细图文教程
  • 基于Java+Swing+Mysql实现旅游管理信息系统
  • 使用 Openpyxl 操作 Excel 文件详解
  • 统信服务器操作系统V20 1070A 安装docker新版本26.1.4
  • 【数据分享】1929-2024年全球站点的逐年降雪深度数据(Shp\Excel\免费获取)
  • python爬虫系列课程1:初识爬虫
  • 大模型工具大比拼:SGLang、Ollama、VLLM、LLaMA.cpp 如何选择?
  • 什么是语料清洗、预训练、指令微调、强化学习、内容安全; 什么是megatron,deepspeed,vllm推理加速框架
  • HTTP的“对话”逻辑:请求与响应如何构建数据桥梁?
  • 【深度学习】预训练和微调概述
  • 自动化测试框架搭建-单次接口执行-三部曲
  • 【阮一峰】2.数组