当前位置: 首页 > news >正文

附录2-将三国演义按章节存储为不同的txt(bs4)

地址 《三国演义》全集在线阅读_史书典籍_诗词名句网

目录

1  项目分析

2  代码


1  项目分析

我们可以在首页中找到所有的章节

每一个章节是一个a标签,a标签连接到该章节的内容

但这个网站他有bug,章节都是乱套的,我们无视这种错误,直接保存

2  代码

思路就是先把网页爬下来,然后从网页找找到章节名称与章节链接,之后再请求对应的章节链接,把章节内容爬下来

爬了几个之后我就手动停掉了

在result中会出现这些txt

并且内容也与网站上看到的一样

http://www.lryc.cn/news/154843.html

相关文章:

  • 现代C++中的从头开始深度学习:【6/8】成本函数
  • Vue——vue3中的ref和reactive数据理解以及父子组件之间props传递的数据
  • 新手如何备考PMP考试?
  • FPGA输出lvds信号点亮液晶屏
  • 算法面试-深度学习基础面试题整理(2023.8.29开始,每天下午持续更新....)
  • FireFox禁用HTTP2
  • 搭建HTTPS服务器
  • 无人化在线静电监控系统的组成
  • element ui级联选择器数据处理
  • zookeeper-3.6.4集群搭建
  • 15种下载文件的方法文件下载方法汇总超大文件下载
  • Windows安装配置Rust(附CLion配置与运行)
  • 【ROS】例说mapserver静态地图参数(对照Rviz、Gazebo环境)
  • 【RapidAI】P0 项目总览
  • 初识c++
  • 【面试经典150题】跳跃游戏Ⅱ
  • 20230831-完成登录框的按钮操作,并在登录成功后进行界面跳转
  • 039 - sql逻辑操作符
  • DbLInk使用
  • 2.3 Vector 动态数组(迭代器)
  • 【ES6】Proxy的高级用法,实现一个生成各种 DOM 节点的通用函数dom
  • 气象站是什么设备?功能是什么?
  • 227. 基本计算器 II Python
  • python中字典常用函数
  • leetcode88合并两个有序数组
  • Ceph入门到精通-Nginx 大量请求 延迟优化
  • Vulnstack----5、ATTCK红队评估实战靶场五
  • QT 5.8
  • AIGC+思维导图:提升你的学习与工作效率的「神器」
  • javaScript:DOM元素的获取(静态/动态获取)