当前位置: 首页 > article >正文

python爬取discuz_爬虫技术实践(二)Discuz! 按板块爬取帖子内容实战

Discuz! 是一套由康盛创想开发的通用社区论坛软件系统,成熟度高、覆盖率大。用户可以在不需要任何编程的基础上,通过简单的设置和安装,在互联网上搭建起具备完善功能、很强负载能力和可高度定制的论坛服务。Discuz! 的基础架构采用 PHP + MySQL 实现。

1. 实战环境

由 Ubuntu、Nginx、PHP、MySQL 配置的 Discuz! Docker 环境可从以下链接中下载:

Docker 镜像下载地址

提取码:esdm

1.1 环境配置

1.1.1 配置 Python 环境

Python、requests、pyquery

Python 依赖安装:

pip install requests pyquery

1.1.2 导入 Docker 镜像

$ sudo docker load ubuntu-nginx-php-mysql-discuz-exp-2.tar

1.1.3 启动环境

查看 ubuntu-nginx-php-mysql-discuz:exp-2 的 IMAGE ID

$ sudo docker images

REPOSITORY TAG IMAGE ID CREATED SIZE

ubuntu-nginx-php-mysql-discuz exp-2 368753f87d4f 22 hours ago 1.02GB

镜像的 IMAGE ID 为 368753f87d4f

启动 ubuntu-nginx-php-mysql-discuz:exp-2

$ sudo docker run -itd {IMAGE ID}

1.1.4 进入 Docker 容器

查看已运行的 Docker 容器

$ sudo docker ps

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES

a37b8fa69b5d 368753f87d4f "/bin/bash" 40 seconds ago Up 38 seconds optimistic_hypatia

容器的 CONTAINER ID 为 a37b8fa69b5d

进入容器

$ sudo docker attach {CONTAINER ID}

1.1.5 在容器中启动服务

启动 Nginx PHP Mysql 服务,进入 /root 文件夹,运行 start.sh

# cd /root

# bash start.sh

1.1.6 获取容器的 IP 地址

# ifconfig

eth0 Link encap:Ethernet HWaddr 02:42:ac:11:00:02

inet addr:172.17.0.2 Bcast:172.17.255.255 Mask:255.255.0.0

UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1

RX packets:32 errors:0 dropped:0 overruns:0 frame:0

TX packets:0 errors:0 dropped:0 overruns:0 carrier:0

collisions:0 txqueuelen:0

RX bytes:3721 (3.7 KB) TX

http://www.lryc.cn/news/2416823.html

相关文章:

  • 一文看懂第三代E/E架构。
  • The world 浏览器 ,windows中的快捷操作
  • Response.Cookies和Request.Cookies的Cookies
  • 2014 360校园招聘技术类笔试题
  • 【Ubuntu安装QQ】
  • MikroTik RouterOS 5.x使用HunterTik 2.3.1进行破解
  • Android学习路线指南
  • 软件开发中的热更新概述
  • Doctype是什么与浏览器模式详解(标准模式混杂模式)
  • window安全小知识1——autorun.inf相关知识
  • VC++编程技巧83例
  • 【操作系统】知识梳理(六)输入输出系统
  • printf大部分参数详解
  • symfony快速构建restfull api--api-platform初体验(快速上手笔记)
  • 清除电脑各种使用记录不留痕迹,保护你的隐私!
  • jquery插件treeTable
  • 在Node.js版本v12.16.2中,`crypto`模块提供了加密功能的实现接口
  • 免费获取天气预报代码
  • 叉乘证明贝祖定理_谈方琳定理
  • oracle中exist什么意思,oracle中not exists 是什么意思 , oracle数据库中exists的作用
  • Nagios 安装教程
  • HS6621低功耗调试(HS6621CG)
  • QQ如何设置使用代理服务器?
  • 提权进阶篇
  • [从零学习汇编语言] - 计算机中的硬件与软件
  • 【爬虫】批量下载B站收藏夹视频 - Python
  • 动态IP?静态IP?看完本文你就懂了
  • 系统提示uxtheme.dll文件缺少出现错误问题
  • xvid编解码器安装
  • Solidity随笔