当前位置: 首页 > news >正文

Huginn服务部署

工作中需要使用爬虫系统,做为技术选型需要对Huginn系统进行部署并进行功能验证。下面的文章会记录了Huginn的部署过程,本次部署采用的Ubuntu-23.0.4系统,使用Docker部署。部署过程需要翻墙。

一、安装Docker

删除旧版本

sudo apt-get remove docker docker-engine docker.io containerd runc

使用脚本安装Docker

 curl -fsSL https://test.docker.com -o test-docker.shsudo sh test-docker.sh

二、启动Docker容器

配置Docker镜像

sudo vim /etc/docker/daemon.json

注:Ubuntu默认不安装vim命令需要自己安装,也可以使用vi命令

sudo apt install vim

需要在daemon.json文件中写入下方内容

{"registry-mirrors": ["https://docker.mirrors.ustc.edu.cn"]
}

启动Docker服务

systemctl start docker

查看Docker服务状态

systemctl status docker

配置Docker服务为开机启动

systemctl enable docker

三、安装Huginn镜像并运行

拉取Huginn镜像

从仓库拉取镜像,创建并指定端口创建启动一个容器

sudo docker run -it -p 3000:3000 huginn/huginn

查看Docker中现有的镜像

sudo docker image ls

删除镜像

sudo docker image  rm  huginn/huginn

四、试用结果

1、开源版本可适用于单一页面数据采集,例如采集天气的温度或湿度信息,或者单一静态页面的信息。不适合复杂页面的数据采集。

2、若要实现复杂页面信息的采集,需要适用商业版(开源版本有BUG)并且需要适用一个叫做PhantomJsCloud API Service - It just works! 的云服务(这个服务是收费的)

3、这个软件的主要优势在于可以通过一系列的配置实现对复杂网页数据的获取,而不需要通过编写代码实现。

4、软件中将对一个网页数据的爬取的过程抽象为多个Agents,通过对Agents的配置完成对网页数据的爬取。例如需要从某一个网站的首页获取到所有文章,则需要先创建一个Agents来获取文章列表然后将列表数据做为事件传递到下一个Agents 中用来获取文章的详情。

http://www.lryc.cn/news/494336.html

相关文章:

  • 深入解析Java数据包装类型:特性、机制与最佳实践
  • 【Java基础入门篇】二、控制语句和递归算法
  • PostgreSQL WAL日志膨胀处理
  • 用户该怎么管理维护自己的服务器?
  • 【MYSQL数据库相关知识介绍】
  • 初窥 HTTP 缓存
  • yolov8的深度学习环境安装(cuda12.4、ubuntu22.04)
  • RSA算法和AES算法,哪种更安全
  • Vue教程|搭建vue项目|Vue-CLI新版脚手架
  • kdump调试分析(适用于麒麟,ubuntu等OS)
  • houdini肌肉刷pin点的方法
  • JMeter 并发策略-针对准点秒杀场景的压测实现
  • 龙迅#LT6912适用于HDMI2.0转HDMI+LVDS/MIPI,分辨率高达4K60HZ,支持音频和HDCP2.2
  • RBF神经网络预测结合NSGAII多目标优化
  • 如何看linux系统内核是aarch64 ,还是64-bit
  • 如何通过 ADB 安装 xapk
  • QT:多ui界面显示
  • redis cluster 3主3从部署方案
  • 前端学习笔记之文件下载(1.0)
  • 从技术视角看AI在Facebook全球化中的作用
  • Web 表单开发全解析:从基础到高级掌握 HTML 表单设计
  • Milvus 2.5:全文检索上线,标量过滤提速,易用性再突破!
  • 【webrtc】 mediasoup中m77的IntervalBudget及其在AlrDetector的应用
  • AI数据分析工具(二)
  • 小米路由mini刷PDCN教程补充
  • [巅峰极客 2021]签到
  • 详解SpringCloud集成Camunda7.19实现工作流审批(二)
  • Matlab学习笔记
  • Hexo博客在多个设备同步
  • 淘宝Vision Pro:革新购物体验的沉浸式未来