当前位置: 首页 > news >正文

利用人工智能模型学习Python爬虫

爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 网络爬虫(又称为网页蜘蛛,网络机器人)是其中一种类型。 爬虫可以自动化浏览网络中的信息,当然浏览信息的时候需要按照我们制定的规则进行,这些规则我们称之为网络爬虫算法。
——使用讯飞星火认知大模型提问“爬虫是什么?”

文章目录

  • 前言
  • 一、ChitGPT学习Python爬虫
    • (一)ChitGPT介绍
    • (二)爬虫代码初体验
  • 二、讯飞星火认知大模型学习Python爬虫
    • (一)讯飞星火认知大模型介绍
    • (二)爬虫代码初体验
  • 总结


前言

本文是参加新星计划Python编程基础及爬虫入门的学习笔记,感谢爱吃饼干的小白鼠老师的Python知识分享。下面主要介绍本人利用几个人工智能模型学习Python爬虫的过程,供各位小伙伴参考。


一、ChitGPT学习Python爬虫

(一)ChitGPT介绍

ChitGPT是CSDN自带的人工智能模型,是一个纯文本AI模型,可以回答我的很多问题,也会编写、优化代码。
在这里插入图片描述

(二)爬虫代码初体验

  1. 使用ChitGPT提问:“python爬虫代码”
    在这里插入图片描述
  2. 代码测试
import requestsurl = "http://www.example.com"  # 指定要爬取的网页地址
response = requests.get(url)  # 发送请求获取网页内容
html = response.text  # 获取网页 HTML 代码
print(html)  # 打印 HTML 代码
  1. 执行结果
    如下图所示,打印出网页。
    在这里插入图片描述

二、讯飞星火认知大模型学习Python爬虫

(一)讯飞星火认知大模型介绍

讯飞星火认知大模型
在这里插入图片描述

(二)爬虫代码初体验

  1. 使用讯飞星火提问:“python爬虫代码”
    在这里插入图片描述

  2. 代码测试

import requestsfrom bs4 import BeautifulSoupurl = 'https://www.example.com'response = requests.get(url)soup = BeautifulSoup(response.text, 'html.parser')title = soup.find('h1').textprint(title)
  1. 执行结果
    在这里插入图片描述

总结

爬虫是一种自动化程序,可以代替人们自动地在互联网中进行数据信息的采集与整理。在大数据时代,信息的采集是一项重要的工作,如果单纯靠人力进行信息采集,不仅低效繁琐,搜集的成本也会提高。此时,我们可以使用网络爬虫对互联网上的信息进行自动化采集和整理。

爬虫可以用于很多方面,例如:搜索引擎、数据分析、舆情监测、电商平台、金融市场等等。在这些领域中,爬虫可以帮助我们快速获取大量的数据,并且可以自动化地进行处理和分析 。

http://www.lryc.cn/news/93497.html

相关文章:

  • .Net泛型详解
  • C++ 教程(10)——存储类
  • vue3+vite+element-plus创建项目,修改主题色
  • mysql select是如何一步步执行的呢?
  • 找到距离最近的点,性能最好的方法
  • vue基础--重点
  • HarmonyOS元服务端云一体化开发快速入门(上)
  • leetcode 279.完全平方数
  • Spring boot ApplicationContext
  • 【Python实战】Python采集王者皮肤图片
  • 很详细的Django开发入门详解(图文并茂)
  • Ansible 部署
  • 【操作系统】计算机操作系统知识点总结
  • springmvc整合thymeleaf
  • Redis 内存管理机制
  • Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存
  • 用代码实现一个简单计算器
  • 运维圣经:挖矿木马应急响应指南
  • 【Flutter】Flutter 如何获取安装来源信息
  • Stimulsoft Reports用户手册:Report Designer介绍
  • 跨模态检索论文阅读:Dissecting Deep Metric Learning Losses for Image-Text Retrieval(GOAL)
  • 贪心算法part5 | ● 435. 无重叠区间 ● 763.划分字母区间 ● 56. 合并区间
  • IMX6ULL裸机篇之SPI实验-ICM20608代码实现
  • 51单片机读取DS18B20温度传感器
  • set/map学习
  • JavaScript Web APIs学习总结
  • 萤石摄像头RTSP流获取(黑屏解决)
  • ThreadLocal引发的内存泄漏分析
  • 银行数据治理:数据质量管理实践
  • 2.7V至25V宽输入电压15A 峰值电流