当前位置: 首页 > news >正文

目标驱动学习python动力

文章目录

  • 迟迟未开始的原因
  • 打破思维里的围墙
  • 抛砖引玉
    • 爬虫
  • 结束词

迟迟未开始的原因

其实我也是很早就知道有python,当时听说这个用于做测试不错,也就一直没有提起兴趣,后来人工智能火了之后,再次接触python,安装好python环境,下载好编辑软件PyCharm,然后写下了第一行输出“hello world”。。。后来枯燥的学习语法过程中被其他事情打断了,也就把这件事给落下了。
我觉得很多人学习东西都可能进入这种怪圈,不管是九年义务教育从基础学起,还是一些前辈苦口婆心的告诉你说基础很重要,就行盖房子的地基,一定要牢固,所以也有很多人想我一样一头就埋进了语法的基础学习中,枯燥无味,极度挑战耐心。

打破思维里的围墙

在互联网刚兴起的时候,就流传一句话,只要学点皮毛,就能在IT圈找到工作,后来再慢慢学。
其实这句话是有点道理,目标驱动了学习的动力,学到一些皮毛后,不断深入学习,慢慢成长,看似有点拔苗助长,基础不牢固,那么想想,如果这个学点皮毛的同学,到了公司后,接收的需求里包含了某一个技术点自己没有学过,是否就开始请教其他同学或者是自己到csdn等网站搜索知识,然后补充回来,或者当这位同学的代码没有考虑到高并发场景,面对领导的点名,是否心里默默记住并回家恶补一番。
打破思维里的围墙,直接上手最有用的技术,先模仿,后自创,优先把握关键皮毛,然后收集其他皮毛,最后发现没有皮毛可以收集了,就已经算是行业里的准专业人士了。

抛砖引玉

我来抛个砖,python比较有趣的应该是爬虫、数据分析和自动化。下面抛爬虫砖

爬虫

爬虫分页面爬虫和接口爬虫,接口爬虫容易遇到反爬虫问题,页面爬虫模拟浏览器行为,比较不容易反爬虫。不管是页面爬虫还是接口爬虫,都需要请求,所以第一个接触的是requests。
页面爬虫需要分析得到的html文件,BeautifulSoup就是处理这个的,名字特别好,翻译过来就是美味汤。这样最简单的爬虫就完成了。

import requests
from bs4 import BeautifulSoup
import json if __name__ == "__main__":self.base_url = "http://xzqh.mca.gov.cn"# 看着很多,其实抄来的,不一定了,反正ctrl+vself.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36','Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7','Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8','Accept-Encoding': 'gzip, deflate, br','Connection': 'keep-alive','Upgrade-Insecure-Requests': '1','Sec-Fetch-Dest': 'document','Sec-Fetch-Mode': 'navigate','Sec-Fetch-Site': 'none','Sec-Fetch-User': '?1','Cache-Control': 'max-age=0',}# 1. 获取并解析页面中的省级数据response = requests.Session().get(f"{self.base_url}/map",headers=self.headers,timeout=10,verify=True)response.encoding = 'gbk'  # 设置正确的编码# form表单格式为:<form name="fsform"><table class="select_table"><tr><td><input type="hidden" id="pyArr" value="具体内容"></td></tr></table></form>soup = BeautifulSoup(response.text, 'html.parser')form = soup.find('form', {'name': 'fsform'})if form:input_data = form.find('input', {'id': 'pyArr'})if input_data:json_data =  input_data.get('value')else:print("未找到input标签")else:print("未找到form表单")if json_data:info_array = json.loads(json_data)print(info_array)else:print("未找到数据")

结束词

看完是不是感觉挺简单的,实践过程如果遇到报错,直接丢网上查查就知道答案,祝各位道友顺利!

http://www.lryc.cn/news/488750.html

相关文章:

  • 力扣-Hot100-回溯【算法学习day.39】
  • 小熊派Nano接入华为云
  • 【linux硬件操作系统】计算机硬件常见硬件故障处理
  • 谈学生公寓安全用电系统的涉及方案
  • 自动语音识别(ASR)与文本转语音(TTS)技术的应用与发展
  • Go 语言数组
  • 13. 【.NET 8 实战--孢子记账--从单体到微服务】--简易权限--完善TODO标记的代码
  • 深入剖析Java内存管理:机制、优化与最佳实践
  • 【Amazon】亚马逊云科技Amazon DynamoDB 实践Amazon DynamoDB
  • Qt-常用的显示类控件
  • LabVIEW内燃机缸压采集与分析
  • 【Linux学习】【Ubuntu入门】1-7 ubuntu下磁盘管理
  • VScode clangd插件安装
  • 【机器学习】- L1L2 正则化操作
  • Logback实战指南:基础知识、实战应用及最佳实践全攻略
  • 基于python的机器学习(三)—— 关联规则与推荐算法
  • 【大模型】LLaMA: Open and Efficient Foundation Language Models
  • 模拟器多开限制ip,如何设置单窗口单ip,每个窗口ip不同
  • hive的存储格式
  • 鸿蒙学习高效开发与测试-应用程序框架(3)
  • 什么命令可以查看数据库中表的结构
  • django基于python 语言的酒店推荐系统
  • 【深度学习|onnx】往onnx中写入训练的超参或者类别等信息,并在推理时读取
  • WebSocket详解、WebSocket入门案例
  • 05_Spring JdbcTemplate
  • Bug:引入Feign后触发了2次、4次ContextRefreshedEvent
  • 最新‌VSCode保姆级安装教程(附安装包)
  • layui 表格点击编辑感觉很好用,实现方法如下
  • 三十一、构建完善微服务——API 网关
  • 非对称之美(贪心)