当前位置: 首页 > news >正文

python-study-day5

urllib中handler的使用

import urllib.request
url = "http://www.baidu.com"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36 Edg/122.0.0.0'
}
# 请求地址的定制
request_url = urllib.request.Request(url, headers=headers)
# 获取handler对象
handler = urllib.request.HTTPHandler()
# 获取opener对象
opener = urllib.request.build_opener(handler)
# 调用open方法
response = opener.open(request_url)
# 将请求的数据放在content中
content = response.read().decode('utf-8')
print(content)

jsonpath的使用案例_淘票票

import urllib.requesttao_url = "https://www.taopiaopiao.com/cityAction.json?activityId&_ksTS=1723703101104_132&jsoncallback=jsonp133&action=cityAction&n_s=new&event_submit_doGetAllRegion=true"
headers = {'accept': 'text/javascript, application/javascript, application/ecmascript, application/x-ecmascript, */*; q=0.01','accept-language': 'zh-CN,zh;q=0.9','bx-v': '2.5.14','cookie': 'cna=so9EH9DIXigCAdoXf5vkIDJp; xlly_s=1; isg=BL6-wd-dVNTlioDwOYJ00GT1D9QA_4J5P--IlmjHsIH8C17l0I38ibDlg9fHM3qR','priority': 'u=1, i','referer':"https://www.taopiaopiao.com/",'sec-ch-ua': '"Not)A;Brand";v="99", "Google Chrome";v="127", "Chromium";v="127"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': '"Windows"','sec-fetch-dest': 'empty','sec-fetch-mode': 'cors','sec-fetch-site': 'same-origin','user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36','x-requested-with': 'XMLHttpRequest',
}request = urllib.request.Request(url=tao_url, headers=headers)
response = urllib.request.urlopen(request)
content = response.read().decode('utf-8')# 数据处理
json_path = content.split('(')[1].split(')')[0]# 存储到本地
with open('15_jsonpath_淘票票.json','w',encoding='utf-8') as fp:fp.write(json_path)# 获取所有的地区名字,regionName
import jsonpath
import json
obj = json.load(open('15_jsonpath_淘票票.json','r',encoding='utf-8'))
city_list = jsonpath.jsonpath(obj,'$..regionName')
print(city_list)

beautifulSoup的基本使用

from bs4 import BeautifulSoup
soup = BeautifulSoup(open('16_beautifulSoup.html','r',encoding='utf-8'),'lxml')
# print(soup)
# 获取第一个li标签
# print(soup.li)
# 获取标签的属性
# print(soup.li.attrs)# bs的一些函数
#  find()   找到第一个li标签,括号里面可以写一些特定的条件
# print(soup.find('li'))
# print(soup.find('li',title="6"))
# print(soup.find('li',class_="box"))# findAll()  找到所有li标签
print(soup.findAll('li'))

http://www.lryc.cn/news/429852.html

相关文章:

  • Telegram mini app 本地开发配置
  • python发票查验接口助您拒绝做糊涂账、发票ocr
  • 【Linux】线程控制|POSIX线程库|多线程创建|线程终止|等待|线程分离|线程空间布局
  • JimuReport 积木报表 v1.8.0 版本发布,开源可视化报表
  • 性能优化理论篇 | swap area是个什么东西
  • Photoshop (PS)下载安装win/mac版
  • 初识redis:Set类型
  • Qt 设置QTableView的某列或某行只读
  • 这么多焊工证,我该拥有那种焊工证呢?
  • HttpWebRequest访问https请求被中止: 未能创建 SSL/TLS 安全通道
  • 响应式Web设计:纯HTML和CSS的实现技巧
  • linux centos 防火墙常用命令
  • iOS18 Beta7 最终测试版推送:苹果的又一次技术飞跃
  • 超详细!2024叉车证办理及考试流程详解!速看!
  • 浅谈监听器插件之SSHMon Samples Collector
  • R语言论文插图模板第7期—分组散点图
  • 设计模式 抽象工厂方法模式
  • PowerShell 一键配置IP
  • 【Pyhthon读取 PDF文件表格 ,转为 CSV/TSV/JSON文件】
  • <数据集>商品条形码识别数据集<目标检测>
  • 无人机系统的关键技术
  • (24)(24.4) MultiWii/DJI/HDZero OSD (version 4.2 and later)(一)
  • HiveSQL:提取json串内容——get_json_oject和json_tuple
  • Clickhouse 二进制安装
  • 大数据开发工程师面试整理-项目经验
  • 游戏引擎详解——图片
  • 电商API数据接口在电商运营电商数据分析中的作用?
  • Java OkHttp使用(二)
  • 宝塔(bt.cn)面板新手小白使用中常见问题
  • 【LeetCode:3133】数组最后一个元素的最小值(Java)