当前位置: 首页 > news >正文

Python爬虫实战 | 爬取网易云音乐热歌榜单

网易云音乐热歌榜单爬虫实战

环境准备

  • Python 3.x
  • requests 库
  • BeautifulSoup 库

安装依赖

pip install requests beautifulsoup4

代码

import requests
from bs4 import BeautifulSoupdef get_cloud_music_hot_songs():url = "http://music.163.com/#/discover/playlist"  # 网易云音乐热歌榜单页面headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}response = requests.get(url, headers=headers)soup = BeautifulSoup(response.text, 'html.parser')songs = soup.find_all('li', class_='f-hide')hot_songs = []for song in songs:title = song.find('a').get('title')hot_songs.append(title)return hot_songsif __name__ == '__main__':hot_songs = get_cloud_music_hot_songs()for index, song in enumerate(hot_songs):print(f'{index + 1}. {song}')

运行代码

将上述代码保存为 get_hot_songs.py,然后在命令行中运行:

python get_hot_songs.py

注意事项

  • 网易云音乐的页面结构可能会发生变化,这会导致爬虫失效。
  • 爬虫应遵循网易云音乐的爬虫协议,不要频繁请求,以免给服务器造成负担。
  • 实际使用时请确保代码的合法性,尊重版权和个人隐私。

以上代码会打印出网易云音乐热歌榜单的前几首歌曲名称。由于网易云音乐的反爬虫机制,这个简单的案例可能无法长期有效。对于复杂的爬虫任务,可能需要使用更高级的技术,如Selenium等。

我们继续学习更高级的技术吧~~

http://www.lryc.cn/news/479665.html

相关文章:

  • apk因检测是否使用代理无法抓包绕过方式
  • DevOps业务价值流:架构设计最佳实践
  • 计算机网络——SDN
  • 开源数据库 - mysql - innodb源码阅读 - master线程(一)
  • vscode ssh连接autodl失败
  • 文件系统和日志管理 附实验:远程访问第一台虚拟机日志
  • 云上拼团GO指南——腾讯云博客部署案例,双11欢乐GO
  • 【VScode】VScode内的ChatGPT插件——CodeMoss全解析与实用教程
  • 水库大坝安全监测预警方法
  • 深度学习:微调(Fine-tuning)详解
  • qt QWebSocketServer详解
  • 【数据结构】线性表——链表
  • Fork突然报错
  • Vue Element-UI 选择隐藏表格中的局部字段信息
  • easyui +vue v-slot 注意事项
  • vue之组件网站(后续补)
  • 大模型的常用指令格式 --> ShareGPT 和 Alpaca (以 llama-factory 里的设置为例)
  • 【论文阅读】火星语义分割的半监督学习
  • ACM社团第一次测试题解(禁止直接复制粘贴提交)
  • redis:zset有序集合命令和内部编码
  • Day107:代码审计-PHP模型开发篇MVC层RCE执行文件对比法1day分析0day验证
  • Web服务nginx实验1访问特定目录
  • 数据结构之二叉树前序,中序,后序习题分析(递归图)
  • Me-LLaMA——用于医疗领域的新型开源大规模语言模型
  • C#-常见异常的处理方式(持续更新)
  • 「Mac玩转仓颉内测版2」入门篇2 - 编写第一个Cangjie程序
  • 注册登录学生管理系统小项目
  • qt QCompleter详解
  • YOLOv11融合特征细化前馈网络 FRFN[CVPR2024]及相关改进思路
  • 【前端知识】JS模块规范