当前位置: 首页 > article >正文

数据获取_Python

1 导入数据

(1) 文件系统

        ①表格形式的数据:CSV/Excel

import pandas as pd# 读取 CSV 文件
data = pd.read_csv('sales_data.csv')# 读取excel
data2 = pd.read_excel('file.xlsx', sheet_name='Sheet2', skiprows=5, nrows=100)

        ②JSON

# 使用 pandas 库
import pandas as pddata = pd.read_json('file.json')# 使用 json 库
import json
with open('city_data.json', 'r', encoding='utf - 8') as file:data = json.load(file)

(2) 数据库

import mysql.connector
import pandas as pd
conn = mysql.connector.connect(host='localhost',user='user',password='password',database='database_name'
)cursor = conn.cursor()
query = "SELECT * FROM table_name"
cursor.execute(query)results = cursor.fetchall()
# 将 results转成列表
column_names = []
for desc in cursor.description:column_names.append(desc[0])
# 将列表转成 DataFrame
data = pd.DataFrame(results, columns=column_names)cursor.close()
conn.close()

(3) 网络数据

①API 调用

import requests
# 身份验证
headers = {# API 密钥'Authorization': 'Bearer your_api_key'
}response = requests.get('https://api.example.com/data', headers = headers)
if response.status_code == 200:data = response.json()

②网页爬虫

# 获取网页内容
import requests
response = requests.get('http://example.com')
if response.status_code == 200:content = response.text# 解析网页内容
from bs4 import BeautifulSoup
soup = BeautifulSoup(content, 'html.parser')
elements = soup.find_all('a') # 查找所有链接

2 导出数据

import csv# 创建示例数据
data = [['姓名', '年龄', '城市'],['张三', 25, '北京'],['李四', 30, '上海'],['王五', 35, '广州']
]with open('example.csv', 'w', newline='', encoding='utf - 8') as csvfile:writer = csv.writer(csvfile)writer.writerows(data)

http://www.lryc.cn/news/2379215.html

相关文章:

  • <前端小白> 前端网页知识点总结
  • 历史数据分析——宁波海运
  • 小结:jvm 类加载过程
  • OpenCv高阶(八)——摄像头调用、摄像头OCR
  • Java开发经验——阿里巴巴编码规范实践解析3
  • MySQL——6、内置函数
  • MySQL如何查看某个表所占空间大小?(表空间大小查看方法)
  • 软件架构之-论软件系统架构评估以及应用
  • 低延迟与高性能的技术优势解析:SmartPlayer VS VLC Media Player
  • pytorch小记(十九):深入理解 PyTorch 的 `torch.randint()` 与 `.long()` 转换
  • 深入解析Spring Boot与微服务架构:从入门到实践
  • 【交互 / 差分约束】
  • 宝塔面板部署前后端项目SpringBoot+Vue2
  • 现代生活健康养生新视角
  • 鸿蒙Next API17新特性学习之如何使用新增鼠标轴事件
  • 多模态大语言模型arxiv论文略读(八十一)
  • 3.4/Q2,Charls最新文章解读
  • 通过觅思文档项目实现Obsidian文章浏览器在线访问
  • Python列表全面解析:从入门到精通
  • 5月18总结
  • 赋予AI更强的“思考”能力
  • Linux Bash | Capture Output / Recall
  • 2025/5/18
  • 基于Quicker构建从截图到公网图像链接获取的自动化流程
  • LeetCode算 法 实 战 - - - 双 指 针 与 移 除 元 素、快 慢 指 针 与 删 除 有 序 数 组 中 的 重 复 项
  • uniapp自定义日历计划写法(vue2)
  • Java IO框架
  • 数据库2——查询
  • Mamba LLM 架构简介:机器学习的新范式
  • Android 性能优化入门(一)—— 数据结构优化