当前位置: 首页 > news >正文

scrpy学习-02

新浪微博

[Scrapy 教程] 3. 利用 scrapy 爬取网站中的详细信息 - YouTube

def parse(self,response):

soup BeautifulSoup(response.body,'html.parser')

tags soup.find_all('a',href=re.compile(r"sina.*\d{4}-\d{2}-\d{2}.*shtmls"))#匹配日期

for tag in tags:

url tag.get('href')

yield scrapy.Request(url,callback=self.parse_details)

def extract_title(self,soup):

selectors =['h1.main-title']

for selector in selectors:

if len(soup.select(selector))!=0:

title soup.select(selector)[0].text

return title

python与数据库

(6条消息) pymysql详解(connect连接、游标cursor、获取查询结果集、获取实时数据、解决查询数据为历史数据问题、insert into需要注意的地方)_pymysql.connect_XC_SunnyBoy的博客-CSDN博客

这是一个连接到本地MySQL数据库服务器的命令,其中:

  • -h127.0.0.1指定要连接的主机名或IP地址,这里使用本地主机(localhost)的IP地址127.0.0.1。

  • -uroot指定要用哪个MySQL用户进行连接,这里使用root用户进行连接。

  • -p123456指定连接时使用的密码,这里使用123456作为root用户的密码。

整个命令的意思是使用root用户和密码123456连接到本地MySQL服务器。如果连接成功,将打开MySQL客户端命令行界面,可以在其中执行各种MySQL命令和查询。

#创建对象
db = pymysql.connect(host='localhost',
user='root',
password='@hdp020820',
database='maoyandb',)

pymysql.err.OperationalError: (1049, "Unknown database 'maoyandb'")

CREATE TABLE movieinfo (name VARCHAR(255),actor VARCHAR(255),release_date DATE
);

import pymysql

导出数据库

#创建对象
self.db = pymysql.connect(host='localhost',
user='root',
password='@hdp020820',
database='maoyandb',)cursor = db.cursor()
# sql语句执性,单行插入
info_list = ['刺杀,小说家','雷佳音,杨幂','2021-2-12']
sql = 'insert into filmtab values(%s,%s,%s)'
#列表传参
cursor.execute(sql,info_list)
db.commit()
# 关闭
cursor.close()
db.close()

http://www.lryc.cn/news/32058.html

相关文章:

  • MySQL运维篇之Mycat分片规则
  • vue router elementui template CDN模式实现多个页面跳转
  • ElasticSearch - ElasticSearch基本概念及集群内部原理
  • 【反射中,Class.forName和ClassLoader区别】
  • 2023了为什么还有人在问:女生适合做跨境电商吗?
  • 磁盘分区和挂载
  • 电子技术——晶体管尺寸
  • Tuxera NTFS2023MacOS读写软件功能介绍使用
  • 2022年数维杯国际大学生数学建模挑战赛A题自动地震地平线跟踪解题全过程论文及程序
  • 推荐系统[八]:推荐系统常遇到问题和解决方案[物品冷启动问题、多目标平衡问题、数据实时性问题等]
  • shutil.copyfile PermissionError: [Errno 13] Permission denied
  • 07react+echart,大屏代码开发
  • 【数据库原理复习】ch2 SQL语句(主要基于sql server)
  • Cadence Allegro 导出Component Pin Report详解
  • PAT甲级 1110 Complete Binary Tree
  • 【JavaSE】逻辑控制语句
  • Motionbuilder系统文件说明
  • 【我的Android开发】AMS中Activity栈管理
  • C++源程序的构成————学习笔记
  • Spark Catalyst
  • element 远程搜索下拉加载
  • 空间复杂度与顺序表的具体实现操作(1)
  • 【springmvc】Rest ful风格
  • 华为OD机试真题Python实现【用户调度】真题+解题思路+代码(20222023)
  • JavaSE学习笔记总结day19
  • FreeSql使用
  • Hadoop集群搭建,基于3.3.4hadoop和centos8【图文教程-从零开始搭建Hadoop集群】,常见问题解决
  • UE4 材质学习 (焚烧材质)
  • 【c++】STL常用算法2—常用查找算法
  • 史上最全最详细的Java架构师成长路径图,程序员必备