当前位置: 首页 > news >正文

爬虫练习:获取某网站的房价信息

一、相关网站

二、相关代码

import requests
from lxml import etree
import csv
with open('房天下数据.csv', 'w', newline='', encoding='utf-8') as csvfile:fieldnames = ['名称', '地点','价格','总价','联系电话']writer = csv.DictWriter(csvfile, fieldnames=fieldnames)writer.writeheader()for page in range(1,33):response = requests.get(f'https://newhouse.fang.com/house/s/b9{page}/')result = etree.HTML(response.text)names = [name.strip() for name in result.xpath('//div[@class="nlcd_name"]/a/text()')]addreses = result.xpath('//div[@class="address"]/a/@title')prices = [price.xpath('string(.)').strip() for price in result.xpath('//div[@class="nhouse_price"]')]total_prices = result.xpath('//p[@class="zj_price"]/text()')phone_texts = result.xpath('//div[@class="tel"]/p/text()')# 定义一个函数用于检查电话号码是否有效(这里仅作为示例,您可以根据实际需求定义有效性)def is_valid_phone_number(phone_number):# 这里可以根据实际情况编写验证规则# 例如,简单地检查长度大于0return bool(phone_number.strip())# 合并电话号码和分机号,并用'转'连接phones = ['{}转{}'.format(phone_texts[i].strip(), phone_texts[i+1].strip())if is_valid_phone_number(phone_texts[i]) and is_valid_phone_number(phone_texts[i+1])else "NAN"for i in range(0, len(phone_texts)-1, 2)]# print(names,addreses,prices,total_prices,phones)for nam,add,pri,topr,pho in zip(names,addreses,prices,total_prices,phones):print(f'{nam} ====== {add} ====== {pri} ====== {topr} ===== {pho}')writer.writerow({'名称': nam, '地点': add,'价格':pri,'总价':topr,'联系电话':pho})

三、获取结果

版权声明和免责声明

本博客提供的所有爬虫代码和相关内容(以下简称“内容”)仅供参考和学习之用。任何使用或依赖这些内容的风险均由使用者自行承担。我(博客所有者)不对因使用这些内容而产生的任何直接或间接损失承担责任。

严禁将本博客提供的爬虫代码用于任何违法、不道德或侵犯第三方权益的活动。使用者应当遵守所有适用的法律法规,包括但不限于数据保护法、隐私权法和知识产权法。

如果您选择使用本博客的爬虫代码,您应当确保您的使用行为符合所有相关法律法规,并且不会损害任何人的合法权益。在任何情况下,我(博客所有者)均不对您的行为负责。

如果您对本声明有任何疑问,或者需要进一步的澄清,请通过我的联系方式与我联系。

http://www.lryc.cn/news/317894.html

相关文章:

  • 第一个C语言hello world
  • 【Python】新手入门学习:详细介绍依赖倒置原则(DIP)及其作用、代码示例
  • 嵌入式驱动学习目录索引(更新中)
  • ruoyi-vue插件集成websocket
  • 华为ce12800交换机m-lag(V-STP模式)配置举例
  • STM32第九节(中级篇):RCC——时钟树讲解(第一节)
  • c/c++字符串处理标准库 string 介绍
  • HarmonyOS NEXT应用开发之深色模式适配
  • Go微服务: 基于Go Micro框架实现微服务调用
  • 大模型prompt提示词如何调优?
  • 【Python/crawl】如何使用Python爬虫将一系列网页上的同类图片下载到本地
  • Postgresql 连接数查看,死锁问题解决
  • ssm蛋糕甜品商城系统(程序+文档+数据库)
  • 算法空间复杂度计算
  • C++ lambda函数个人理解
  • SwiftUI的context Menu
  • 【数据结构】树与堆 (向上/下调整算法和复杂度的分析、堆排序以及topk问题)
  • 安装CDH平台的服务器磁盘满了,磁盘清理过程记录
  • 《互联网的世界》第七讲-能源
  • 前端代码整洁与规范之CSS篇
  • 在【IntelliJ IDEA】中配置【Tomcat】【2023版】【中文】【图文详解】
  • 【SSM】任务列表案例 基本CRUD SSM整合
  • 基于微信小程序的校园跑腿小程序,附源码
  • 网络学习:9个计算机的“网络层”知识点
  • web项目的搭建
  • C++for语句
  • 最新基于R语言lavaan结构方程模型(SEM)技术
  • 【网络安全】-数字证书
  • 【C++ 】stack 和 queue
  • html--彩虹马