当前位置: 首页 > news >正文

Javascript抓取京东、淘宝商品数据(商品采集商品详情图片抓取)

之前用的方法:

let temp = []var lists = $('#J_goodsList li.gl-item')$.each(lists,function(idx,item){ temp.push({   id:$(item).data('sku'),   goods_img:$(item).find('img').attr('src'),   goods_name:$(item).find('.p-name em').text(),   market_price:$(item).find('.p-price i').text(), })})console.log(temp)
  1. 通过分类查询京东、淘宝的商品,比如搜索“电子产品”,获取到电子产品的列表

  2. 通过JavaScript操作页面dom元素,获取到商品信息数组

  3. 通过在线工具将json数组转成excel文件

  4. 处理图片地址,包裹上img标签,通过浏览器加载并下载图片

    //img13.360buyimg.com/n7/jfs/t1/181788/14/25091/44594/63c0c017F11c3c118/4521648b22e0dd3a.jpg 
    1. 原图片

    2. 将链接中的n7改成n1(尺寸变大),并且加上img标签

      <img src=https://img13.360buyimg.com/n1/s450x450_jfs/t1/181788/14/25091/44594/63c0c017F11c3c118/4521648b22e0dd3a.jpg />
    3. 将图片下载到本地

  5. 将生成的excel文件数据和EDI网站商品数据合并

  6. 将商品图片上传到服务器

  7. 手动给每个商品添加商品详情,这个是主要的工作量

这种方式主要有两个缺点:

  1. 列表获取不到商品详情图片,需要手动去抓取

  2. 过程比较繁琐,有很多需要手动操作的地方

优化后直接用API调用,稳定性好,支持高并发。

1、注册账号获取APIkey和密钥,点此注册

2、查看API文档,获取请求参数和响应参数表。

 

http://www.lryc.cn/news/319833.html

相关文章:

  • Oracle 部署及基础使用
  • ROS 语音交互(二)nlp
  • 智慧公厕建设的主要目标是什么?
  • 常用芯片学习——BME280芯片
  • QT 状态机的使用
  • 走进volatile的世界,探索它与可见性,有序性,原子性之间的爱恨情仇!
  • python从入门到精通(十五):python爬虫完整学习大纲
  • 为什么JDK8.0 之后允许接口定义静态方法和默认方法呢?
  • 如何通过生成式AI增强人类的创造力
  • 力扣111---二叉树的最小深度(简单题,Java,递归+非递归)
  • C#处理文件
  • git |常用命令
  • 力扣100热题:两、三、四数之和,哈希+数组+双指针+排序
  • 国外visa卡怎么办理,可充ChatGPTPLUS、Claude、Midjourney
  • 【Web】记录[长城杯 2022 高校组]b4bycoffee题目复现
  • C++ 多路音频pcm混音算法
  • Golang 泛型定义类型的时候前面 ~ 代表什么意思
  • 泽众云真机-机型支持ADB调试功能即将上线
  • 基于springboot的购物商城管理系统
  • uni-app开发特点和开发流程
  • Sentinel篇:线程隔离和熔断降级
  • HTML静态网页成品作业(HTML+CSS)——家乡广州介绍设计制作(5个页面)
  • 【Java IO流】缓冲流和对象流的解析和应用实例
  • 鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:Select)
  • mysql将一个表另存为新表,同时复制索引、约束、主键等信息
  • 基于springboot+vue的房屋交易平台
  • 17个工作必备的Python自动化代码分享(上篇)
  • python-0008-修改django数据库为mysql
  • oracle用户密码过期
  • 安全地使用v-html