当前位置: 首页 > news >正文

2. 《大数据之路:阿里巴巴大数据实践》学习笔记,持续更新ing

笔记链接(飞书):https://t0s016els2a.feishu.cn/docx/JrNydGljUonH1ExcGCpcoC8unTb
密码:r6@61391

该书籍部分目录如下:

文章目录

    • 第1篇 数据技术篇
      • 第2章 日志采集
        • 2.1 浏览器的页面日志采集
          • 2.1.1 页面浏览日志采集流程
          • 2.1.2 页面交互日志采集
          • 2.1.3 页面日志的服务端清洗和预处理
        • 2.2 无线客户端的日志采集
          • 2.2.1 页面事件
          • 2.2.2 控件点击及其他事件
          • 2.2.3 特殊场景
          • 2.2.4 H5 & Native 日志统一
          • 2.2.5 设备标识
          • 2.2.6 日志传输
        • 2.3 日志采集的挑战
          • 2.3.1 典型场景
          • 2.3.2 大促保障
      • 第3章 数据同步
        • 3.1 数据同步基础
          • 3.1.1 直连同步
          • 3.1.2 数据文件同步
          • 3.1.3 数据库日志解析同步
        • 3.2 阿里数据仓库的同步方式
          • 3.2.1 批量数据同步
          • 3.2.2 实时数据同步
        • 3.3 数据同步遇到的问题与解决方案
          • 3.3.1 分库分表的处理
          • 3.3.2 高效同步和批量同步
          • 3.3.3 增量与全量同步的合并
          • 3.3.4 同步性能的处理
          • 3.3.5 数据飘移的处理
      • 第4章 离线数据开发
      • 第5章 实时技术
      • 第6章 数据服务
      • 第7章 数据挖掘
    • 第2篇 数据模型篇
    • 第3篇 数据管理篇
    • 第4篇 数据应用篇

第1篇 数据技术篇

第2章 日志采集

2.1 浏览器的页面日志采集
2.1.1 页面浏览日志采集流程
2.1.2 页面交互日志采集
2.1.3 页面日志的服务端清洗和预处理
2.2 无线客户端的日志采集
2.2.1 页面事件
2.2.2 控件点击及其他事件
2.2.3 特殊场景
2.2.4 H5 & Native 日志统一
2.2.5 设备标识
2.2.6 日志传输
2.3 日志采集的挑战
2.3.1 典型场景
2.3.2 大促保障

第3章 数据同步

3.1 数据同步基础
3.1.1 直连同步
3.1.2 数据文件同步
3.1.3 数据库日志解析同步
3.2 阿里数据仓库的同步方式
3.2.1 批量数据同步
3.2.2 实时数据同步
3.3 数据同步遇到的问题与解决方案
3.3.1 分库分表的处理
3.3.2 高效同步和批量同步
3.3.3 增量与全量同步的合并
3.3.4 同步性能的处理
3.3.5 数据飘移的处理

第4章 离线数据开发

第5章 实时技术

第6章 数据服务

第7章 数据挖掘

第2篇 数据模型篇

第3篇 数据管理篇

第4篇 数据应用篇

http://www.lryc.cn/news/289617.html

相关文章:

  • 编程笔记 html5cssjs 062 JavaScrip如何使用
  • 【前端基础--7】
  • 微信小程序如何搜索iBeacon设备
  • JVM篇:垃圾回收算法
  • 2024年数学建模美赛 分析与编程
  • 05-Nacos-配置中心接入
  • 服务端开发小记02——Maven
  • DjangoURL调度器(一)
  • Typora 无法导出 pdf 问题的解决
  • uniapp封装公共的方法或者数据请求方法
  • SpringBoot AOP应用(公共字段填充)
  • NIO案例-聊天室
  • 文心一言情感关怀之旅
  • mac电脑安卓文件传输工具:Android File Transfer直装版
  • 第九篇【传奇开心果系列】beeware的toga开发移动应用示例:人口普查手机应用
  • 14.5 Flash查询和添加数据库数据
  • [C#]winform部署yolov7+CRNN实现车牌颜色识别车牌号检测识别
  • VBA技术资料MF111:将表对象转换为正常范围
  • Nginx代理服务器、HTTP调度、TCP/UDP调度、Nginx优化、HTTP错误代码、状态页面、压力测试
  • 从 React 到 Qwik:开启高效前端开发的新篇章
  • 【lodash.js】非常好用高性能的 JavaScript 实用工具库,防抖,深克隆,排序等
  • JS中的try...catch
  • 选择海外云手机需要考虑什么?
  • 物联网协议Coap之C#基于Mozi的CoapClient调用解析
  • java中如何使用Lambda表达式(一)
  • C++继承详解
  • docker数据卷的使用
  • 2024獬豸杯完整Writeup
  • Vue学习笔记之应用创建和基础知识
  • CSS3基础知识总结