2. 《大数据之路:阿里巴巴大数据实践》学习笔记,持续更新ing
笔记链接(飞书):https://t0s016els2a.feishu.cn/docx/JrNydGljUonH1ExcGCpcoC8unTb
密码:r6@61391
该书籍部分目录如下:
文章目录
- 第1篇 数据技术篇
- 第2章 日志采集
- 2.1 浏览器的页面日志采集
- 2.1.1 页面浏览日志采集流程
- 2.1.2 页面交互日志采集
- 2.1.3 页面日志的服务端清洗和预处理
- 2.2 无线客户端的日志采集
- 2.2.1 页面事件
- 2.2.2 控件点击及其他事件
- 2.2.3 特殊场景
- 2.2.4 H5 & Native 日志统一
- 2.2.5 设备标识
- 2.2.6 日志传输
- 2.3 日志采集的挑战
- 2.3.1 典型场景
- 2.3.2 大促保障
- 第3章 数据同步
- 3.1 数据同步基础
- 3.1.1 直连同步
- 3.1.2 数据文件同步
- 3.1.3 数据库日志解析同步
- 3.2 阿里数据仓库的同步方式
- 3.2.1 批量数据同步
- 3.2.2 实时数据同步
- 3.3 数据同步遇到的问题与解决方案
- 3.3.1 分库分表的处理
- 3.3.2 高效同步和批量同步
- 3.3.3 增量与全量同步的合并
- 3.3.4 同步性能的处理
- 3.3.5 数据飘移的处理
- 第4章 离线数据开发
- 第5章 实时技术
- 第6章 数据服务
- 第7章 数据挖掘
- 第2篇 数据模型篇
- 第3篇 数据管理篇
- 第4篇 数据应用篇