当前位置: 首页 > news >正文

大数据项目实战之数据仓库:用户行为采集平台——第1章 数据仓库概念

第1章 数据仓库概念

数据仓库(Data Warehouse),是为企业制定决策,提供数据支持的。可以帮助企业改进业务流程、提高产品质量等。

数据仓库的输入数据通常包括:业务数据用户行为数据爬虫数据

业务数据:就是各行业在处理事务过程中产生的数据。比如用户在电商网站中登录、下单、支付等过程中,需要和网站后台数据库进行增删改查交互,产生的数据就是业务数据

业务数据通常存储在 MySQLOracle 等数据库中。

Untitled

用户行为数据:用户在使用产品过程中,通过埋点收集与客户端产品交互过程中产生的数据,并发往日志服务器进行保存。比如页面浏览、点击、停留、评论、点赞、收藏等。用户行为数据通常存储在日志文件中。

Untitled

爬虫数据:通常事通过技术手段获取其他公司网站的数据。不建议同学们这样去做。

Untitled

数据仓库,并不是数据的最终目的地,而是数据最终的目的地做好准备。这些准备包括对数据的:备份、清洗、聚合、统计等

http://www.lryc.cn/news/31392.html

相关文章:

  • NTP对时服务器(NTP电子时钟)在生物制药业应用
  • JPA 之 QueryDSL-JPA 使用指南
  • 如何找回回收站删除的视频?这三种方法可以试试
  • FPGA_边沿监测理解
  • 41 42Ping-Pong操作
  • 保护你的数据安全,了解网络安全法!
  • 什么是CatGPT-使用效果如何-
  • 【MySQL】第17章_触发器
  • 【前端】一个更底层库-React基础知识点第2篇
  • GIT基础常用命令-1
  • 02_qml_简介
  • 小程序项目在hbuilder里面给它打包成app
  • linux安装pycharm
  • seata1.5.2使用从零快速上手(提供代码与安装包)
  • 我的机器学习之路
  • react-swipeable-views轮播图实现下方的切换点控制组件
  • 假如你知道这样的JVM
  • MyBatis框架快速入门 - 基本使用
  • Linux命令---文件管理
  • getDerivedStateFromProps和getSnapshotBeforeUpdate
  • 【Docker】如何在内网快速搭建docker并安装Oracle11g
  • 为啥用 时序数据库 TSDB
  • Linux命令·cp
  • SAP GUI快捷键
  • 【Java】序列化与反序列化
  • 面向对象的使用
  • LPDDR4x 的 学习总结(3) - SDRAM基本功能
  • 设计模式(三)--适配器模式(Adapter Pattern)
  • Web服务器基础介绍与Apache的简单介绍(LAMP架构与搭建论坛)
  • Linux 进程:exec函数簇