当前位置: 首页 > news >正文

大数据|大数据基础(概念向)

目录

📚大数据概念

🐇常见数据存储单位

🐇大数据的特点(5V)

🐇大数据 VS 数据库

🌟数据库

🌟大数据

📚大数据业务分析基本步骤

 🐇收集数据

 🐇整理数据

 🐇分析数据

 🐇数据可视化

📚大数据概念

  • 所有感官可以察觉的事物,能被记下来的,能够被查询到,就是数据(date)
  • 数据分析的前提是有数据,数据存储的目的是支撑数据分析
  • 大数据主要解决的问题:海量数据的存储和海量数据的计算问题

🐇常见数据存储单位

59871e9bfe704051b2384267451102da.jpg

🐇大数据的特点(5V)

🥕Volume(大):大数据的采集,计算,存储量都非常庞大。

🥕Variety(多):多种类和来源多样化。

🥕Value(值):大数据价值密度相对较低(抓小偷一大堆监控视频可能就一小段有用)

🥕Velocity(快):数据增长速度快,处理速度也快,获取速度的速度也要快。处理数据的效率是企业的生命。

🥕Veracity(信):数据的准确性和可信赖度,即数据的质量。

  • 全样而非抽样✔️
  • 效率而非精确✔️
  • 相关而非因果✔️

🐇大数据 VS 数据库

🌟数据库

类似于一个池塘养鱼,它数据规模小,类型单一先有模式后有数据(先有池塘后有鱼),处理对象为数据(池塘里的鱼)

🌟大数据

类似于大海捕鱼,它数据规模大,类型繁多先有数据后有模式(模式随数据增多不断演变),处理对象为“鱼”,并通过某些“鱼”判断其他鱼是否存在。


大数据应用场景:电商精确广告位;用户偏好精准营销等等。大数据监控我🤡


大数据处理面临的挑战:数据安全、数据存储和处理能力限制、数据完整性、隐私保护、数据质量(垃圾数据的泛滥)、广泛的异构性(变化与多样化)、新硬件给大数据处理带来的变革等。


📚大数据业务分析基本步骤

ca69a0b5a0024533ac2ede4fe5dc6c8b.jpg

 🐇收集数据

数据收集是按确定的数据分析框架,以收集相关数据的过程,它为数据分析提供了素材和依据。一般的数据来源主要有以下几种方式:

  • 数据库:每个公司都有自己的业务数据库
  • 公开出版物:可用于收集数据的公开出版物
  • 互联网,市场调查

 🐇整理数据

数据处理是指对收集到的数据进行加工处理,形成适合数据分析的样式。即在一堆数据中找出有价值有意义的数据。主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。

 🐇分析数据

数据分析是指用适当的分析方法及工具,对处理的数据进行分析,提取有效信息,形成有效结论的过程。数据挖掘是一种高效的数据分析方法。一般来说,数据挖掘侧重解决四类数据分析问题:分类,聚类,关联和预测。

 🐇数据可视化

数据展现的过程,将数据可视化为图表。

2b3b785886b24841b3c381534de63ccc.jpg


 流处理是指按照流水线的方式处理数据,它能够快速处理大量的数据。而批处理是指按照批次的方式处理数据,通常在处理时间较长的情况下使用。


http://www.lryc.cn/news/17965.html

相关文章:

  • 若依配置教程(九)若依前后端分离版部署到服务器Nginx(Windows版)
  • 【仔细理解】计算机视觉基础1——特征提取之Harris角点
  • Elasticsearch7.8.0版本进阶——近实时搜索
  • OAK相机深度流探测草莓距离
  • 文件共享服务器(CIFS)的相关知识及指令
  • springcloud-2service consumer
  • JavaScript 进阶--charater3
  • Solon2 之基础:三、启动参数说明
  • 引入防关联浏览器以防止数据盗窃
  • Spring的一些知识点
  • 使用WordPress快速搭建外贸网站教程
  • 在 vue 或 react 项目中使用 mockjs 搭建 mock server
  • 【十一届蓝桥杯】
  • vm 网络配置
  • 2023年CDGA考试-第11章-数据仓库和商务智能(含答案)
  • 从0-1搭建流媒体系统之live555 安装、运行、转发、拉流
  • 搭建个人博客保姆级教程(二)
  • 数字图像处理与Python实现-Pillow图像处理
  • HMM隐马尔可夫模型 | 关键原理+面试知识点
  • 【Leedcode】数据结构中链表必备的面试题(第三期)
  • D1.Chopping Carrots (Easy Version)【数学,二分,暴力,思维】
  • 【Maven】(二)使用 Maven 创建并运行项目、聊聊 POM 中的坐标与版本号的规则
  • (考研湖科大教书匠计算机网络)第六章应用层-第六节:电子邮件
  • 一、初识TypeScript、什么是类型系统
  • 一文了解什么是字节对齐(超详细)
  • Java无法通过形参设置为null改变实参
  • GEE:样本点选择教程
  • 3.知识图谱相关学习资料汇总,提供系统化的知识图谱学习路径。一份详细的指南,补全你知识的漏洞
  • TypeScript学习笔记(一)编译环境、数据类型、函数类型、联合类型
  • 为什么要移除数据库物理外键?