当前位置: 首页 > news >正文

大数据中的一些词汇解释

OLTP(online Transaction Prrocessing)

OLTP是一个处理面向事务的数据的软件系统。术语“在线交易”是指实时完成活动,而不是批处理。此数据是结构化数据的常见来源,可作为许多分析过程的输入。OLTP交易讲究实时性,就像线上缴费你一定想要在一分钟内收到短信一样,它的响应时间是次秒级。为此OLTP大都采用结构化数据并尽可能做简单操。。

OLAP(online Analytical processing)

OLAP与OLTP不同,它对时效性要求不高但是侧重于对历史数据的分析和整合。OLAP系统主要用于处理数据分析查询。OLAP 是商业智能、数据挖掘和机器学习过程的一个组成部分。它们与大数据相关,因为它们既可以作为数据源,也可以作为能够接收数据的数据接收器。它们通常用于诊断、预测和规范性分析。

ETL(Extract transform load)

ETL 是企业数据应用过程中的一个数据流(pipeline)的控制技术,把原始的数据经过一定的处理,放入数据仓库里。

可以想象一下一条大河的源头被污染,下游就无法作为饮用水源,也无法用于灌溉。如果想用于灌溉,就要将河上游工厂的污水进行处理之后再排入,如果想用于饮用,那就要用水淡化或者渗透过滤技术,对水质进行改造。

同样,原始数据并不是完美的、洁净的,质量参差不齐的数据对于数据最终的使用会产生很大的影响。所以原始数据需要进行处理。(来自知乎)

http://www.lryc.cn/news/189485.html

相关文章:

  • 10月11-12日上课内容 Ansible
  • android studio 我遇到的Task :app:compileDebugJavaWithJavac FAILED问题及解决过程
  • PLC电梯控制系统
  • FastAPI学习-27 使用@app.api_route() 设置多种请求方式
  • 08. 机器学习- 线性回归
  • 好奇喵 | PT(Private Tracker)——什么是P2P,什么是BT,啥子是PT?
  • 【Node.js】crypto 模块
  • vue父组件向子组件传值的方法
  • MATLAB算法实战应用案例精讲-【优化算法】高尔夫优化算法(GOA)(附MATLAB代码实现)
  • 数组的reduce和reduceRight方法
  • 自动监控网站可用性并发送通知的 Bash 脚本
  • go 项目打包部署到服务器
  • 整理mongodb文档:副本集成员可以为偶数
  • PHP - 遇到的Bug - 总结
  • 统计子岛屿的数量
  • IntelliJ IDEA Maven 项目的依赖分析
  • 数学建模、统计建模、计量建模整体框架的理解以及建模的步骤
  • WaitGroup原理分析
  • java直播源码:如何使用Java构建一个高效的直播系统
  • Websocket获取B站直播间弹幕教程——第二篇、解包/拆包
  • 膝关节检测之1设计目标手势与物体交互的动画
  • canvas力导布局
  • 【网络安全】「漏洞原理」(二)SQL 注入漏洞之理论讲解
  • JavaScript中类的学习
  • 1600*A. Linova and Kingdom(DFS优先队列贪心)
  • gitlab git lfs的替代软件整理汇总及分析
  • IDEA 2023.2.2图文安装教程及下载
  • 第六届“中国法研杯”司法人工智能挑战赛
  • Springcloud中间件-----分布式搜索引擎 Elasticsearch
  • 基于深度学习的目标检测和语义分割:机器视觉中的最新进展