当前位置: 首页 > news >正文

ETL-从1学到100(1/100):ETL涉及到的名词解释

本文章主要介绍ETL和大数据中涉及到名词,同时解释这些名词的含义。由于不是一次性收集这些名词,所以这篇文章将会持续更新,更新日志会存放在本段话下面:

12-19更新:OLTP、OLAP、BI、ETL。

12-20更新:ELT、EII

1. OLTP

中文称呼:在线事务处理系统。

主要功能:对数据进行增删改查,特性是事物的吞吐量。面向的业务主要涉及到的是常用的软件信息存储等等。

2. OLAP

中文称呼:联机分析处理系统。

主要功能:偏向于数据的查询,特性是查询效率。面向的主要是决策分析,关键数据提取汇总等等。

3. BI

中文称呼:商业智能(常常听见过BI报表开发有没有?)

主要功能:使用ETL清洗数据,整合数据仓库,提取数据,完成数据的展现,打破信息壁垒。换个角度来说,BI更像是ETL+数仓+其他技术的一个综合体。

4. ETL

中文称呼:数据清洗(E:抽取+T:转换+L:加载)

主要功能:将数据从OLTP系统中转移到数据仓库中的一系列操作的集合。

5. ELT

中文称呼:抽取、加载、转换

主要功能:ELT与ETL还是有所不同的,所以我在这里还是要记录一下ELT,它的主要功能是:数据首先从源数据进行抽取和加载(ETL是先抽取再转换),再转换成需要的格式,这样做的好处在于,把高吞吐的工作交给数据库来做,减轻高吞吐负担。

6.EII

中文称呼:虚拟数据整合

主要功能:EII目前基本上很少有人用了,EII的侧重点在于对用户的数据展示上,数据的加载转换不是它所注意的。

http://www.lryc.cn/news/264728.html

相关文章:

  • Jenkins + gitlab 持续集成和持续部署的学习笔记
  • R语言【cli】——通过cli_abort用 cli 格式的内容显示错误、警告或信息,内部调用cli_bullets和inline-makeup
  • cka从入门到放弃
  • 通过 jekyll 构建 github pages 博客实战笔记
  • 【AI美图】第09期效果图,AI人工智能汽车+摩托车系列图集
  • 网线的制作集线器交换机路由器的配置--含思维导图
  • LLM微调(四)| 微调Llama 2实现Text-to-SQL,并使用LlamaIndex在数据库上进行推理
  • 柔性数组(结构体成员)
  • C#合并多个Word文档(微软官方免费openxml接口)
  • MySQL 5.7依赖的软件包和下载地址
  • 图论 | 网络流的基本概念
  • 【音视频 | AAC】AAC音频编码详解
  • redis基本用法学习(C#调用NRedisStack操作redis)
  • [CVPR 2023:3D Gaussian Splatting:实时的神经场渲染]
  • 【SpringBoot快速入门】(4)SpringBoot项目案例代码示例
  • Linux服务器 部署飞书信息发送服务
  • 用C#也能做机器学习?
  • Python PDF格式转PPT格式
  • 搭建知识付费平台?明理信息科技为你提供全程解决方案
  • 漫谈UNIX、Linux、UNIX-Like
  • Netty Review - Netty与Protostuff:打造高效的网络通信
  • 在ClickHouse数据库中启用预测功能
  • 目标检测YOLO实战应用案例100讲-树上果实识别与跟踪计数(续)
  • Docker 文件和卷 权限拒绝
  • Appium Server 启动失败常见原因及解决办法
  • 将Abp默认事件总线改造为分布式事件总线
  • Jupyter Notebook修改默认工作目录
  • 高校/企业如何去做数据挖掘呢?
  • 数据仓库-数据治理小厂实践
  • 【C++多线程编程】(五)之 线程生命周期管理join() 与 detach()