当前位置: 首页 > news >正文

ETL-kettle数据转换使用详解

一、excel转换成mysql

表格就按照我们刚才转换的表格来转换成MySQL数据

  1. 在MySQL数据库中创建数据库,这个根据自身情况。我就在现有test库中测试了。

  2. 根据以上步骤,新建转换。

  3. 构建流程图,选择excel输入和表输出

  4. 将两个组件连接起来

  5. 双击表输入,文件选择源文件的位置,然后点击增加,在点击【工作表】,获取工作表名称,把标签移到右边
    在这里插入图片描述
    在这里插入图片描述

  6. 点击「字段」选项卡,点击「获取来自头部数据的字段…」按钮,Kettle会从Excel中读取第一行字段名称。
    在这里插入图片描述

  7. 将 age 字段的格式设置为#,register_date的格式设置为 yyyy-MM-dd HH:mm:ss。

  8. 点击「预览记录」按钮查看抽取到的数据。如果数据格式有我呢提,在调整格式
    在这里插入图片描述

  9. 点击「确定」按钮并保存。

  10. 配置MySQL组件,双击表输出组件

    数据库连接这里 点击新建连接,配置数据库连接信息,点击测试连接,看是否成功,如果报错,看是否世缺少jdbc的驱动,去MySQL官网下载对应的驱动即可。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  11. 输入目标表的名称为:user,后续Kettle将在MySQL中创建一张名为 user 的表格。
    在这里插入图片描述

  12. 点击下方的「SQL」按钮,可以看到Kettle会自动帮助我们生成MySQL创建表的SQL语句

    我们将age和gender字段的数据类型改为INT类型。并点击执行按钮,会自动在MySQL数据库中创建该表。可以去数据库验证下。执行完之后,点击确定并保存组件信息。
    在这里插入图片描述

  13. 保存并执行转换
    在这里插入图片描述

  14. 查看数据,由于ID 数据过大,需要把属性换成 bigint
    在这里插入图片描述

http://www.lryc.cn/news/545392.html

相关文章:

  • 【容器化】低版本docker拉取ubuntn 22.04镜像启动容器执行apt update提示 NO_PUBKEY 871920D1991BC93C
  • Hive-04之存储格式、SerDe、企业级调优
  • Makefile、Make和CMake:构建工具的三剑客
  • The “Rule-of-Zero“ should be followed (s4963)
  • Kotlin语言特性(二):泛型与注解
  • FunPapers[3]:WWW‘25「快手」生成式回归预测观看时长
  • 并发编程1
  • Hadoop之01:HDFS分布式文件系统
  • 从源到目标:深度学习中的迁移学习与领域自适应实践
  • WebRTC与PJSIP:呼叫中心系统技术选型指南
  • 使用IDEA如何隐藏文件或文件夹
  • 【人工智能】数据挖掘与应用题库(1-100)
  • 腾讯云大模型知识引擎驱动的DeepSeek满血版医疗顾问大模型搭建实战
  • 大白话页面加载速度优化的工具与实践案例
  • 【JAVA面试题】什么是面向对象?谈谈你对面向对象的理解。
  • 解锁责任链模式:Java 实战与应用探秘
  • 华为 Open Gauss 数据库在 Spring Boot 中使用 Flyway
  • 汽车电子电控软件开发中因复杂度提升导致的架构恶化问题
  • VMware Ubuntu 共享目录
  • Linux安装jdk,node,mysql,redis
  • Excel工作圈小工具一个集合了大量Excel功能的绿色工具软件
  • DeepSeek实操教程(清华、北大)
  • 模拟退火算法浅尝
  • React:B站评论demo,实现列表渲染、删除按钮显示和功能实现、导航栏渲染切换及高亮显示、评论区的排序
  • 支持IPD项目管理的9大系统,哪款工具能有效提高项目控制能力
  • 4070Super安装GPU版本pytorch记录
  • SpringBoot 端口配置
  • Linux网络相关概念和重要知识(1)(网络协议、网络通信)
  • go前后端开源项目go-admin,本地启动
  • 爬虫系列之发送请求与响应《一》