当前位置: 首页 > news >正文

对话新晋 Apache SeaTunnel Committer:张圣航的开源之路与技术洞察

近日,张圣航被推选为 Apache SeaTunnel 的 Committer成员。带着对技术的热情和社区的责任,他将如何跟随 Apache SeaTunnel 社区迈向新的高度?让我们一起来聆听他的故事。

自我介绍

请您简单介绍一下自己,包括职业背景、当前的工作以及加入 Apache SeaTunnel 社区的起点。

在这里插入图片描述

  • **您的全名:**张圣航
  • **邮箱:**shenghang@apache.org
  • **当前职位/角色:**大数据架构师
  • **主要技术方向:**从事汽车行业,大数据架构师,负责数据平台整体工作,主导数据运维、同步、开发等平台建设,为业务系统提供高效数据支撑。
  • **加入SeaTunnel社区的时间:**2024年6月
  • **最初如何接触到SeaTunnel这个项目的:**当时使用的是 DataX ,而 DataX 作为一款经典单机离线的数据集成工具,缺乏服务化及分布式处理能力,在大规模数据同步场景下存在明显局限,需要一款更全面的数据集成框架,基于以上痛点,我们选择并使用了Apache SeaTunnel!

社区贡献之路

您在成为 Committer 之前,对社区都有哪些贡献?

您的第一个贡献是什么?
  • Kafka 消费者组自动提交偏移量逻辑错误的修复
哪些具体的功能、改进或活动是您主导的?
  • 新增 Seatunnel Engine 任务调度 Pendding 队列特性
    • https://github.com/apache/seatunnel/pull/7693
  • 支持 Kafka Protobuf 数据格式支持
    • https://github.com/apache/seatunnel/pull/7361
  • 支持 Kerberos 在 e2e 中的测试
    • https://github.com/apache/seatunnel/pull/8108
    • https://github.com/apache/seatunnel/pull/8159
  • 新增 Seatunnel Engine资源调度算法
    • https://github.com/apache/seatunnel/pull/8233
  • 新增 Hbase Sink TTL 特性
    • https://github.com/apache/seatunnel/pull/7116
  • 新增 Api 获取日志特性
    • https://github.com/apache/seatunnel/pull/7818
  • 修复Flink Source Busy 100%忙碌问题
    • https://github.com/apache/seatunnel/pull/8354
  • 支持 Typesense 连接器
    • https://github.com/apache/seatunnel/pull/7450
  • 支持配置变量的默认值替换
    • https://github.com/apache/seatunnel/pull/7562
  • 修复 Doris 自定义 SQL 未执行问题
    • https://github.com/apache/seatunnel/pull/7464
  • 修复Kafka消费者组自动提交偏移量逻辑错误
    • https://github.com/apache/seatunnel/pull/6961
  • 修复Flink模式下 RabbitMQ checkpoint 异常等
    • https://github.com/apache/seatunnel/pull/7108
在贡献过程中,您遇到了哪些挑战,又是如何克服的?
  • Engine、Connector、Transform每一个环节都有大量源码,在学习的过程中还是有一点难度,非常感谢社区的技术小伙伴,其中特别想感谢范佳、海林等大佬的解惑,加快了我对SeaTunnel的了解。

成为 Committer 的感受

成为 Committer 对您来说意味着什么?
  • 能够更好地推动社区发展,帮助新贡献者融入,促进更多人参与开源项目,推动国内开源文化的普及。同时有机会与行业内大佬交流,深入参与项目的技术讨论和架构设计,

洞察 SeaTunnel

  • 在您看来,SeaTunnel 作为一个开源项目的独特优势是什么?

    • 高度可扩展性、多种数据源支持、高效稳定的数据处理能力、活跃的社区支持、易于使用和部署
  • 您最喜欢 SeaTunnel 的哪些功能或特性?

    • 实时数据集成能力

对社区的寄语

您对社区成员,尤其是想要加入开源项目的新手,有什么建议?
  • 不要害怕源码读不懂,搞不定,阅读源码是每个开发者成长过程中必经的阶段,很多功能的优化并不复杂,我在SeaTunnel的第一个PR就是修改了一个简单的判断逻辑,修复一个Bug。
如果开发者想要开始参与贡献 SeaTunnel,您会推荐他们从哪些方面入手?
  • 可以按照下面几个步骤开展:

    1.先了解使用项目:下载并使用,熟悉功能和问题。

    2.阅读贡献指南:熟悉项目的贡献流程和要求。

    3.从小任务开始:如修复文档、简单bug,逐步积累经验。

    4.参与社区讨论:加入邮件列表、微信群等,了解项目动态。

    5.保持耐心:接受反馈,逐步改进。

感谢展望🙏

您如何平衡工作、开源贡献与生活?

  • 哈哈,下班后少刷手机,工作之余多在开源社区活跃,好几位SeaTunnel的PMC/Committer经常在很晚的时候还在跟我持续交流!非常敬佩且折服!

有哪些人或团队在您的开源之路上给予了特别的支持?

  • 当然是WhaleOps了,作为基于Apache SeaTunnel开发并发布对应商业版的公司,白鲸开源的技术大佬们都很热情低调!
对 SeaTunnel 社区的未来,您有什么样的期待?

Apache SeaTunnel 在数据集成的基础能力方面已经展现出十分强大的实力,然而,在当前数据处理愈发注重用户体验和操作便捷性的趋势下,可视化界面的突破对于其进一步拓展用户群体、提升用户满意度以及降低使用门槛等方面显得尤为重要,这将为非技术专业人员更高效地利用 SeaTunnel 进行数据集成任务提供有力支持。

本文由 白鲸开源科技 提供发布支持!

http://www.lryc.cn/news/520724.html

相关文章:

  • Mac 删除ABC 输入法
  • 《机器学习》之K-means聚类
  • 日常工作之 Elasticsearch 常用查询语句汇总
  • WeakAuras NES Script(lua)
  • JVM 触发类加载的条件有哪些?
  • Android实战经验篇-增加系统分区
  • 深入学习 Python 量化编程
  • 机器学习笔记——特征工程
  • 4种革新性AI Agent工作流设计模式全解析
  • 【入门级】计算机网络学习
  • 安装 Jenkins 后无法访问用户名或密码且忘记这些凭证怎么办?
  • day08_Kafka
  • 安装conda 环境
  • 【dockerros2】ROS2节点通信:docker容器之间/docker容器与宿主机之间
  • 使用外网访问在群晖中搭建思源docker
  • 深度学习中的EMA技术:原理、实现与实验分析
  • win32汇编环境,窗口程序中对按钮控件常用操作的示例
  • CentOS 7.9 通过 yum 安装 Docker
  • 【开源免费】基于Vue和SpringBoot的英语知识应用网站(附论文)
  • 工具推荐:PDFgear——免费且强大的PDF编辑工具 v2.1.12
  • Web渗透测试之XSS跨站脚本 防御[WAF]绕过手法
  • MMDetection框架下的常见目标检测与分割模型综述与实践指南
  • 怎么实现Redis的高可用?
  • OpenCV实现Kuwahara滤波
  • WINFORM - DevExpress -> DevExpress总结[安装、案例]
  • Golang学习笔记_22——Reader示例
  • 【2024年华为OD机试】(A卷,100分)- 猜字谜(Java JS PythonC/C++)
  • iostat命令详解
  • Linux:操作系统简介
  • 企业级信息系统开发讲课笔记4.12 Spring Boot默认缓存管理