手把手教你贡献一个Seatunnel Connector PR | 新增jtds方式链接sqlserver

文摘 2024-11-14 00:01 重庆

SeaTunnel是一个非常易于使用的、超高性能的分布式数据集成平台，支持海量数据的实时同步。每天可稳定高效同步数百亿数据，已被近百家企业投入生产使用。

现在的版本不支持通过jtds的方式链接sqlserver，我们来自己写代码来实现它，并把代码提交给apache seatunnel。

一、下载源代码

1.首先从远端仓库 https://github.com/apache/seatunnel fork一份代码到自己的仓库中

2.远端仓库中目前有超过30个分支：

- dev ：日常开发分支

- 其他分支：发布版本分支

3.把自己仓库clone到本地

git clone git@github.com:yougithubID/seatunnel.git

4. 添加远端仓库地址，命名为upstream

这一步是为了让本地代码知道他的上游是apache/seatunnel

git remote add upstream git@github.com:apache/seatunnel.git

5.查看仓库：

git remote -v

此时会有两个仓库：origin(自己的仓库)和upstream（远端仓库）

6. 获取/更新远端仓库代码（已经是最新代码，就跳过）

git fetch upstream

二、编写代码

1.加载拉取到本地的代码到IDEA中

这里我们需要注意两个module:seatunnel-connectors-v2和seatunnel-examples，其中seatunnel-connectors-v2是我们来写代码的module，seatunnel-examples是我们用来测试代码的module。

2.编写代码

目前代码中已经实现了基于JDBC的方式取链接SqlServer。我们只需要在它的基础之上去做一定的修改即可，经过debug来阅读源码，并了解了需要改的地方如下图：

代码实现如下：

SqlServerDialectFactory.java

return (url.startsWith("jdbc:jtds:sqlserver:") || url.startsWith("jdbc:sqlserver:"));

SqlserverTypeMapper.java

private static final String SQLSERVER_SYSNAME = "SYSNAME";case SQLSERVER_SYSNAME:                return BasicType.STRING_TYPE;

SimpleJdbcConnectionProvider.java

public boolean isConnectionValid() throws SQLException {        if (connection != null && connection.toString().startsWith("net.sourceforge.jtds")){            return connection != null                    && !connection.isClosed();        }else {            return connection != null                    && connection.isValid(jdbcConfig.getConnectionCheckTimeoutSeconds());        }    }

pom.xml

<jtds.version>1.3.1</jtds.version><dependency>                <groupId>net.sourceforge.jtds</groupId>                <artifactId>jtds</artifactId>                <version>${jtds.version}</version>                <scope>provided</scope>            </dependency><dependency>            <groupId>net.sourceforge.jtds</groupId>            <artifactId>jtds</artifactId>            <version>${jtds.version}</version>        </dependency>

四、测试代码

1.编写config文件，我们测试通过net.sourceforge.jtds.jdbc.Driver 从sqlserver中读出数据再写入sqlserver中

env {  # You can set flink configuration here  execution.parallelism = 1  job.mode = "BATCH"  #execution.checkpoint.interval = 10000  #execution.checkpoint.data-uri = "hdfs://localhost:9000/checkpoint"}
source {  # This is a example source plugin **only for test and demonstrate the feature source plugin**  Jdbc {    driver = net.sourceforge.jtds.jdbc.Driver    url = "jdbc:jtds:sqlserver://localhost:1433/dbname"    user = SA    password = "A_Str0ng_Required_Password"    query = "select age, name from source"  }
  # If you would like to get more information about how to configure seatunnel and see full list of source plugins,  # please go to https://seatunnel.apache.org/docs/connector-v2/source/Jdbc}
transform {
  # If you would like to get more information about how to configure seatunnel and see full list of transform plugins,  # please go to https://seatunnel.apache.org/docs/transform-v2/sql}
sink {  Jdbc {    driver = net.sourceforge.jtds.jdbc.Driver    url = "jdbc:jtds:sqlserver://localhost:1433/dbname"    user = SA    password = "A_Str0ng_Required_Password"    query = "insert into sink(age, name) values(?,?)"  }
  # If you would like to get more information about how to configure seatunnel and see full list of sink plugins,  # please go to https://seatunnel.apache.org/docs/connector-v2/sink/Jdbc}

2.修改seatunnel-flink-connector-v2-example中的SeaTunnelApiExample,写入我们写好的config文件

添加seatunnel-flink-connector-v2-example pom文件中添加jdbc依赖

3. 运行代码

运行SeaTunnelApiExample，右键->run

五、提交issue

issue的作用就是告诉社区我们打算做什么事情，后续的PR就是来提交代码解决这个issue。除此以外issue也是我们来提出bug或者其他想法的地方。不一定自己来实现它。你提出来，别人能解决，他们就会提交PR来解决这个问题。

我这里提交了一个叫[Feature][Connector-V2][SqlServer] Support driver jtds for SqlServer #5307 的issue，其中Feature可以按具体的内容换成BUG/DOCS等等 Connector-V2可以换成其他的具体模块，这里大家可以参照别人已经提的issue来命名。

注：带"*"的都是必填项

六、提价代码：

git commit -m 'commit content'git push

提交后在github上查看提交代码详情

七、提交PR（pull request）

提交完成后，因为我们的仓库的代码的上游是apache/seatunnel,在conribute中我们就可以去提交一个PR。

点击Open pull request，就会跳转到上游apache/seatunnel下面的Pull Request列表，并自动开发创建PR页面。填写相关内容，PR的名称就跟需要解决的这个issue一样就可以了，需要注意的时候，最后要带上issue的ID ，我这里是#5307 ，之后点击提交就可以了。

之后就等社区的管理员审核就可以了，这个过程中可能会在PR中进行留言交流，必要的话，再修改代码，重新提交代码，openPR...

更多大数据相关内容请关注大数据技能圈公众号：

http://mp.weixin.qq.com/s?__biz=Mzg5Mzg3MzkwNA==&mid=2247490276&idx=1&sn=5712673bcd46fe6c7a667de49ea8f2ce

大数据技能圈

分享大数据前沿技术，实战代码，详细文档

最新文章

从0到1建设电商项目数据湖实战教程

Seatunnel 如何设置资源隔离 ↗

需要知道的 Seatunnel 8个命令行写法

性能超越Spark 13.3 倍,比某MPP整体快数十秒 | 多项性能指标数倍于主流开源引擎 | 云器科技发布性能测试报告

Seatunnel 检查点用法看这篇文章就够了

Seatunnel 如何生成保存点及通过保存点恢复任务 ↗

官方推荐 | 企业级 SeaTunnel 集群部署详细教程

SeaTunnel 默认引擎Zeta ，用起来真香！

Hi 介绍一下，这是腾讯ima

自己手搓一个 Seatunnel Access Connector

手把手教你贡献一个Seatunnel Connector PR | 新增jtds方式链接sqlserver

Seatunnel 快速安装详细步骤↗

爆肝三天，我整理了500+ Seatunnel Connector 模板！

全网最全Doris实战文章合集↗

Doris 数据库链接参数调优（经验篇）

从小时级到毫秒：Doris Light Schema Change技术详解

Doris 查询缓存优化机制详解

万字长文讲解什么是 Doris 物化视图

Doris 超全索引实战教程

Doris如何做到将查询性能提升100倍

再见火山模型！Doris2.0 正式将Pipeline模型确定为新一代执行模型 ↗

什么是湖仓一体数据平台？怎么构建湖仓一体数据平台

Doris MPP架构和 Hadoop 分布式架构到底有什么区别？

Doris向量化技术大解密↗

大数据仓库开发规范示例

大数据平台开发规范示例

通过一条SQL 理解 Doris 优化器（RBO/CBO）原理

Elasticsearch，Github 7万多star一夜清零，究竟发生了什么？

Datavines 集成 DolphinScheduler 打通数据质量管理最后一公里 ↗

请不要自己写，这款数据质量可视化配置工具用起来够方便！

最全Doris实战文章汇总↗

Doris Flink Connector 整库同步使用指南

Doris 3.0存算分离｜标准部署篇

Doris 数据副本问题排查指南

Doris Compaction 原理 | 实践全析

Doris BE宕机问题排查指南

Doris 数据均衡问题排查指南

为什么Apache Doris适合做大数据的复杂计算，MySQL不适合？

Kafka TO Doris 保姆级入门详解

Doris 资源隔离详解

Doris IP变更问题详解

Doris 自定义函数之C++ UDF详解

Doris 如何一键实现MySQL万表整库同步？

Doris Manager 极致丝滑地运维管理

Doris 如何实现高并发点查？（原理+实践全析）

Doris 审计日志插件 | 快速体验

Doris 自定义函数之JAVA UDF详解

建议收藏｜现在 Apache Doris 应该选择什么版本部署和升级？

程序员会被AI平替？Claude 3.5学习使用电脑，就像给人装上翅膀练习飞翔

一文聊透开放表格式和开放数据Lakehouse

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉