Flink1.9.2源码编译和使用_技术 _ 頭條網

为什么要编译flink源码

用于学习，在IDEA上开发的flink job，能直接在IDEA运行，如果运行时依赖的flink框架是我们自己编译构建的，就做到了从业务到框架都可以修改源码并验证，起到了很好的学习和动手实践效果；

环境信息

电脑：2019版13寸MacBook Pro，2.3 GHz 四核Intel Core i5，8 GB 2133 MHz LPDDR3

操作系统：macOS Catalina 10.15.3

JDK：1.8.0_211

Maven：3.6.0

IDEA：2018.3.5 (Ultimate Edition)

关于正版IDEA

免费使用正版IDEA，可以参考《》

全文概览

今天的实战由以下内容组成：

开发一个最简单的flink任务，在IDEA上以local模式运行；下载flink1.9.2源码；修改flink1.9.2源码，并且编译构建；设置，让步骤1中的flink任务用上刚刚编译的flink1.9.2框架；再次运行flink任务，验证修改后的flink框架是否生效；

IDEA上运行flink job工程

在IDEA上创建flink job的maven工程并运行，请参考《》假设您已按上面的步骤在IDEA建好了flink job工程；运行起来，在浏览器打开flink页面，如下图，绿框中显示一共有8个Task Slot：

之所以会有8个Task Slot，和下图红框中的代码有关，这是段flink框架源码(StreamExecutionEnvironment.java)，入参parallelism是CPU核数，我这里是开了超线程的四核i5处理器，所以parallelism等于8：

今天的目标就是修改上图红框中的源码，然后在网页上看是不是生效了（Task Slot数量从8改成5）；

准备工作

maven中央仓库地址建议用阿里云的，否则会经常遇到jar下载超时错误，地址：http://192.168.50.43:8081/repository/aliyun-proxy/flink1.9.2源码的maven工程依赖了一个中央仓库没有的jar，GAV是io.confluent:kafka-schema-registry-client:3.3.1，您需要下载下来在本地仓库做mvn install操作，下载地址：http://packages.confluent.io/maven/io/confluent/kafka-schema-registry-client/3.3.1/kafka-schema-registry-client-3.3.1.jar上述准备工作都需要您在本地maven上操作，但是如果您的条件允许，还是强烈推荐在内网搭建maven私服nexus3，参考：《》、《》、《》

下载flink1.9.2源码

flink1.9.2源码的下载地址：http://ftp.jaist.ac.jp/pub/apache/flink/flink-1.9.2/flink-1.9.2-src.tgz

修改和编译构建

将下载好的flink-1.9.2-src.tgz解压，得到文件夹flink-1.9.2

打开这个文件：flink-1.9.2/flink-streaming-java/src/main/java/org/apache/flink/streaming/api/environment/StreamExecutionEnvironment.java如下图红框，找到createLocalEnvironment方法，把setParallelism的入参改成一个固定的数字(每个Task Slot都要分配内存，所以这个数字请不要改得太大，否则启动flink就会报错了，我这里改成了5)：

在文件夹flink-1.9.2下，执行编译构建的命令：mvn clean install -DskipTests -Dfast经历漫长等待后提示构建成功：

确认这个文件已生成，稍后就要用到：flink-1.9.2/flink-dist/target/flink-dist_2.11-1.9.2.jar

设置

为了用上刚刚构建出来的flink框架jar，要做些设置，打开之前运行的flink job应用，在项目上点击右键，点击菜单Open Module Settings，如下图：

接下来要做三个和jar有关的操作，注意每一步都很重要：下图红框1中的flink-dist_2.11-1.9.2.jar文件，是《》一文中添加的，目的是提供网页服务，现在将其删除，操作如下图红框所示：

下图红框1中的maven依赖：org.apache.flink:flink-streaming-java_2.11:1.9.2，也请删除，操作如下图红框所示：

点击下图红框中的加号：

在弹出的窗口选中刚才构建好的文件flink-1.9.2/flink-dist/target/flink-dist_2.11-1.9.2.jar：

记得点击右下角的OK按钮保存，修改完毕，接下来验证咱们修改的flink框架源码是否生效了

验证

当前flink job工程来自《》一文，StreamingJob的工作是读取本机18081端口的数据，所以我们要把18081端口的服务启动起来，不然StreamingJob运行时是连不上端口的，打开一个控制台，执行命令：nc -l 18081现在可以将StreamingJob运行起来，如下图，右键点击StreamingJob，选择Run 'StreamingJob.main()'：即可启动flink任务：

在IDEA的控制台搜索关键字localhost，如下图红框，可以查到flink网页的端口，我这里是52704：

浏览器访问http://localhost:52704，如下图红框，Total Task Slots数量是5，我们修改的flink1.9.2的源码生效了：

至此，Flink1.9.2的源码从修改到编译构建，再到验证都已经完成了，如果您也在学习flink，希望本文能给您一些参考，一起来动手实战吧；

为什么要编译flink源码

环境信息

关于正版IDEA

全文概览

IDEA上运行flink job工程

准备工作

下载flink1.9.2源码

修改和编译构建

设置

验证

相關文章:

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

网络工程师职业生涯中，哪两点是最重要的？

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

Hive分桶表

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

第一章 Spring Framework概述

opencv人工智能深度学习这样实现人脸的年龄检测

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

深入了解ProcessFunction的状态操作(Flink-1.10)

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪