近日 Apache StreamPark(Incubating) PMC 正式发布了 Apache StreamPark 2.1.4 版本,从 2024 开年以来,社区就在积极准备新版本,为的是让大家在新年伊始就可以用上稳定的版本,助力业务起飞,我们在稳定性的打磨上足够有耐心,这是个诚意满满的版本。在本次发布中,支持了最新的 Apache Flink 1.19,简化了项目的配置,Flink on Kubernetes 方面的能力做了充分验证,修复了一些高危安全漏洞。2.1.4 版本是目前推荐的稳定版本,建议所有用户升级到这个版本。
Github:
官 网:
欢迎 使用、关注、star、fork
作为流处理开发管理框架,Apache StreamPark 在对 Apache Flink 的支持上,一如既往地走在前列。得益于 Apache StreamPark 良好的架构设计,使得在 StreamPark 中支持一个新版本的 Flink 非常容易,因此我们率先支持了 Flink 1.19[1]。在使用上非常的简单,用户只需要添加一个 Flink 1.19 的环境即可为作业自由地选择 Flink 版本。并且 Apache StreamPark 适配了更多发行版的 Flink,如 CDH 版本的 Flink、华为云、腾讯云 Flink 等。
本次特别加强了 Flink on Kubernetes 的可用性和稳定性,修复了 Kubernetes Session 集群停止和状态获取相关的 Bug。简化了 on Kubernetes 模式下参数指定:在 Flink on Kubernetes Application 模式下的几个必要的参数如:serviceAccount,在早期的版本中没有直观的体现出来,需要用户通过 -D <arg> 动态属性 的方式指定,本次直观的将这些参数放到页面中,方便用户设置。
本次发布,在部署 Flink on Kubernetes 方面进行了充分的验证,可用性和稳定性大大增强,感谢参与验证的企业用户。下面是 Apache StreamPark 部署 Flink on Kubernetes 的操作演示:
本次简化了平台的配置文件,在之前的版本中,平台有多个配置文件:application.yml、kerberos.yml... 等,给用户的使用上带来了心智负担,并且在核心配置 application.yml 中,存在大量无需用户关注的系统配置,这给用户的使用带来了干扰,本次将这些配置文件统进行简化,只将需要用户关注的配置项提取到配置文件 config.yaml 中。
考虑到配置文件的兼容性,如果把之前老版本的配置文件放到 conf 下,则会优先加载老版本的配置文件,新的配置 config.yaml 不会生效,这里强烈建议使用新的配置文件,在下个版本中,历史配置文件将不再兼容。
历史配置:
本次简化后的配置文件:
-
修复安全漏洞:CVE-2024-29070、CVE-2024-29120、CVE-2024-29178、CVE-2024-29737、CVE-2024-34457。
-
修复 Flink on YARN 作业失败后被重复启动多次的 Bug。
-
修复 MySQL 低版本执行初始化 SQL 存在语法不兼容的 Bug。
-
修复 Flink on Kubernetes Application 模式作业一直在初始状态的 Bug。
-
修复 Flink on Kubernetes Application 模式作业已失败,但 Pod 仍然存活的 Bug。
-
修复用户的作业中存在 System.exit,导致 Apache StreamPark 平台退出的 Bug。
-
安全性原因,调整 swagger API 范围,仅保留开放 API 部分。
-
新增项目同时构建的最大并行限制。
本次 Apache StreamPark 2.1.4 版本的完整 Release Note 请访问:
StreamPark 开源社区的发展,离不开广大用户群体的积极反馈和宣传布道,更离不开贡献者们的无私贡献,感谢对此版本做出贡献的每一位贡献者。
Mrart、296431555、GOODBOY008、lvshaokang、wangsizhu0504、zhilinli123、Kick156、DimitriMok、ihadoop、zhangxiangyang、gwy1995、dsanww、531651225、zzzk1、wolfboys
别感谢本次的 Release Manager @吕少康[2],吕老师在发版过程中积极地跟踪问题和推进进度,出色地完成了此次发版工作。感谢吕老师为社区做出的贡献,也欢迎其他 PPMC member 和 Committer 在后续的发版中担任 Release Manager,帮助社区更快捷、高质量地完成发版。
Apache StreamPark 是一个流处理应用程序开发管理框架。旨在轻松构建和管理流处理应用程序,提供使用 Apache Flink 和 Apache Spark 编写流处理应用程序的开发框架和一站式流计算平台,核心能力包括但不限于应用开发、调试、交互查询、部署、运维、实时数仓等。目前已有腾讯、百度、联通、天翼云、自如、马蜂窝、同程数科、长安汽车、天眼查等众多公司在生产环境使用、并且获得了多项业内荣誉,是近年来成长较快的开源项目。
Apache StreamPark 加入 ASF 孵化器快 2 年,社区一直以来都以用心做好一个项目为原则,高度关注项目质量和用户的落地使用,努力建设发展社区,认真学习和遵循「The Apache Way」,目前项目趋于成熟,已临近毕业。诚挚欢迎更多的贡献者参与到社区建设中来,和我们一道携手共建,共同见证项目的毕业,可以扫描下面的二维码加入社区讨论群。
💻 项目地址:https://github.com/apache/streampark
🧐 提交问题和建议:https://github.com/apache/streampark/issues
🥁 贡献代码:https://github.com/apache/streampark/pulls
📮 Proposal:https://cwiki.apache.org/confluence/display/INCUBATOR/StreamPark+Proposal
📧 订阅社区开发邮件列表:dev@streampark.apache.org [3]
💁♀️社区沟通:
参考资料
[1] https://nightlies.apache.org/flink/flink-docs-release-1.18/release-notes/flink-1.19
[2] https://github.com/lvshaokang