引言
经过近几年的发展,大数据技术已不再仅停留于概念,它在各个行业的细分领域中都有了成功实践。随着实时化需求的场景日益增多,企业对大数据处理技术提出了更高的要求。
流处理因可以帮助企业快速响应不断变化的市场条件、客户行为和其他关键业务信息,从而获得竞争优势,正在迅速成为企业应用程序现代化和改进数据驱动应用程序实时数据分析的关键技术。
本次 CommunityOverCode Asia 2023(原 ApacheCon Asia)的流处理专题,将给大家带来 Apache 相关项目的最新资讯,现在就一起来看看吧!
出品人
左右滑动查看出品人
李钰(花名:绝顶)
ASF Member,Apache Flink & HBase PMC Member,Apache Paimon (incubating) & Celeborn (incubating) Champion,阿里云 EMR 团队负责人,阿里巴巴资深技术专家。
王鑫
Apache Member, Apache Storm、Incubator PMC Member ,Committer,Apache RocketMQ、 Apache IoTDB、Apache StreamPipes Committer,蚂蚁集团大数据部实时数据负责人。
专题介绍
流式数据处理是当今大数据领域的趋势,很多企业渴望更及时地洞察自己的数据,而曾经的“批处理”思维正迅速被流式处理所取代。越来越多的公司,无论大小,都在重新思考技术架构时把实时性作为第一考量,并开始用强大的开源引擎如 Apache Flink, Apache Spark, Apache Kafka, Apache Pulsar, Apache Storm, Apache StreamPark (incubating), Apache Paimon (incubating) 等构建自己的实时计算平台。
在该主题中,您将了解到一线大厂把这些 Apache 项目应用到其生产环境中的实际经验,以及这些 Apache 项目生态的最新发展和流计算技术未来的发展方向。
议程亮点
8 月 18 日 13:30 - 16:45
■ 演讲议题:Apache Flink 流批自适应 Shuffle
新的 Shuffle 架构具有以下优势:
1. 更加适应云原生环境的资源编排与隔离特点;
2. 兼具传统流式与批式 Shuffle 技术的优势;
嘉宾介绍
宋辛童丨阿里云高级技术专家
Apache Flink PMC Member & Committer,阿里云高级技术专家,阿里云 Flink Shuffle & SDK 团队负责人。
嘉宾介绍
谭玉新丨阿里云高级开发工程师
就职于阿里云计算平台开源大数据部门,专注于 Apache Flink 开源项目。
议题介绍:
嘉宾介绍
潘臻轩丨蚂蚁集团资深技术专家
蚂蚁金服资深技术专家,现负责蚂蚁图计算部门流式图计算团队。2012 年加入阿里集团数据平台, 2016 年加入蚂蚁集团数据技术部,经历了阿里和蚂蚁实时计算从 0 到 1 的演进,从 17 年底开始负责流式图系统和团队的构建,从 0 到 1 打造了蚂蚁的流式图系统。对实时计算和图计算以及上层的应用场景有深入的理解。
1. 大数据实时计算平台支持基于事件的低延迟处理以及流批一体的数据处理,支撑了 30+ 内部和外部组织的实时化业务和 10000+ 的数据服务订阅,每天处理 2.3 万亿条数据、600TB+ 数据量,集群规模独享 480+ 服务器,服务了十几条业务生产产品线。
嘉宾介绍
穆纯进丨联通数字科技有限公司大数据实时计算平台研发负责人
Apache StreamPark PMC、大数据实时计算平台研发负责人,负责万亿级 Flink 实时计算开发、运维以及平台建设。
嘉宾介绍
白松丨杭州数澜科技有限公司研发中心副总经理
数澜科技公司联合创始人、研发中心副总经理,拥有 9 年大数据平台研发经验,专注于大数据、实时计算、数据权限等领域的研究。负责公司核心产品数栖平台和数栖 EMR 的产品研发工作,目前数栖产品已成为国内外数百家公司建设数据中台的基础设施工具,例如中信集团、富士康、万科、宝马、浙江交投集团等。
■ 演讲议题:Streaming Apache Kudu within Apache Flink
分享时间:8 月 18 日 15:45 - 16:15
议题介绍:
嘉宾介绍
Wei Chen丨eBay Staff Software Engineer
Wei is focusing on empowering the eBay's Notification Platform by leveraging the big data and streaming processing technologies. He is also a tech blog writer and actively contributing in open source community. Wei received his bachelor and master degrees from Shanghai Jiao Tong University.
■ 演讲议题:Shaping the Future: Unveiling High-Concurrency Streaming Analytics with Apache Druid
分享时间:8 月 18 日 16:15 - 16:45
议题介绍:
嘉宾介绍
Tijo Thomas丨Imply Data inc Lead Solutions Architect
SummaryLead with great passion for big data technology, having 18+ years of experience in the software industry ( engineering, professional service , product management). Helping customer in the field , negotiating with customer on the feature request and align them with the product roadmap Extensive experience across the stack in Managing, Architecting, Designing and Implementing Big data applications, frameworks and platforms.More than 4 year of experience as Solution Architect Experience in design and implementing a highly scalable SAAS platform for public Cloud. Hold two patents in the area of Big Data.
8 月 19 日 13:30 - 16:45
■ 演讲议题:阿里云基于 Flink CDC 的实时数据集成实践
分享时间:8 月 19 日 13:30 - 14:00
议题介绍:
嘉宾介绍
阮航丨阿里云高级研发工程师
阿里云高级研发工程师, Flink CDC Maintainer & Apache Flink Contributor。
■ 演讲议题:自如基于 Apache StreamPark 的大规模 On Kubernetes 实时计算生产实践深度解析
分享时间:8 月 19 日 14:00 - 14:30
议题介绍:
1. 在此次演讲中,我们将深度探讨如何借助 Apache StreamPark——一站式实时计算作业管理平台,精细化管理自如超过 300 个 Flink On Kubernetes 实时作业。Apache StreamPark 为我们提供了一套直观的可视化界面,协助我们管理了众多关键功能,包括 Flink 作业的开发,作业部署到 Kubernetes,Flink Docker 镜像管理、Flink Kubernetes Pod Template 管理等。
嘉宾介绍
陈卓宇丨自如大数据平台研发工程师
Apache StreamPark PPMC.
■ 演讲议题:Flink K8S Operator AutoScaling
分享时间:8 月 19 日 14:30 - 15:00
议题介绍:
嘉宾介绍
陈政羽丨真有趣游戏高级大数据开发工程师
Apache Flink/Streampark Contributor ,长期从事游戏行业数据开发,目前在公司负责云原生的 Flink 大数据部署作业平台构建与作业研发,从 0 到 1 为真有趣游戏构建部署、提交作业的一站式 Flink 智能作业平台、反外挂平台以及数据集成平台。
■ 演讲议题:RSQLDB 基于消息队列的流数据库
分享时间:8 月 19 日 15:00 - 15:30
议题介绍:
本演讲将从一下几个方面介绍 RSQLDB:
1. 流计算演进之路,为什么需要 RSQLDB;
2. RSQLDB 架构设计原理;
嘉宾介绍
倪泽丨阿里云,Apache RocketMQ Committer,RocketMQ Streams 维护人,RSQLDB 维护人
Apache RocketMQ Committer,RocketMQ Streams maintainer,RSQLDB maintainer,云原生消息团队研发计算专家。
As a Scala developer writing new Flink job, you expect to use latest Scala 3 version, rather the one Flink was compiled with. Support of Scala 2.13 and Scala 3 was not really possible until Flink 1.15 came out. In this talk we will review how the Scala API was done in Apache Flink prior the version 1.15 and what has changed in that release. Apache Flink chose quite opposite way to enable Scala developers to use any Scala version than Apache Spark project and that is interesting discussion on its own.
During this talk we will go through the SBT example project to build Flink jobs with Scala 3. We will look at the current community options of Scala wrappers for Flink Java API and challenges related to that. As a result, we will see that using Scala in Flink jobs is much more convenient than writing your streaming jobs with Java API. An introduction to the Scala CLI makes the whole packaging experience of Scala Jobs a pure joy.
嘉宾介绍
Alexey丨Ververica Solution Architect
Alexey is a Solution Architect working for last the last 6 years on data solutions and products. At Ververica, he is focusing on supporting clients to solve their challenges in adopting data stream processing with Apache Flink. Among his previous project and companies he developed different systems such as Data Lakes, Data Integration and Data Virtualization Layers. He has also spent many years on developing data services for investment banks including currency trading software. In his spare time, he also contributes to various open-source projects or starts his own for fun. His hobbies are astronomy, playing music and gym.
■ 演讲议题:小米 Flink 实时计算平台的建设实践
分享时间:8 月 19 日 16:15 - 16:45
议题介绍:
本次分享将聚焦实时计算平台的建设,结合小米自身的业务实践经验,分享小米在实时计算领域的探索与建设,打造具备资源弹性、低成本、易用等特性的统一实时计算平台。
4. 总结与展望 对本次分享的内容进行简要总结,并对实时计算平台未来的演变方向展开一定的探讨和展望。
嘉宾介绍
陈子豪丨小米软件研发工程师
小米软件研发工程师,主要负责小米实时计算平台及 Flink 框架内核开发。
专题议程

作为 Apache 软件基金会(ASF)的官方全球系列大会,每年的 CommunityOverCode Asia 都吸引着来自全球各个层次的参与者、社区共同探索 "明天的技术"。8 月 18 日至 20 日,即将强势来袭的 CommunityOverCode Asia 2023 上,大家可以近距离感受来自 Apache 项目的最新发展和新兴创新。

往期精选

▼ 「活动回顾」扫下方图片观看全场直播回放▼


点击「阅读原文」,立即购票






















