
第12届中国开源黑客松圆满落下帷幕
接下来让我们一起跟随开源人的步伐
回顾一下这场开源黑客松活动盛会吧!
# 开源之道,“松”柏之茂 #
5月28日、29日,由中国开源云联盟指导,中国电子技术标准化研究院、华为、英特尔、腾讯联合主办的第12届中国开源黑客松在北京落下帷幕。
活动参与者都是来自五湖四海的开发者,人数有数百人之多,他们齐聚黑客松,开启“最强大脑”,互相交流开源心得,活动氛围热情高涨,完成了许多精彩、有趣的项目。
此次活动,涵盖了多个主流的支撑基础架构平台的开源项目,共建多个场景的全栈合作模式,13个开源项目茁壮成长,大有繁盛“松”柏之茂,直上云霄之势。

# 春“华”秋实,星光熠熠 #
一直以来,华为都遵循本心,本着开放的理念,敞开怀抱,积极拥抱开源,踊跃参与黑客松活动,这次,华为开源王牌项目一起出动,MindSpore、openEuler、openGauss、openLooKeng、Spark等项目,在中国开源黑客松活动中收获满满,硕果累累。
在这两天里我们看见了TinyMS搭建模型练习、探讨多样性算力场景、云边端场景开发、数据库适配等优质开源项目,虽然只有短短的两天时间,但是依然看到了中国开源人的实力,看到了开源的未来与希望。
01
MindSpore
MindSpore 是华为开源的一款支持端边云全场景的深度学习训练推理框架自研 AI 框架,主要应用于计算机视觉、自然语言处理、强化学习等领域,具备自动微分、并行训练,全场景部署等多种特性。此外基于 MindSpore 专门开发了高阶 API 工具 TinyMS,专门解决小萌新开发者在 AI 学习中上手难,上手慢的问题。
# Keyword:快速搭建AI模型
快速学习 MindSpore 的高阶 API 工具 TinyMS 来搭建模型,进行模型训练和部署,辅导开发者实现模型复现,帮助其参与开源社区贡献。
# Outcome:

两位对AI完全零基础的大二学生在现场了解了MindSpore和TinyMS的基本信息,掌握了深度学习项目训练的基本流程,在现场学会安装MindSpore和TinyMS,并跑通TinyMS的1分钟快速实践:手写数字识别案例。
最有贡献的开发者:赵佳悦



02
openEuler & Spark

Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。现在形成一个高速发展应用广泛的生态系统。
openEuler 是一个开源、免费的 Linux 发行版平台,将通过开放的社区形式与全球的开发者共同构建一个开放、多元和架构包容的软件生态体系。同时,openEuler 也是一个创新的平台,鼓励任何人在该平台上提出新想法、开拓新思路、实践新方案。
这次,两个社区联合开发,基于openEuler操作系统,共同完成贡献,并搜集、探讨国内多样性算力场景诉求。Spark + openEuler项目组在黑客松活动的第二天上午,举办了一场黑客松的“会中会”。通过远程连线邀请到了远在硅谷的DataBricks Apache Spark社区研发主管、Apache Spark PMC李潇,与来自网易、百度、华为、中国电信、北京邮电大学等公司、高校线上线下20余位开发者针对Spark Arm适配、性能调优、Spark产品化建议、生产环境使用以及Spark社区贡献等主题进行了深入的交流
# Keyword:大数据领域开发者从0到1参与社区贡献
Spark社区及openEuler社区的开发者参与开源社区的开发、讨论,探讨Spark社区需求、特性,帮助大数据领域开发者参与社区贡献。
# Outcome:
1.Spark Arm Github Action POC 支持。
2.Kyuubi达成Apache孵化计划,5月31日发起项目为期7天的孵化确认。
3.《Spark社区开发者交流》吸引Databricks、百度、华为、网易、电信等参与。
贡献者以及贡献:贡献者ID, 特性数量/PR数量/代码数量/Commit数量YaoQin, Commmits: 2(merge 1)
Yikun, Commits: 3
Penglei, Commits: 1
最有贡献的开发者:姚琴



精彩镜头
SHOTS
03
openGauss


本次黑客松的数据库小组由来自华为、浪潮、中国联通、中国电信、北京邮电大学等公司、高校的开发者参与。由于到场这些开发者同时也分别来自openGauss、openEuler、wechaty等开源社区,因此数据库项目组决定挑战在两天时间内充分结合各开源软件,实现一个全Arm架构端边云协同的小技术项目,实现对黑客松活动现场微信群的聊天内容进行采集、存储、分析以及实时展示。
# Keyword:端云协同demo
完成云边端场景的安装部署以及开发工作,完成端云协同demo展示
# Outcome:

如上图所示,项目使用wechaty机器人接入黑客松活动现场微信交流群进行实时数据采集,并将采集到得数据发送到运行着openEuler 21.03 操作系统的树莓派4B开发板上,在这里将对原始数据进行处理,同时,这台树莓派上还部署着2.0版本的openGauss数据库,处理完成的数据将被持久化在openGauss数据库中。最后通过部署在华为云上鲲鹏虚拟机实例中的前端页面进行可视化展示。

项目组在黑客松的两天时间内完成了上述项目的设计、开发和验证,实现了人员、聊天内容、高频词等内容分析,并且在最终的总结环节由主要开发者-来自北京邮电大学的吴京京同学,进行了现场的Live Demo演示,在演示环节这个小项目也经受住了来自黑客松现场小伙伴们短时间内的信息轰炸,完成了实时的数据分析,博得了全场的喝彩。
最有贡献的开发者:吴京京
04
openLooKeng
openLooKeng是一款开源的高性能数据虚拟化引擎,提供统一SQL接口,具备跨数据源/数据中心分析能力景。openLooKeng致力于为大数据用户提供极简的数据分析体验,让用户像使用“数据库”一样使用“大数据”。openLooKeng始终支持开源开发,感兴趣的朋友可访问 https://openlookeng.io/ 进行进一步的了解和分析,欢迎加入openLooKeng社区!
# Keyword:特性PR合入
作为大数据开源项目的新成员,这是openLooKeng第二次亮相第12届中国开源黑客松。在近百人的活动现场,这支团队虽然只有7名成员,但短短两天,便完成了从0到1 的两个特性的开发:ClickHouseConnector 外部UDF注册和下推适配;以及KylinConnector 的适配。团队代表成员之一,黎一泽荣获黑客松明星组员奖。
# Outcome:
1. kylin connector 适配:支持select, show table ,desc table 等,支持与其他数据源做融合分析。
2.clickhouse 外部UDF注册和下推适配 :支持clickhouse 的函数注册到openLooKeng ,支持外部UDF下推。
后续安排:代码合入openLooKeng开源社区主仓库
贡献者以及贡献:贡献者ID, 特性数量/PR数量/代码数量/Commit数量
所有人 commit数量:5 所有代码 500+行
项目组最佳贡献者:黎一泽


# 诸子百家,不止代码 #
在紧张的代码时间过后,黑客松活动主办方给大家安排了娱乐环节,大家纷纷放下电脑和成员们一起拍照打卡帝都四合院风光、参与游戏互动、享受午后茶歇。秉承着”work hard, play hard”的哲学观念,努力工作,玩儿的痛快!
在这里,我们体会到开源社区的意义不止在修复issue、提交pr,更是结识“社区”里志同道合的朋友们,无论他们是来自天南海北还是素未谋面的开发者,我们为同一个目标共同努力!

# 回首过去,拥抱未来 #
开源是科技创新的未来,随着开源开放理念的兴起,开源逐渐成为云计算、大数据、人工智能等领域技术开发的主流模式。2015年办会以来,开源黑客松已走过6个春秋冬夏。openGauss自开源以来一直积极参与其中,同时,openGauss也期盼越来越多的开发者加入开源,加入开源黑客松活动,和我们一起构建开源生态。
10月,我们再次相约黑客松!




