
在数字化时代,数据不仅仅是信息的载体,它已成为推动企业和社会发展的核心燃料。近年,在大模型技术突飞猛进的背景下,数据治理的复杂性和重要性也被提升到了前所未有的高度,随着数据量指数级增长,如何有效管理和利用数据,是一个充满机遇又伴随着挑战的议题。
为此,DataFun将于2024年8月17日举办《DataFunSummit2024:数据治理在线峰会》,旨在搭建一个高端对话平台,汇聚行业智慧,共同探索大模型与数据治理的深度融合之路。
字节跳动数据平台作为本次大会共创伙伴,将推出「数据血缘」专场论坛,由抖音集团大数据研发专家——贺佳欢出品,将从数据稳定性保障、安全合规、预算管理和成本等多方向,为听众带来丰富的实践经验分享。

01
精彩议题抢先看
演讲嘉宾:刘浩阳 抖音集团大数据研发专家
演讲提纲:
● 抖音集团血缘整体介绍
● 抖音集团血缘系统架构
● 抖音集团血缘应用场景
听众收益:
● 认识大数据血缘方向,了解建设思路
● 血缘系统架构如何设计,重点解决的问题
● 血缘的价值应用在哪些方向

演讲嘉宾:朱江 火山引擎LAS大数据研发专家
在数据中台的大背景下,离线数仓领域中用户经常需要解决以下问题:
-哪些Hive表/Hive列无下游使用,可以进行数据治理?
这些问题可以统一归类为数据发现问题。抖音集团通过算子级血缘能力,针对离线数仓任务进行SQL分析,构建Hive表的血缘关系,基于标签传播算法自动化工程化地解决数据发现问题,规避人工标注存在的周期长、成本高、准确率低等问题,对数据进行精细化运营,助力标签传播、数据治理等场景。
另外,数据安全问题近期也逐步受到各国政府和企业的重视,随着国家数据安全法、个人信息保护法的相继颁布和实施,对于数据最小够用原则也提出了明确的要求。因此,如何更细粒度管控权限,如何保证数据安全也变成了每个企业都必须解决的问题。抖音集团基于算子级血缘能力,构建了SQL权限点精细化提取能力及动态脱敏能力,有效的保证了敏感数据安全可控。
听众收益:
● 认识大数据血缘方向,了解建设思路
● 血缘系统架构如何设计,重点解决的问题

三、DataLeap数据资产方向的大模型实践-找数助手
演讲嘉宾:何舒青 抖音集团数据研发专家
● 大模型对找数助手的赋能
● 如何通过「消费促沉淀」的解决方案,不断提升数据问答助手的拦截率,加速数据飞轮

点击阅读原文,报名DataFun活动



