暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DataFunSummit2024:数据治理技术峰会,探讨AI时代的数据治理新趋势

545

在数字化时代,数据不仅仅是信息的载体,它已成为推动企业和社会发展的核心燃料。近年,在大模型技术突飞猛进的背景下,数据治理的复杂性和重要性也被提升到了前所未有的高度,随着数据量指数级增长,如何有效管理和利用数据,是一个充满机遇又伴随着挑战的议题。

为此,DataFun将于2024年8月17日举办《DataFunSummit2024:数据治理在线峰会》,旨在搭建一个高端对话平台,汇聚行业智慧,共同探索大模型与数据治理的深度融合之路。

字节跳动数据平台作为本次大会共创伙伴,将推出「数据血缘」专场论坛,由抖音集团大数据研发专家——贺佳欢出品,将从数据稳定性保障、安全合规、预算管理和成本等多方向,为听众带来丰富的实践经验分享。



01

精彩议题抢先看


一、抖音集团大数据血缘演进与应用

演讲嘉宾刘浩阳 抖音集团大数据研发专家

演讲提纲:

● 抖音集团血缘整体介绍

● 抖音集团血缘系统架构

● 抖音集团血缘应用场景

● 未来展望

听众收益:

● 认识大数据血缘方向,了解建设思路

● 血缘系统架构如何设计,重点解决的问题

● 血缘的价值应用在哪些方向


二、抖音集团离线数仓血缘基础能力的构建与应用

演讲嘉宾:朱江 火山引擎LAS大数据研发专家 

演讲提纲:

在数据中台的大背景下,离线数仓领域中用户经常需要解决以下问题:

-哪些Hive表包含业务A的数据?

-哪些Hive表/Hive列无下游使用,可以进行数据治理?

这些问题可以统一归类为数据发现问题。抖音集团通过算子级血缘能力,针对离线数仓任务进行SQL分析,构建Hive表的血缘关系,基于标签传播算法自动化工程化地解决数据发现问题,规避人工标注存在的周期长、成本高、准确率低等问题,对数据进行精细化运营,助力标签传播、数据治理等场景。

另外,数据安全问题近期也逐步受到各国政府和企业的重视,随着国家数据安全法、个人信息保护法的相继颁布和实施,对于数据最小够用原则也提出了明确的要求。因此,如何更细粒度管控权限,如何保证数据安全也变成了每个企业都必须解决的问题。抖音集团基于算子级血缘能力,构建了SQL权限点精细化提取能力及动态脱敏能力,有效的保证了敏感数据安全可控。

听众收益:

● 认识大数据血缘方向,了解建设思路

● 血缘系统架构如何设计,重点解决的问题

● 血缘的价值应用在哪些方向


三、DataLeap数据资产方向的大模型实践-找数助手

演讲嘉宾:何舒青 抖音集团数据研发专家 

演讲提纲:
介绍抖音集团在数据资产方向的技术探索——如何通过费促沉淀」辅助用户自主消费数据资产,加速数据飞轮。
主要内容:
● 数据消费面临的问题
● 找数助手整体架构
● 消费促沉淀方案

● 大模型对找数助手的赋能

听众收益:
● 如何借助大模型技术,辅助用户自主查找和消费数据资产,如:找hive表、用数-问口径和加工逻辑等

● 如何通过「消费促沉淀」的解决方案,不断提升数据问答助手的拦截率,加速数据飞轮


点击阅读原文,报名DataFun活动

文章转载自字节跳动数据平台,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论