

日程介绍

议题分析&听众收益
深度学习平台离线训练作业资源调度优化
新技术/实用技术点:
1、离线训练任务优先级调度。
2、离线训练任务资源使用率预估及调整。
听众收益:
了解通过优先级调度、任务资源使率预估、异构GPU调度等策略优化离线训练任务资源调度,提升资源利用率。
基于任务可预测性的高吞吐分布式训练集群资源调度
新技术/实用技术点:
1、可预测任务的动态资源调度策略
2、混合任务下的统一优先级调度
听众收益:
1、了解作业可预测性定义和分类
2、了解异构资源下的动态资源调度策略
3、了解基于任务优先级的统一调度策略
深度学习平台在线推理服务和离线训练作业混部
新技术/实用技术点::
1、推理服务自动弹性伸缩策略。
2、离在线混部下资源动态调度。
听众收益:
1、了解模型推理服务自动弹性伸缩方案。
2、了解离线作业和在线服务资源混部实现。
分布式微服务场景下的灰度干扰研究和应用混部
新技术/实用技术点:
1、基于时空编码的服务性能及干扰预测。
2、基于微服务组件级可区分的细粒度应用混部。
听众收益:
了解云服务场景下的“灰度干扰”现象,同时针对局部干扰进行细粒度的资源管理和应用混部,提升系统效率。
文章转载自DataFunSummit,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




