暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

枫清科技(Fabarta)受邀参加 GOTC 全球开源技术峰会

Fabarta 2024-08-15
126

2024 年 8 月 15 日至 16 日,“2024 GOTC 全球开源技术峰会”将在上海张江科学会堂盛大开启。全球开源技术峰会(Global Open-source Technology Conference,简称 GOTC)始于 2021 年,是面向全球开发者的开源技术盛会。本届大会由上海市经信委与中国电子指导,开源中国与上海浦东软件园联合举办。
本届大会由一个主论坛领航,两大高峰论坛以及六大专题论坛并行,全面深入探讨 AI、数据库、云原生等前沿技术领域。通过主题演讲、圆桌讨论、创新集市、人才集市、黑客松、技术展示和互动工作坊等形式,与会者将有机会交流实践经验、探索前沿技术,促进跨领域合作。枫清科技(Fabarta)大语言模型/算法专家王斐受邀在本次大会进行技术分享,现场将为大家分享函数式大模型应用的 LLMOps 实践经验。
王斐

枫清科技(Fabarta)大语言模型/算法专家

嘉宾介绍枫清科技(Fabarta)大语言模型/算法专家,负责大模型应用的底层架构和解决方案研发,曾任职 IBM 数据科学家,在计算机视觉、大模型项目落地有丰富经验。

分享时间2024年8月15日 下午 14:05-14:40

分享地点【LLMOps 最佳实践】·舞台 2·源聚

分享议题:《函数式大模型应用的 LLMOps 实践经验》

议题简介

大模型应用通常以链的等方式构建,链中包含不同的子过程,子过程之间有嵌套、回退、跳转、并行、汇总等复杂处理。相比于传统的应用,大模型应用需要追踪链路执行顺序,分析执行过程并计算并发度。本次分享将会介绍复杂大模型应用(超过200+子过程、10+分支)的监控方案,基于监控结果可以实现用量统计、性能分析、log 收集、评估等功能。同时,本次分享也将为大家带来 RAG、text2sql、text2api 的统一问答方案,以及大模型应用链路回退、并行和聚合、子链路跳转的设计方案等前沿技术热点。

议题大纲:

1、函数式大模型应用 LLMOps 痛点

  • 典型案例简介:rag、text2api、text2sql、澄清反问、生成图表。

  • 痛点分析:链路太长,调用复杂,嵌套深,链路跳转和回退,监控不同过程的模型用量,找不到性能瓶颈,算法端和前端之间参数传递以及增加新参数不够灵活等。

2、大模型应用 llmops 经验介绍

  • 性能分析:分析火焰图和时序图,找出性能瓶颈,并发执行可拆分、可并行的模块,如并发执行意图确认和生成链路。

  • 对话评估:通过自动化评估找到薄弱环节,如在链路中加入 text2api 参数、text2sql 数据项澄清和反问,提高大模型在智能问数场景下的正确率和用户体验。

  • 用量监控:监控链路中不同过程的 prompt 长度,当 prompt 超长时,允许回退到其他子链路,如重新召回,切换模型。

  • 基于 json config 的前后端分离开发模式:使用统一的 json config 管理前后端参数。
活动报名:

本次大会将集结全球范围内对开源技术充满热情的开发者、社区成员、创业者、企业领袖、媒体人,以及各开源项目应用场景的产业精英、跨界才俊与年轻力量。通过主题演讲、圆桌讨论、创新集市、人才集市、黑客松、技术展示和互动工作坊等形式,与会者将有机会交流实践经验、探索前沿技术,让我们一起激发创新活力、展示开源魅力、促进跨领域合作。欢迎点击阅读原文,看完整日程并报名参会。

推荐阅读

企业场景中大语言模型的应用实践探索丨技术专栏

基于图智能和 AIGC 技术的金融营销解决方案丨技术解读

文章转载自Fabarta,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论