
近日,Unstructured Data Meetup 杭州场圆满收官!本次 Meetup 由向量数据库领军者 Zilliz 创办,同时还邀请到来自魔搭社区、TorchV 的技术专家分享行业对于 GenAI 如何连接非结构化数据的思考。
以下是本次 Unstructured Data Meetup 的重点内容:
Zilliz 合伙人、研发 VP 栾小凡 《从端到云, 向量数据库到底应该长什么样》
魔搭社区高级技术专家 张志成《魔搭社区 Modelscope-Agent 开源框架—功能完备且生产可落地的 Agent 框架》
杭州萌嘉网络(TorchV)科技有限公司联合创始人&CTO 肖玉民《融合 RAG 技术&企业应用需求的创新和实践》
Milvus 资深产品经理 张粲宇《混合检索:构建 RAG 与多模态应用的新利器》

01.
从端到云, 向量数据库到底应该长什么样?

Zilliz 合伙人、研发 VP 栾小凡从“生成式 AI 应用开发者,究竟在乎些什么”开始讲起,指出“Milvus + Zilliz 能够满足 GenAI 应用场景的向量检索诉求”。
随后,栾小凡介绍了轻量级向量数据库 Milvus Lite。Milvus Lite 不仅具有易于部署、资源占用低等特点,还可以面向 CI/CD 和 POC 场景、针对 ARM 优化等。而 Milvus 则具备面向 GenAI 应用的核心能力,包括支持动态 Schema、丰富的数据类型;支持百万级用户、多租户能力;支持混合查询、关键词+向量检索;支持 Float、Binary 等多种向量数据等能力。
最后是 Zilliz Cloud,栾小凡称其不只是向量数据库。原因在于,Zilliz Cloud 具有全托管向量数据库服务,相比开源实现3倍性能提升,10 倍成本下降;可一键扩展,动态伸缩;安全合规,通过 SOC2 和 GDPR 认证。同时,Zilliz Cloud 还具有全链路非结构数据处理 Pipeline,具备 API As Service,支持多模态数据处理;集成大量SOTA模型和框架;可一键完成数据同步。而 Zilliz Serverless 可以为用户带来更便宜、更弹性、云的初体验,其按需计费,不用不花钱、存储成本低至1.2/GB/月、免费实例、弹性扩缩容、功能对齐开源 Milvus。
02.
魔搭社区 Modelscope-Agent 开源框架—功能完备且生产可落地的 Agent 框架

魔搭社区高级技术专家张志成的分享围绕魔搭社区 Modelscope-Agent 开源框架展开。
他首先对 modelscope 的生态进行了介绍,并表示 modelscope-agent 围绕 modelscope 的生态持续成长。随后介绍了 Modelscope-Agent 的能力及应用案例。
据张志成介绍, Modelscope-Agent 框架具有以下特点:
可定制且功能全面的轻量 agent 框架:提供可定制的 agent 设计,涵盖了数据收集、工具检索、工具使用、存储管理、定制模型训练和实际应用等功能,可用于快速实现实际场景中的应用。
开源 LLMs 作为核心组件:可以通过利用 ModelScope 社区的多个开源LLMs上进行模型训练。面对不同的支持指令微调的开源模型,用户可以快速构建出可执行各类任务的agent。
多样化且全面的API:以统一的方式实现与模型API和常见的功能API的无缝集成,同时也支持各类Modelscope社区的开源小模型作为tool被调用。
支持基于分布式的 multi-agent 任务,轻松将单 agent 能力扩展到 multi-agent 以及分布式场景。
支持快速 agent 服务化,方便多种应用场景落地(绘本故事、写真照片等)。
03.
融合 RAG 技术&企业应用需求的创新和实践

杭州萌嘉网络(TorchV)科技有限公司联合创始人& CTO 肖玉民表示,随着生成式 AI 大模型的爆发,RAG 技术体系在实际的企业应用场景中的角色日益隆重。
肖玉民结合萌嘉科技开发的TorchV Bot(基于RAG、大模型技术栈),结合企业客户的真实需求,探讨 RAG 技术在 Embedding、检索、生成等方面的技术细节,以及 TorchV 在落地过程中所面临的挑战与解决方案。肖玉民表示 TorchV 的基线产品包括 Bot、Doraemon、Assistant、Comparison。其中,Bot 的应用案包括招商数字名片、SOP 助手,应用技术实践为混合检索(HybridSearch);Doraemon 的应用案例包括销售/导购助手、装修设计师助理,应用技术实践为语义分块/父窗口;Assistant 应用案例包括研报助手;Comparison 应用案例包括合同审批助手,Assistant/Comparison 的应用技术实践包括 PDF 表格解析。
最后,肖玉民分享了对于 RAG 的三大感悟:其一,RAG 是一套综合技术方案,解决大模型幻觉需要持续迭代;其二,企业用户需要的是开箱即用& 90 分的产品,而非只有 60 分的 demo;其三,数据质量越高,回答效果越好。
04.
混合检索:构建 RAG 与多模态应用的新利器

Milvus 资深产品经理张粲宇的分享主要围绕着混合检索展开,依次介绍了为什么需要混合检索、混合检索在各类场景中的应用以及展示如何在 Milvus 中使用混合检索。
张粲宇表示,当前检索的发展趋势呈现出以下特点:检索的数据规模越来越大 (IDC:数据量年均增长率 19.2%,2025 年超 175 ZB);检索的形式越来越多样(文字、图片、表格、语音、视频…);检索的条件越来越复杂(Filter/Agg/Join -> 丰富的语义理解)。在此情况下,用户的关注重点放在了“更强大的检索质量”上面。具体来讲,即更准确的搜索效果、更灵活的查询方式、更全面的维度、更丰富的语义。Milvus 2.4 的混合检索可有效满足用户的多种需求,并应用于 RAG 场景,例如 Milvus Chatbot。除了 RAG 场景,混合检索还可在多模态搜索场景下应用例如,ResNet 图搜、CLIP 文搜、ResNet + CLIP 混合检索。不止如此,混合检索的应用场景还包括推荐系统、自动驾驶、建材家装、艺术创作等。
以上就是本次 Meetup 的全部内容了,微信后台回复关键词「6.15杭州」可获取讲师 PPT。
预告:
Unstructured Data Meetup 7月即将登陆北京,下周开放报名,北京的开发者朋友们敬请期待!
推荐阅读







