
“效率、成本、体验全面提升。靠谱!
在腾讯云向量数据库的帮助下,试题聚类的准确率从50%提升到了95%;检索吞吐能力达到了行业平均水平的10倍;人工标注的成本也大大降低。技术革新直接带动了业务增长——用户的付费率提升了50%以上。”
——巨闲网络CTO 杨宇建
项目背景
上海巨闲网络科技有限公司(考试宝)是国内领先的职业教育考试学习平台,公司成立于2019年,是一家有互联网基因的科技创新企业。
到2025年6月为止,考试宝平台上的试题量已经超过60亿道,覆盖10000多个职业类别,是目前品类覆盖最全的职业教育考试学习产品,用户总量突破8000万。
面对海量数据下的检索效率瓶颈与智能化转型需求,考试宝选择与腾讯云向量数据库深度合作,通过AI技术重构教育数据基础设施,努力改善用户的数字服务体验,提供更有价值的产品和服务。
AI时代教育行业两大核心挑战:
1. 海量试题资源难以高效利用
尽管在线教育平台已经积累海量题目资源,却深陷于“数据富矿,开采困难”的困局。
由于缺乏先进的语义理解技术与智能聚类算法,平台难以从60亿量级的庞杂题库中精准挖掘高价值题目,致使重复内容泛滥、优质资源稀缺。这种低效的资源利用方式,正严重制约高质量精选题库的建设进程。
2. 人工处理模式难以为继
传统的人工审核机制在试题去重、分类和标注环节存在明显效率短板。面对题库规模指数级的增长,这种“人海战术”不仅成本压力巨大,更无法满足业务快速发展的需求,成为制约平台升级的关键瓶颈。
技术选型
如何解决上述两大难题?
经过两三个月的技术论证与方案打磨,腾讯云向量数据库团队与考试宝团队最终确立了「Embedding+向量检索」这一业界创新技术路线,并首次实现该方案在商业化应用中的大规模落地,效果优异。
依托腾讯云向量数据库提供的Embedding能力,业务可高效转换原始试题文本为高维语义向量。该技术不仅完整保留了试题的语义特征,更赋予非结构化、高检索难度的文本数据可计算、可比较的数学特性,显著优化了后续存储与检索流程。
在完成向量化处理后,系统通过精准计算试题间语义相似度,自动识别并过滤重复及高度相似题目,有效筛选最具代表性的优质试题,从源头确保了题库质量。
经过去重处理的试题由业务系统进行智能分类与结构化整合,依据知识点分布、难度梯度等多维指标构建精选题库,精准满足用户的个性化学习需求。
该解决方案打通了试题数字化至智能化处理的全自动链路,在显著提升题库建设效率与质量的同时,为教育行业打造了可复制、可扩展的技术范式。
腾讯云向量数据库的三大优势
1. 千亿级数据规模,500万QPS支撑
单集合支持千亿级向量数据与500万QPS并发量,从容应对超大规模业务场景,保障高并发下的稳定响应。
2. 向量+关键字混合检索,精准高效
融合向量语义检索与关键字精确检索能力,显著提升搜索及RAG业务的召回率与准确率,带来更快、更精准的查询效果。
3. 多模型支持,降本增效
集成bge-m3等十余种主流Embedding模型,加速数据导入过程,降低用户使用成本与门槛,提升业务部署效率。
业务价值
“效率、成本、体验全面提升。”
——巨闲网络CTO 杨宇建
在腾讯云向量数据库的加持下,考试宝的AI基础设施实现了质的飞跃:
准确率显著提升:试题聚类准确率从50%跃升至95%,系统智能识别重复题与相似题的能力大幅增强,有效减少冗余内容,为用户提供更精炼、更高质量的优质题库。
成本大幅优化:通过AI自动化替代人工审核,标注成本显著降低,效率同步提升,使团队得以聚焦于更高价值的工作。
精选题沉淀效率显著提升:自动化聚类技术使优质试题筛选效率提升8倍,精选题库更新周期由1个月缩短至3天,有力支撑了题库的持续迭代,最终驱动用户付费率提升50%,将效率切实转化为业务收益。
未来展望
腾讯云向量数据库作为AGI领域的新一代数据枢纽,将通过构建教育智能化的数据基座,持续深耕教育场景及多领域需求,为教育行业打造「数据-知识-智能」闭环体系,以技术创新驱动教育数字化向更智能、更精准的方向演进。
1. 教育场景深度赋能
基于向量+关键字混合检索技术,题库检索精准度与召回率显著提升,助力教育机构高效定位优质教学资源,实现题库管理智能化升级,为个性化学习提供更强数据支撑。
2. 存储与计算成本优化
依托磁盘索引优化及业界领先的RaBitQ索引技术,腾讯云向量数据库为百亿级题库提供高性价比存储方案,使大规模AI应用更经济可持续。
3. 构建多源数据生态
支持MySQL、MongoDB等多元数据源无缝接入,打造企业级统一数据平台,夯实AI教育创新的数据基础,赋能智能化知识管理体系构建。
未来,我们将持续拓展向量数据库在教育场景的应用深度,推进AI技术与教学实践的融合创新,为行业交付更高效智能的解决方案。
TencentDB
往期推荐




