Part1 内容介绍
在自然语言处理领域,大型语言模型(LLM)如GPT-3、BERT等已经取得了显著的进展,它们能够生成连贯、自然的文本,回答问题,并执行其他复杂的语言任务。但想要让大模型回答复杂问题,需要对原始内容进行深入的理解,比如对数据库进行解析、图像、语音等内容进行解析。

SQL Agent的一个显著特点是其能够优雅地从错误中恢复。它通过运行生成的查询,捕获任何发生的错误或异常,然后正确重新生成查询来实现这一点。这确保了交互的顺畅进行,并防止由于错误而导致的中断。
本月的学习内容主要围绕检索增强生成(RAG)与SQL Agent展开:
SQL Agent原理 知识库构建与管理、检索模块技术 ChatGPT/ChatGLM的API使用
Part2 活动安排
免费学习活动,不会收取任何费用。 请各位同学添加下面微信,并回复【竞赛学习】,即可参与。

Part3 积分说明和奖励
为了激励各位同学完成的学习任务,在完成学习后(本次活动,截止4月1),将按照积分顺序进行评选 Top3 的学习者。如果打卡积分相同,则按照prompt质量和文本长度进行排序。
学习资料:http://discussion.coggle.club/t/topic/31 在线评分地址:https://competition.coggle.club/
打卡积分奖励
Top1的学习者将获得以下奖励:
50元现金红包 Coggle 竞赛专访机会
Top2-3的学习者将获得以下奖励:
20元红包 Coggle 竞赛专访机会
历史活动打卡链接,可以参考如下格式:
https://blog.csdn.net/weixin_42551154/article/details/125474519 https://blog.csdn.net/weixin_42551154/article/details/125481695
欢迎大家将打卡内容,发在竞赛论坛中,让大家一起学习进步,交流讨论。
Part4 基金金融问答
背景介绍
本次比赛要求选手基于大语言模型LLM构建一个问答系统,问答内容涉及基金/股票/债券/招股书等不同数据来源。不限制选手的模型使用,选手可以选择商业化模型或者开源模型,可以结合多个模型,可以采用公开访问的外部数据进行微调模型,也可以采用LangChain、向量数据库等相关技术。

SQLite数据库.db
大小:1.46g
文件格式:sqllite db文件
文件数量:1
时间跨度:2019年-2021年
数据表说明:
◦ 基金基本信息
◦ 基金股票持仓明细
◦ 基金债券持仓明细
◦ 基金可转债持仓明细
◦ 基金日行情表
◦ A股票日行情表
◦ 港股票日行情表
◦ A股公司行业划分表
◦ 基金规模变动表
◦ 基金份额持有人结构
招股说明书
招股说明书 pdf源文件
大小:527MB
文件格式:pdf文件
文件数量:80
招股说明书 pdf解析后的txt文件
大小:44MB
文件格式:txt文件
文件数量:80
打卡任务
| 任务名称 | 所需技能 |
|---|---|
| 任务1:初始大模型与Agent | 无 |
| 任务2:ChatGLM API使用 | Python |
| 任务3:数据库表内容解析 | SQL |
| 任务4:文本索引与答案检索 | TFIDF、BM25 |
| 任务5:文本嵌入与向量检索 | Embedding |
| 任务6:文本多路召回与重排序 | ReRank |
| 任务7:问答意图识别(进阶方向) | BERT/TFIDF |
| 任务8:问答关键词提取(进阶方向) | TextRank |
| 任务9:扩展词与扩展查询(进阶方向) | Word2Vec/BART |
任务1:初始大模型与Agent
大模型的Agent指的是以大型语言模型(如GPT-3、GPT-4等)为核心,构建的具有一定自主性和智能的软件实体。这些Agent能够执行多种任务,包括但不限于自然语言处理、决策制定、任务规划和执行等。
Agent通常具备以下特点:上下文学习能力:大模型的Agent能够理解和处理复杂的上下文信息,这使得它们能够在对话中保持连贯性,理解用户的需求,并在此基础上做出响应。
推理能力:这些Agent能够进行逻辑推理,解决复杂问题,甚至在一定程度上模拟人类的思考过程。
任务规划与执行:Agent能够识别任务需求,规划执行步骤,并自主执行这些任务,这在自动化工作流程和提高效率方面非常有用。
自然语言交互:大模型的Agent能够以自然语言与用户进行交互,提供信息、解答问题或执行命令。
自主智能:尽管Agent的智能程度有限,但它们在特定领域内展现出一定程度的自主性,能够自主发现问题、设定目标、构思策略并执行任务。
多模态能力:一些Agent还能够处理和理解多种类型的数据,如文本、图像、声音等,这使得它们在多模态任务中表现出色。
大模型的Agent在多个领域都有应用,例如智能助手、客户服务、内容创作、教育、健康咨询等。随着技术的发展,这些Agent的能力正在不断增强,它们的应用范围也在不断扩大。然而,它们仍然面临着一些挑战,如处理幻觉问题、上下文容量限制等,这些都需要持续的研究和改进。
图书推荐
随着大语言模型的快速发展,语言AI已经进入了新的阶段。这种新型的语言AI模型具有强大的自然语言处理能力,能够理解和生成人类语言,从而在许多领域中都有广泛的应用前景。大语言模型的出现将深刻影响人类的生产和生活方式。本书将介绍提示工程的基本概念和实践,旨在帮助读者了解如何构建高质量的提示内容,以便更高效地利用大语言模型进行工作和学习。
本书内容通俗易懂,案例丰富,适合所有对大语言模型和提示工程感兴趣的读者。无论是初学者还是进阶读者,都可以从本书中获得有价值的信息和实用技巧,帮助他们更好地应对各种挑战和问题。
# 转发本文集30个赞 免费领书 #

每天大模型、算法竞赛、干货资讯





