
2月16日下午,星环科技、财联社携手发布“多模态事件驱动量化平台”。双方将在事件驱动型分析这一前沿智能投研及预训练语言模型领域,建立长期和深入的合作伙伴关系。
一方面,财联社借助星环科技在大数据、人工智能和云计算领域的领先技术和产品落地能力,推动数据驱动的业务创新,打造金融信息行业大数据标杆;另一方面,星环科技通过财联社在金融信息舆情方面的数据积累和专家经验,联合打造优秀、可落地的行业解决方案,共同推动智能量化产品的发展。
目前,该事件驱动量化平台发布了多个产品模块,赢得了市场头部量化机构认可。同时该量化数据平台已提供给多家私募、证券行业内头部机构进行实测。
事件驱动量化平台
多重驱动 助力量化私募强势崛起
截至2022年,国内量化类私募基金管理资产规模已突破万亿元,在证券私募行业的占比超过20%,国内百亿量化私募公司已经突破20家,数量再创历史新高,如何利用好自身优势,切入这万亿规模的市场,是摆在各市场参与者面前的一道难题。
星环科技、财联社联合发布的“多模态事件驱动量化平台”,一方面利用财联社作为金融信息服务机构在新闻驱动策略和事件驱动策略上对业务理解的先天优势;另一方面结合了星环科技在数据技术领域的先进能力,为解决这道市场难题开启了一扇门。
作为兼具高效精准的多模态数据存储、特征提取与分析能力和高可信度的数据信息来源的多模态智能量化产品,该平台通过可信数据源的收集、智能标注、知识抽取、自动标签以及标准化结果输出与分析,形成体系化、聚合化的完整知识图谱与有效量化因子,协助和赋能金融机构的交易员、分析师、研究员或相应部门;并可替代原有重复且冗杂的人工数据、资料收集和主体关系梳理流程,辅助金融机构在行业深度、政策导向、宏观经济等方面,进行全面且深入的智能化专家体系搭建,极大提高理解和研究相应场景的效率。
目前,财联社与星环科技已研发了新闻驱动、政策图谱、公告舆情、风控合规、灾害预警方案等8个产品模块,赢得了市场某头部百亿量化私募的认可。目前量化数据已提供给多家私募、证券行业内头部机构进行实测,产品应用场景持续开发中。未来平台将不断通过将业务与技术的不断融合,走在量化市场的最前沿。
多模智能量化实现路径
相关功能模块包括:
新闻驱动:用舆情分析可以快速收集到股票的相关新闻,再进行文本的情绪分析,并判断出这些新闻的正负面。根据正负面新闻对股价的潜在影响和模型逻辑,以期先于其他人作出投资决策。
政策图谱:汇聚历年来重要政策数据,并通过行业关联到具体的上市公司,帮助投资者快速定位相关政策影响标的。
政策信息化解决方案框架
公告舆情:收集2008年以来所有的公告数据,通过近两百个细分标签,可以追溯上市公司在不同时期发布的特定类型公告对股价的持续影响,对未来的股价走势形成一定的辅助预测功能。
风控合规:通过上百个预设的风险模块,对历史上对上市公司股价影响较大的事件在未来做实时监控,方便投资者第一时间规避潜在投资风险。
灾害预警:通过对地震,海啸,火灾等灾害的烈度以及发生区域的监控,可以第一时间帮投资者分析灾难对上市公司经营的或有影响。
研报数据:通过对研究员历史评价,市场影响力评价的比重不同,测算市场预期与公司实际业绩之间的差距,帮投资者寻找潜在收益空间。
行业数据:通过对不同行业的深度了解,对行业供需、价格等影响因素的整合研究,让投资者对行业有更深刻的认知。
事件驱动因子案例
后续,星环科技、财联社双方将进一步建立更长期和深入的合作伙伴关系,基于新闻大数据的数据挖掘和机器学习技术,共同建设新闻大数据和人工智能平台,推动相关应用创新。同时,双方联合团队将通过建立创新实验室、共创开发者大会、成立行业组织等,在政策知识图谱、新闻事件驱动算法、自动化新闻实体识别等多个方面进行业务和技术创新,形成能成为行业标杆的方案和创新产品。
随着大数据、人工智能、云计算等新一代信息技术的发展,新闻媒体与大数据、AI和机器学习的融合发展,已成为大势所趋。未来,双方将合作开拓数据新市场,发挥各自在内容与技术领域的特长,探索数据市场的新形态、新业务、新应用。
预训练语言模型为量化投资提供全新视角
业内分析人士指出,预训练语言模型为基本面量化提供了更为高效的交互式问答工具,一定程度上促进了基本面量化行业研究员生产力的提升,或将为量化投资提供全新视角。
星环科技量化团队判断,面向专业领域发展的企业,可以将自身擅长的厂商结合预训练的语言模型进行优化。企业可在模型后期的SFT(监督微调),RFHL(人类反馈的强化学习)、PPO算法对于预训练模型的定向优化,如金融投研有很多专有知识,需要融合人类研究员或分析师的专业feedback,不断地优化算法结果。
值得一提的是,双方近期也有基于AIGC的相关领域结果发布,包括自动化量化算法编程和生成研究报告。星环科技量化团队认为,虽然是较为初级、不加验证的结论,但是在结合专有领域微调和强化学习融合人类先验知识之后,将把基础投研带到辅助人类投研的一类智能化产品之中。除了研究报告、图文进入统一预训练模型,还有影音频、卫星遥感等多模数据可以进入预训练模型进行优化,有望大幅提升投研效率与准确率,并提升事理推理的广度。
未来,投资机构或相关人员,可以交互式地与此类模型进行高效的投研数据信息挖掘,解决海量的基础投研工作效率问题。融合星环科技多模态数据平台,结合语言大模型预训练调优,将打开智能投研领域AIGC更高维度的应用场景创新,从而更好的服务量化、投研、投顾等一系列专业领域应用建设。
星环科技创始人、CEO孙元浩表示,金融科技结合信息尤其是深度解读,未来在智能量化投研是一个新兴领域,双方在这个细分领域深耕专注服务于量化机构发展。对于下一步,孙元浩明确称:“第一,争取未来实现开放式的平台赋能全行业;其次,基于大模型深度投入研发;第三,结合私募评价体系进行另类量化行业组织构建。”
基于新闻业务的独特数据优势
本次发布的事件驱动量化交易平台,拥有一大核心抓手:数据。财联社旗下星矿数据在其中发挥了尤其重要的作用。
星矿数据是财联社金融信息业务的延伸,财联社目前拥有采编团队500多人,报道内容覆盖全国30多个省市、几千家上市公司,且人员仍处于持续增加阶段。专业、强大的记者团队能够触及更多上市公司,并掌握非标信息和事件现场的一手材料,为及时、准确发现最新资讯提供了可能,更为财联社的非标数据资讯业务奠定了基础。
“为了更快地提高采编的效率,信息传播的效率,服务投资者的效率,我们意识到单靠工人已经无法解决问题,于是建立了数据中枢:星矿数据平台。我们不是为了切入数据而切入数据,是真的被投资者的需求逼到了这一步。涉足后我们发现,除已有数据外,金融市场也会产生大量数据,同时数据再次推动金融研究和决策,再根据后者的行为形成数据,就像不断自我进化的生命力一样。而媒体的本质就是发现变化并报道变化。星矿数据平台的诞生,给记者们带来源源不断的选题。财联社在数据业务方面和其他数据机构存在差异化,我们的未来在应用端,星矿数据会变成一个无限扩展化的数据应用工具平台。”财联社总裁徐安安介绍。
星矿数据产出的数据异动,能够及时被记者发现、使用、验证,而记者采访时的关注点,也能及时形成星矿新的数据字段、数据表,这样的产品闭环是单纯数据供应商所不具备的。
星矿数据在赋能服务媒体业务的同时,通过梳理记者的需求,确定了上市公司某些行为对股价的影响是偏向一致的,根据这些事件变动可以快速做出相应的反馈,比如更换审计、管理层大的变动(CEO、CFO变更)、业绩公布、盈利预期等,通过技术转换生成了大量的数据功能表,这些表既可以用于回顾历史,也可以对股价走势形成一定的预测,从而使得传统的传媒数据具备了量化交易的可能性。
在对内系统相对完善和成熟后,财联社将星矿数据平台进一步拓展,针对券商等机构形成产品,将数据传输给券商,为其自营及资管等业务提供帮助。
其中,星矿舆情事件库能够监测证券市场关联信源,从中采集舆情信息,利用其领先的内容运营能力和成熟的NLP(自然语言处理)技术平台,对采集到的原始数据进行实时处理,形成结构化的舆情事件数据,以流式或数据库的方式,在毫秒级时间内向外提供服务。事件库中的舆情事件结构除时间、人物、内容等事件基本信息外,还包含事件热度、可信度等情绪信息,以及与之关联行业、主体及股票等标签信息。投资机构通过星矿舆情事件库,能够对资本市场重要事件做出迅速反应,及时调整其投资决策。
智能投研多模态统一算法框架








