GenSQL可以连接和分析以回答有关产品的查询,并且可以轻松集成。
麻省理工学院的研究人员开发了一种用于数据库的生成式人工智能工具,使用户可以分析数据并预测未来数据或填补缺失的信息。
GenSQL 是结构化查询语言 (SQL) 编程语言的扩展,它将概率编程与传统数据库搜索集成在一起。
它允许用户分析现有数据,对未来数据进行预测,并通过将 SQL 与表格数据的概率模型相结合来填充缺失的信息。
这款由生成式 AI 驱动的工具让业务用户能够提出复杂的问题,将实际数据与概率推理相结合,为他们提供有关产品或服务的更细致入微的见解。
该工具旨在让开发人员在数据库中采用概率建模,而无需事先具备概率编程方面的专业知识。
“借助GenSQL,典型用户和专家都可以更轻松且交互式地查询生成模型,以定性和定量地测试其有效性,”该论文写道。
“用户、生成建模者和概率编程系统开发人员之间的这种责任分工可能会帮助我们的社会更安全、更有效地扩大表格数据生成模型的部署。”
数据库正在成为企业人工智能武器库中越来越重要的组成部分,为做出决策提供了大量至关重要的信息。
然而,它们通常是不同的,因为公司通常有分散的独立孤岛,包含各种类型的数据,包括文本、图像和视频。
企业还需要具有技术专长的员工来理解巨大的数据孤岛。
麻省理工学院团队创建了 GenSQL,以简化管理和分析来自各种来源的数据。
研究人员表示,现有的概率编程系统无法支持复杂的数据库查询,也无法有效地将表格数据与生成模型相结合。
他们开发的GenSQL易于使用。用户将他或她的数据和模型上传到GenSQL,GenSQL会自动集成它们。然后,用户可以对多个任务进行搜索,包括数据清理和合成数据生成。
用户还可以开发自定义模型,以便在不同数据源之间进行协调。
在评估GenSQL时,研究人员发现,与以前的系统相比,该工具在检测数据库异常方面更简洁,更不容易出错。
由于其重用优化,该工具还将执行任务的速度提高了近七倍,从而实现了更快的运行时间。
“查看数据并试图通过使用一些简单的统计规则来找到一些有意义的模式可能会错过重要的交互,”GenSQL项目的主要作者Mathieu Huot告诉麻省理工学院新闻。 “你真的想在模型中捕获变量的相关性和依赖性,这可能非常复杂。借助GenSQL,我们希望使大量用户能够查询他们的数据和模型,而无需了解所有详细信息。




