PostgresML 是一个端到端的机器学习系统。它使您能够仅使用 SQL 来训练模型并进行在线预测,而您的数据永远不会离开您最喜欢的数据库。
PostgresML——使用PostgreSQL 进行简单的机器学习
仅使用 SQL 和 Postgres 的开源扩展来训练和部署模型以进行在线预测。使用内置仪表板管理您的项目并可视化数据集。

仪表板使跨模型和数据集比较不同的算法或超参数变得容易。

看看它的实际效果——demo.postgresml.org
box 里装了什么
有关功能的完整列表,请参阅文档(https://postgresml.org/)。
所有你喜欢的算法
无论您需要简单的线性回归还是极端梯度提升,我们都支持Scikit Learn和XGBoost中的所有分类和回归算法,无需额外配置。
托管模型部署
模型可以定期重新训练并根据其关键指标自动升级到生产环境。提供回滚功能以确保您始终能够提供最高质量的预测以及所有部署的历史日志以进行长期研究。
在线和离线支持
通过标准 Postgres 连接提供预测,以确保您的核心应用程序始终可以实时访问您的数据和模型。纯 SQL 工作流还支持批量预测以将结果缓存在本机 Postgres 表中以供查找。
即时可视化
对数据集运行标准分析,以检测数据集上的异常值、双峰分布、特征相关性和其他常见数据可视化。一切都在仪表板中进行分类,以便于参考。
超参数搜索
在您的训练集上使用带有交叉验证的网格或随机搜索来发现最重要的旋钮来调整您最喜欢的算法。
SQL 原生向量操作
矢量运算使学习嵌入的工作变得轻而易举,例如最近邻搜索或其他相似性比较。
Postgres 的性能
由于您的数据永远不会离开数据库,因此您可以在基础状态服务中保持您期望的速度、可靠性和安全性。利用您现有的基础架构和专业知识来提供新功能。
开源
我们建立在巨人的肩膀上。这些机器学习库和 Postgres 已获得广泛的学术和行业使用,我们将继续他们的传统与社区一起构建。在麻省理工学院获得许可。
快速开始
- 克隆这个 repo:
$ git clone git@github.com:postgresml/postgresml.git
- 启动 dockerized 服务。PostgresML 将在端口 5433 上运行,以防万一您已经运行了 Postgres:
$ cd postgresml && docker-compose up
- 在安装了 PostgresML 的 Docker 容器中连接到 PostgreSQL:
$ psql postgres://postgres@localhost:5433/pgml_development
- 验证您的安装:
pgml_development=# SELECT pgml.version(); version --------- 0.8.1 (1 row)
有关使用 PostgresML的完整指南,请参阅文档(https://postgresml.org/)。

PostgresML官网:https://postgresml.org/
PostgresML GitHub地址:https://github.com/postgresml/postgresml
原文标题:PostgresML——Simple machine learning with PostgreSQL
原文链接:https://github.com/postgresml/postgresml




