暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

如何使用ChatGpt进行数据分析

程序员学长 2023-04-13
548

大家好,我是小寒。

在本文中,我对 ChatGPT 进行了测试,并要求它「自动生成数据科学问题的解决方案。」
       ​

概述

这里将进行 2 个不同的实验。

在第一个实验中,我想看看 ChatGPT 是否可以帮助我,编写在特定数据集上构建机器学习模型的代码。
在第二个实验中,我们将吸取实验 1 的经验教训并重新设计提示,以获得预期结果。

实验一

现在让我们开始第一个实验。

我将考虑「黑色星期五销售数据集。」

该数据集包含零售店的客户交易,包括「客户人口统计数据、产品详细信息和总购买金额。」

该公司希望了解客户的购买行为以实现个性化。

因此,问题是建立一个机器学习模型,以根据客户人口统计数据和过去购买的产品来预测购买量。

在第一个提示中,我将向 ChatGPT 介绍数据集及其内容。

提示 1

你将获得包含客户交易的零售店数据集。每行包含客户人口统计信息、产品详细信息和上个月的总购买金额。下面给出了示例数据集。

现在,ChatGPT 响应请求数据集。

在下一个提示中,「我将提供黑色星期五销售数据集的示例数据。」

由于 chatgpt 不支持上传文件,所以「我们将从数据集中复制并粘贴大约 100-150 行。」

提示 2

现在,我们让 ChatGPT 编写代码来构建模型,用来预测目标变量 “Purchase”。

提示3

我希望你充当数据科学家并为我编写代码。请建立一个机器学习模型来预测上述数据集中的 Purchase 变量。

如你所见,ChatGPT 为我们提供了构建机器学习模型的代码。

我们将代码复制到 jupyter notebook 中进行运行,上面的代码抛出错误。

下面我们让 ChatGpt 自己来对错误进行修复。

提示4

上面的代码报错。年龄列 "55+" 不能转换为 int。

我们继续将代码复制到 jupyter notebook 中进行运行,不出所料,又报错了。

我们接着让 ChatGpt 来对错误进行修复。

提示5

上述代码是错误的。ValueError: could not convert string to float: '4+'

我们继续将代码复制到 jupyter notebook 中进行运行,它真的成功运行了

实验二

从第一个实验中学到的一些知识是:

  • 始终提供详细的提示以实现预期的结果。
  • 如果错误,请告诉 ChatGPT 修复代码。它可以修复自己的代码。

现在,我们将开始实验 2。

提示一

你将获得包含客户交易的零售店数据集。每行包含客户人口统计信息、产品详细信息和上个月的总购买金额。下面给出了示例数据集。

提示二

提示三

我希望你充当数据科学家并为我编写代码。请建立一个机器学习模型来预测上述数据集中的 Purchase 变量。包括数据预处理步骤,例如删除不必要的 ID 列、编码分类变量、处理缺失值等。

我们继续将代码复制到 jupyter notebook 中进行运行,它真的直接成功运行了。并且比实验一生成的代码 MSE 小很多。

结论

在本文中,我们了解了如何将 ChatGPT 用于数据科学。

你可以使用 ChatGPT 自动化整个编码。
但有时,ChatGPT 会提供故障和有缺陷的内容。那些时候你需要明确告诉 ChatGPT 修复并重新生成内容。它可以纠正自己的错误并从中学习。

最后,我们理解了「正确提示对于数据科学家从 ChatGPT 获得预期结果的重要性。」


最后



今天的分享就到这里。如果觉得不错,点赞,转发安排起来吧。
接下来我们会分享更多的 「ChatGpt的使用方式以及python相关的技术」,欢迎大家关注。
最后,最近新建了一个 python 学习交流群,会经常分享 「python相关学习资料,也可以问问题,非常棒的一个群」

「进群方式:加我微信,备注 “python”」



往期回顾


Fashion-MNIST 服装图片分类-Pytorch实现

python 探索性数据分析(EDA)案例分享

深度学习案例分享 | 房价预测 - PyTorch 实现

万字长文 |  面试高频算法题之动态规划系列

面试高频算法题之回溯算法(全文六千字)  

    




如果对本文有疑问可以加作者微信直接交流。进技术交流群的可以拉你进群。

文章转载自程序员学长,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论