大家好,我是小寒。
概述
这里将进行 2 个不同的实验。
实验一
现在让我们开始第一个实验。
我将考虑「黑色星期五销售数据集。」
该公司希望了解客户的购买行为以实现个性化。
在第一个提示中,我将向 ChatGPT 介绍数据集及其内容。
提示 1
你将获得包含客户交易的零售店数据集。每行包含客户人口统计信息、产品详细信息和上个月的总购买金额。下面给出了示例数据集。

现在,ChatGPT 响应请求数据集。
在下一个提示中,「我将提供黑色星期五销售数据集的示例数据。」
提示 2


提示3
我希望你充当数据科学家并为我编写代码。请建立一个机器学习模型来预测上述数据集中的 Purchase 变量。

如你所见,ChatGPT 为我们提供了构建机器学习模型的代码。
我们将代码复制到 jupyter notebook 中进行运行,上面的代码抛出错误。

下面我们让 ChatGpt 自己来对错误进行修复。
提示4
上面的代码报错。年龄列 "55+" 不能转换为 int。


我们接着让 ChatGpt 来对错误进行修复。
提示5
上述代码是错误的。ValueError: could not convert string to float: '4+'

我们继续将代码复制到 jupyter notebook 中进行运行,它真的成功运行了。

实验二
从第一个实验中学到的一些知识是:
始终提供详细的提示以实现预期的结果。 如果错误,请告诉 ChatGPT 修复代码。它可以修复自己的代码。
现在,我们将开始实验 2。
提示一
你将获得包含客户交易的零售店数据集。每行包含客户人口统计信息、产品详细信息和上个月的总购买金额。下面给出了示例数据集。

提示二

提示三
我希望你充当数据科学家并为我编写代码。请建立一个机器学习模型来预测上述数据集中的 Purchase 变量。包括数据预处理步骤,例如删除不必要的 ID 列、编码分类变量、处理缺失值等。



结论
在本文中,我们了解了如何将 ChatGPT 用于数据科学。
最后,我们理解了「正确提示对于数据科学家从 ChatGPT 获得预期结果的重要性。」
最后
—
「进群方式:加我微信,备注 “python”」

往期回顾







如果对本文有疑问可以加作者微信直接交流。进技术交流群的可以拉你进群。





