用ChatGPT轻松玩转机器学习与因果推断
用ChatGPT突破传统学习束缚,解锁AI无限可能!
20217--2024--Stata经典课程新课纲、新升级
AI赋能科研
GPT辅助Stata机器学习与因果推断学术应用
含GPT基础课赠送+因果推断+双重机器学习(Stata操作)等
前沿内容
原理+操作+论文+前沿
超长回放,详询工作人员报名
来源:How to analyze data in STATA with the help of ChatGPT - Data For Development
下面主要谈论关于AI如何在Stata统计数据分析中的使用
提供上下文
我首先给ChatGPT提供了我想要做什么的上下文。在数据分析支持的情况下,你可以通过粘贴整个数据集(根据我的测试,ChatGPT目前能够读取不超过250行的数据)来做到这一点。你也可以简单地解释或粘贴你的代码簿,即你数据集中变量的定义。我选择了后者。
这是我的提示:
以下是一份关于5岁以下儿童营养的数据集的代码簿。阅读并理解,因为我将需要你的帮助使用STATA版本13来分析数据。
变量名 标签 值
ID 案例ID 从1到413的数字
hmi 家庭月收入 美元
phe 父母最高教育 1=无教育,2=小学,3=中学,4=大学
cbw 儿童出生体重 千克数
s 儿童性别 1=男,2=女
cam 儿童年龄 月数
ChatGPT回应说它已经阅读并理解了上下文:
尽管它随后要求我粘贴数据集,知道ChatGPT在记忆上下文和阅读非常长的提示方面的限制,我继续要求对如何分析数据进行洞察。
注意:在这个演示中,我使用的是GPT-3.5模型。如果你付费使用ChatGPT并且可以访问GPT-4,我强烈建议你使用它,因为它在创造性思维方面表现出色,并且有很大的上下文窗口。
1、要求分析数据
如果你不确定你可以对数据进行什么样的分析,你所要做的就是要求洞察。我问了:
我可以从数据集中提取什么问题?
我得到的回答是令人震惊的。ChatGPT能够建议几乎所有你想要从数据集中提取的东西:
从这一点开始,我所需要做的只是询问我可以如何在STATA中运行这些分析。
获取你可以用于在STATA中分析数据的命令
有了我可以从数据集中提取的问题;下一步是询问我可以使用什么样的命令在STATA中。这是我的下一个提示:
我应该使用什么STATA命令来运行第1点中描述的描述性统计?
在这种情况下,我指的是ChatGPT在之前的回答中建议的描述性统计。
在其回应中,我得到了3个单独的STATA summarize命令,用于总结数据集中的连续变量。
我尝试运行它给我的命令,它们都没有错误地运行了。
接下来,我想探索ChatGPT建议我可以分析的性别差异。这是我的提示:
我应该使用什么STATA命令来探索儿童出生体重的性别差异,包括一个图表
这是我得到的部分回应:
不幸的是,在STATA中运行命令时出现了错误。所以我不得不带着我得到的错误回到ChatGPT。这是我的下一个提示:
我得到了一个错误:
. summarize cbw, by(s)
option by() not allowed
r(198);
ChatGPT回应说它在命令建议中犯了一个错误——summarize命令没有内置的by()选项。
我尝试了它给我的新建议,它在STATA中像魅力一样工作。
我也尝试了建议的图表,虽然它们并不是我在这个情况下会使用的图表,但是命令没有问题地运行了。
这就是为什么即使有ChatGPT的帮助,你仍然需要了解你的统计数据分析。我建议你不仅会学习命令,还会学习分析背后的统计基本原理。
在我的情况下,我会使用一个条形/柱状图,类别在x轴上,儿童平均出生体重在y轴上。如果我要帮助这个命令,我所要做的就是问ChatGPT告诉我
获取解释和报告的帮助
最后,有了我从STATA得到的结果,我寻求ChatGPT的帮助来解释和撰写报告。我开始粘贴STATA的输出,然后要求解释和报告。这是我的提示:
性别 | 儿童出生体重的总结
孩子 | 平均值 标准差 频率
------------+------------------------------------
女性 | 2.6080303 .34159919 198
男性 | 2.9938605 .34173072 215
------------+------------------------------------
总计 | 2.8088862 .39204185
用APA格式写出解释和报告
正如预期的那样,ChatGPT接着提供了我的研究结果的解释和撰写如下:
有趣的是,在报告中,它包括了t统计量,这些并不在我提供的输出中。我强烈建议你在简单地复制并粘贴ChatGPT的文本到你的报告之前,先运行STATA中的t检验。
结论
像ChatGPT这样的人工智能工具的使用代表了进行研究的学生、研究人员和数据分析师的巨大机会。虽然在某些情况下并不完美,我们现在能够更快地学习,更容易地从数据中提取洞察,并在我们的数据分析和报告过程中获得我们需要的帮助
你可以在这里查看完整的对话: