Stata绘图:精美的散点图和线性拟合图-scatterfit-slopefit

文摘   教育   2024-10-06 22:01   中国  

👇 连享会 · 推文导航 | www.lianxh.cn

🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

 课程特色 · 2024机器学习与因果推断

  • 懂原理、会应用。本次课程邀请了两位老师合作讲授,目的在于最大限度地实现理论与应用的有机结合。为期四天的课程,分成两个部分:第一部分讲解常用的机器学习算法和适用条件,以及文本分析和大语言模型;第二部分通过精讲 4-6 篇发表于 Top 期刊的论文,帮助大家理解各类机器学习算法的应用场景,以及它们与传统因果推断方法的巧妙结合。
  • 以 Top 期刊论文为范例。目前多数人的困惑是不清楚如何将传统因果推断方法与机器学习结合起来。事实上,即便是 MIT 和 Harvard 的大牛们也都在「摸着石头过河」。为此,通过论文精讲和复现来学习这部分内容或许是目前最有效的方式了。张宏亮老师此前在浙江大学按照这一模式教授了「因果推断和机器学习」课程,效果甚佳:学生们能够逐渐建立起研究设计的理念,并在构造识别策略时适当地嵌入机器学习方法。 


温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

作者:刘东 (中国农业大学)
E-mail:ld01@cau.edu.cn

Source:https://github.com/leojahrens/scatterfit


目录

  • 1.简介

  • 2.安装命令

  • 3. scatterfit 实例

  • 4.slopefit 实例



1.简介

scatterfit 可生成多种散点图并在其上叠加拟合线。它包含两个命令:scatterfit 用于可视化两个变量 x 和 y 之间的关系,slopefit 用于可视化在另一个连续变量 z 条件下 x 和 y 之间的关系。

2.安装命令

. ssc install scatterfit, replace 
. help scatterfit
. help slopefit

要求: Stata version 13.1 及以上版本,并且需要安装 gtools, ftools, palettes, colrspace, blindschemes, labutil 命令。

. ssc install gtools
. ssc install ftools
. ssc install palettes
. ssc install colrspace
. ssc install blindschemes
. ssc install labutil

3. scatterfit 实例

调入数据

. sysuse "auto.dta", clear

画出表示 weight 和 length 之间的散点图

. scatterfit weight length

在散点图的拟合线上添加置信区间

. scatterfit weight length, fit(lfitci)

局部多项式拟合

. scatterfit weight length, fit(polyci) bw(10)

bwidth(num)表示用于控制局部多项式或 LOWESS 平滑拟合线平滑程度的带宽参数。

按照不同的分类 ( 是否为 foreign)展示 weight 和 length 之间的散点图和拟合线

. scatterfit weight length, by(foreign)

将 X 轴变量基于分位点切分成大小相等的区间,并在这些区间内绘制 Y 变量和 X 变量的均值

. scatterfit weight length, binned nq(20)

nq(num) 表示选择等大小的分组 / 分位数的数量。参数 num 用于指定要将变量分成多少个等大小的组 / 分位数。具体来说,该命令将变量的值分为 num 个等大小的分组 / 分位数,以进行后续的分析或可视化。

scatterfit 可以对数据进行预处理,以便在考虑控制变量后,仅显示 x 和 y 变量之间的残差协变关系。这是通过首先在控制变量上回归 x 和 y 变量,然后使用残差进行绘图来实现的

. scatterfit weight length, controls(trunk) ///
fcontrols(foreign) ///
regparameters(coef sig pval)

4.slopefit 实例

Slopefit 可以在一个连续变量 z 的条件下,可视化 x 和 y 之间的关系。它也可以创建带有拟合线的散点图。散点图和拟合线都显示了在不同的 z 值下 x 的斜率(即效应)。拟合线是从一个简单的交互模型中得出的,该模型假设 x 的效应随 z 线性变化。相比之下,散点图显示了在用户定义的 z 分组中(例如,z 的第一十分位数等)x 的效应。这些单独的斜率是从一个交互回归模型中得出的,该模型使用 z 的分解版本来获取不同子集的 z 的分别斜率系数。

有几种方法可以创建 z 的分段。与 scatterfit 一样,标准设置是根据分位数截断点将 z 分类为等大小的分段。

. slopefit weight length turn, ///
indslopes(quantiles) nquantiles(20)

此时,拟合线显示了连续交互模型的结果,最底部的散点标记显示的是在 z 分布的最低 5% 范围内 x 的效应。

scatterfit 类似, 也可以通过将 z 排序为等间距的分段来创建这些分段。the bins can also be created by sorting z into equally spaced bins.

. slopefit weight length turn,  ///
indslopes(unibin) nunibin(20)

或者将 z 本身视为离散变量, 并使用 z 的每个不同的值来创建分段。这意味着将 z 的每个不同取值单独作为一个分段,并在每个分段中计算 x 的效应。

. slopefit weight length turn,  ///
indslopes(discrete)

也可以附加 indslopesci 选项,以绘制个别斜率的置信区间,对于每个不同的左右自我定位值,都可以进行绘制。indslopesci 的作用是计算和绘制个别斜率的置信区间。该选项通常用于多元回归分析中,用于检验每个自变量的效应是否显著。

. slopefit weight length turn,  ///
indslopes(discrete) ci indslopesci



🍓 课程推荐:2024 机器学习与因果推断专题
主讲老师:司继春 (上海对外经贸大学) ;张宏亮(浙江大学)
课程时间:2024 年 11 月 9-10 日 ;16-17日
课程咨询:王老师 18903405450(微信)

尊敬的老师 / 亲爱的同学们:

连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!

New! Stata 搜索神器:lianxh 和 songbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
  . ssc install lianxh
  . ssc install songbl
👉  使用:
  . lianxh DID 倍分法
  . songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。

连享会
连玉君老师团队分享,主页:lianxh.cn。白话计量,代码实操;学术路上,与君同行。
 最新文章