普林斯顿大学机器学习的250页讲义, 看了后学机器学习变简单多了.

学术   2024-11-02 12:15   美国  

凡是搞计量经济的,都关注这个号了

箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

下面长达250页的讲义是普林斯顿大学机器学习课程的辅助材料。该课程旨在为学生提供全面的机器学习知识体系,涵盖监督学习、无监督学习、深度学习和强化学习等多个领域,为学生未来在机器学习、人工智能和数据科学领域的深造或独立研究打下坚实的基础。课程内容包括但不限于线性模型在分类与回归中的应用、聚类技术、低秩表示(如主成分分析)、n-gram语言模型、矩阵分解技术、前馈神经网络和卷积神经网络,以及马尔可夫决策过程和强化学习等。每个模型都配有生动的应用案例,帮助学生更好地理解和掌握这些概念。
全面介绍人工智能与机器学习:在过去的十年中,深度学习及其相关技术极大地推动了人工智能和机器学习领域的发展。因此,本讲义致力于为学生打下扎实的深度学习和强化学习基础。这样,即便是那些不打算继续选修其他人工智能或机器学习课程的学生,也能掌握对他们未来职业生涯有益的机器学习技能。当然,将课程的后半部分聚焦于这些“高级”主题,意味着必须对一些传统初级机器学习课程中的内容进行精简。
让学生体验现代编程环境:本课程将引导学生从零开始学习Python编程,并逐步深入。学生将有机会在Google Colab平台上实践深度学习,并在OpenAI Gym环境中体验强化学习的魅力。
讲义结构
这些讲义分为六个主要部分:
第一部分介绍监督学习。主题包括线性回归、线性分类和梯度下降。
第二部分讲解无监督学习。主题包括聚类、降维、n-gram语言模型和矩阵分解。
第三部分涵盖深度学习的基础知识。主题包括前馈神经网络和卷积神经网络。
第四部分介绍强化学习。主题包括马尔可夫决策过程和Q学习。
第五部分介绍一些机器学习的高级应用。主题包括机器学习的伦理以及深度学习在自然语言处理中的应用。
第六部分提供一些与机器学习相关的数学背景知识。主题包括概率论、微积分和线性代数。
机器学习的基本要素
机器学习是一门致力于开发能够根据数据或经验自动提升性能的决策程序的学科。这一过程主要涉及以下几个核心要素:
数据:拥有一组用于训练的数据集。这些数据可能包含一个额外的标签字段。如果数据带有标签,那么学习的目的便是预测新数据的标签,这种学习方式称为监督学习,例如回归(第1章、第5章)或分类(第4章)。若数据未带标签,学习的目标则转变为提取数据的内在结构,这种学习方式称为无监督学习,如聚类(第6章)或降维(第7章)。
模型:构建一个模型,希望通过学习来掌握其运作机制。模型本质上是从数据点到预期答案或输出的映射过程。在监督学习中,预期答案是数据的标签;而在无监督学习中,输出则是数据的结构。
模型参数:每个模型都由一系列可调整的值或内部参数定义。学习的目标在于寻找这些参数的最佳组合,以实现模型的最佳性能。在训练过程中,这些参数的值会不断更新或调整。
模型拟合:基于提供的数据确定最佳(或足够好)的模型参数值的过程称为模型拟合。评估模型性能有多种方法,其中一种常见的方法是定义损失函数,用以衡量模型预测与实际输出之间的差异。在第4章中,将探讨如何为不同类型的模型定义相应的损失函数。
测试:在很多情况下,尤其是在监督学习中,关心模型在新数据上的表现。这个过程称为模型测试。通常,会用一部分数据(比如80%)来训练模型,而用剩余的数据(比如20%)来测试模型。这部分用于测试而非训练的数据被称为保留数据,假设它是整个数据集的一个良好代表。

关于机器学习,参看:1.机器学习之KNN分类算法介绍: Stata和R同步实现(附数据和代码),2.机器学习对经济学研究的影响研究进展综述,3.回顾与展望经济学研究中的机器学习,4.最新: 运用机器学习和合成控制法研究武汉封城对空气污染和健康的影响! 5.Top, 机器学习是一种应用的计量经济学方法, 不懂将来面临淘汰危险!6.Top前沿: 农业和应用经济学中的机器学习, 其与计量经济学的比较, 不读不懂你就out了!7.前沿: 机器学习在金融和能源经济领域的应用分类总结,8.机器学习方法出现在AER, JPE, QJE等顶刊上了!9.机器学习第一书, 数据挖掘, 推理和预测,10.从线性回归到机器学习, 一张图帮你文献综述,11.11种与机器学习相关的多元变量分析方法汇总,12.机器学习和大数据计量经济学, 你必须阅读一下这篇,13.机器学习与Econometrics的书籍推荐, 值得拥有的经典,14.机器学习在微观计量的应用最新趋势: 大数据和因果推断,15.R语言函数最全总结, 机器学习从这里出发,16.机器学习在微观计量的应用最新趋势: 回归模型,17.机器学习对计量经济学的影响, AEA年会独家报道,18.回归、分类与聚类:三大方向剖解机器学习算法的优缺点(附Python和R实现),19.关于机器学习的领悟与反思
20.机器学习,可异于数理统计,21.前沿: 比特币, 多少罪恶假汝之手? 机器学习测算加密货币资助的非法活动金额! 22.利用机器学习进行实证资产定价, 金融投资的前沿科学技术! 23.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!24.用合成控制法, 机器学习和面板数据模型开展政策评估的论文!25.更精确的因果效应识别: 基于机器学习的视角,26.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法,27.如何用机器学习在中国股市赚钱呢? 顶刊文章告诉你方法!28.机器学习和经济学, 技术革命正在改变经济社会和学术研究,29.世界计量经济学院士新作“大数据和机器学习对计量建模与统计推断的挑战与机遇”,30.机器学习已经与政策评估方法, 例如事件研究法结合起来识别政策因果效应了!31.重磅! 汉森教授又修订了风靡世界的“计量经济学”教材, 为博士生们增加了DID, RDD, 机器学习等全新内容!32.几张有趣的图片, 各种类型的经济学, 机器学习, 科学论文像什么样子?33.机器学习已经用于微观数据调查和构建指标了, 比较前沿!34.两诺奖得主谈计量经济学发展进化, 机器学习的影响, 如何合作推动新想法!35.前沿, 双重机器学习方法DML用于因果推断, 实现它的code是什么?

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章