作者按
统计学习或机器学习是统计学、数据科学和人工智能中一个重要的分支,其思想、方法和理论是大数据和人工智能科学技术的基础和核心,在人工智能大数据时代具有重要的基础作用。统计学习或机器学习不仅能从庞大的数据中提炼有价值的信息,还能实现数据的清洗与整合、数据的建模与预测、数据的可视化与智能化。它已在生物、医学、经济、金融、环境科学、抽样调查及工程技术等领域得到越来越广泛的应用,尤其是在大数据技术迅速发展的今天,它的重要性更加凸显。因此,统计学习或机器学习已被国内外多数高等院校列入本科生和研究生所学习或研究的内容之一。今天为大家介绍“大数据时代的统计与人工智能系列教材”中的新成员《统计学习(R语言版)》。
内容简介
本书特色
第一,内容广泛,体系完整,逻辑清晰。本书共15章内容,从统计学习的基本概念和基础知识出发,严谨并系统地介绍了各种统计学习方法的思想、原理和理论,突出每种方法的适用范围,形成了一个完整且逻辑清晰的知识体系,有助于读者系统学习和掌握统计学习内容,达到学有所用。
第二,强调方法的思想性,理论与应用并重。本书特别注重揭示每种统计学习方法的思想和理论,帮助读者理解方法的本质和适用场景,从而能够灵活运用这些方法解决复杂问题。本书理论与应用并重,不仅深入浅出地阐述了统计学习的基本思想、原理和理论,还通过大量实例和案例分析,将理论与应用紧密结合,使读者既能具备扎实的理论基础,又能提升解决实际问题的能力。
第三,注重编程,突出数据可视化。本书除了介绍每种统计学习方法的程序包和核心函数外, 更重要的是突出编程思想, 培养读者应用R语言进行编程和数据分析的能力,加深对每种统计学习方法的理解和掌握。数据可视化是本书的一大特色,对数据分析结果进行可视化,使读者能更直观地对各种统计学习方法进行比较和评价。
第四,主题明确,重点突出。本书以统计模型的预测能力为主题,围绕平衡偏差和方差这条主线,对各种统计学习方法以及各种统计方法在数据分析中的优缺点展开介绍,阐释了不同统计学习方法如何平衡偏差和方差,避免过拟合和欠拟合,达到最优的数据拟合效果和预测能力,并重点突出各种统计学习方法的数据驱动思想。
第五,丰富教学资源,方便教与学。本书提供与本课程相关的电子资源,如课件、程序、数据、彩图等数字化学习资料,以及与统计学习和机器学习相关的丰富教学资料,可以满足学生主动学习和教师备课的需求,丰富教与学的过程, 提高教与学的效果。
作者简介
李高荣,北京师范大学统计学院教授,博士生导师,北京师范大学第十二届“最受本科生欢迎的十佳教师”。目前为中国现场统计研究会第十一届理事、中国数学会概率统计分会第十二届理事、中国工业互联网研究院技术专家委员会专家、中国现场统计研究会统计交叉科学研究分会常务理事和多元分析应用专业委员会常务理事等。主要研究方向是非参数统计、高维统计、统计学习、纵向/面板数据分析、测量误差数据和因果推断等。发表学术论文120多篇,出版4部著作,主持国家和省部级科研项目10多项。
本书目录
样章试读
电子资源获取
《统计学习(R语言版)》的电子资源,读者可扫左边二维码关注公众号(BNUlgr),获取本书相关的电子资源,包括课件、程序、数据和彩图等,供读者在线学习。读者也可以扫右边高等教育出版社关于本书的二维码,获取本书的程序、数据、彩图和课件申请表。电子资源只能用于本书的教学和学习,不得用于商业盈利之目的,请大家遵守版权协议,否则将承担相应后果。
使用本书作为教材的老师,请下载附件的“统计学习(R语言版)课件”(见下面附件),填写申请表,盖学院或系的公章,扫描并发送电子版到:ligaorong@bnu.edu.cn,文件名以:教师名+学校命名,教师在使用本书课件时,请遵守使用协议。也请各位专家、老师和同学多提宝贵意见。