小羽的书屋:我学数据分析用过的那些书

文摘   2024-09-17 09:01   爱尔兰  
这个公众号的资深读者们都知道我学数据分析基本是自学的,虽然我在上学期间上了大量的学校的课程,但我并不是计算机或者数学专业出身。在学习代码阶段依然要补充很多新的知识,而且代码的世界日新月异,最重要的技能就是持续学习的技能。这个帖子我汇总了我所用过的那些数据分析的教程书,也是一个广告贴,想要自学以及顺便支持下“科研代码关小羽”这个账号的小伙伴欢迎对应链接下单。我相信这些书可以极大地节省初学者的时间,让你高效地使用R/Python来进行数据分析和绘图。
1. R速成-统计分析和科研数据分析快速上手
首先介绍一本《R速成-统计分析和科研数据分析快速上手》,较比经典的《R语言实战 》更适合入门,是挪威心理学教授和神经科学教授联手写成,第一次在国内推出中文版,由庄亮亮和赵子茜翻译,译者也是国内R语言的大牛。前半部分介绍了R语言的一些基础,后半部分开始介绍R语言统计学上的应用。这本书里介绍了ggplot2很多绘图的知识点和代码,相对于网络上比较零散的信息,参考两本权威的书籍,一定会让你的R使用锦上添花,事半功倍。目前参与跟团购,仅需49.50元。
2. R实战:系统发育树的数据集成操作及可视化》
这本书是南方医科大余光创教授(Y叔)写的关于ggtree数据整合和可视化的书。ggtree由R语言大神Y叔原创,于2018年发表在Molecular Biology and Evolution杂志上,现引用已达2569。ggtree是ggplot2的拓展包,它不仅能画进化树,而且还能对进化树进行丰富多彩的美化和添加多组数据或元素。使用ggtree可以轻松给10分以上的文章画进化树。


90%以上是代码和图,贴近实战,系统地介绍使用treeiotidytreeggtree ggtreeExtra软件包操作系统发育树的全套流程,包括对树文件的解析,以及树与其相关数据的操作、整合、可视化等内容。如果你从事进化、群里遗传学、宏基因组学等研究,可能已经接触了Y叔开发的ggtree,看到这本书的时候会非常熟悉,这本书可以认为是Y叔手把手教你如何用他开发的软件画图。目前参与跟团购,仅需54.50元。
目前本公众号和电子工业出版社合作,99元即可到手2本,也可以单独购买,大家感兴趣的识别下方二维码,进入跟团购,可以冲了。

3. 基础统计学

你见过不断更新再版到第14版的统计学书吗?我们说,评价一本书好坏可以参照的一个标准就是其再版次数,一本书可以出版到第14版,可见其畅销经典程度!而且这本书连续25年在美国统计类教材排名第一,已被翻译成多国文字,堪称国际版统计教材!

这本神书就是《基础统计学(第14版)(双色)》!

书中包括统计学在各个学科领域中的关键应用不限于自然科学、经济学、法学等,任何专业的学生都能在本书中找到与未来工作相关的实际应用。

本书从基础的统计学理论到实际的数据分析,每一章都是知识的珍宝,等待着你的探索!


作者花费数千小时收集的真实数据集配套200多个案例场景生动讲解知识点应用。


全书中94% 的示例和93% 的习题都来自真实数据。部分习题来自附录B中的46个数据集,其中20个数据集是第14 版新增的内容。

需要直接使用数据集的习题,一般可在每章习题集的末尾找到,并标有图标。

4. 《AI for Science:人工智能驱动科学创新》
一本关于人工智能的百科全书!最性价比的系统了解人工智能应用的书。
本书为读者徐徐展开AI for Science的美丽图景,与大家一起去了解:
人工智能究竟帮科学家做了什么?
人工智能将如何改变我们所生活的世界?
本书共分为8章。
  • 第1章介绍了作为全新的科学创新范式的AI for Science的具体含义、底层逻辑,以及大力发展AI for Science的原因。
  • 第2章从科学研究底层的理论模式与主要困境,以及人工智能三要素(数据、算法、算力)出发,对AI for Science的技术支撑进行解读。
  • 第3章介绍了在材料基因组工程的推动下,人工智能如何与材料科学结合,加快传统材料和新型材料的开发过程。
  • 第4章介绍了人工智能在加快药物研发、辅助基因研究方面及在合成生物学中的普遍应用。
  • 第5章介绍了人工智能如何在提高芯片设计的自动化水平、优化半导体制造和封测的工艺和水平、寻找新一代半导体材料等方面提供帮助。
  • 第6章介绍了人工智能在化石能源科学研究、可再生能源科学研究、能源转型三个方面的落地应用。
  • 第7章从环境监测、污染治理、碳减排三个方面介绍了人工智能为环境科学引入的新价值和新机遇。
  • 第8章探讨了AI for Science在快速发展过程中面临的机遇和挑战,并对“平台科研”模式进行了展望。
由于AI for Science与我们每个人息息相关,所以本书适合各界读者阅读,特别是关注该领域的政府工作人员、科研人员、创业者、投资人、科技从业者,以及对人工智能感兴趣的读者。
如果你想洞察未来的科技生态,真的可以来读一读这本书!

5. Python数据分析:

《利用Python进行数据分析(中文版)》是一本全面而实用的数据分析指南,专为中文读者设计,旨在帮助大家掌握数据科学的核心技能。这本书系统地介绍了使用Python进行数据处理、分析和可视化的方法,涵盖了从数据清洗到复杂数据建模的全流程。书中包含大量可直接使用的代码示例,能够瞬间解决科研中的数据分析难题,助力您高效地撰写并发表论文。无论你是数据分析的新手还是希望深化技能的从业者,这本书都将为你提供宝贵的实践经验和理论支持。通过丰富的案例和实践练习,您将学会如何运用Pandas、NumPy、Matplotlib等强大工具,解锁数据背后的潜在价值。

欢迎收藏本贴,持续更新中!


科研代码
专注R和Python的数据分析。
 最新文章