使用scikit-learn进行机器学习

科技   2024-09-22 21:16   广东  

 今天是生信星球陪你的第992天


   

公众号里的文章大多数需要编程基础,如果因为代码看不懂,而跟不上正文的节奏,可以来找我学习,相当于给自己一个新手保护期。我的课程都是循环开课,点进去咨询微信↓

生信分析直播课程(9月30日下一期)

生信新手保护学习小组(10月初下一期)

单细胞陪伴学习小组(10月初下一期

机器学习:计算机能够学习从数据中做出决策,而无需具体编程!
这里是Datacamp网站机器学习课程的学习记录,课程目录如下:

1.无监督学习

从未标记的数据中发现隐藏的模式,例如聚类。

2.监督学习

预测值是已知的,分析的目的是根据特征预测未见过的数据的目标值
监督式学习的类型:
分类: 目标变量是分类型数据
回归: 目标变量是连续型数据

3.命名约定

feature = predictor variable = independent variable
(特征 = 预测变量 = 自变量 )
Target variable = dependent variable = response variable
(目标变量 = 因变量 = 响应变量)

4.数据要求

无缺失值
numeric格式的数据
数据存储在 pandas DataFrame 或 NumPy array中
先执行探索性数据分析 (EDA)

5.scikit-learn 的一般语法

(不是可以直接运行的代码)
from sklearn.module import Model
model = Model()
model.fit(X, y)
predictions = model.predict(X_new)
print(predictions)
## array([0, 0, 0, 0, 1, 0])

算是又开启了一段新的学习历程。同时开启python的单细胞和机器学习环节。后面继续分享。


生信星球
一个零基础学生信的平台-- 原创结构化图文/教程,精选阶段性资料,带你少走弯路早入门,收获成就感,早成生信小能手~
 最新文章