外国博士:中国博士很优秀，但很爱跪舔导师，这样不好！我说了不要用神经网络建模！

文摘 2025-01-27 09:03 荷兰

中国学生往往在学术道路上走得小心翼翼，不管是在国内读博还是国外读博，对导师的话总是奉若神明，仿佛踩在随时会裂开的薄冰上。他们看着国外学生在课堂上拍着桌子，语气坦然地对导师说：“你说的不对”那种自信和松弛仿佛一种奢侈品，让人心生羡慕又带着不解。中国学生的基础素养，动手能力和创造性并不比外国学生差，但为什么总是在课题组承担最辛苦，最艰难的研究方向？与很多欧洲，甚至是非洲学生相比，东亚背景的学生，为什么总是陷在“服从”的模式里？是文化的敬畏，是教育的规训，还是内心深处对权威的无法摆脱？在国内容易成功的“人情世故”，在国外反而是束缚你自由发展的枷锁。中国留学生，你有资格更自信！

那么在机器学习领域，要想更自信的展示结果，神经网络是一个不错的选择。神经网络是机器学习领域的关键方法之一，尤其在处理非线性问题时展现了强大的能力。今天的更新将带您从基础了解神经网络的概念，实现一个完整的建模与可视化流程。

什么是神经网络？
神经网络是一种受生物神经系统启发的计算模型，由多层人工神经元组成，包括输入层、隐藏层和输出层。其关键功能是通过调整连接权重和偏置，以最小化模型预测误差。下图展示了一个简单的神经网络结构：

graph TD
A[输入层] --> B1[隐藏层1]
A --> B2[隐藏层1]
B1 --> C[输出层]
B2 --> C[输出层]

常用激活函数包括 ReLU、Sigmoid 和 Tanh，而优化器如梯度下降（Gradient Descent）负责模型的权重调整。

神经网络的科研应用

生物信息学：预测蛋白质结构和基因表达模式。
医学影像：如癌症病灶检测、MRI图像分类。
经济预测：时间序列预测，如股票市场趋势分析。
自然语言处理：情感分析、机器翻译。

R 实现神经网络建模与可视化

我们以一个回归问题为例，使用 R 的 neuralnet 包创建并训练一个神经网络模型，并通过优化的可视化来展示实际值与预测值的对比关系。

代码实现：

# 加载所需包
library(neuralnet)
library(ggplot2)
library(scales)
# 生成示例数据
set.seed(123)
data <- data.frame(
  x1 = runif(100, 0, 10),
  x2 = runif(100, 0, 10)
)
data$y <- data$x1^2 + data$x2^2 + rnorm(100, sd = 5)

# 数据标准化
normalize <- function(x) (x - min(x)) / (max(x) - min(x))
data_normalized <- as.data.frame(lapply(data, normalize))

# 数据划分
train_data <- data_normalized[1:80, ]
test_data <- data_normalized[81:100, ]

# 构建神经网络模型
nn_model <- neuralnet(
  y ~ x1 + x2, 
  data = train_data, 
  hidden = c(5, 3),  # 两层隐藏层，分别有5和3个神经元
  linear.output = TRUE,
  lifesign = "minimal"
)
# 可视化神经网络结构
plot(nn_model)

# 模型预测
predictions <- compute(nn_model, test_data[, c("x1", "x2")])$net.result
results <- cbind(test_data["y"], Predicted = predictions)

# 反标准化（将预测值恢复原始范围）
results$Actual <- test_data$y * (max(data$y) - min(data$y)) + min(data$y)
results$Predicted <- results$Predicted * (max(data$y) - min(data$y)) + min(data$y)

# 高质量可视化
ggplot(results, aes(x = Actual, y = Predicted)) +
  geom_point(color = "#1b9e77", size = 2.5, alpha = 0.8) +
  geom_smooth(method = "lm", se = FALSE, color = "#d95f02", linetype = "dashed", size = 1) +
  scale_x_continuous(name = "实际值 (Actual)", breaks = pretty_breaks(n = 5)) +
  scale_y_continuous(name = "预测值 (Predicted)", breaks = pretty_breaks(n = 5)) +
  labs(
    title = "神经网络预测：实际值与预测值对比",
    subtitle = "可视化展示回归效果",
    caption = "数据来源：模拟生成 | 图表由 ggplot2 制作"
  ) +
  theme_classic(base_size = 14) +
  theme(
    plot.title = element_text(face = "bold", size = 18, hjust = 0.5),
    plot.subtitle = element_text(size = 14, hjust = 0.5),
    axis.title = element_text(size = 14, face = "bold"),
    axis.text = element_text(size = 12),
    plot.caption = element_text(size = 10, hjust = 1, face = "italic")
  )

通过训练的神经网络模型，我们得到了实际值与预测值之间的良好拟合效果，同时通过优化的可视化图表展示了回归结果的高质量信息表达。这种结合神经网络建模与可视化的方法，有助于提高科研结果的可解释性。

小结

本文通过 R 的 neuralnet 包实现了一个简单的神经网络回归模型，并展示了预测结果的高质量可视化。对于科研工作者来说，R 提供了强大的神经网络建模与可视化支持，在领域如医学、经济学、生物信息学中均能发挥重要作用。如果你希望获得更多可复制的R、Python代码，欢迎点击下方名片，关注我们！

感谢关注，你的支持是我不懈的动力！

科研代码

专注R和Python的数据分析。

DeepSeek血屠三万亿美股！谁还用ChatGPT啊？用Python演示什么是可生成式AI。

外国博士:中国博士很优秀，但很爱跪舔导师，这样不好！我说了不要用神经网络建模！

外导当众羞辱新生：“你的代码都是ChatGPT复制的”。请学会用代码补全写Python！

外导震惊：韩国学生不让我过中国新年？我不想吃辣白菜，我要用XGBoost发论文！

审稿人：不要学老外，用深度学习“灌水”发论文，30个样品，有必要上深度学习吗?

青椒注意：有必要提示学生“上课没用”，特别是数据分析，从描述性统计开始！

导师说学会Python必备代码，准备发NCS论文，太吓人了！

审稿人：给我看看原始数据好吗？你的回归模型的准确率太高了！

退学博士破防痛哭：读研不是上岸，曾经熬夜用R优化模型！

一年涨粉4万！公众号“科研代码”2024年创作回顾

搞科研，原来“模仿”才是最快发论文的方法？

韩国教授吐槽中国博士:“英语不好，Python虚拟环境也不会！！”

粉丝赠书！一法破万法，《AI帮你赢：人人都能用的AI方法论》

博士答辩：发8篇SCI论文的好学生答不出置信区间的含义？不开玩笑，这很普遍！

缅甸军阀：印度博士听话加班不睡觉，泰国快快给我送，写R代码，做正态分布！

导师：求求你！我的学生祖宗，把数据用R清洗好了再建模，不就不报错了吗？

海归博导：我以为R包的安装不用教，直到遇到自己的学生

Follow Michael, english data analysis中英双语数据分析教程来了，还有视频呢！

坚持用R画正确的中国地图，审稿人无能狂怒！

导师：你不会用R做数据筛选，那还不如用Excel

医学数据：我写好这个模型的代码，主任当场给我敬酒！

审稿人：为什么行业大牛的论文总喜欢用这个图？3个R包就能做！

印度青椒：我的爸爸不是校长，我还有希望吗？

审稿人：你以为100%准确率是好事吗？恰恰相反，都overfitting了！

海归博导：中国学生要自信！1个中国的好硕士顶国外的3个博士，组学数据分析已经超越国外同龄人！

审稿人：要警惕打着机器学习的名义“造”论文，特别是判别分析（LDA）

导师：人家隔壁组5行代码就做出了RCS图，你们行不行！

医学科研绘图：年底了，我还在做火山图返修论文，圣诞老人当场对我敬礼！

审稿人：一个Cox比例风险模型，拯救多少医学人的数据分析！

学R语言，看这两本教程就够了

裁员了，很严重，大家做好准备吧！

医学科研绘图：我用R画出这三个图，印度审稿人当场向我敬礼！

“颜值就是影响因子”：R可视化美学提升之条形图代码

资深博导：我从不反对用ChatGPT搞科研，但你得学会用啊！报个班吧，组里给你花钱！

审稿人：看在你弦图好看的份上，勉强大修！R画的吧？

tiff还是png？原来R做PCA绘图可以随意设置分辨率。300dpi，提交！

资深博导：你得学会用R导出图表啊！你是想给我代码让我自己run吗？

为什么说在中国做科研最忌讳踏实？

审稿人：你都用ggplot2画图了，就不能提高下审美吗？

视频教程：主成分分析，视频号，已出道！

打破记录！“真心建议” 大家读一下这篇《Nature》重磅文章

审稿人：PCA的误区就是"分类"，但Python可以画得很漂亮！

审稿人：神经网络就比线性模型高级吗？R代码一模一样！

今年顶会这情况。。。大家提前做准备吧！

资深博导：你用上中下三种方法重新画一个聚类分析图，准备发NC!

堪比诺奖级别！曾被审稿人拒稿多次，R和python惊现神级操作，还得是寒门学子！

审稿人：贝叶斯分类模型不是“画圈圈”，跟判别模型其实不一样！

审稿人：我看的是你的三种回归建模吗？，我要的你的诚意！同意接收！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉