DeepSeek血屠三万亿美股！谁还用ChatGPT啊？用Python演示什么是可生成式AI。

文摘 2025-01-28 09:02 荷兰

最近DeepSeek横空出世，其最大的优势是可以在不使用最新英伟达GPU的基础上，通过优化算法路线，进而达到超越ChatGPT的能力。这就很有想象空间了，这意味着如果进一步增强硬件能力，其模型的表现还可以迎来数量级的增长，怪不得1月27日，阿斯麦、英伟达、博通盘前跌超10%，台积电跌超9%。

同时DeepSeek还有很强的角色扮演能力，受微博上宝玉x博主的启发，我也让DeepSeek模仿“公知语气”，对自己进行一番批判：

哎呀，今天咱们就来聊聊这个所谓的“Deepseek”吧。说实话，每次听到有人吹Deepseek，我都忍不住想笑。你们这些人啊，是不是被国产情怀冲昏了头脑？Deepseek这种东西，也配跟ChatGPT比？真是让人哭笑不得。ChatGPT的模型架构，那可是基于Transformer的，参数量高达1750亿，训练数据覆盖了全球多种语言和文化。Deepseek呢？参数量多少？训练数据从哪里来的？是不是就靠爬点中文网页，凑合凑合就完事了？这种技术差距，简直就是天壤之别！ChatGPT可是全球通用的，支持多种语言，覆盖了全球用户。Deepseek呢？是不是就只能在中文圈子里打转？这种局限性，简直就是自绝于世界！你们这些人啊，是不是觉得只要能在国内用就行，根本不关心国际化？这种狭隘的心态，真是让人失望。

再让DeepSeek模仿“贴吧老哥”的口气，狠狠反驳上述说法：

兄弟们，听我说，现在还在用ChatGPT的，你们是不是还没睡醒？Deepseek才是真正的未来，ChatGPT那玩意儿早就过时了！ChatGPT那玩意儿，用过的都知道，贵得一批！动不动就收费，还搞什么订阅制，简直是抢钱。Deepseek就不一样了，性价比高，功能还强大，谁用谁知道。省下来的钱，买几包烟不香吗？ChatGPT是老美的东西，谁知道他们会不会搞什么小动作？咱们用Deepseek，就不用担心被老美牵着鼻子走。科技自主，才能在国际上有话语权，懂不懂？Deepseek在算法、模型上都做了大量创新，效果杠杠的。ChatGPT那套老掉牙的技术，早就该淘汰了。咱们要用就用最新的，最先进的，别总跟在别人屁股后面跑。人工智能这块，Deepseek才是真正的未来。ChatGPT那玩意儿，顶多算个过渡产品。Deepseek在自然语言处理、图像识别、语音识别等方面都有突破性进展，这才是真正的人工智能。

简直太有趣了，众所周知目前而得大语言模型用的都是可生成式AI技术，虽然我们的读者大多数关注的是“数据分析在科研数据中的应用”，今天我们也不妨探讨的更深入一些，简单介绍什么是可生成式AI?

Python代码教程：什么是可生成AI？

生成式AI（Generative AI）是指能够生成新内容的人工智能系统。这些内容可以是文本、图像、音乐、视频等。与传统的判别式AI不同，生成式AI不仅仅是对已有数据的分类或预测，而是能够创造出全新的、有意义的数据。

生成文本

下面是一个简单的Python代码示例，使用GPT-2模型生成文本：

from transformers import GPT2LMHeadModel, GPT2Tokenizer

# 加载预训练的GPT-2模型和分词器
model_name = "gpt2"
model = GPT2LMHeadModel.from_pretrained(model_name)
tokenizer = GPT2Tokenizer.from_pretrained(model_name)

# 输入提示文本
input_text = "Deepseek is the future of AI because"

# 将文本转换为模型输入格式
input_ids = tokenizer.encode(input_text, return_tensors="pt")

# 生成文本
output = model.generate(input_ids, max_length=50, num_return_sequences=1)

# 解码生成的文本
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)

print(generated_text)

## Deepseek is the future of AI because it is the future of the human race. ## ## The future of AI is not a matter of the future of AI, but of the future of humanity. ## ## The future of AI is not a matter

生成图像

下面是一个简单的Python代码示例，使用GAN（生成对抗网络）生成图像：

import tensorflow as tf
from tensorflow.keras import layers
import numpy as np
import matplotlib.pyplot as plt

# 定义生成器模型
def make_generator_model():
    model = tf.keras.Sequential()
    model.add(layers.Dense(7*7*256, use_bias=False, input_shape=(100,)))
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Reshape((7, 7, 256)))
    model.add(layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False))
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False))
    model.add(layers.BatchNormalization())
    model.add(layers.LeakyReLU())

    model.add(layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh'))

    return model

# 生成随机噪声
noise = tf.random.normal([1, 100])

# 生成图像
generator = make_generator_model()
generated_image = generator(noise, training=False)

# 可视化生成的图像
plt.imshow(generated_image[0, :, :, 0], cmap='gray')
plt.show()

结语：技术之争，背后是价值观的碰撞

Deepseek和ChatGPT的争论，表面上是技术之争，实际上却是价值观的碰撞。希望今天的更新让你了解可生成式AI的基本概念，从而对机器学习，人工智能更感兴趣。相信更多的人工智能技术会被大力引进到不同的学科领域，掌握必要的分析技术越来越成为各个学科的方向之一。

感谢关注，你的支持是我不懈的动力！

科研代码

专注R和Python的数据分析。

DeepSeek血屠三万亿美股！谁还用ChatGPT啊？用Python演示什么是可生成式AI。

外国博士:中国博士很优秀，但很爱跪舔导师，这样不好！我说了不要用神经网络建模！

外导当众羞辱新生：“你的代码都是ChatGPT复制的”。请学会用代码补全写Python！

外导震惊：韩国学生不让我过中国新年？我不想吃辣白菜，我要用XGBoost发论文！

审稿人：不要学老外，用深度学习“灌水”发论文，30个样品，有必要上深度学习吗?

青椒注意：有必要提示学生“上课没用”，特别是数据分析，从描述性统计开始！

导师说学会Python必备代码，准备发NCS论文，太吓人了！

审稿人：给我看看原始数据好吗？你的回归模型的准确率太高了！

退学博士破防痛哭：读研不是上岸，曾经熬夜用R优化模型！

一年涨粉4万！公众号“科研代码”2024年创作回顾

搞科研，原来“模仿”才是最快发论文的方法？

韩国教授吐槽中国博士:“英语不好，Python虚拟环境也不会！！”

粉丝赠书！一法破万法，《AI帮你赢：人人都能用的AI方法论》

博士答辩：发8篇SCI论文的好学生答不出置信区间的含义？不开玩笑，这很普遍！

缅甸军阀：印度博士听话加班不睡觉，泰国快快给我送，写R代码，做正态分布！

导师：求求你！我的学生祖宗，把数据用R清洗好了再建模，不就不报错了吗？

海归博导：我以为R包的安装不用教，直到遇到自己的学生

Follow Michael, english data analysis中英双语数据分析教程来了，还有视频呢！

坚持用R画正确的中国地图，审稿人无能狂怒！

导师：你不会用R做数据筛选，那还不如用Excel

医学数据：我写好这个模型的代码，主任当场给我敬酒！

审稿人：为什么行业大牛的论文总喜欢用这个图？3个R包就能做！

印度青椒：我的爸爸不是校长，我还有希望吗？

审稿人：你以为100%准确率是好事吗？恰恰相反，都overfitting了！

海归博导：中国学生要自信！1个中国的好硕士顶国外的3个博士，组学数据分析已经超越国外同龄人！

审稿人：要警惕打着机器学习的名义“造”论文，特别是判别分析（LDA）

导师：人家隔壁组5行代码就做出了RCS图，你们行不行！

医学科研绘图：年底了，我还在做火山图返修论文，圣诞老人当场对我敬礼！

审稿人：一个Cox比例风险模型，拯救多少医学人的数据分析！

学R语言，看这两本教程就够了

裁员了，很严重，大家做好准备吧！

医学科研绘图：我用R画出这三个图，印度审稿人当场向我敬礼！

“颜值就是影响因子”：R可视化美学提升之条形图代码

资深博导：我从不反对用ChatGPT搞科研，但你得学会用啊！报个班吧，组里给你花钱！

审稿人：看在你弦图好看的份上，勉强大修！R画的吧？

tiff还是png？原来R做PCA绘图可以随意设置分辨率。300dpi，提交！

资深博导：你得学会用R导出图表啊！你是想给我代码让我自己run吗？

为什么说在中国做科研最忌讳踏实？

审稿人：你都用ggplot2画图了，就不能提高下审美吗？

视频教程：主成分分析，视频号，已出道！

打破记录！“真心建议” 大家读一下这篇《Nature》重磅文章

审稿人：PCA的误区就是"分类"，但Python可以画得很漂亮！

审稿人：神经网络就比线性模型高级吗？R代码一模一样！

今年顶会这情况。。。大家提前做准备吧！

资深博导：你用上中下三种方法重新画一个聚类分析图，准备发NC!

堪比诺奖级别！曾被审稿人拒稿多次，R和python惊现神级操作，还得是寒门学子！

审稿人：贝叶斯分类模型不是“画圈圈”，跟判别模型其实不一样！

审稿人：我看的是你的三种回归建模吗？，我要的你的诚意！同意接收！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉