最近DeepSeek横空出世,其最大的优势是可以在不使用最新英伟达GPU的基础上,通过优化算法路线,进而达到超越ChatGPT的能力。这就很有想象空间了,这意味着如果进一步增强硬件能力,其模型的表现还可以迎来数量级的增长,怪不得1月27日,阿斯麦、英伟达、博通盘前跌超10%,台积电跌超9%。
同时DeepSeek还有很强的角色扮演能力,受微博上宝玉x博主的启发,我也让DeepSeek模仿“公知语气”,对自己进行一番批判:
哎呀,今天咱们就来聊聊这个所谓的“Deepseek”吧。说实话,每次听到有人吹Deepseek,我都忍不住想笑。你们这些人啊,是不是被国产情怀冲昏了头脑?Deepseek这种东西,也配跟ChatGPT比?真是让人哭笑不得。ChatGPT的模型架构,那可是基于Transformer的,参数量高达1750亿,训练数据覆盖了全球多种语言和文化。Deepseek呢?参数量多少?训练数据从哪里来的?是不是就靠爬点中文网页,凑合凑合就完事了?这种技术差距,简直就是天壤之别!ChatGPT可是全球通用的,支持多种语言,覆盖了全球用户。Deepseek呢?是不是就只能在中文圈子里打转?这种局限性,简直就是自绝于世界!你们这些人啊,是不是觉得只要能在国内用就行,根本不关心国际化?这种狭隘的心态,真是让人失望。
再让DeepSeek模仿“贴吧老哥”的口气,狠狠反驳上述说法:
兄弟们,听我说,现在还在用ChatGPT的,你们是不是还没睡醒?Deepseek才是真正的未来,ChatGPT那玩意儿早就过时了!ChatGPT那玩意儿,用过的都知道,贵得一批!动不动就收费,还搞什么订阅制,简直是抢钱。Deepseek就不一样了,性价比高,功能还强大,谁用谁知道。省下来的钱,买几包烟不香吗?ChatGPT是老美的东西,谁知道他们会不会搞什么小动作?咱们用Deepseek,就不用担心被老美牵着鼻子走。科技自主,才能在国际上有话语权,懂不懂?Deepseek在算法、模型上都做了大量创新,效果杠杠的。ChatGPT那套老掉牙的技术,早就该淘汰了。咱们要用就用最新的,最先进的,别总跟在别人屁股后面跑。人工智能这块,Deepseek才是真正的未来。ChatGPT那玩意儿,顶多算个过渡产品。Deepseek在自然语言处理、图像识别、语音识别等方面都有突破性进展,这才是真正的人工智能。
简直太有趣了,众所周知目前而得大语言模型用的都是可生成式AI技术,虽然我们的读者大多数关注的是“数据分析在科研数据中的应用”,今天我们也不妨探讨的更深入一些,简单介绍什么是可生成式AI?
Python代码教程:什么是可生成AI?
生成式AI(Generative AI)是指能够生成新内容的人工智能系统。这些内容可以是文本、图像、音乐、视频等。与传统的判别式AI不同,生成式AI不仅仅是对已有数据的分类或预测,而是能够创造出全新的、有意义的数据。
生成文本
下面是一个简单的Python代码示例,使用GPT-2模型生成文本:
from transformers import GPT2LMHeadModel, GPT2Tokenizer
# 加载预训练的GPT-2模型和分词器
model_name = "gpt2"
model = GPT2LMHeadModel.from_pretrained(model_name)
tokenizer = GPT2Tokenizer.from_pretrained(model_name)
# 输入提示文本
input_text = "Deepseek is the future of AI because"
# 将文本转换为模型输入格式
input_ids = tokenizer.encode(input_text, return_tensors="pt")
# 生成文本
output = model.generate(input_ids, max_length=50, num_return_sequences=1)
# 解码生成的文本
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)
## Deepseek is the future of AI because it is the future of the human race.
##
## The future of AI is not a matter of the future of AI, but of the future of humanity.
##
## The future of AI is not a matter
生成图像
下面是一个简单的Python代码示例,使用GAN(生成对抗网络)生成图像:
import tensorflow as tf
from tensorflow.keras import layers
import numpy as np
import matplotlib.pyplot as plt
# 定义生成器模型
def make_generator_model():
model = tf.keras.Sequential()
model.add(layers.Dense(7*7*256, use_bias=False, input_shape=(100,)))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Reshape((7, 7, 256)))
model.add(layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same', use_bias=False))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same', use_bias=False))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Conv2DTranspose(1, (5, 5), strides=(2, 2), padding='same', use_bias=False, activation='tanh'))
return model
# 生成随机噪声
noise = tf.random.normal([1, 100])
# 生成图像
generator = make_generator_model()
generated_image = generator(noise, training=False)
# 可视化生成的图像
plt.imshow(generated_image[0, :, :, 0], cmap='gray')
plt.show()
结语:技术之争,背后是价值观的碰撞
Deepseek和ChatGPT的争论,表面上是技术之争,实际上却是价值观的碰撞。希望今天的更新让你了解可生成式AI的基本概念,从而对机器学习,人工智能更感兴趣。相信更多的人工智能技术会被大力引进到不同的学科领域,掌握必要的分析技术越来越成为各个学科的方向之一。
感谢关注,你的支持是我不懈的动力!