最近一个华人小哥做了一款PetGPT(宠物GPT),号称能把人说的话翻译给狗子。
本着科学的态度,我们先来分析一下,这个APP有多靠谱。
首先,翻译嘛,对方的语言里要有对应的词,而且语言构件要相同。
举个例子:一个小学生用手指给你一指,然后说
“心机之蛙,一直摸你肚子!”
你就知道他是柯南
他说的是日语“真実はいつもひとつ”。发音:shin-ji-tsu-wa-i-tsu-mo-hi-to-tsu。
翻译成中文就是:
心机之蛙一直摸你肚子 真相(一直/永远)只有一个!
这句话能翻译,因为中文和日语都有“真相”“一”这些词汇
它们都是靠发音表达。
如果你把这句话说给一个聋子
....
当然,他听不见,聋哑人使用的是手语
狗狗交流时,“动作”是重要的语言构件
摇尾巴、龇牙、转动身体、闻屁股等等
这款APP都没照顾到
更不用说,还有方言的问题
另外,我们还得考虑,AI是怎么学习人类的
其实是靠模拟人的大脑
当我们看见猫时,大脑数以亿计的神经元会接收到信息
包括位置、颜色、动作、气味、声音等等
大量信息被拆成碎片分配给各个神经元
每个神经元包含数个突触,和周边的神经元相连
它们之间互相参照,再对照之前的正确记忆,给出判断
我们用类似的架构制造AI,叫做
“人工神经网络”(Artificial Neural Network)
我们看一个简化的的架构
用几个点的信息,再互相连接,判断是猫还是狗
判断结果出来后,还需要人类告诉AI,结果对不对
再调整每个神经元(参数)意见的“权重”
让结论的正确率达到最高
现代的AI,比如说GPT3.5,据说有超过1750亿个神经元(参数)
还要反复练习,由人类不断提供意见
花费了大量时间训练后,AI这才趋近“可以使用”
如果参数不够,练习不足,AI会是怎样的?
2009年,有一款叫做“绿坝”的软件,号称能判断图片是否适合孩子观看
然后.....
大家发现,这款“绿坝”AI只是判断图片中类似肌肤颜色的色点和分布
有类似躯干、四肢构图,类似肤色的通通屏蔽
结果以下几位都被判断为“不适合儿童”了
这款软件迅速消失在人们的视野中
倒是大家开玩笑画的“绿坝娘”挺可爱的,保留了下来
好了,回头再看
宠物GPT有多少神经元参数呢?不知道
谁去告诉AI,它的翻译对不对呢?估计没谁说得准
训练量够吗?肯定不够
那它究竟有多“靠谱”,就不用说了吧
当然,研究动物语言还是很有趣的
比如科学家发现虎鲸常在同类间骂脏话,海豚喜欢聊八卦
还有什么有意思的信息?
看看今天的《南国少年》吧
今天的报纸还有一个比较有趣的点
地球的自转速度加快了?
其实这是一个短期现象
我们用一个很简单的例子来说明
矮胖的舞者、质量向中间集中的陀螺转得快
因为转动惯量大
很可能是这几年气温升高,冰山融化,水汇入大海,水离地心更近了
导致地球转快了点(2021年快了0.5毫秒)
但是总体上看,地球会越转越慢
日月潮汐引力的作用,相当于一直为地球自转轻点着“刹车”
这个“变慢”过程很漫长,但科学家在1972年就已经准备好“闰秒”了
地球自转加快,用文科的话说,就是
“不经意间,河流中出现了打转回旋的水花”
至于其他新闻?还需要各位读者翻看报纸了
没订的来一份!
想订《南国少年》吗?
欢迎戳下图直接订阅↓↓↓