大模型学习就和人的学习是一样的,比如一个高中生他们只学习了通用的知识,不过他们对于金融、医学、建筑 等领域的知识不懂,高中生就是大模型的基座。那么就等他们上大学以后,对高中生做针对性的训练,让每个高中生具备不同领域的知识,这个就是微调。
下面这小大模型,基座的综合评分是目前比较好的,参数量越多,对资源的占用越大,训练起来越困难。
如果是个人做实验,你就只需要使用比较小的模型,最小的模型就只有1b的参数量,你就理解成他小学毕业,学习的东西很少,你问他很多东西他都不知道,他会胡说八道的回答你
现在阿里云的计算平台,可以免费使用3个月,大家可以试试
先本地部署,这个模型对性能要求很低,你就用最低配置就是了
部署好了以后,通过web测试使用
看看在线体验,可以回答基本的问题
让他讲一个故事,他就开始胡说八道了。因为他不知道哪吒,每没有学习过这个故事,他就现编一个告诉你。
比如你问豆包大模型,他就可以讲给你听,因为豆包大模型学习过这个故事
所谓微调就是,把一些特定领域的知识告诉大模型,比如你让他学习一本书,他就可以回答你这个本书里面的知识,如果你把所有知名的金融书籍让他学习,他就可以学习成一个金融专家。
问他一点弱智的问题,他都回答不对
现在给大模型基座学习一点,自己整理的知识
上传的数据集的格式,用的json文件
上传数据开始训练
开始任务
训练好以后,就开始部署
再开始部署
最后大模型无法打开
RuntimeError: probability tensor contains either `inf`, `nan` or element < 0