个人如何微调大模型

教育   2024-11-18 17:30   四川  

大模型学习就和人的学习是一样的,比如一个高中生他们只学习了通用的知识,不过他们对于金融、医学、建筑 等领域的知识不懂,高中生就是大模型的基座。那么就等他们上大学以后,对高中生做针对性的训练,让每个高中生具备不同领域的知识,这个就是微调。

下面这小大模型,基座的综合评分是目前比较好的,参数量越多,对资源的占用越大,训练起来越困难。

如果是个人做实验,你就只需要使用比较小的模型,最小的模型就只有1b的参数量,你就理解成他小学毕业,学习的东西很少,你问他很多东西他都不知道,他会胡说八道的回答你

现在阿里云的计算平台,可以免费使用3个月,大家可以试试

先本地部署,这个模型对性能要求很低,你就用最低配置就是了

部署好了以后,通过web测试使用

看看在线体验,可以回答基本的问题

让他讲一个故事,他就开始胡说八道了。因为他不知道哪吒,每没有学习过这个故事,他就现编一个告诉你。

比如你问豆包大模型,他就可以讲给你听,因为豆包大模型学习过这个故事

所谓微调就是,把一些特定领域的知识告诉大模型,比如你让他学习一本书,他就可以回答你这个本书里面的知识,如果你把所有知名的金融书籍让他学习,他就可以学习成一个金融专家。

问他一点弱智的问题,他都回答不对

现在给大模型基座学习一点,自己整理的知识

上传的数据集的格式,用的json文件

上传数据开始训练

开始任务

训练好以后,就开始部署

再开始部署

最后大模型无法打开

RuntimeError: probability tensor contains either `inf`, `nan` or element < 0


数据产品之美
基金分析,LOF基金套利,基金实时估值
 最新文章