点击上方关注 “终端研发部”
设为“星标”,和你一起掌握更多数据库知识
作为程序员,我知道,要想训练一个大模型,首先要有数据,对,游戏攻略等数据和数据集
收集玩家与BOSS战斗的视频或日志数据,下面是我打怪的一些心得和体会:
Boss百足虫挑战攻略
近战攻击,还会喷射毒气。我的心得就是掌握好战斗的节奏,躲避技能输出
赤尻马猴
第一次在被击败后会再次登场并获得强化,展开强大的妖气远程攻击,注意躲避即可
虎先锋
先清理敌人,在慢慢边打小兵边寻找。基于虎先锋的伤害很高,和控制效果,我们需要反制和输出。
大头怪
边打边退,你打我就避,等发头发大战放完,右击进行蓄力,然后连环混走一波,然后不断重复该动作,直到大头怪的血量见到零
有了这些训再去训练数据集
首先我们可以训练得到一个近似高端玩家水平的游戏AI,再通过与其他现有角色的AI进行模拟战斗,就可以在角色上线之前模拟真实的对局数据
比如,我们可以设计一个AI agent——虚拟玩家,并从头开始训练它学习黑神话的玩法。
工具的话,我们可以选择利用python和Pygame简单搭建了基础的游戏环境,这样我们就可以直观地观察agent的训练过程了
期间,我们要用数学知识进行记录状态,比如
根据agent执行动作,记录状态。动作可以随机生成
在训练初期阶段,系统通常会倾向于随机策略,来探索更多的动作和对应的reward。在训练后期阶段,系统会越来越依赖已有的知识进行调整
但是对于,这类的训练,常用的模型包括卷积神经网络、循环神经网络(RNN)、强化学习等
利用已经学习到的policy做出动作,每一次进行优化即可,知道完成我们想要的数据
然后接着对第二种场景进行训练,依次循环
真正训练AI去打游戏是一个很耗时且复杂的过程,还需要一个专业的知识
东西比较多,后面接着写,其他请各位知友进行想象。。。
计算机专业必读书籍:
最后说一句(别白嫖,求关注)
回复 【idea激活】即可获得idea的激活方式
回复 【Java】获取java相关的视频教程和资料
回复 【SpringCloud】获取SpringCloud相关多的学习资料
回复 【python】获取全套0基础Python知识手册
回复 【2020】获取2020java相关面试题教程
回复 【加群】即可加入终端研发部相关的技术交流群
阅读更多
重磅!OpenAI正研发ChatGPT文本水印技术,其他大模型将何去何从?
构建一个简单的大型语言模型(LLM)应用 | LangChain
相信自己,没有做不到的,只有想不到的
在这里获得的不仅仅是技术!
喜欢就给个“在看”