---点击上方蓝色字体关注我
-------------------------------
这位威斯康星大学麦迪逊分校的终身教授塞巴斯蒂安撰写的从零开始构建大模型的入门书。
虽然要在今年的8月份才正式出版,但在github上的星标已经达到了离谱的20.6k了!非常受欢迎。
而且这本书的作者不仅仅是终身教授,还拥有其它众多的荣誉。
像之前非常受欢迎的这两本书也是他撰写的,甚至还登顶过github热门开发者榜单榜首!也经常活跃在大模型的各种前沿工作和讲座中,GitHub和推特上也有不少粉丝,绝对是大模型领域一位公认的大牛!
这本书虽然还没出版,但是我已经购买了电子版本,如果你需要这本书的PDF和配套代码可以直接扫码添加我的助手让她无偿及时发送给大家。
这本书的目的在于从理论和代码层面动手带你从零一步步构建属于自己的大语言模型,从内到外的学习和理解大型语言模型的工作原理。构建起你对大语言模型的框架性认知。
整本书的每个阶段都充斥着清晰的文本、图表和示例解释,涵盖了从初始设计和创建到在通用语料库上的预训练,再到针对特定任务的微调。
第一章是带你通透的理解大语言模型,像大语言模型背后的基本概念、类似chatgpt类的大模型的transformer结构,然后开始规划如何从零构建大语言模型。
后面的章节就是使用文本数据、编码注意力机制、从头开始实现gpt模型以生成文本、未标记数据的预训练、文本分类的微调、按照指令进行微调。
确实是一本非常不错的大模型教程书,难怪还未发布就已经这么受欢迎了。