书单 | 大模型通透指南,读这几本就够!

教育   2024-11-01 17:02   北京  

👆点击“博文视点Broadview”,获取更多书讯


--文末赠书--

决定大模型成功关键因素是什么?

本期书单带你从不同角度

从软件到硬件,

从理论到实践,

助你精进算力模型、把握建模细节、优化训练策略,

重新认识大模型





构建大模型的基础设施





01


▊《算力芯片——高性能 CPUGPUNPU 微架构分析

濮元恺 著 

  • 主流AI芯片技术方案一本通


回顾了近20年来主流的CPU、GPU芯片架构的特点,介绍了存储与互连总线技术,即大模型专用AI超级计算机的中枢核心




02


▊《深度神经网络高效计算:大模型轻量化原理与关键技术

程健 著 

  • 破解计算复杂度难题,聚焦运行效率

  • 业界泰斗马颂德、周志鑫院士盛赞


本书围绕深度学习模型计算,重点从深度学习模型优化、算法软件加速、硬件架构设计等方面展开介绍深度学习高效计算。




03


▊《大模型时代的基础架构:大模型算力中心建设指南

方天戟 著 

  • 构建大模型基础架构云平台最佳实践

  • 以腾讯专有云与智算平台为例


本书首先从AI算法的特点开始,分析了AI相关应用的架构及对应的硬件特性,然后对如何构建、扩展、运行支撑AI应用的硬件平台,以及如何调度AI算力并构建支撑应用的存储、网络、中间件、运维、运营平台进行了讨论。





大模型的主流分类



01


▊《大规模语言模型:从理论到实践

张奇桂韬郑锐黄萱菁  著 

  • 复旦NLP团队新作

  • 从0分享研发MOSS大语言模型的实践经验


本书详细介绍了构建大语言模型的四个主要阶段:预训练、有监督微调、奖励建模和强化学习。每个阶段都有算法、代码、数据、难点及实践经验的详细讨论。




02


▊《扩散模型:生成式AI模型的理论、应用与代码实践

杨灵张至隆张文涛崔斌  著 

  • 生成式AI模型的理论、应用与代码实践

  • 着重解密了DALL·E 2、Stable Diffusion、Midijourney等一众热门应用的核心技术


      书中讨论了扩散模型的相关原理和算法改进,即去噪扩散概率扩散模型、基于分数的生成模型和随机微分方程,还讨论了扩散模型与GAN、VAE等其他生成模型的关联,最后详细介绍了扩散模型在文生图、3D建模、视频生成、时序数据预测、医学和生命科学等诸多领域的应用。


      可供高等院校计算机科学、人工智能和医学、生物学等交叉学科专业的师生,以及相关人工智能应用程序的开发人员阅读。




03


▊《多模态大模型:新一代人工智能技术范式

刘阳林倞  著 

  • 多模态大模型的核心技术和典型应用

  • 中国工程院高文院士力荐给相关专业的学生和科研工作者


      本书以深入浅出的方式介绍多模态大模型的技术方法、开源平台和应用场景,并详细阐述因果推理、世界模型及多智能体与具身智能等前沿技术领域,有助于读者全面了解多模态大模型的特点及发展方向,对新一代人工智能技术范式和通用人工智能的发展起到重要推动作用。




04


▊《多模态大模型:技术原理与实战

彭勇彭旋郑志军茹炳晟  著 

  • 教你从0到1部署多模态大模型

  • 聚焦中小公司的大模型构建策略


      本书详细介绍了中小公司的大模型构建之路,阐述了如何通过微调、量化压缩等技术构建垂直领域的轻量级大模型。进一步详述了多模态大模型在六大领域(分别是金融领域、出行与物流领域、电商领域、工业设计与生产领域、医疗健康领域和教育培训领域)的应用,帮助读者更好地理解多模态大模型的应用场景和可能产生的商业价值






大模型最佳实践指南



01


▊《Llama大模型实践指南

张俊祺曲东奇张正占冰强 等  著 

  • Llama从入门到实践

  • 用Llama定制自己的行业大模型

      

      本书的一个显著特点是跨学科性。不仅讨论了计算机科学和机器学习的基础概念,还引入了语言学、信息检索和人机交互等多个学科的知识。介绍各种LLAMA模型的调优技巧和策略,提供详细的实践指导。

     

      深入探讨LLAMA在各个领域的实际应用,包括自动文本生成、机器翻译、情感分析、问答系统等,帮助读者了解如何将LlAMA应用于实际项目中。




02


▊《LangChain实战:从原型到生产,动手打造 LLM 应用

张海立 等  著 

  • 基于长期维护版Langchain0.1,精选多个工业级的实战案例

  • 提供教学视频和本地免费的实验环境


      本书是专为初学者和对LangChain应用及大语言模型(LLM)应用感兴趣的开发者而编写的。本书以LangChain团队于2024年1月发布的长期维护版本0.1为基础,重点介绍了多个核心应用场景,并且深入探讨了LCEL的应用方式。


      通过本书,读者可以真正体验到LangChain在从原型到生产的LLM应用开发和上线闭环体验方面的优势,全面了解LangChain的概念、原理和应用,并且获得实际开发LangChain应用的经验。





03


▊《Chatbot从0到1(第2版):对话式交互实践指南

李佳芮李卓桓  著 

  • 探索大模型应用、对话式AI的奥秘!从产品维度解构大模型

  • 陆奇、韦青、王小川等行业专家一致力荐

     

      本书中增加ChatGPT的内容并介绍在大模型时代下搭建Chatbot的方法。虽然搭建Chatbot的产品方法论并没有因为以ChatGPT 为代表的大模型的出现发生本质的变化,但是在一些技术落地的实现路径中,新的技术对旧的技术确实有了一定程度的替换。作者将自己全新的理解和实践更新在本书中,希望能帮助读者在面对人工智能浪潮时,在了解技术的基础之上,能在产品维度有更清晰的认知、更深入的理解、更务实的应用。



  • 互动有奖


    按以下方式与博文菌互动,即有机会获赠图书!

    活动方式:在评论区留言参与“人工智能对你日常工作的帮助”等话题互动,届时会在参与的小伙伴中抽取1名幸运鹅赠送图书盲盒一份!

    说明:留言区收到回复“恭喜中奖”者将免费获赠本图书,中奖者请在收到通知的24小时内将您的“姓名+电话+快递地址”留言至原评论下方处即可,隐私信息不会被放出,未在规定时间内回复视作自动放弃兑奖资格。

    活动时间:截至11月4日开奖。

    快快拉上你的小伙伴参与进来吧~~

    温馨提示:可以将“博文视点”设为星标,以免错过赠书活动哦!


发布:王功瑾

审核:陈歆懿

 


如果喜欢本文
欢迎 在看留言分享至朋友圈 三连
<
 PAST · 往期回顾 
>


书单 | 10月新书速递!


博文视点Broadview
IT出版旗舰品牌,实时发布最新鲜的IT热点图书资讯,分享优质图书内容,打造与万千精英读者良好的互动平台。
 最新文章