2024年学习LLM的7大步骤,让你少走弯路

文摘   2024-07-30 08:22   新加坡  

人工智能(AI)已经深刻影响我们的生活和工作,作为一名有抱负的AI工程师,你可能正在考虑如何高效地学习AI知识,并在这个飞速发展的领域占得一席之地。

以下是我基于个人经验的七大步骤建议:

第一步:打好编程基础,首选Python

作为AI工程师,编写代码是必备技能。Python因其简洁的语法和丰富的库生态,已成为AI领域事实上的标准语言。

我推荐以下学习资源:

1. 廖雪峰的官方网站:

提供了非常全面的Python教程,https://www.liaoxuefeng.com/wiki/1016959663602400

2. 菜鸟教程

https://www.runoob.com/python3/python3-tutorial.html

3. B站(哔哩哔哩):

B站上有许多优质的Python教学视频,例如“Python编程时光”、“黑马程序员”等UP主,提供了从入门到高级的Python视频教程。

第二步:学习大语言模型(LLM)

ChatGPT、Claude等大语言模型是当前AI领域的明星。开始应用LLM时,你不需要完全理解它们的工作原理,但需掌握以下术语:

  • Tokens
  • Context window
  • Attention机制
  • Temperature(在LLMs中)
  • Transformer架构

掌握这些概念将为你构建第一个AI项目奠定基础,你将在后续每个项目中不断扩展这些知识。推荐学习资源:

1. Andrej Karpathy的YouTube频道

2. Datawhale的B站频道

3. OpenAI Playground(用于实验)

第三步:掌握提示词工程

AI工程师需知道如何与LLM进行沟通,因此提示词工程(Prompt Engineering)至关重要。初期只需掌握基础:

  • 学会如何具体描述
  • 学会如何提供上下文
  • 学会如何清晰表达目标
  • 通过迭代改进提示

建议初学者只在项目需要的时候再去学习高级提示词工程(网上有丰富的学习资源)。编写优质提示词的任务正在被LLM本身还有DSPy等框架自动化,所以提示工程可能不会成为未来的必备技能,因此掌握基础知识即可。

同时要学好英语,这里我截一张图。

第四步:动手做AI项目

构建AI项目是成为AI工程师的必由之路,光有理论是不够的。除非你能展示出实际运用AI和编程知识创造有价值的项目的能力,否则还称不上是一名AI工程师。

我建议你从一个简单的项目开始,比如构建一个ChatGPT的"克隆":

  • Python编程语言
  • OpenAI API
  • Streamlit(用于构建用户界面)
  • 大约40行代码

这个项目能让你进入“创造者模式”,巩固前几步学到的知识。

第五步:分享你的学习历程

通过写公众号或加入知识星球等方式,分享你的学习过程,包括代码、经验、错误、想法、推荐资源等。

这样做不仅能扩大影响力,也是复盘总结的过程,有助于建立信任和权威,激励他人,追踪成长,巩固知识,拓展人脉,打造个人品牌。

靠谱的知识星球,我个人推荐“生财有术”和“AI破局俱乐部”,可以通过里面的成员互动和大航海行动,学到自己想要的知识,同时有能力的话,加入其中作为自愿者,帮助他人成长,同时扩大自己的影响。

第六步:进阶学习和项目实践

在打好基础后,挑战更多进阶学习主题和项目,如RAG(Retrieval-Augmented Generation)、AI Agents、LangChain、HuggingFace、向量数据库、向量嵌入、开源大语言模型、图像生成(如DALL-E)、语音模型(如Whisper、TTS)。

选择项目时,以解决实际问题、创造商业价值为导向,推动你踏出舒适区,学习新知识,提升已有技能。

目前企业最热门的一个应用:知识库的落地,微软开源了一个项目GraphRAG,在有了一定能力后可以尝试去学习这个知识。

还有DSPy,对于数据驱动的系统开发项目,DSPy 提供了更专业的工具和支持,可能在这些场景中更受青睐。

第七步:锻炼认知能力

认知能力指的是你对AI产品或需求的理解、分析和判断。通过技术、产品、商业等多维度思考,设计出可行、具有商业价值的解决方案。

在实践中不断总结和迭代,深入研究AI应用,尝试实现一个AI产品的最小可行产品(MVP),打磨自己的认知能力。

学习AI是一条漫长且充满挑战的道路,需要循序渐进,注重基础,多实践,学以致用,同时要常思考、多总结。希望这七大步骤能帮助你快速上手AI,成为新时代的筑梦者和引领者!


蔡荔谈AI
AI科普 AI培训 超级个体 创业
 最新文章