原文作者:Ronin (@DeRonin_) 与 @andy_ai0
原文浏览量:3.8M
本文为原文的中文翻译与整理,未改变作者真实内容与意图
AI工程已经成为当今科技领域最具价值的技能之一。
问题是:大多数初学者根本不清楚自己到底该学什么。
有人一头扎进机器学习理论,有人陷在教程里出不来,还有人直接跳进提示词和Agent的世界,却完全不懂API、后端基础,也不知道真正的产品是如何构建的。
结果往往都一样:困惑一大堆,实际技能几乎为零。
如果你的目标是成为一名AI工程师,你不需要掌握人工智能的每一个领域。
你需要学会的是:如何在现实世界中构建有用的AI系统。
这意味着你要学会:
- 使用LLM构建端到端的应用
- 使用OpenAI和Anthropic等模型API
- 正确设计提示词和上下文
- 使用结构化输出和工具调用
- 在需要时加入检索增强(RAG)
- 部署项目,让人们真正能够使用它们
这篇文章就是为你提供的一份6个月实战路线图。
全文超过10,000字,完整阅读可能需要几个小时甚至更久。但它的真正价值在于:你需要学习的每一项技能,这里都提供了资源和清晰的操作说明。
按照这个路线图,你可以在6个月内达到AI工程师的水平,并且在第1-2个月内就能开始自己动手构建项目。
目录
- AI工程师到底是做什么的?
- 第1个月:夯实编程基础
- 第2个月:掌握LLM应用开发
- 第3个月:真正学会RAG
- 第4个月:Agent、工具、工作流与评估
- 第5个月:部署、产品思维与可靠性
- 第6个月:专精方向 & 成为可被雇佣的人
- 结语:6个月后你能得到什么
AI工程师到底是做什么的?
很多人听到”AI工程师”这个词,脑海里浮现的是那些从头训练巨型模型的研究员。
但在现实中,现代AI工程师做的事情要实用得多。
他们是在已有模型的基础上构建产品和系统。通常包括:
- 连接LLM API
- 设计提示词和上下文流程
- 构建聊天、搜索或自动化系统
- 集成工具、数据库和外部API
- 处理结构化输出
- 优化可靠性、成本和延迟
- 将AI功能部署到真实应用中
在实践中,AI工程师往往介于以下几个角色之间:
- 软件工程师
- 产品工程师
- 自动化工程师
- 应用AI工程师
这就是为什么这个岗位增长如此迅速的原因。
公司需要的不仅仅是研究员。他们需要的是能把模型变成实际产品的人。
这也是为什么这份路线图更侧重于实践,而不是枯燥的理论。
如果你能构建真正的LLM应用、检索系统、自动化流程和可生产的workflow,你离就业就已经比绝大多数初学者近得多。
第1个月:打好编程和基础
本月目标:成为一名可用的Python开发者
你不需要成为专家,只需要能够自信地构建简单程序,不再需要频繁搜索基础语法。
AI工程首先就是软件工程。后面所有内容都假设你能写出干净的Python代码,会使用终端、调用API、管理代码库。这个月是你的地基。
1. Python
Python是AI工程的语言。未来六个月你遇到的几乎所有库、API和教程都是用Python写的。
怎么学:
选择一个结构化课程,强迫自己动手写代码,而不是只看视频。初学者最常见的错误就是被动地看教程,然后从不打开编辑器。
资源:
- Python for Everybody (Coursera,免费旁听) — 绝对初学者最好的起点
- freeCodeCamp Python课程 (YouTube,免费) — 4小时综合视频
- CS50P: Harvard的Python编程导论 (免费) — 更严谨,有习题和最终项目
- Python官方文档 (教程部分) — 权威参考
重点掌握:
- 变量、数据类型、循环、条件判断、函数
- 列表、字典、集合、元组
- 文件读写和JSON处理
- 类和基础OOP
- try/except错误处理
- 虚拟环境(venv)和pip
- requirements.txt包管理
练习项目: 构建一个简单的CLI工具,比如个人记账工具(读写JSON文件),或者调用公共API(如天气API)并打印格式化结果的脚本。
2. Git和GitHub
Git是专业人士保存和分享代码的方式。你需要用它来版本管理、协作,以及在GitHub上展示你的作品。
资源:
重点掌握:
- git init, add, commit, push, pull
- 分支与合并
- .gitignore
- 在GitHub上创建仓库并推送本地项目
- 编写README文件
练习: 从现在开始,每一个项目(哪怕是小脚本)都应该放在GitHub仓库里。
3. CLI / 终端基础
资源:
重点掌握: cd, ls, pwd, mkdir, rm, cat, less, grep,运行Python脚本,环境变量,PATH基础概念。
4. JSON、API、HTTP和异步基础
资源:
重点掌握: GET/POST请求、读写JSON、HTTP状态码、API Key、async/await的作用。
练习项目: 写一个Python脚本,调用一个免费的公共API(比如Open-Meteo天气API,不需要API key),将结果格式化为干净的JSON输出。
5. SQL和Pandas基础
资源:
重点掌握: SQL的SELECT, WHERE, GROUP BY, JOIN, ORDER BY;Pandas加载CSV、筛选行、选择列、基础聚合。
6. FastAPI
资源:
重点掌握: 创建GET/POST端点、路径参数、查询参数、Pydantic请求体、运行uvicorn、使用FastAPI自带的/docs接口测试API。
第1个月里程碑
到本月底,你应该能够:
- 编写读写文件、调用API、处理错误的Python程序
- 使用Git版本管理并推送项目到GitHub
- 自信地在终端中操作
- 理解HTTP请求并在Python中发起一个请求
- 用基础SQL查询SQLite数据库
- 在本地构建并运行一个简单的FastAPI应用
第2个月:掌握LLM应用开发
本月目标:使用OpenAI和Anthropic API构建真正的AI应用
到本月底,你应该能熟练编写可靠的提示词、从模型中获取结构化数据、让模型调用你的函数,并处理好各种可能出错的场景。
1. 提示词基础
资源:
重点掌握: system message和user message的区别、为什么具体性很重要、chain-of-thought(逐步思考)、few-shot示例。
练习: 选一个真实任务(比如总结文档、提取关键信息、分类反馈),写5个不同的提示词,比较输出结果。
2. 结构化输出 / JSON Schema
资源:
重点掌握: 用Pydantic模型定义数据schema,传递给API,理解structured output和JSON mode的区别,优雅处理拒绝回答的情况。
练习项目: 构建一个发票/收据解析器。输入原始文本,返回一个包含invoice_number, amount, items, due_date等字段的结构化Python对象。
3. 函数/工具调用
资源:
重点掌握: 用JSON Schema清晰描述函数、解析工具调用响应、执行函数并把结果返回给模型、工具调用的5步流程。
练习项目: 构建一个简单的助理,拥有三个工具:get_weather(city)、calculate(expression)、search_notes(query),让模型根据你的问题决定调用哪个工具。
4. 流式响应
资源:
重点掌握: 设置stream=True,遍历delta chunks,组装完整响应,通过FastAPI的StreamingResponse返回流式输出。
5. 对话状态管理
资源:
重点掌握: messages数组结构、为什么需要同时追加user和assistant消息、上下文窗口限制、简单的截断策略。
练习项目: 在终端中构建一个简单的多轮聊天机器人,每轮追加到messages列表,添加/reset命令清空历史。
6. 成本、延迟和Token基础
资源:
重点掌握: 什么是token、输入和输出token的不同定价、上下文窗口大小的影响、更小更快的模型 vs 更大更聪明的模型的延迟权衡。
7. 错误处理
资源:
重点掌握: 429限流错误与指数退避、timeout处理、验证模型输出、降级策略。
8. 提示词注入 awareness
资源:
重点掌握: 直接注入和间接注入的区别、为什么system prompt不是真正”安全”的、最小权限原则、永远不要自动信任未经验证的LLM输出去做重要决策。
第2个月里程碑
到本月底,你应该能够:
- 编写出能产生一致、可靠输出的提示词
- 使用Pydantic + Instructor从任何模型获取结构化JSON数据
- 实现工具调用,让模型能调用你的Python函数
- 通过FastAPI端点实时流式返回响应
- 正确管理多轮对话历史
- 在发送请求前估算token成本
- 优雅处理API错误、超时和错误输出
- 解释什么是提示词注入并应用基本防御手段
第3个月:真正学会RAG
本月目标:构建能让LLM从你的文档中回答问题的系统,而不仅仅是依赖训练数据
到本月底,你应该能够:导入文档、生成嵌入并存储、在查询时检索正确的chunk、生成有依据、准确且可引用的答案。
RAG是当下AI工程中最受欢迎的实用技能。几乎每个真实的企业AI用例——客服机器人、内部知识库、文档问答——都建立在它之上。
1. 嵌入(Embeddings)
资源:
重点掌握: 向量的概念、为什么相似文本产生相似向量、余弦相似度、不同嵌入模型的区别。
练习: 取20个相关主题的句子,用OpenAI或sentence-transformers生成嵌入,写一个简单的最近邻搜索,返回与查询最相似的3个句子。
2. 分块(Chunking)
资源:
重点掌握: 带有重叠的固定大小分块作为基线、递归分块用于结构化文档、语义分块。推荐起点: LangChain的RecursiveCharacterTextSplitter,chunk_size=500, chunk_overlap=50。
3. 向量数据库
资源:
- Chroma官方文档 — 本地原型开发首选
- Pinecone学习中心
- Qdrant文档
- pgvector
重点掌握: 创建collection、插入带metadata的嵌入、用top_k进行相似性搜索、查询时用metadata过滤。
练习项目: 从任意公开文档中索引50-100个页面到Chroma,写入metadata(来源URL、章节标题)。编写查询函数,为任何问题检索最相关的5个chunk。
4. 元数据过滤
资源:
重点掌握: 在导入时为每个chunk打上相关metadata(来源文件名、页码、章节、日期、类别),查询时用这些字段过滤结果。
5. 重排序(Reranking)
资源:
重点掌握: 两阶段”检索-然后-重排序”模式、bi-encoder和cross-encoder的区别。
6. 检索质量问题
常见问题: 语义漂移、chunk边界问题、缺少metadata上下文、top_k太小。
资源:
7. 减少幻觉
资源:
重点掌握: 提示模型只根据提供的上下文回答(找不到答案时说”我不知道”)、在输出答案前添加置信度阈值。
8. 引用和接地
资源:
重点掌握: 将chunk的metadata传递到提示词上下文中,指示模型在答案中引用来源。
9. RAG框架:LangChain 或 LlamaIndex
- LlamaIndex: 搜索和索引优先,适合快速原型
- LangChain: 编排引擎优先,适合多Agent工作流
资源:
练习项目: 构建一个”与文档聊天”的应用。导入10-20个PDF或文本文件。构建FastAPI端点,接收问题,检索top 5最相关chunk并重排序,返回带有引用的答案。
第3个月里程碑
到本月底,你应该能够:
- 解释什么是嵌入以及为什么相似文本产生相似向量
- 使用合适的策略智能地分块任何文档
- 在向量数据库中存储和查询嵌入,支持元数据过滤
- 添加重排序步骤提升检索质量
- 系统性地调试常见检索失败
- 使用LlamaIndex或LangChain构建完整的端到端RAG流程
第4个月:Agent、工具、工作流与评估
本月目标:构建能自主执行一系列动作的AI系统、串联多步骤工作流,并能批判性地评估它们是否正常工作
1. Agent循环
Agent本质上是一个循环:感知 → 规划 → 行动 → 观察,不断重复。
资源:
- Anthropic: 构建有效的Agent — 必读
- OpenAI: 构建Agent实用指南 (PDF)
- freeCodeCamp: 开源LLM Agent手册
- LangChain学院: LangGraph介绍
重点掌握: perceive → plan → act → observe循环、Agent何时终止、为什么Agent本质上是LLM做分支决策的while循环。
练习: 不使用任何框架,只用OpenAI或Anthropic API从头构建一个Agent。给它3个工具、一个目标和循环。
2. 工具选择
写好工具描述是成功的一半。描述要明确、具体。
资源:
3. 状态管理
资源:
4. Agent中的重试和错误处理
资源:
5. 什么时候不要用Agent
这是最重要也最容易被忽视的技能。
决策框架:
- 如果任务可以在一个提示词内解决 → 用单次LLM调用
- 如果步骤固定且可预测 → 用工作流
- 只有步骤数量真正不可预测、需要动态决策时 → 才用Agent
资源:
6. 多步骤工作流
常见模式: 提示词链、路由、并行化、编排器-子Agent。
资源:
练习项目: 构建一个3步内容流水线:
步骤1:LLM从文章中提取关键事实
步骤2:另一个LLM调用并行生成推文、领英帖和摘要
步骤3:最后一个LLM调用对所有三个结果评分并选出最佳
7. 评估框架(Evals)
资源:
8. 任务成功指标
资源:
练习项目: 拿你第3个月的RAG流程,为它构建一个完整的评估框架。创建30个问答对,用DeepEval对每个答案进行相关性、忠实度和完整性评分。然后改变一个参数(chunk size、模型、top_k),重新运行,看是否改善。
第4个月里程碑
到本月底,你应该能够:
- 解释什么是Agent循环,并能不依赖框架从头实现一个
- 编写能被模型正确可靠选择的工具描述
- 使用LangGraph等工具正确管理Agent状态
- 处理Agent循环中的失败而不崩溃
- 自信地判断一个任务需要Agent、工作流还是单次提示词
- 构建能够串联、路由和并行化LLM调用的多步骤工作流
- 编写自动化评估,在更改提示词或模型时捕捉性能退化
- 为你构建的任何AI系统定义并测量任务成功指标
第5个月:部署、产品思维与可靠性
本月目标:把你构建的所有东西变得可投入生产
1. FastAPI生产模式
资源:
重点掌握: 使用Gunicorn + Uvicorn workers(而不是裸Uvicorn)、健康检查端点、CORS中间件、异步数据库会话、后台任务。
2. Docker
资源:
练习项目: 将你第3个月的RAG应用容器化。创建docker-compose.yml运行FastAPI应用、向量数据库和Redis。确保docker compose up能启动所有服务。
3. 后台任务和队列
资源:
4. 认证和API密钥安全
资源:
5. 日志和可观测性
资源:
6. 提示词和版本管理
资源:
7. 成本监控和限流
资源:
8. 缓存
资源:
第5个月里程碑
到本月底,你应该能够:
- 用Docker部署FastAPI + LLM应用,使用正确的生产配置
- 用后台任务和队列处理长时间运行的任务
- 用认证、限流和API密钥管理保护你的API
- 使用Langfuse或LangSmith追踪和调试LLM调用
- 用版本控制和回滚能力管理提示词
- 实时监控成本并设置预算上限
- 缓存LLM响应以减少延迟和成本
第6个月:专精方向 & 成为可被雇佣的人
你需要从以下三个方向中选择一个,专注实践。
方向1:AI产品工程师
最适合: 想快速进入创业公司的人
关注点: LLM应用、RAG、Agent、部署、产品UX
本月学习内容:
- 端到端产品构建:使用Vercel AI SDK、Streamlit、Gradio
- AI产品UX:Google: People + AI Guidebook、NN/g AI UX指南
目标: 本月构建2-3个完整的、可以演示的项目。部署上线,让人们能真正试用。
方向2:应用ML / LLM工程师
最适合: 想要更深层技术角色的人
关注点: 微调、何时微调vs提示词、评估、推理优化、开源模型
本月学习内容:
- 何时微调vs提示词工程:Google ML速成课、IBM: RAG vs 微调 vs 提示词工程
- 微调实践:OpenAI微调指南、HuggingFace Transformers微调教程、Unsloth
- 开源模型:Ollama、HuggingFace模型Hub、vLLM
方向3:AI自动化工程师
最适合: 想立即为企业构建解决方案的人
关注点: 工作流编排、业务流程自动化、多工具系统、CRM/文档/邮件/客服用例
本月学习内容:
- 工作流编排:n8n (开源)、Temporal (开源)
- 业务流程自动化:Zapier AI Actions、Make
- CRM、文档、邮件、客服自动化
练习项目: 构建一个端到端的潜在客户资格认定系统:导入潜在客户 → 用LLM研究每个客户 → 打分排名 → 生成个性化 outreach 消息 → 记录到表格或CRM。
结语:6个月后你能得到什么?
说实话:这个路线图不会让你在6个月内成为高级AI工程师。
但它会让你成为能够构建、发布和部署解决真实问题的真实AI系统的人。
而今天,市场恰恰就在为这种人买单。
薪资参考(美国市场)
- 初级AI工程师:90,000−130,000
- 中级(3-5年):155,000−200,000
- 高级:195,000−350,000+
- Glassdoor(2026年3月)平均值:$184,757
自由职业参考
- AI Agent开发:175−300/小时
- RAG实施:150−250/小时
- LLM集成:125−200/小时
咨询服务参考
- 为企业设置AI Agent:300−5,000
- AI内容管理:500−2,000/月
- 客服自动化:1,000−4,000
- 冷外展设置:500−2,000
最后想对你说的话
从每个月中挑选一个项目,动手构建它。不是读教程,不是看视频。构建它、弄坏它、修复它、部署它、放到GitHub上。能被雇佣的工程师是那些展示了自己构建了什么的人,而不是那些展示了自己学了什么的人。
开始分享你学到的东西。在X、LinkedIn任何地方写下来。教别人是最好的学习方式,同时也在建立你的个人品牌。我见过的最好的机会,从来不是来自投了500份简历,而是来自那些被看见的人。
不要等到”准备好”的那一天。你永远不会觉得准备好。从”我在学习”到”我在构建”的这段距离,是大多数人永远被困住的地方。
从你有可用项目的那一刻起,就开始申请、开始接单、开始提供服务。即使它们不完美。市场不奖励完美,它奖励能交付的人。
6个月足够改变一切——只要你真正投入工作。
我相信每一个读到这里的你都能做到。
永远不要停止构建,永远不要停止学习。
希望这篇文章对你有用 ❤️
原文作者:Ronin (@DeRonin_) 与 @andy_ai0
中文翻译整理:为保持原意,未对内容进行删改

发表回复