面试题[AI大模型]
AI开发核心技术栈:大模型原理、RAG检索增强生成、Agent智能体开发、Prompt工程、LangChain框架实战、向量数据库、模型微调与部署。
1. AI大模型基础
1.1 什么是 RAG?
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与大语言模型生成的技术架构。它通过在生成答案前先从外部知识库中检索相关文档,让模型“查资料再作答”,从而有效解决大模型知识更新滞后、容易产生幻觉等问题。
RAG 的主要流程(经典三步)
| 阶段 | 核心动作 | 说明 |
|---|---|---|
| 1. 索引(Indexing) | 文档切块 → 向量化 → 存储 | 离线准备:将知识库文档分割成小段落,用嵌入模型转为向量,存入向量数据库。 |
| 2. 检索(Retrieval) | 查询向量化 → 相似度搜索 → 召回相关块 | 在线:用户问题也被转为向量,去数据库中召回最相似的 top‑K 个文本块。 |
| 3. 生成(Generation) | 拼接提示词 → LLM 生成答案 | 将检索到的文本块与原始问题一起构成提示,交给 LLM 生成最终答案。 |
更细致的流程(含常用优化)
- 查询预处理
- 可对用户问题进行改写(如 HyDE)、分解多跳问题,提升检索准确性。
- 检索
- 常用向量相似度(余弦、内积)+ 关键词(BM25)混合检索。
- 可增加重排序(Re‑rank)步骤,在初步检索(如向量相似度或关键词匹配)召回一批相关结果后,用更精准的模型对召回结果精细排序,把最可能包含答案的结果放在最前面。
- 上下文注入
- 将排好序的文本块与问题按模板组合,例如:
基于以下内容回答问题:\n{检索结果}\n问题:{query}\n答案:
- 将排好序的文本块与问题按模板组合,例如:
- 生成
- LLM 根据提供的证据生成答案,并可要求引用来源。
- (可选)对话记忆
- 多轮对话场景下,将历史对话摘要也纳入检索或提示中。
简单理解:RAG 就是让 LLM 学会“开卷考试”——先翻书(检索),再作答(生成)。
2. AI大模型进阶
3. AI大模型拓展
3.1 OpenClaw 原理
OpenClaw之所以这么火,是因为它不再只是一个能聊天的AI,而是一个真正能动手干活的AI系统。它的核心理念,可以概括为给大语言模型(LLM)装上"手和脚",让AI从"思考者"进化为"执行者"。你可以把它的工作方式想象成三个部分:统一的输入通道、强大的中央调度系统和丰富的执行工具。
OpenClaw 核心原理速览:
| 核心层级 | 代表组件 | 一句话解释 | 它做了什么 |
|---|---|---|---|
| 统一入口层 | Channels (通道) | 像一个"万能插座",连接所有聊天App | 让你在微信/飞书/Telegram上就能直接发指令,不用切换应用 |
| 中央调度层 | Gateway (网关) + Agent (智能体) | 系统的"大脑"和"项目经理" | 理解你的任务,拆解步骤,并指挥工具去执行 |
| 能力扩展层 | Skills (技能) + Memory (记忆) | AI的"工具箱"和"日记本" | 让AI拥有操作电脑、处理文件等具体能力,并记住你过往的偏好 |
为了让你更清晰地理解,我把这个过程拆解开来看看:
Step 1:理解意图与拆解任务
当你在聊天软件里下达指令,比如 "帮我整理一下桌面",OpenClaw的智能体(Agent)就开始工作了。
- 接收指令:你的消息会通过通道(Channels)进入系统。
- 规划任务:接着,网关(Gateway)会判断该交给哪个智能体(Agent)处理。智能体会进行意图识别,把这个复杂指令拆解成一系列具体步骤:先扫描桌面、识别文件类型,再分类移动。
Step 2:调用工具并执行
任务拆解好后,就该AI的"手脚"登场了。
- "工具包" (Skills):OpenClaw的技能系统,就像为AI准备的乐高积木,包含了"搜索文件"、"移动文件"、"发送邮件"等一个个功能块。智能体只需要按顺序调用它们即可。任何开发者都能为它添加新技能,让AI的能力无限扩展。
- "记忆本" (Memory):为了能连贯地工作,AI需要记忆。OpenClaw将记忆设计为本地文件,这就像AI的"日记本",它能从中回忆你的习惯,或记住任务执行到哪一步了。
Step 3:自主反馈与循环
执行过程中,OpenClaw会实时观察结果并自动调整,形成一套完整的"思考-行动-观察"循环。
- 动态调整:比如在"整理桌面"时,如果"图片"文件夹不存在,它会自动创建,而不是让任务失败。
- 跨应用操作:这种能力让它能完成跨应用任务,比如"从邮件下载Excel附件,分析数据后做成图表发给老板"。
深层思考:OpenClaw为何能引发革命?
OpenClaw的火爆,反映了AI领域从"感知与生成"向"自主执行"演进的关键一步。
- 重新定义AI角色:它通过Headless(无头)架构,让AI退居后台,融入现有聊天软件,极大降低了用户的使用门槛。同时,通过本地化的记忆存储,将"黑箱"的AI行为变得透明,用户可以随时查看和修正,建立了人机协作的信任基础。
- 范式迁移,而非技术堆砌:OpenClaw的成功不在于发明了全新的AI技术,而在于用一种巧妙、优雅的工程架构,将大模型(LLM)的智能、即时通讯的便捷和操作系统的能力进行了整合。它证明了,在AI领域,优秀的系统设计有时比纯粹的算法突破更能影响世界。