BHW 是某著名理工科院校的研究生,2026 年毕业,之前在某大厂内部实习了三个月。学历和实习经历都有很强的竞争力,因此比较容易拿到各种大厂的面试。
这是他在字节的二面,之前在分析一面的时候我说过他的问题出在亮点不多,那么很显然这个面试也一样,亮点没刷出来。可以认为问题都回答出来了,只是说和同样的竞争者比起来,他并不一定建立了足够的优势。
- 一面参考应届生字节一面 - BHW
- 二面参考应届生字节二面 - BHW
- 三面参考应届生字节二面 - BHW
分析内容
总体表现
从整场录音看,BHW 的表现具有典型的“应届生能答出来,但亮点不足”的特点:
可取之处
- 整体表达有条理,没有硬伤
- 大模型工程化基础概念(Prompt、COT、ReAct)都有理解
- SQL/MySQL 方面回答得更稳
- 工单一致性、提示词拆解等点能讲出一些经验
明显短板
- 项目描述偏虚,被面试官多次追问、戳穿细节不足
- 无法清晰解释大模型为什么必要(场景合理性)
- ReAct、RAG、工具链、召回方式深度不足
- 对一些关键基础(如 BM25/ANN 区别、KNN 的适用场景)答得模糊
- 技术题写得出来但优化方向不清晰
- 面试后段明显出现慌乱、表达断裂
总体评价:
作为应届生,属于“基本可用但亮点不够”类型。 如果按社招标准,会被认为:深度不足、工程经验薄弱、无法撑起项目。
PS:这个评价标准是偏高的,适配的是字节的招聘要求。很多中小型公司其实到这个表现是肯定能拿到 Offer 的。因此你不要将这个评价标准套用到别的公司的面经上。
面试逐段复盘
以下根据录音按实际流程拆解。
自我介绍与项目真实性验证
录音中面试官多次追问:
- “这个是在 XX 做的吗?”
- “什么时候实习的?”
- “实习结束了吗?”
- “这是校招吧?”
这些都属于典型的大厂“反查真实经历”流程。 BHW 在此环节表现 OK,没有自相矛盾。
核心项目深挖
这是整场面试 失分最多的部分。
面试官连续追问:
- “为什么要用大模型?”
- “规则能不能做?”
- “大模型解决了什么问题?”
- “慢 SQL 怎么靠大模型分析?”
- “Explain 不是传统手段就能做了吗?”
BHW 的回答出现了三类典型错误:
失分1:使用大模型理由不够强
他主要回答:
“规则可以,但大模型能智能推理…”
但并没有真正回答:
- 规则为什么不够?
- 业务场景中哪里需要“LLM + 工具”的能力?
- 用 LLM 会解决哪些工程痛点?
导致面试官给出评价:
“有点虚啊。”
实际上,这种问题可以直接虚构一个业务场景,而这个业务场景是规则引擎明显无法解决的,那么自然就可以得出一个结论,这是必须要使用大模型的业务场景。
记住一个面试技巧:证明使用 A 而不是使用 B 的必要性,两个思路:
- 罗列 A 和 B 的优缺点,而后结合业务说 A 更好。这种遇到一些面试官就会质疑。
- 举出一个无可辩驳的场景,在这个场景下只能用 A。这个思路相当于直接放弃了辩经。
失分2:难点不被认可
BHW 提到的难点只有:
- 提示词设计
- 工单一致性
这两个难点,对于一个应届生来说确实可以认为是难点,但是他在面试过程中缺乏一个证明过程,也就是证明为什么这会是一个难点。
例如说一种简单的话术可以是“……难点是提示词设计。举个例子,在我们的场景中需要提示词 xxx,在最开始我们撰写的提示词就有 A、B、C 三个问题。比如说在使用的时候,A 会导致 XX。后续我在结合 AB 测试的时候写过几个版本……”
这其实也是很多人面试的时候会犯的错误,有一些难点,你一说面试官就能认可是一个难点,有一些难点你得证明一下为什么是难点。
ReAct/tool:深度不足
面试官问:
- “ReAct 用来干什么?”
- “工具是什么?”
- “你们怎么注册工具?”
- “怎么 reason → act → observe?”
BHW 回答:
- “注册 MCP 工具(git diff、explain 等)”
- “让模型调用工具再分析”
上一次面试遇到过类似的问题,这一次表现也差不多:没讲出 ReAct 的进阶内容。
例如:
- 如何避免幻觉?
- 如何控制链条深度?
- 如何阻断错误的 tool-call?
面试官尝试引导他谈“任务拆解 → 逐步验证”,但 BHW 没能抓住。
RAG 召回:表达差
典型对话:
“你用 RAG 解决什么问题?” “你召回用的是什么算法?” “BM25 和 KNN 分别适用什么场景?”
BHW 回答:
“有点忘了。” “解决相关性。” “KNN 就是找最近的…”
这是整场面试中最明显的「深度不足」信号。如果你是应届生,这是允许的;如果你是社招,这是直接淘汰点。
如果要刷亮点,可以考虑:
- BM25(词项匹配)适用于结构化知识库
- 向量检索适用于语义相关场景
- 双召回是为了降低偏差,提高稳定性
- Rerank 提升精准度
但 BHW 没有提到任何这些关键点。其实我个人认为他是知道这些的,在平时的面试复盘和交流的时候我都能确认这一个点。所以我会认为他可能是前面的面试让他现在有点紧张,所以没有刷亮点。
实际上,这里我还要额外强调一个面试中的点,回答问题一定要使用精准的技术词汇,而不是凭借个人的感觉,用自己的语言来回答,这会让人觉得你很菜。
算法题:写出来了但无高光
录音中 BHW:
- 犹豫是否用贪心还是回溯
- 回溯写出来了
- 面试官要求尝试不同输入
整体算法题算过关,但没有高光。
基础知识:失分
面试官问:
- “Transformer 结构知道吗?”
- “Q、K、V 是什么?”
BHW回答:
“研一的时候知道,但最近没关注了。”
对于大模型方向岗位,这属于非常不好的信号。如果你的简历有和 AI 相关的内容,那么你就算是应届生也应该掌握 Transformer/QKV 这种基础概念。
这算是我的锅,因为我在面试辅导的时候忘了跟他提一嘴要了解一下 Transformer 的基本概念。
面试尾声
当面试官问:
“你觉得自己表现怎么样?”
BHW 回答:
“尽我所能。” “可能没 get 到您的点。”
这类表达会让面试官下意识觉得:
- 心理素质不足
- 对自己的水平缺乏准确判断
建议应届生使用更职业化的表达,比如:
“整体大部分问题能够覆盖,但我能感觉到您希望听到更工程化的视角,这是我需要进一步加强的部分。”
不过这个东西,没那么重要,你就算随便扯也不会给你加很多分,也不会给你减很多分。
2. 面试官提问路线(专业复盘)
结合录音内容,面试官的提问路线非常标准,呈现出一个“大模型工程 + 分布式系统 + 服务端基础”岗位的全流程考察。
Step1:项目真实性验证
连续追问时间、地点、职责。
目的:确认不是“带水实习”。
Step2:核心项目深挖
重点如下:
- 大模型必要性
- 场景合理性
- 工程落地方式
- 工具调用
- ReAct 流程是否真正实践过
- RAG 是否真正在线上使用过
目的:确认候选人不是看文章、不是 PPT 工程师。
Step 3:扩展问法验证“技术深度”
例如:
- 为什么要用 BM25?
- 为什么要用 KNN?
- 为什么要用双召回?
- 工单一致性如何保证?
目的:判断候选人是否真的理解原理。
Step4:基础考察(比例偏低)
仅问了 transformer、QKV 等基础内容。
目的:验证知识体系完整度。
Step5:算法题
目的:确保候选人不是“只能讲概念的人”。
总结
结论:合格。
BHW 的表现符合一个 大模型方向应届生 的基础要求:
- 项目能讲
- 有基本的 ReAct/RAG 概念
- 有提示词设计经验
- 算法能写
- 能理解一些工程场景
但距离“让面试官眼前一亮”还有一些差距,就是没能让面试官觉得这是一个非常优秀的候选人。
改进点
多思考为什么
可以讲,但讲不出“为什么这样设计”。
改进建议:
- 明确大模型的作用点
- 用“业务痛点 → 方案 → 效果”结构化叙述
- 对每个模块讲出 trade-off 和 alternative
RAG、ReAct、召回算法深度不足
现在是“知道概念”的程度 需要进化为“知道为什么这么做”的程度。
面试后半场慌乱,稳住心态
出现明显的:
- 句子断裂
- 内容重复
- 逻辑混乱
一定要小心面试官搞心态。一些变态当上面试官之后就是喜欢搞人心态,要稳住,不然一身功力只能发挥个六七层,有点坑。
社招:目测不合格
社招特别看以下几点:
| 能力 | 社招要求 | BHW 的回答 |
|---|---|---|
| 工程化深度 | 能讲架构选型理由、优化手段、瓶颈定位 | 表达虚、无法解释为什么用大模型 |
| 原理理解 | BM25、ANN、ReAct loop、token 限制实现 | 多次回答“不太清楚” |
| 架构掌控能力 | 能独立设计 + 持续优化 | 多次表示自己做提示词、工单、调用接口 |
| 业务抽象能力 | 解释“为什么要做这个项目” | 解释不清楚 |
所以如果按社招标准打分:
- 技术深度:不及格
- 项目掌控力:不及格
- 工程能力:偏弱
- 面试表现力:偏弱
社招几乎很难过。
后续面试方案完善
大模型项目要讲“必要性”,不是讲“功能”
比如:
“规则 → 无法处理跨表因果关系 explain → 无法结合业务上下文 LLM → 补充复杂语义推断能力”
ReAct 必须讲“为什么比单次调用更强”
例如:
- 逐步验证避免幻觉
- 工具链提升可解释性
- 复杂任务分步完成
RAG 必须讲“双路召回 + rerank + chunk 策略”
面试官不会满足于“相关性”。
算法题要写完之后补分析:
- 时间复杂度
- 空间复杂度
- 可否优化
这样分数会明显高。
最后
BHW 的这场面试,体现了典型应届生常见的短板:项目能讲,但讲不深;术语会说,但不扎实;工程能写,亮点不足。
面试不是比知识,而是比深度;不是比你做了什么,而是比你为什么这样做。
能答出来是合格,能讲清楚是优秀,能让面试官记住你,才是拿 offer 的关键。
最后该小伙伴没有拿到字节的 Offer,基本上可以认为并不是他不够合格,而是在横向对比中落败。这也就是很多小伙伴在坚持到最后的时候,或者在等待开奖的时候没有等到。
本质上就是:面试是一个按照排名录取的,而不是按照合格录取的。