总体表现

从整场录音看，BHW 的表现具有典型的“应届生能答出来，但亮点不足”的特点：

可取之处

整体表达有条理，没有硬伤
大模型工程化基础概念（Prompt、COT、ReAct）都有理解
SQL/MySQL 方面回答得更稳
工单一致性、提示词拆解等点能讲出一些经验

明显短板

项目描述偏虚，被面试官多次追问、戳穿细节不足
无法清晰解释大模型为什么必要（场景合理性）
ReAct、RAG、工具链、召回方式深度不足
对一些关键基础（如 BM25/ANN 区别、KNN 的适用场景）答得模糊
技术题写得出来但优化方向不清晰
面试后段明显出现慌乱、表达断裂

总体评价：

作为应届生，属于“基本可用但亮点不够”类型。 如果按社招标准，会被认为：深度不足、工程经验薄弱、无法撑起项目。

PS：这个评价标准是偏高的，适配的是字节的招聘要求。很多中小型公司其实到这个表现是肯定能拿到 Offer 的。因此你不要将这个评价标准套用到别的公司的面经上。

面试逐段复盘

以下根据录音按实际流程拆解。

自我介绍与项目真实性验证

录音中面试官多次追问：

“这个是在 XX 做的吗？”
“什么时候实习的？”
“实习结束了吗？”
“这是校招吧？”

这些都属于典型的大厂“反查真实经历”流程。 BHW 在此环节表现 OK，没有自相矛盾。

核心项目深挖

这是整场面试 失分最多的部分。

面试官连续追问：

“为什么要用大模型？”
“规则能不能做？”
“大模型解决了什么问题？”
“慢 SQL 怎么靠大模型分析？”
“Explain 不是传统手段就能做了吗？”

BHW 的回答出现了三类典型错误：

失分1：使用大模型理由不够强

他主要回答：

“规则可以，但大模型能智能推理…”

但并没有真正回答：

规则为什么不够？
业务场景中哪里需要“LLM + 工具”的能力？
用 LLM 会解决哪些工程痛点？

导致面试官给出评价：

“有点虚啊。”

实际上，这种问题可以直接虚构一个业务场景，而这个业务场景是规则引擎明显无法解决的，那么自然就可以得出一个结论，这是必须要使用大模型的业务场景。

记住一个面试技巧：证明使用 A 而不是使用 B 的必要性，两个思路：

罗列 A 和 B 的优缺点，而后结合业务说 A 更好。这种遇到一些面试官就会质疑。

能力	社招要求	BHW 的回答
工程化深度	能讲架构选型理由、优化手段、瓶颈定位	表达虚、无法解释为什么用大模型
原理理解	BM25、ANN、ReAct loop、token 限制实现	多次回答“不太清楚”
架构掌控能力	能独立设计 + 持续优化	多次表示自己做提示词、工单、调用接口
业务抽象能力	解释“为什么要做这个项目”	解释不清楚

快速导航

分析内容

总体表现

可取之处

明显短板

面试逐段复盘

自我介绍与项目真实性验证

核心项目深挖

失分1：使用大模型理由不够强

失分2：难点不被认可

ReAct/tool：深度不足

RAG 召回：表达差

算法题：写出来了但无高光

基础知识：失分

面试尾声

2. 面试官提问路线（专业复盘）

Step1：项目真实性验证

Step2：核心项目深挖

Step 3：扩展问法验证“技术深度”

Step4：基础考察（比例偏低）

Step5：算法题

总结

改进点

多思考为什么

RAG、ReAct、召回算法深度不足

面试后半场慌乱，稳住心态

社招：目测不合格

后续面试方案完善

大模型项目要讲“必要性”，不是讲“功能”

ReAct 必须讲“为什么比单次调用更强”

RAG 必须讲“双路召回 + rerank + chunk 策略”

算法题要写完之后补分析：

最后