把上下文检索和代码定位作为一个智能体任务来处理,而不是传统的检索任务。
通过智能体的多轮交互,逐步缩小检索范围,最终定位到最相关的代码片段。
在该任务上, 目前的主流agent模型(KIIM-K2,MiniMax-2.1, CodeX, Deepseek V3.2等均在60%左右)
基于Deepseek-V3.2的3000条轨迹数据进行蒸馏, 将Qwen3-30B的文件召回率从接近基线(带有关键词的BM25, 召回率24.74\%)提升近100%(24.11 \% \to 45.6\%), 超过了GPT-5.1(30.65\%)的表现。