Style Challenger · 数据生成管线架构

Chained Reflection 风格 challenge 训练样本生成工具 · @danialwang
PIPELINE · 解析 & 上下文构建 aisearch_result *.json (planner 结果) frontier_aisearch 输出 解析 / 抽取 extract_search_turns query · history · 搜索文档 构建上下文 build_history_messages system + user(query+docs) ① Draft 生成 LLM 产出初稿 --model · reasoning-effort prompts/ answer_system · reflection .md 模板 (多版本) data/ few-shot db-shot-*.csv render_few_shot_block xiaocai 代理 build_xiaocai_clients appid,secret 鉴权 · GPT/Gemini ② Chained Reflection draft 留作 assistant 续写最终答案 ③ 引用修复 fix_reference.py 归一化 · 空则丢弃 ④ 落盘输出 _write_item_file [system, user, assistant] merge_answers.py 合批 outputs/ 训练样本 items/*.jsonl · failed.jsonl summary.json · *_prompt.txt 可直接用于 SFT 训练 CLI 入口 run_style_challenger_chained.py run_text_batch.sh · 并发 50 图例 LEGEND 核心管线 (解析/上下文/输出) LLM 生成 (Draft/Reflection) 模型代理 / 输出存储 配置源 (prompts / few-shot) 后处理 (引用修复) CLI 入口 / 批量调度

核心管线

两段式生成

输出 & 依赖