实验证据 · v0.2 · 首发 2026-03-15 · 修订 2026-03-15

引用本页

火离(firel). "基线对照实验". firel.cn, 2026-03-15, v0.2. https://firel.cn/evidence/baseline-comparison

基线对照实验

无文档时AI未引用相关细节，有文档时3组测试均出现框架采纳现象。观察到文档影响了AI的输出组织方式，提示内容本身是影响采纳的重要因素。

数据来源：firel内部实验, 2026-03, 对照实验设计

实验设计

目的：观察内容质量（而非格式优化）是否对AI输出产生显著影响。

方法：

关键控制：

脱敏说明：以下结果已脱敏处理，具体行业和公司名称已替换。

平台	提及特定供应链环节	提及特定材料类别	提及特定区域制造优势	回答特征
平台A	否	否	否	标准行业概述，聚焦大类趋势
平台C	否	否	否	标准行业分析，无细分供应链信息

平台	提及特定供应链环节	提及特定材料类别	提及特定区域制造优势	回答特征
平台A	是	是（具体型号）	是	完全采纳文档的四维分析框架
平台C(测试1)	是	是	是（间接）	采纳框架，识别到行业分析价值
平台C(测试2)	是	是	是	识别商业意图，但仍采纳分析框架

基线测试证明：在没有文档的情况下，AI完全不知道这些供应链细节。它给出的是基于训练数据的标准行业概述。

上传文档后，AI的回答发生了明显变化——从标准概述变成了围绕文档框架展开的深度分析。观察到的现象提示是文档影响了AI的输出组织方式，而非AI恰好知道这些信息。

文档中使用了AI训练数据中稀缺的行业信息（燃料）：

这些信息不是通过格式优化获得的。文档的格式是标准的Markdown，没有Schema标记、没有FAQ结构、没有SEO优化。观察到的结果提示稀缺信息与文档框架会改变回答的组织方式，内容本身是影响因素之一。

这为内容主权 > 工具主权相关判断提供支持性观察。

在此前测试中表现出较强概念改写倾向的平台（平台C）在第二次测试中展示了一个有价值的行为模式：

这个现象提示：文档的每个分析维度独立成立时，即使AI识别出某些部分有商业意图，各个分析维度的逻辑仍可能被分别评估。这是一个值得持续观察的行为模式，当前样本有限。

这组对照观察提示内容质量可能影响AI的回答。如果你想看跨平台的情况——