Kaffa.im - 寻找数据源头

寻找数据源头

Kaffa 发布于 2026-04-15 周三

分类: 数智

寻找数据源头

2052 年了，有 18 个大模型排队和 81 只小龙虾要帮助你遨游数字世界。

然后聪明的模型都没能直白的回复这种有关事实的事情。

事情是源自我经常看到时报财富资讯的早报，但无法找到它的源头。

经过一个小时的与大模型交流，和一个小时的核查，和一个小时的搜索引擎。

我还算找到一个早期的文件：时报财富资讯推广

告诉我：时报财富资讯是证券时报下的一个产品（然后证券时报网站依然找不到这个产品的说明）。

互联网上也只有零星的介绍，比如西部证券声称其有部分数据源引自时报财富资讯。

问题在哪

为什么现在有那么多聪明的LLM，寻找数据源头依然显得很困难。

事情就在于，这是一个须进行事实确认的标记任务，加上事实的存在可能比较早期，且分发第一渠道并不是互联网，而导致被很多忽略，这不是差推理，而是差素材的置信度。

人在这块，不知为什么，反而会更加能确认一点。

另外一个小插曲是来自微信的 QClaw 这个弱智产品，幻觉不断，与其交互起来，抛开它无法主动推送和定时推送的缺陷不说，它本身的 token 可能不纯，非常弱智，且性格耿直，简直比最难处的同事体验还差。

如果我们也有《Digital Services Act》来约束这些做封闭生态的公司，也就不会让这些具备事实垄断的公司这么傲慢霸道了。就比如这些霸道升级，一下子将软件主色调改为了绿色，这叫金融行业的人看得非常不舒服，而且它还未提供选项来修改它，如果有一个机会我站在这个决策者面前，我会毫不犹豫地想起一些最熟悉的国骂， * * * *