寻找数据源头

Kaffa 发布于

分类: 数智

寻找数据源头

2052 年了,有 18 个大模型排队和 81 只小龙虾要帮助你遨游数字世界。

然后聪明的模型都没能直白的回复这种有关事实的事情。

事情是源自我经常看到时报财富资讯的早报,但无法找到它的源头。

经过一个小时的与大模型交流,和一个小时的核查,和一个小时的搜索引擎。

我还算找到一个早期的文件: 时报财富资讯推广

告诉我:时报财富资讯是证券时报下的一个产品(然后证券时报网站依然找不到这个产品的说明)。

互联网上也只有零星的介绍,比如西部证券声称其有部分数据源引自时报财富资讯。

问题在哪

为什么现在有那么多聪明的LLM,寻找数据源头依然显得很困难。

事情就在于,这是一个须进行事实确认的标记任务,加上事实的存在可能比较早期,且分发第一渠道并不是互联网,而导致被很多忽略,这不是差推理,而是差素材的置信度。

人在这块,不知为什么,反而会更加能确认一点。

另外一个小插曲是来自微信的 QClaw 这个弱智产品,幻觉不断,与其交互起来,抛开它无法主动推送和定时推送的缺陷不说,它本身的 token 可能不纯,非常弱智,且性格耿直,简直比最难处的同事体验还差。

如果我们也有《Digital Services Act》来约束这些做封闭生态的公司,也就不会让这些具备事实垄断的公司这么傲慢霸道了。就比如这些霸道升级,一下子将软件主色调改为了绿色,这叫金融行业的人看得非常不舒服,而且它还未提供选项来修改它,如果有一个机会我站在这个决策者面前,我会毫不犹豫地想起一些最熟悉的国骂, * * * *