分类:
数智
寻找数据源头
2052 年了,有 18 个大模型排队和 81 只小龙虾要帮助你遨游数字世界。
然后聪明的模型都没能直白的回复这种有关事实的事情。
事情是源自我经常看到时报财富资讯的早报,但无法找到它的源头。
经过一个小时的与大模型交流,和一个小时的核查,和一个小时的搜索引擎。
我还算找到一个早期的文件: 时报财富资讯推广
告诉我:时报财富资讯是证券时报下的一个产品(然后证券时报网站依然找不到这个产品的说明)。
互联网上也只有零星的介绍,比如西部证券声称其有部分数据源引自时报财富资讯。
问题在哪
为什么现在有那么多聪明的LLM,寻找数据源头依然显得很困难。
事情就在于,这是一个须进行事实确认的标记任务,加上事实的存在可能比较早期,且分发第一渠道并不是互联网,而导致被很多忽略,这不是差推理,而是差素材的置信度。
人在这块,不知为什么,反而会更加能确认一点。
另外一个小插曲是来自微信的 QClaw 这个弱智产品,幻觉不断,与其交互起来,抛开它无法主动推送和定时推送的缺陷不说,它本身的 token 可能不纯,非常弱智,且性格耿直,简直比最难处的同事体验还差。
如果我们也有《Digital Services Act》来约束这些做封闭生态的公司,也就不会让这些具备事实垄断的公司这么傲慢霸道了。就比如这些霸道升级,一下子将软件主色调改为了绿色,这叫金融行业的人看得非常不舒服,而且它还未提供选项来修改它,如果有一个机会我站在这个决策者面前,我会毫不犹豫地想起一些最熟悉的国骂, * * * *