我试着让 ChatGPT 推荐《连线》杂志的精选产品,结果它全弄错了
ChatGPT 在提供产品推荐时频繁出错,甚至歪曲了《连线》杂志的真实测评,揭示了 AI 购物助手在准确性方面的严重缺陷。
当人工智能扮演科技评论员时,没人是赢家
这里有一个有趣的实验:问问 ChatGPT,《连线》(WIRED) 的评论员推荐哪款电视、耳机或笔记本电脑。去试试吧,你会得到一个自信、排版整齐,但完全错误的答案。这就像是问一个从不看足球的人谁是英超最佳球队,结果他却激情澎湃地推荐阿克宁顿斯坦利队一样,简直是数字版翻车现场。
这正是《连线》记者里斯·罗杰斯 (Reece Rogers) 在测试 OpenAI 的聊天机器人时发现的情况。结果不仅仅是稍有偏差,简直是错得离谱,甚至让人感到“印象深刻”。
电视推荐的重大乌龙
当罗杰斯询问 ChatGPT 关于《连线》的最佳电视推荐时,该聊天机器人给出的答案是 LG QNED Evo Mini-LED。听起来还挺像那么回事,对吧?但有一个小问题:这根本不是《连线》推荐的产品。当被追问时,ChatGPT 似乎改口称真正的首选是 TCL QM6K,而它之前却悄悄地把这个选项换成了 LG。为什么?你的猜测和我的一样,但“一本正经地胡说八道”似乎成了生成式 AI 的招牌动作。
根本没人评测过的 AirPods
更离谱的还在后面。ChatGPT 据称将 AirPods Max 2 列为了《连线》的耳机推荐。苹果在 2026 年 3 月 16 日发布了 AirPods Max 2,并于 3 月 25 日开始发售。在撰写本文时,完全有可能《连线》的耳机评论员瑞安·瓦尼亚塔 (Ryan Waniata) 还没来得及进行全面测试并将其加入购物指南。不过,这点小细节显然没能阻挡 ChatGPT 给出“好”建议的决心。
这有点像美食评论家在推荐一道他从未尝过的菜。当然,菜单上的描述听起来很诱人,但这并不是评论工作的运作方式,对吧?
被时间遗忘的笔记本电脑
最能说明问题的错误可能涉及笔记本电脑。ChatGPT 据称一直坚持认为《连线》的首选是 2025 年的 MacBook Air M4。而 MacBook Air M5 已于 2026 年 3 月 3 日发布,并于 3 月 11 日开始销售。当这段对话发生时,M5 型号已经上市数周了。ChatGPT 却自信地推荐去年的旧型号作为当前的最爱,这就像在 Windows 11 发布已久的情况下,还在推荐 Windows 10 一样。
数据勾勒出一幅严峻的图景
如果你认为这只是个别事件,那么数据表明事实并非如此。OpenAI 自己也承认,ChatGPT 搜索结果中高达 63% 的产品提及包含不准确信息。仔细想想这个数字,它提到的产品中近三分之二都存在错误。抛硬币的准确率可能都比这高。
即使有了 OpenAI 改良后的购物功能和专门的购物模型,复杂查询的准确率也仅达到 52% 左右,而标准 ChatGPT 搜索的准确率仅为 37%。这算进步吗?从技术上讲,是的。这令人放心吗?绝对不是。达到这么低的及格线根本不值得庆祝。
与此同时,一项更广泛的调查发现,64% 的消费者在过去六个月内遇到过 AI 生成的关于产品或服务的错误信息。华盛顿州立大学 2026 年 3 月的一项研究给 AI 的准确性和一致性打了“D”级。如果是学校成绩单,家长早就被叫去谈话了。
康泰纳仕交易的讽刺之处
事情在这里变得相当荒谬。《连线》的母公司康泰纳仕 (Conde Nast) 早在 2024 年 8 月就与 OpenAI 签署了一份多年授权协议。该协议涵盖了《连线》、《GQ》、《Vogue》等刊物,允许它们的内容以正确的链接形式出现在 ChatGPT 的回答中。
所以,康泰纳仕花钱让自己的内容出现在 ChatGPT 中,而 ChatGPT 依然把推荐搞错了。这就像雇了一个能查阅你所有文件,却坚持要胡编乱造的私人助理。你已经把答案给了他们,他们却还在临场发挥。
没人深究的联盟营销收入问题
除了准确性问题,还有一个更隐蔽的问题。当 ChatGPT 展示据称基于《连线》评测的产品推荐时,这些列表并不包含出版商的联盟营销链接。这一点至关重要。
联盟营销收入是科技新闻行业的生命线。当你点击评测链接购买产品时,出版机构会获得少量佣金,这有助于资助你所依赖的测试和编辑工作。ChatGPT 巧妙地绕过了整个系统。它借用了专家评测的公信力,剥离了资助这些评测的商业机制,而且往往还把真正的推荐产品搞错了。这简直是三重打击。
越来越多的人将 AI 聊天机器人作为购物旅程的一部分,而 ChatGPT 占据了 AI 驱动购物流量的绝大部分。ChatGPT 回答的每一个查询,都可能是一个从未到达出版商网站的访问。虽然这种流量分流在绝对数量上可能仍然很小,但趋势很明显,任何重视独立产品新闻的人都应该对此感到担忧。
OpenAI 的尴尬转向
这一切都发生在一个更宏大的背景下,即 OpenAI 试图在电子商务领域分一杯羹,但进展并不顺利。该公司在 2025 年 9 月推出了“即时结账”功能,但由于转化率低,以及你猜对了,准确性问题,该功能已被缩减。OpenAI 现在正将 ChatGPT 重新定位为产品发现和研究工具,而非直接购买平台。
最新版本 GPT 5.4 声称与 GPT 5.2 相比,幻觉率降低了 33%。当然,这是进步。但当你的起点是经常出错时,33% 的改进仍然让你处于相当不可靠的境地。
这对你意味着什么
如果你正在使用 ChatGPT 来辅助购买决策,请保持怀疑态度,就像对待公交车站陌生人的建议一样。他们可能是对的,也可能是在自信地胡说八道。如果不亲自核实,你根本无法分辨。
更明智的做法是什么?如果必须使用 AI 作为起点,请务必根据实际来源进行核实。如果 ChatGPT 说《连线》推荐某样东西,请去《连线》官网查询。如果它引用了特定的评测,请找到那篇评测。多花十秒钟的时间,就能让你免于购买根本没有专家推荐的产品。
大局观
这实际上并不是关于一个聊天机器人搞错了几个产品推荐的故事。这是关于 AI 如何与专家知识交互的根本性矛盾。这些系统吞噬权威内容,以不同的准确度重新包装,并将它们作为可靠的指南呈现出来,同时还在破坏产生这些内容的经济模式。
在 AI 能够稳定地搞定基础知识之前,当被问及产品推荐时,ChatGPT 最诚实的回答或许应该是:“我不确定。这里有链接指向那些真正测试过这些产品的人。”但当然,这需要那种目前仍属于科幻小说范畴的自我意识。
阅读原文请访问 来源。
