Tech · 6 min read

我试着让 ChatGPT 推荐《连线》杂志的精选产品,结果它全弄错了

ChatGPT 在提供产品推荐时频繁出错,甚至歪曲了《连线》杂志的真实测评,揭示了 AI 购物助手在准确性方面的严重缺陷。

我试着让 ChatGPT 推荐《连线》杂志的精选产品,结果它全弄错了

当人工智能扮演科技评论员时,没人是赢家

这里有一个有趣的实验:问问 ChatGPT,《连线》(WIRED) 的评论员推荐哪款电视、耳机或笔记本电脑。去试试吧,你会得到一个自信、排版整齐,但完全错误的答案。这就像是问一个从不看足球的人谁是英超最佳球队,结果他却激情澎湃地推荐阿克宁顿斯坦利队一样,简直是数字版翻车现场。

这正是《连线》记者里斯·罗杰斯 (Reece Rogers) 在测试 OpenAI 的聊天机器人时发现的情况。结果不仅仅是稍有偏差,简直是错得离谱,甚至让人感到“印象深刻”。

电视推荐的重大乌龙

当罗杰斯询问 ChatGPT 关于《连线》的最佳电视推荐时,该聊天机器人给出的答案是 LG QNED Evo Mini-LED。听起来还挺像那么回事,对吧?但有一个小问题:这根本不是《连线》推荐的产品。当被追问时,ChatGPT 似乎改口称真正的首选是 TCL QM6K,而它之前却悄悄地把这个选项换成了 LG。为什么?你的猜测和我的一样,但“一本正经地胡说八道”似乎成了生成式 AI 的招牌动作。

根本没人评测过的 AirPods

更离谱的还在后面。ChatGPT 据称将 AirPods Max 2 列为了《连线》的耳机推荐。苹果在 2026 年 3 月 16 日发布了 AirPods Max 2,并于 3 月 25 日开始发售。在撰写本文时,完全有可能《连线》的耳机评论员瑞安·瓦尼亚塔 (Ryan Waniata) 还没来得及进行全面测试并将其加入购物指南。不过,这点小细节显然没能阻挡 ChatGPT 给出“好”建议的决心。

这有点像美食评论家在推荐一道他从未尝过的菜。当然,菜单上的描述听起来很诱人,但这并不是评论工作的运作方式,对吧?

被时间遗忘的笔记本电脑

最能说明问题的错误可能涉及笔记本电脑。ChatGPT 据称一直坚持认为《连线》的首选是 2025 年的 MacBook Air M4。而 MacBook Air M5 已于 2026 年 3 月 3 日发布,并于 3 月 11 日开始销售。当这段对话发生时,M5 型号已经上市数周了。ChatGPT 却自信地推荐去年的旧型号作为当前的最爱,这就像在 Windows 11 发布已久的情况下,还在推荐 Windows 10 一样。

数据勾勒出一幅严峻的图景

如果你认为这只是个别事件,那么数据表明事实并非如此。OpenAI 自己也承认,ChatGPT 搜索结果中高达 63% 的产品提及包含不准确信息。仔细想想这个数字,它提到的产品中近三分之二都存在错误。抛硬币的准确率可能都比这高。

即使有了 OpenAI 改良后的购物功能和专门的购物模型,复杂查询的准确率也仅达到 52% 左右,而标准 ChatGPT 搜索的准确率仅为 37%。这算进步吗?从技术上讲,是的。这令人放心吗?绝对不是。达到这么低的及格线根本不值得庆祝。

与此同时,一项更广泛的调查发现,64% 的消费者在过去六个月内遇到过 AI 生成的关于产品或服务的错误信息。华盛顿州立大学 2026 年 3 月的一项研究给 AI 的准确性和一致性打了“D”级。如果是学校成绩单,家长早就被叫去谈话了。

康泰纳仕交易的讽刺之处

事情在这里变得相当荒谬。《连线》的母公司康泰纳仕 (Conde Nast) 早在 2024 年 8 月就与 OpenAI 签署了一份多年授权协议。该协议涵盖了《连线》、《GQ》、《Vogue》等刊物,允许它们的内容以正确的链接形式出现在 ChatGPT 的回答中。

所以,康泰纳仕花钱让自己的内容出现在 ChatGPT 中,而 ChatGPT 依然把推荐搞错了。这就像雇了一个能查阅你所有文件,却坚持要胡编乱造的私人助理。你已经把答案给了他们,他们却还在临场发挥。

没人深究的联盟营销收入问题

除了准确性问题,还有一个更隐蔽的问题。当 ChatGPT 展示据称基于《连线》评测的产品推荐时,这些列表并不包含出版商的联盟营销链接。这一点至关重要。

联盟营销收入是科技新闻行业的生命线。当你点击评测链接购买产品时,出版机构会获得少量佣金,这有助于资助你所依赖的测试和编辑工作。ChatGPT 巧妙地绕过了整个系统。它借用了专家评测的公信力,剥离了资助这些评测的商业机制,而且往往还把真正的推荐产品搞错了。这简直是三重打击。

越来越多的人将 AI 聊天机器人作为购物旅程的一部分,而 ChatGPT 占据了 AI 驱动购物流量的绝大部分。ChatGPT 回答的每一个查询,都可能是一个从未到达出版商网站的访问。虽然这种流量分流在绝对数量上可能仍然很小,但趋势很明显,任何重视独立产品新闻的人都应该对此感到担忧。

OpenAI 的尴尬转向

这一切都发生在一个更宏大的背景下,即 OpenAI 试图在电子商务领域分一杯羹,但进展并不顺利。该公司在 2025 年 9 月推出了“即时结账”功能,但由于转化率低,以及你猜对了,准确性问题,该功能已被缩减。OpenAI 现在正将 ChatGPT 重新定位为产品发现和研究工具,而非直接购买平台。

最新版本 GPT 5.4 声称与 GPT 5.2 相比,幻觉率降低了 33%。当然,这是进步。但当你的起点是经常出错时,33% 的改进仍然让你处于相当不可靠的境地。

这对你意味着什么

如果你正在使用 ChatGPT 来辅助购买决策,请保持怀疑态度,就像对待公交车站陌生人的建议一样。他们可能是对的,也可能是在自信地胡说八道。如果不亲自核实,你根本无法分辨。

更明智的做法是什么?如果必须使用 AI 作为起点,请务必根据实际来源进行核实。如果 ChatGPT 说《连线》推荐某样东西,请去《连线》官网查询。如果它引用了特定的评测,请找到那篇评测。多花十秒钟的时间,就能让你免于购买根本没有专家推荐的产品。

大局观

这实际上并不是关于一个聊天机器人搞错了几个产品推荐的故事。这是关于 AI 如何与专家知识交互的根本性矛盾。这些系统吞噬权威内容,以不同的准确度重新包装,并将它们作为可靠的指南呈现出来,同时还在破坏产生这些内容的经济模式。

在 AI 能够稳定地搞定基础知识之前,当被问及产品推荐时,ChatGPT 最诚实的回答或许应该是:“我不确定。这里有链接指向那些真正测试过这些产品的人。”但当然,这需要那种目前仍属于科幻小说范畴的自我意识。

阅读原文请访问 来源

D
Written by

Daniel Benson

Writer, editor, and the entire staff of SignalDaily. Spent years in tech before deciding the news needed fewer press releases and more straight talk. Covers AI, technology, sport and world events — always with context, sometimes with sarcasm. No ads, no paywalls, no patience for clickbait. Based in the UK.