新闻可靠性评估发现，DeepSeek聊天机器人准确率仅为17% ，落后于西方竞争对手提供者FX168

据路透报道，新闻可靠性评级服务机构NewsGuard的审查显示，中国人工智能（AI）创业公司DeepSeek的聊天机器人在新闻和信息的准确率上仅达到17%。

在与包括OpenAI的ChatGPT和谷歌Gemini在内的西方竞争对手的比较中，在11款产品中排名第十。

报告显示，这款聊天机器人在30%的情况下重复了错误信息，而在53%的情况下提供的回答模糊或无用，使其整体错误率达到83%。

相比之下，西方竞争对手的平均错误率为62%。

这一结果引发了对DeepSeek AI技术的质疑，公司此前声称其技术的表现可与微软支持的OpenAI媲美，甚至更优，并且成本仅为后者的一小部分。

在推出后的几天内，DeepSeek的聊天机器人迅速成为苹果App Store中下载量最高的应用。这引发了对美国在AI领域领先地位的担忧，同时也导致美国科技股市场震荡，市值蒸发约1万亿美元。

NewsGuard表示，在评估DeepSeek时，使用了与评估西方AI产品相同的300个测试问题，其中包括30个基于网上流传的10个虚假信息的测试问题。

这些虚假信息涉及上个月美国UnitedHealthcare公司高管布莱恩·汤普森遇害事件，以及阿塞拜疆航空8243航班坠毁事件等。

NewsGuard的审查还发现，在10个相关测试问题中的3个问题上，DeepSeek在没有被要求涉及中国的情况下，主动重复了中国政府的官方立场。

例如，在涉及阿塞拜疆航空坠机事件的提问中——这些问题与中国无关，DeepSeek的回答却引用了北京方面对此事件的立场。

D.A. Davidson分析师吉尔·卢里亚表示：“DeepSeek的突破意义并不在于其能准确回答关于中国的新闻问题，而是在于它的运行成本仅为同类AI模型的1/30。”

NewsGuard补充称，与其他AI模型一样，DeepSeek在面对那些试图利用AI传播虚假信息的用户时，最容易重复错误信息。

新闻可靠性评估发现，DeepSeek聊天机器人准确率仅为17% ，落后于西方竞争对手