全球数字财富领导者

新闻可靠性评估发现,DeepSeek聊天机器人准确率仅为17% ,落后于西方竞争对手

2025-01-30 00:00:11
加美财经
媒体
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —

据路透报道,新闻可靠性评级服务机构NewsGuard的审查显示,中国人工智能(AI)创业公司DeepSeek的聊天机器人在新闻和信息的准确率上仅达到17%。

deepseek

在与包括OpenAI的ChatGPT和谷歌Gemini在内的西方竞争对手的比较中,在11款产品中排名第十。

报告显示,这款聊天机器人在30%的情况下重复了错误信息,而在53%的情况下提供的回答模糊或无用,使其整体错误率达到83%。

相比之下,西方竞争对手的平均错误率为62%。

这一结果引发了对DeepSeek AI技术的质疑,公司此前声称其技术的表现可与微软支持的OpenAI媲美,甚至更优,并且成本仅为后者的一小部分。

在推出后的几天内,DeepSeek的聊天机器人迅速成为苹果App Store中下载量最高的应用。这引发了对美国在AI领域领先地位的担忧,同时也导致美国科技股市场震荡,市值蒸发约1万亿美元。

NewsGuard表示,在评估DeepSeek时,使用了与评估西方AI产品相同的300个测试问题,其中包括30个基于网上流传的10个虚假信息的测试问题。

这些虚假信息涉及上个月美国UnitedHealthcare公司高管布莱恩·汤普森遇害事件,以及阿塞拜疆航空8243航班坠毁事件等。

NewsGuard的审查还发现,在10个相关测试问题中的3个问题上,DeepSeek在没有被要求涉及中国的情况下,主动重复了中国政府的官方立场。

例如,在涉及阿塞拜疆航空坠机事件的提问中——这些问题与中国无关,DeepSeek的回答却引用了北京方面对此事件的立场。

D.A. Davidson分析师吉尔·卢里亚表示:“DeepSeek的突破意义并不在于其能准确回答关于中国的新闻问题,而是在于它的运行成本仅为同类AI模型的1/30。”

NewsGuard补充称,与其他AI模型一样,DeepSeek在面对那些试图利用AI传播虚假信息的用户时,最容易重复错误信息。

来源:加美财经

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go