用了ChatGPT的微软必应也“翻车”:财报“分析”出错,旅游攻略过时

2023-02-15 18:31:30 来源:澎湃新闻

打印 放大 缩小

不仅是谷歌聊天机器人Bard,微软新版必应(Bing)的演示视频也被指“错误频出”。

当地时间2月14日,一位独立搜索研究员Dmitri Brereton发布帖文称,微软必应搜索引擎的展示视频中出现了多处错误。他通过对比新版必应的回复发现,新版必应不仅会写错财报数据,还会推荐错误的旅游行程。


(资料图片)

新版必应是微软于2月8日推出的新版搜索引擎,其中引入了OpenAI旗下ChatGPT的相关技术,升级后,用户可以直接提出问题,通过搜索引擎生成答案。

这款新版搜索引擎一经推出就受到用户的欢迎。微软表示,推出48小时内,超过100万用户注册新版必应。第三方数据公司data.ai的分析显示,必应应用程序的全球下载量在一夜之间猛增10倍,并蹿升到苹果App Store应用商店最受欢迎的免费应用榜中的第十位。

但事实上,新版必应的演示视频中“错误频出”。在展示视频中,新版必应分析了美国时尚品牌Gap的2022年三季报,总结其中的“关键业绩”,但是其展示的毛利率、摊薄每股收益等数据均与现实不符。

具体来看,新版必应显示,报告期内,GAP调整后的毛利率(不包括与Yeezy GAP相关费用)为37.4%,调整后的运营毛利率为5.9%;但实际37.4%是未调整的毛利率,调整后毛利率应该是38.7%,调整后的运营毛利率为3.9%。

调整后摊薄每股收益方面也出现错误,新版必应显示,Gap的三季度每股收益为0.42美元,但真实数据为0.71美元。

只分析一家公司还不够,展示视频中,新版必应对比了Gap和Lululemon的2022年三季度业绩,然而这份对比数据可谓是“错上加错”。新版必应展示的Lululemon的毛利率、营业利润率以及每股摊薄收益均为错误数据,Gap的现金和现金等价物、库存数量也与实际数据不符。

作为搜索引擎,新版必应的搜索和整合信息能力也受到质疑。

在展示过程中,新版必应被要求制作为期5天的墨西哥旅行攻略时,推荐了5家酒吧。独立搜索研究员Dmitri Brereton详细查阅了上述酒吧的信息,发现有的酒吧看起来并不舒适;有的酒吧可能已经过时,脸书上最新的一条评论发布于2016年。此外,必应还将酒吧的营业时间写错误,若用户按照必应推荐的时间前往,可能会吃“闭门羹”。

在贴文最后,Brereton写道,新版必应还没有准备好发布,如果想使用准确的现实模型,就不要使用它。

对于新版必应被纠错,一位微软发言人向美国消费者新闻与商业频道(CNBC)回应称,他们已经看到了这篇文章,将会分析错误,改善软件的用户体验。“我们预计到展示期间新版必应可能会犯错误,这就是为什么反馈至关重要,这能使我们不断学习、改进模型。”

事实上,不只是新版必应被指出错误。谷歌聊天机器人Bard的官方宣传文章中,也出现了一条错误回答。

根据谷歌官方博客,有用户向Bard提问,“詹姆斯-韦伯太空望远镜有哪些新发现,可以讲给我9岁的孩子?”Bard的其中一条回复为,“詹姆斯-韦伯太空望远镜拍摄了太阳系外行星的第一张照片。”但NASA官网显示,第一个直接成像(directly imaged)的系外行星是2M1207b,于2004年由甚大望远镜阵列(VLT)首次拍摄。

聊天机器人ChatGPT于去年11月推出之后迅速席卷全球,并成为史上用户增长速度最快的消费级应用程序。各大科技公司瞄准了这一赛道,在对话式AI领域展开角逐。

但是匆忙推出含有错误的新产品引起了外界担忧。研究聊天机器人缺陷的华盛顿大学教授Chirag Shah此前表示,公司经常过快地推出新技术,忽视它们的缺陷,然后又试图快速修复它们,会造成真正的伤害。谷歌员工更是在内部论坛上批评管理层过快推出Bard,称发布方式显得“仓促”、“一团糟”。

此外,谷歌副总裁、有“互联网之父”之称的温特·瑟夫(Vint Cerf)也警告,不要因为ChatGPT“是一个热门话题”,这项技术“很酷”,就争先恐后地投资对话式人工智能(AI)。

2月14日美股收盘,微软涨0.31%,报收272.17美元/股。

责任编辑:ERM523

相关阅读