用了ChatGPT的微软必应也“翻车”：财报“分析”出错，旅游攻略过时

不仅是谷歌聊天机器人Bard，微软新版必应（Bing）的演示视频也被指“错误频出”。

当地时间2月14日，一位独立搜索研究员Dmitri Brereton发布帖文称，微软必应搜索引擎的展示视频中出现了多处错误。他通过对比新版必应的回复发现，新版必应不仅会写错财报数据，还会推荐错误的旅游行程。

(资料图片)

新版必应是微软于2月8日推出的新版搜索引擎，其中引入了OpenAI旗下ChatGPT的相关技术，升级后，用户可以直接提出问题，通过搜索引擎生成答案。

这款新版搜索引擎一经推出就受到用户的欢迎。微软表示，推出48小时内，超过100万用户注册新版必应。第三方数据公司data.ai的分析显示，必应应用程序的全球下载量在一夜之间猛增10倍，并蹿升到苹果App Store应用商店最受欢迎的免费应用榜中的第十位。

但事实上，新版必应的演示视频中“错误频出”。在展示视频中，新版必应分析了美国时尚品牌Gap的2022年三季报，总结其中的“关键业绩”，但是其展示的毛利率、摊薄每股收益等数据均与现实不符。

具体来看，新版必应显示，报告期内，GAP调整后的毛利率（不包括与Yeezy GAP相关费用）为37.4%，调整后的运营毛利率为5.9%；但实际37.4%是未调整的毛利率，调整后毛利率应该是38.7%，调整后的运营毛利率为3.9%。

调整后摊薄每股收益方面也出现错误，新版必应显示，Gap的三季度每股收益为0.42美元，但真实数据为0.71美元。

只分析一家公司还不够，展示视频中，新版必应对比了Gap和Lululemon的2022年三季度业绩，然而这份对比数据可谓是“错上加错”。新版必应展示的Lululemon的毛利率、营业利润率以及每股摊薄收益均为错误数据，Gap的现金和现金等价物、库存数量也与实际数据不符。

作为搜索引擎，新版必应的搜索和整合信息能力也受到质疑。

在展示过程中，新版必应被要求制作为期5天的墨西哥旅行攻略时，推荐了5家酒吧。独立搜索研究员Dmitri Brereton详细查阅了上述酒吧的信息，发现有的酒吧看起来并不舒适；有的酒吧可能已经过时，脸书上最新的一条评论发布于2016年。此外，必应还将酒吧的营业时间写错误，若用户按照必应推荐的时间前往，可能会吃“闭门羹”。

在贴文最后，Brereton写道，新版必应还没有准备好发布，如果想使用准确的现实模型，就不要使用它。

对于新版必应被纠错，一位微软发言人向美国消费者新闻与商业频道（CNBC）回应称，他们已经看到了这篇文章，将会分析错误，改善软件的用户体验。“我们预计到展示期间新版必应可能会犯错误，这就是为什么反馈至关重要，这能使我们不断学习、改进模型。”

事实上，不只是新版必应被指出错误。谷歌聊天机器人Bard的官方宣传文章中，也出现了一条错误回答。

根据谷歌官方博客，有用户向Bard提问，“詹姆斯-韦伯太空望远镜有哪些新发现，可以讲给我9岁的孩子？”Bard的其中一条回复为，“詹姆斯-韦伯太空望远镜拍摄了太阳系外行星的第一张照片。”但NASA官网显示，第一个直接成像（directly imaged）的系外行星是2M1207b，于2004年由甚大望远镜阵列（VLT）首次拍摄。

聊天机器人ChatGPT于去年11月推出之后迅速席卷全球，并成为史上用户增长速度最快的消费级应用程序。各大科技公司瞄准了这一赛道，在对话式AI领域展开角逐。

但是匆忙推出含有错误的新产品引起了外界担忧。研究聊天机器人缺陷的华盛顿大学教授Chirag Shah此前表示，公司经常过快地推出新技术，忽视它们的缺陷，然后又试图快速修复它们，会造成真正的伤害。谷歌员工更是在内部论坛上批评管理层过快推出Bard，称发布方式显得“仓促”、“一团糟”。

此外，谷歌副总裁、有“互联网之父”之称的温特·瑟夫（Vint Cerf）也警告，不要因为ChatGPT“是一个热门话题”，这项技术“很酷”，就争先恐后地投资对话式人工智能（AI）。

2月14日美股收盘，微软涨0.31%，报收272.17美元/股。

要闻	民生	国内	国际	时讯	焦点	科技	聚焦	图片	看点
社会	IT	游戏	女人	房产	推荐	旅游	科技	财经	资讯

用了ChatGPT的微软必应也“翻车”：财报“分析”出错，旅游攻略过时

相关阅读

每日推荐

用了ChatGPT的微软必应也“翻车”：财报“分析”出错，旅游攻略过时

精彩推荐