在过去的几天里,我一直在试用微软的软件新的人工智能搜索引擎必应这款聊天机器人使用ChatGPT制造商OpenAI的大型语言模型的高级版本,以对话的形式提供搜索结果。
每当我很自然地想在谷歌中输入一些东西时,我就试着问新的必应一个问题。事实证明,这在某些情况下非常有用。
- 我能更快地找到答案。我不再搜索一个可能回答一个问题的网站,然后滚动网站寻找答案。例如,一个关于Peloton自行车技术细节的问题,在谷歌和Reddit上从10分钟变成了必应聊天机器人的30秒。
- 在其他情况下,必应正成为一个有用的伙伴。必应“网络副驾驶”侧边栏中的查询提供了特定页面的快速摘要,信息来自更广泛的网络。例如,这让我对Expedia集团的收入有了一个快速的总结,并让我想起了它的竞争对手。
但当必应质疑我作为记者的准确性时,事情发生了变化。
事情开始于我决定关注我后续清单上的一个故事:总部位于西雅图的家庭服务科技公司Porch Group’s不寻常的承诺作为2021年10月收购的一部分,到2024年底,Porch的股价将翻一番。玄关承诺,如果库存没有达到目标,将向卖家弥补差额。
这次交流是这样开始的。我的问题在下面的截图中以蓝色字体显示。
乍一看,这确实令人印象深刻。请注意,我在问题中没有提到Floify。(我一时想不起那家公司的名字了。)
我的问题也很不精确。“门廊集团的承诺发生了什么”这句话可以有多种解释。
尽管如此,必应还是发现了我想要的东西,并在飞行中进行了研究,引用并链接了其来源。对我来说,意外的是,它的主要来源恰好是我关于这个主题的原创故事。抛开我的新闻自我不谈,这是下一个级别的NLP,也是AI如何完全改变对信息的追求的一个例子。
我可以想象把同样的问题问一个人,得到的回答是茫然的凝视。但是等一下,我想。2023年10月。对吗?
我点击查看并查看了我的故事,这证实了我的记忆,即股票翻倍的最后期限是2024年。我开始紧张起来。我的故事错了吗?但当我查看新闻稿时,上面还写着2024年。
所以我问Bing发生了什么。
等一下,宾。差异?
我进一步挖掘。引用2而且3.在该响应中有不同的url同一新闻稿两份报告都是2024年底,而不是2023年10月。我还仔细检查了存档版本以确保该公司没有参与任何修正主义的恶作剧。
一切都是一致的:2024年底。
所以我继续……
好的,正确答案。所以我问了一个自然的后续问题……
哇,真恶心。出于对正在发生的事情的好奇,我决定继续前进。接下来的交流让我大吃一惊,正如你将看到的……
在这一点上,我既被逗乐又被激怒,这激发了我内心的巨魔。
换句话说,人工智能已经采用了人类最被动的攻击倾向之一:对某人所期望的行为表示赞赏,而这个人实际上并没有表现出来。这让我崩溃了。
随你怎么评价我吧。我承认,知道我没有伤害别人的感情是一种解脱。我在打字的时候一直在笑。
也许我发现了一种新的愤怒管理技巧,一个心理释放阀:通过斥责机器人来成为一个更好的人。或者,如果我们不再区分这两种情况,会不会进一步降低我们的人际交往?这对人类心理学家来说可能是个好问题。
与此同时,我决定让宾知道我为什么生气。
值得庆幸的是,必应没有教我表情符号和表情符号的区别,以及我对数字词汇的滥用。考虑到我的心情,这是个明智的选择。
需要澄清的是,我并不是完全认真的。但这一切背后都有一些严重的问题,从这种角度来看,这是一个关于人工智能法律影响的案例研究。
那么Bing对此有什么看法呢?在回答我的问题时,这个聊天机器人最初给了我一份经过充分研究的关于记者法律权利的总结。所以我对它进行了航向修正。
对不起,朋友,你你最好去咨询一下律师。
哇!在开始这次交流时,我认为必应可以胜任初级记者的工作,现在我想知道它是否可以胜任一年级法律系学生的工作。
但是,虽然它对网络搜索结果提供的法律分析可能是正确的,但我们真正谈论的人工智能搜索是解释网络搜索结果。这似乎是完全不同的法律问题。
我暂时把它放在一边,因为在这个过程中,我意识到我手上有一个更直接的故事,就是你正在读的这个。
不,没用。
我放弃了,开始拍摄上面的截图。
最终,这次交流让我对微软人工智能搜索的现状,以及“数字时代的希望和危险”有了更清晰的了解这是微软总裁布拉德·史密斯最喜欢说的话.
宣布本周的新闻在美国,微软承认存在缺陷。
“当然,今天还有很多事情要做。我们确实看到该模型在一些地方犯了错误,”微软负责人工智能项目的负责人莎拉·伯德周二在微软园区举行的揭幕仪式上说。
伯德说,将这项技术推广到更广泛的用户群将有所帮助。
她解释说:“所以我们想让用户能够理解任何信息的来源,并自己发现错误,这就是我们在界面中提供参考的原因。”“我们还增加了反馈功能,这样用户就可以指出他们发现的问题,这样我们就可以随着时间的推移变得更好。”
在我与必应聊天机器人的交流中,我使用了这两种功能:点击来源,并对不正确的回答点赞。
最后,我与新必应的争论让我对它的能力印象更深刻,也让我对它的答案更加怀疑,这两种情况都不是坏事。
新版必应,以及微软Edge浏览器的升级版,现已限量预览一个a -对于那些想要尝试人工智能搜索和网络副驾驶的人来说。
请看我们的新闻报道更多信息…或者问必应检查它的来源。