• 阅读124
  • 回复0

是什么让ChatGPT变得如此聪明?

[复制链接]

45

主题

3

回帖

226

积分

管理员

积分
226
发表于 2023-4-11 19:01:10 | 显示全部楼层 |阅读模式
3月29日,由图灵奖得主Yoshua Bengio、特斯拉CEO马斯克、纽约大学名誉教授Gary Marcus、UC伯克利教授Stuart Russell等1000多人,在一封叫停GPT-4后续AI大模型的公开信上签名。

219.jpg


这封公开信指出,最近人工智能陷入了一场失控的竞赛,模型的创造者们没有办法理解、预测或可靠地控制自己创造的大模型,人类社会对其可能造成的影响也没有做好准备。因此,公开信呼吁,所有AI实验室应立即暂停训练比GPT-4更强大的AI模型,为期至少6个月。

一石激起千层浪,从各个AI群里的讨论来看,赞同和反对的人都为数不少。我们一直在关注大语言模型,所以对这封公开信中提到的“但是没有人能理解、预测或可靠地控制这些大模型,甚至模型的创造者也不能”颇有感触,我想这个论断背后的核心点之一,就是人类至今没有搞清楚大语言模型中的“涌现”(Emergent)现象到底是怎么回事?AI为什么一下子变得如此智能?

过去几十年来,AI能够在局部领域打败人类,比如围棋,但在大多数时候,AI都没那么聪明,比如你问它“李白喜欢用什么手机?”,它要么卡壳要么给出离谱回答。这是因为让AI掌握常识,并且能够融会贯通地运用这些常识、形成推理能力非常难,一直以来这都是巨大的难题。

但这次以ChatGPT为代表的一众大语言模型,突然突破了这个门槛,变得非常“聪明”。当然背后的原因有很多,比如自监督学习、Fine-tuning策略等等,但有一个重要的底层变化——大语言模型的“涌现”(Emergent)现象,就是说一些业界从未想象到的能力,例如基础的社会知识、上下文学习(ICL)、推理(CoT)等等,在训练参数和数据量超过一定数值后,这些能力突然出现了,令AI一下子变得非常智能。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
Copyright ©2024 Comsenz Inc. Powered by Discuz!

顶部