
根据OpenAI官方的说明,GPT-4是一个大型多模态模型,可以接受文本和图像的输入,然后输出文本。
虽然在很多现实场景中的能力不如人类,但是在各种专业和学术的表现中接近人类水平。
如果是比较随意的对话,大家可能感受不到GPT-3.5和GPT-4的区别,一旦针对非常复杂的问题时,GPT-4的优势就凸显出来了。
我们来看一组模拟考试成绩的对比(GPT-3.5 vs GPT-4),包括多种学科,可以看出基本上都比GPT-3.5强,已经达到了学霸水平。
GPT-4可以处理25000字的文本,接受图片输入,能够创作歌曲、便携剧本、学习用户的写作风格等。在GPT-4的发布会上,OpenAI总裁演示了一波修改代码Bug,直接把上万字的代码复制粘贴给GPT-4,然后输入出现的问题,很快得到了GPT-4的解决方案。GPT-4具有较强的逻辑推理能力,下面是官网演示的一个案例。
但是与GPT-3.5一样,它只能获取到2021年9月份之前的信息,不过有一点不同的是,GPT-4的语言风格可以自行设定。
GPT-4之所以更加强大,微软功不可没,据悉OpenAI与微软合作建立了一个超算平台,具有28.5万个CPU核心和1万个GPU,在微软Azure公有云上训练超大规模的AI模型。
GPT-4还具有视觉输入功能,为盲人以及低视力的人提供生活的帮助。并且加强了Dolingo的功能,通过角色扮演,可以让学习第二语言的人,具有和真人对话那种身临其境的感觉。
总之,GPT-4相对于GPT-3.5来说具有更强的逻辑推理能力、语言也更加具有条理性和逻辑性,更接近人类,还可以将图片作为输入,缺点是速度上略慢一些。
目前GPT-4并未对公众免费开放,只是针对ChatGPT Plus订阅用户开放,每月20美元。
Bing Chat 无孔不入
微软也同时确认,新Bing已经用上了GPT-4,聊天的次数每天增加到150个回合,每个回合可以聊15次。近期微软正式发布的Edge浏览器,在右上角增加了一个大大的logo来推广新Bing。网友对于微软的这个操作褒贬不一,有人觉得很方便,有人觉得强行推广很反感。
可以通过如下方法,关闭这个Logo,打开如下注册表,新建一个DWORD(32位)值,重命名为“HubsSidebarEnabled”,键值设为0。
HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft\Edge
如果嫌上述步骤手动操作麻烦的话,直接导入下面链接中的注册表即可。
网盘地址:
https://wwi.lanzoup.com/b00qtc5dg
取件密码:czgm
强烈建议每个人都看一下 GPT4 的发布会
www.youtube.com/watch?v=outcGtbnMuQ
全程无尿点。
但如果要挑出一段精华,我觉得是下面摘出来的这两分钟时间,演示的是:
1. 在草稿本上用纸笔画出一个非常粗糙的草图
2. 拍照告诉 GPT 我要做一个网站长这样,给我生成网站代码
3. 网站做完,总共历时十秒钟左右
大型多模态模型GPT-4,支持图像和文本的输入,并生成文本结果。
OpenAI老板Sam Altman直接开门见山地介绍说:
这是我们迄今为止功能最强大的模型!
在性能表现上,OpenAI官方直接甩出一句话:
在各种专业和学术基准上和人类相当!
GPT-4性能跃迁炸天史上最强大模型
正如之前传言,GPT-4确实拥有多模态能力,可以接受图像输入并理解图像内容。
并且可接受的文字输入长度也增加到3.2万个token(约2.4万单词)。
GPT-4在各种考试中,有几个测试几乎接近了满分:
USABO Semifinal 2020(美国生物奥林匹克竞赛)
GRE Writing
模拟律师考试,GPT-4取得了前10%的好成绩,相比之下GPT-3.5是倒数10%,击败90人类。
做美国高考SAT试题,GPT-4也在阅读写作中拿下710分高分、数学700分(满分800)。
OpenAI表示在内部使用 GPT-4,因此也关注大型语言模型在内容生成、销售和编程等方面的应用效果。另外,内部人员还使用它来帮助人类评估人工智能输出。
对此,李飞飞高徒、英伟达AI科学家Jim Fan点评道:「GPT-4最强的其实就是推理能力。它在GRE、SAT、法学院考试上的得分,几乎和人类考生没有区别。也就是说,GPT-4可以全靠自己考进斯坦福了。」
你以为这就是GPT-4能力的全部?
在发布会直播上,OpenAI总裁Gregman现场表演了一波GPT-4给代码修Bug。
出现问题啥也不用想,直接把1万字的程序文档一股脑扔给GPT-4就行。格式也不用管,你只需要Ctrl+A、Ctrl+C、Ctrl+V。
最惊艳的是,GPT-4对代码的超强的理解能力,帮你生成代码。
Greg直接在纸上画了一个潦草的示意图,拍个照,发给 GPT说,给我按照这个布局写网页代码,就写出来了。
另外,如果运行出错了把错误信息,甚至错误信息截图,扔给GPT-4都能帮你给出相应的提示。
顺便提一句,用GPT-4还可以进行报税 。要知道,每年美国人要花好多时间金钱在报税上面。
微软赢麻了!GPT-4开启AI新时代
那么GPT-4这些新能力实际用起来是什么样的?技术报告中也给出不少展示。
本次而且不只是发布GPT-4这么简单,OpenAI这次“啪的一下”把相关“大动作”一步到位了:
ChatGPT Plus:集成GPT-4的ChatGPT升级版
发布GPT-4的API
公布技术论文 * 公开System Card
不仅如此,传闻的“必应早就用上了GPT-4”在今天也得到了微软方面的证实:
没错,确实是这样的!
不得不说,自打ChatGPT问世以来,微软和谷歌之间打响的数轮科技战役,微软这次又双叒叕赢麻了。
甚至这一次,不少网友都发出了“见证历史”的感慨:
首先,看图能力可以用来解释表情包、梗图。
提问这张图哪里好笑?GPT-4可以按顺序描述出每一格的内容,并总结出笑点:
用巨大的过时VGA接口给小巧的现代智能手机充电。
更进一步,GPT-4可以理解图表中数据的含义,并做进一步计算。
甚至可以直接把论文截图发给它,GPT-4可以按像素处理其中的文字和图片,并给出对整篇论文的总结摘要。
在API方面,GPT-4还开放了一个使用功能,允许修改“系统提示”。
之前ChatGPT的回答总是冗长而平淡,这是因为系统提示中规定了“你只是一个语言模型……你的知识截止于2021年9月”。
现在通过修改这句话,GPT-4就可以展现出更多样的性格,比如扮演苏格拉底。
也可以指定之后所有回答的形式,比如全用json格式。
虽然GPT-4这波能力大升级,但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉。
从前面的官方示例也可以看出,要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt)。
在GPT-4发布之前,便有网友做出了GPT-3和GPT-4参数量的对比图,并猜测GPT-4的参数量将达到100万亿。
有网友预言,未来GPT-5的参数量,会是这样的:
结 语
人工智能技术必将改变我们的生活,目前各行各业都已经或者开始加入到了AI的行列中,发展的速度也是相当的迅速。今天下午14:00百度也将召开“文心一言”的新闻发布会,其背后的智算中心号称是亚洲最大的单体智算中心,效果究竟如何,我们拭目以待。