您的位置:首页 > 行业 >

语言模型又迭代了 史上最大AI语言模型—GPT-3

2020-06-02 10:07:52 来源: 量子位

那个语言模型又迭代了,现在有1750亿个参数。这个让英伟达狂喜,让调参师流泪的数字来自OpenAI,史上最大AI语言模型——GPT-3。单单论文就有72

那个语言模型又迭代了,现在有1750亿个参数。

这个让英伟达狂喜,让调参师流泪的数字来自OpenAI,史上最大AI语言模型——

GPT-3。

单单论文就有72页。

OpenAI表示,通过GPT-3,他们证明了无需梯度更新,无需微调,规模更大的语言模型就可以大大改善无关任务和小样本(few-shot)学习的性能,达到最先进微调方法的水准。

在部分任务中,甚至超越了最先进微调方法。

不仅如此,这个语言模型,还能做加减法。

GPT-3是什么

不妨先来看看GPT-3的实际表现。

比如,先告诉GPT-3这样一个示例:

“whatpu”是坦桑尼亚的一种小型、毛茸茸的动物。一个使用whatpu造句的例子是:我们在非洲旅行时,看到了非常可爱的whatpu。

此后不再给GPT-3任何特定任务提示,就向它抛出问题:

“Burringo”是指加速度非常快的汽车。一个使用Burringo造句的例子是:

GPT-3造出的句子是这样的:

在我们的车库里有一辆Burringo,我爸天天开着它上下班。

至于编故事的能力,在500个词的情况下,人类判断出其为AI生成的概率仅为52%。在最佳案例中,判断准确率甚至降到了12%。

能自己编故事、纠正英语语法,甚至,GPT-3还学会了3位数基本运算。

表中,D{+,-}表示2、3、4、5位数加法或减法,2Dx代表2位数乘法,1DC代表1位数复合运算。

无需微调

前文也说到了,达到这样的效果,不需要梯度更新,不需要微调。只需要指定任务、展示少量演示,来与模型文本交互,就能使其完成任务。

这样一来,一方面,对于新任务,就不需要重新收集大量带标签的数据。

另一方面,可以避免微调阶段出现过拟合,导致模型泛化能力下降的问题。

而实现的关键,总结起来就是:大力出奇迹。

不仅模型尺寸增大到了1750亿,数据量也达到了45TB。V100嘛,是“微软提供的高带宽群集中的V100 GPU”。

研究人员将预训练模型在三种不同的设置下进行了探索。

本文的重点放在零样本、单样本和小样本学习上。研究人员没有对GPT-3进行微调,不过,论文谈到,原则上是可以微调GPT-3的。

模型与架构

具体到模型与架构,研究人员采用了与GPT-2相同的模型和架构,不过,在tranformer各层中使用了交替稠密(alternating dense)和局部带状稀疏注意力(locally banded sparse attention)模式,类似于Spare Transformer。

GPT-3的影响

知乎问题「如何评价1700亿参数的GPT-3」 的标签,已经透露出玄机。

知乎用户CloudySky就说,看了GPT-3,再看看自己 i9+2080ti+2TB 硬盘的台式,想想有空还是打开steam,趁打折多买几个3A大作比较合适。

他还发出了灵魂一问:

有见过人用窜天猴去调试火箭发射井嘛?

复旦邱锡鹏教授则认为,Pretrain+finetune仍然会是未来几年的主流。

虽然如此恐怖的计算成本让人有些望而却步,但EECVC联合创始人Dmytro Mishkin认为:

按10年前的标准,ResNet50的计算代价也是令人望而却步的,但事实证明它们的存在是必要的。

也有网友表示:

GPT-3可能还是无法帮助OpenAI盈利,也无法直接上线显著造福网民,但是从中积累的大模型训练经验是OpenAI及其背后的微软Azure一笔巨大的财富。这就像,人类登上火星/月球可能并不能带来直接的资源收益,但是从中积累的科学技术却可以推动人类社会的发展。

做NLP,虽然有了资源不一定行,但是没有资源现在肯定是不行了。

不管怎么说,看到这GPU熊熊燃烧的场面,想必老黄已经乐开了花。

目前,GPT-3尚未开源,可以期待一下,OpenAI这回会挤多久牙膏了。

关键词: GPT-3

精选 导读

募资55亿港元万物云启动招股 预计9月29日登陆港交所主板

万科9月19日早间公告,万物云当日启动招股,预计发行价介乎每股47 1港元至52 7港元,预计9月29日登陆港交所主板。按发行1 167亿股计算,万

发布时间: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情况曝光 隐形重仓股多为高端制造业

随着半年报披露收官,公募基金二季度持股情况曝光。截至今年二季度末,公募基金全市场基金总数为9794只,资产净值为269454 75亿元,同比上

发布时间: 2022-09-02 10:45
资讯   2022-09-02

又有上市公司宣布变卖房产 上市公司粉饰财报动作不断

再有上市公司宣布变卖房产。四川长虹25日称,拟以1 66亿元的转让底价挂牌出售31套房产。今年以来,A股公司出售房产不断。根据记者不完全统

发布时间: 2022-08-26 09:44
资讯   2022-08-26

16天12连板大港股份回复深交所关注函 股份继续冲高

回复交易所关注函后,大港股份继续冲高。8月11日大港股份高开,随后震荡走高,接近收盘时触及涨停,报20 2元 股。值得一提的是,在7月21日

发布时间: 2022-08-12 09:56
资讯   2022-08-12

万家基金再添第二大股东 中泰证券拟受让11%基金股权

7月13日,中泰证券发布公告,拟受让齐河众鑫投资有限公司(以下简称齐河众鑫)所持有的万家基金11%的股权,交易双方共同确定本次交易的标的资

发布时间: 2022-07-14 09:39
管理   2022-07-14

央行连续7日每天30亿元逆回购 对债市影响如何?

央行12日再次开展了30亿元逆回购操作,中标利率2 10%。这已是央行连续7日每天仅进行30亿元的逆回购缩量投放,创下去年1月以来的最低操作规

发布时间: 2022-07-13 09:38
资讯   2022-07-13

美元指数创近20年新高 黄金期货创出逾9个月新低

由于对美联储激进加息的担忧,美元指数11日大涨近1%创出近20年新高。受此影响,欧美股市、大宗商品均走弱,而黄金期货创出逾9个月新低。美

发布时间: 2022-07-13 09:36
资讯   2022-07-13

美股三大股指全线下跌 纳斯达克跌幅创下记录以来最大跌幅

今年上半年,美股持续回落。数据显示,道琼斯指数上半年下跌15 3%,纳斯达克综合指数下跌29 5%,标普500指数下跌20 6%。其中,纳斯达克连续

发布时间: 2022-07-04 09:51
推荐   2022-07-04

融资客热情回升 两市融资余额月内增加超344亿元

近期A股走强,沪指6月以来上涨4%,融资客热情明显回升。数据显示,截至6月16日,两市融资余额1 479万亿元,月内增加344 67亿元,最近一个半

发布时间: 2022-06-20 09:41
资讯   2022-06-20

4个交易日净买入超百亿元 北向资金持续流入A股市场

北向资金净流入态势延续。继6月15日净买入133 59亿元后,北向资金6月16日净买入44 52亿元。自5月27日至今,除6月13日以外,北向资金累计净

发布时间: 2022-06-17 09:37
推荐   2022-06-17