世界播報(bào):大語(yǔ)言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？

2023-05-19 21:44:37 來(lái)源：程序員客棧

Datawhale干貨

作者：平凡@知乎，諾桑比亞大學(xué)，在讀博士

(相關(guān)資料圖)

今天晚上，花了一點(diǎn)兒時(shí)間看了兩篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

這兩篇講的都是emergent behavior，即涌現(xiàn)現(xiàn)象。

大規(guī)模神經(jīng)網(wǎng)絡(luò)下的涌現(xiàn)現(xiàn)象

在機(jī)器學(xué)習(xí)中使用大規(guī)模神經(jīng)網(wǎng)絡(luò)時(shí)，由于增加了參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)或訓(xùn)練步驟等因素，出現(xiàn)了定性上的新能力和性質(zhì)，這些能力和性質(zhì)在小規(guī)模神經(jīng)網(wǎng)絡(luò)中往往是不存在的。

第一篇文章舉了這個(gè)例子，每個(gè)圖都可以理解為一個(gè)任務(wù)，橫軸是神經(jīng)網(wǎng)絡(luò)的規(guī)模，而縱軸是準(zhǔn)確率，可以理解為模型的性能。

我們拿圖一來(lái)看，在10的22次方前，這些模型基本上的性能基本上都很穩(wěn)定在0附近，而在10的22以后，突然在10的24次方上獲得了很大的性能提升，在其他的幾個(gè)任務(wù)上都表現(xiàn)出類(lèi)似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的評(píng)論引用在這里：

作者發(fā)現(xiàn)，當(dāng)我們訓(xùn)練用網(wǎng)絡(luò)計(jì)算同余加法 a+b = ? (mod c) 時(shí)，網(wǎng)絡(luò)在某個(gè)時(shí)間突然獲得了 100% 準(zhǔn)確率。分析發(fā)現(xiàn)，神經(jīng)網(wǎng)絡(luò)實(shí)際上“頓悟”了使用傅立葉變換來(lái)計(jì)算同余加法！這個(gè)算法可以證明是正確的，反人類(lèi)直覺(jué)的。

從這倆例子里面我的感受是，只要數(shù)據(jù)量足夠且真實(shí)，且模型沒(méi)有硬錯(cuò)誤的前提下，不斷的訓(xùn)練說(shuō)不定真的能夠產(chǎn)生一些意想不到的效果。

還有就是我覺(jué)得人類(lèi)現(xiàn)在積累的知識(shí)并不少，但是系統(tǒng)的少，零星的多，如果類(lèi)似ChatGPT這樣的大模型可以拿所有的人類(lèi)已有知識(shí)進(jìn)行不斷學(xué)習(xí)的話，我覺(jué)得有很大概率會(huì)讓它涌現(xiàn)出意想不到的能力。

甚至可能把人類(lèi)的生產(chǎn)力解放提前很多。

參考

1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf

責(zé)任編輯：{ij7}

為您推薦

世界播報(bào):大語(yǔ)言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？
Datawhale干貨作者：平凡@知乎，諾桑比亞大學(xué)，在讀博士今天晚上，花了一點(diǎn)兒時(shí)間看了兩篇文章：《Emergent
安寧市連然街道：發(fā)揮青年人才力量助推基層治理
安寧市連然街道積極落實(shí)市委、市政府開(kāi)展青年人才培養(yǎng)的工作要求，不斷盤(pán)活青年人才資源，引領(lǐng)青年人才參與
環(huán)球速遞！10家校友企業(yè)簽約入駐天開(kāi)西青園
如不能正常瀏覽請(qǐng)選用IE瀏覽器　　天津北方網(wǎng)訊：19日，10家南開(kāi)大學(xué)、天津大學(xué)的校友企業(yè)與天開(kāi)西青園簽約
天開(kāi)園核心區(qū)業(yè)務(wù)全面展開(kāi)-世界視訊
如不能正常瀏覽請(qǐng)選用IE瀏覽器　　天津北方網(wǎng)訊：這兩天，入駐天開(kāi)園核心區(qū)的企業(yè)各項(xiàng)業(yè)務(wù)已經(jīng)全面展開(kāi)?！?
市領(lǐng)導(dǎo)深入紅橋區(qū)南開(kāi)區(qū)調(diào)研文旅融合發(fā)展|世界訊息
如不能正常瀏覽請(qǐng)選用IE瀏覽器　　天津北方網(wǎng)訊：19日，結(jié)合主題教育，圍繞文旅融合發(fā)展，市委常委、市委宣
惠濟(jì)區(qū)盛夏星空露營(yíng)季文旅促消費(fèi)系列活動(dòng)正式啟動(dòng)
中原網(wǎng)訊5月19日下午，由惠濟(jì)區(qū)文化旅游體育局主辦的“5·19中國(guó)旅游日暨2023年惠濟(jì)區(qū)盛夏星空露營(yíng)季文旅促
朱元璋臨死前給孫子留下一名將，可惜孫子不會(huì)用，否則朱棣不會(huì)贏
朱元璋臨死前給孫子留下一名將，可惜孫子不會(huì)用，否則朱棣不會(huì)贏,好了親愛(ài)的朋友們，看完你們有什么想說(shuō)的
《塞爾達(dá)傳說(shuō)王國(guó)之淚》武器耐久度一覽天天速看
《塞爾達(dá)傳說(shuō)王國(guó)之淚》武器耐久度一覽，《塞爾達(dá)傳說(shuō)王國(guó)之淚》游戲中每一個(gè)武器都是有自己的耐久度的，很
當(dāng)前滾動(dòng):在生產(chǎn)力和生產(chǎn)關(guān)系這對(duì)矛盾中_ 多選_在生產(chǎn)力和生產(chǎn)關(guān)系這對(duì)矛盾中
1、生產(chǎn)關(guān)系適合生產(chǎn)力。2、答:1 生產(chǎn)力是人們改造自然以獲得物質(zhì)生活資料的實(shí)際能力，由勞動(dòng)對(duì)象、勞動(dòng)資
世界播報(bào):福布斯中國(guó)發(fā)布消費(fèi)活力城市榜北京上海廣州位列前三
2023福布斯中國(guó)& 183;城市消費(fèi)發(fā)展論壇19日在重慶舉行。論壇上發(fā)布的“2023福布斯中國(guó)& 183;消費(fèi)活力城市榜
當(dāng)前報(bào)道:三字經(jīng)教案小班第一節(jié)_三字經(jīng)教案小班
1、教學(xué)設(shè)計(jì)閱讀《三字經(jīng)》總體教學(xué)目標(biāo)：1 知道一些中國(guó)的文化知識(shí)2 提高心理素質(zhì)3 認(rèn)識(shí)漢字4 提高記憶能
中炬高新兩副總經(jīng)理已移送檢察機(jī)關(guān)審查起訴
中炬高新兩副總經(jīng)理已移送檢察機(jī)關(guān)審查起訴,廚邦,李嚴(yán),中炬高新,上市公司,審查起訴
私募行業(yè)呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)，全面注冊(cè)制與資管新規(guī)下迎來(lái)新機(jī)遇-當(dāng)前獨(dú)家
5月18日，財(cái)富私募先鋒榜（大灣區(qū)）2022年度頒獎(jiǎng)典禮暨高峰論壇在廣州隆重舉行。此次頒獎(jiǎng)典禮是由南方財(cái)經(jīng)
5月19日華泰柏瑞新興產(chǎn)業(yè)混合A凈值上漲1.11%_天天簡(jiǎn)訊
5月19日，截至收盤(pán)，華泰柏瑞新興產(chǎn)業(yè)混合A（005409）較前一交易日凈值上漲1 11%，跑贏上證指數(shù)，單位凈值
焦點(diǎn)消息！淘寶買(mǎi)家降權(quán)號(hào)是什么意思_淘寶買(mǎi)家號(hào)降權(quán)在哪里查
1、百度上搜淘寶2、登錄你的賬戶(hù)，選擇右上角的牛倩賣(mài)家中心。3、點(diǎn)擊左下方的【客服】。4、點(diǎn)擊 "違規(guī)記錄
sticktodoingsth英語(yǔ)造句 sticktodoing 環(huán)球最新
今天來(lái)聊聊關(guān)于sticktodoingsth英語(yǔ)造句，sticktodoing的文章，現(xiàn)在就為大家來(lái)簡(jiǎn)單介紹下stick
第七屆世界智能大會(huì)現(xiàn)場(chǎng)報(bào)道｜跟著黎明和他的“網(wǎng)紅”機(jī)器人，為美好生活充電！天天速讀
如不能正常瀏覽請(qǐng)選用IE瀏覽器
第七屆世界智能大會(huì)現(xiàn)場(chǎng)報(bào)道｜AR與傳統(tǒng)文化碰撞出智能新“火花” 全球時(shí)訊
如不能正常瀏覽請(qǐng)選用IE瀏覽器
第六屆中國(guó)華錄杯·數(shù)據(jù)湖算法大賽19日啟動(dòng)
如不能正常瀏覽請(qǐng)選用IE瀏覽器　　天津北方網(wǎng)訊：19日，第六屆中國(guó)華錄杯數(shù)據(jù)湖算法大賽正式啟動(dòng)?！　”緦?
世界智能大會(huì)體育大賽開(kāi)賽
如不能正常瀏覽請(qǐng)選用IE瀏覽器　　天津北方網(wǎng)訊：19日，世界智能大會(huì)的智能體育比賽也別開(kāi)生面地開(kāi)賽了。　
全球新動(dòng)態(tài)：2023年世界智能駕駛挑戰(zhàn)賽開(kāi)賽
如不能正常瀏覽請(qǐng)選用IE瀏覽器　　天津北方網(wǎng)訊：19日，2023世界智能駕駛挑戰(zhàn)賽開(kāi)賽?！　√魬?zhàn)賽吸引了國(guó)內(nèi)
cf如何卡怪視頻_cf如何卡bug
1、這是有技巧的,首先站到箱子角,跳一次,落下,按住Shift前后移動(dòng),然后卡進(jìn)去一點(diǎn),繼續(xù)移動(dòng)在進(jìn)去一點(diǎn),之后
北京市三部門(mén)：謀劃建設(shè)國(guó)家級(jí)數(shù)據(jù)訓(xùn)練基地
上證報(bào)中國(guó)證券網(wǎng)訊據(jù)北京市經(jīng)濟(jì)和信息化局5月19日消息，為搶抓通用人工智能產(chǎn)業(yè)發(fā)展新機(jī)遇，推動(dòng)大模型技
北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃成員名單公布包括阿里、百度等
第一批伙伴成員共有39家。5月19日，北京市經(jīng)濟(jì)和信息化局發(fā)布北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃成員名單
格力手機(jī)核心團(tuán)隊(duì)解散！官網(wǎng)已打不開(kāi)，董明珠曾稱(chēng)：不比蘋(píng)果差，分分鐘滅掉小米……|環(huán)球觀察
據(jù)界面新聞5月19日消息，從多個(gè)獨(dú)立信源獲悉，格力電器已解散手機(jī)核心團(tuán)隊(duì)。據(jù)報(bào)道，一位于去年離職的員工
一季度復(fù)蘇態(tài)勢(shì)漸起，日本美妝巨頭不敢掉以輕心
近期，日本美妝巨頭紛紛公布了2023年第一季度財(cái)報(bào)?？梢钥吹?，在全球市場(chǎng)進(jìn)入后疫情時(shí)代之后，仍然是“幾家
人民銀行、外匯局將遏制投機(jī)炒作自律機(jī)制成員單位堅(jiān)決抑制匯率大起大落
記者了解到，5月18日中國(guó)外匯市場(chǎng)指導(dǎo)委員會(huì)（CFXC）2023年第一次會(huì)議在北京召開(kāi)。人民幣匯率近日雙向波動(dòng)
公安部將全面實(shí)行辦案質(zhì)量終身負(fù)責(zé)制度-環(huán)球熱點(diǎn)評(píng)
記者今天從公安部新聞發(fā)布會(huì)上獲悉，公安部將推進(jìn)執(zhí)法監(jiān)督管理機(jī)制和執(zhí)法責(zé)任體系改革，全面實(shí)行辦案質(zhì)量終
全球熱訊:中考自招筆試明晚出分！面試只占20分但很重要
上午8點(diǎn)，市區(qū)2023年青島中考自招考試筆試正式開(kāi)考。島城上萬(wàn)初三考生走進(jìn)考場(chǎng)，初試身手。和去年一樣，今
三全學(xué)院招生簡(jiǎn)章2020最新消息_全球微速訊
1、三全學(xué)院招生簡(jiǎn)章這個(gè)就看你上本科還是專(zhuān)科了，如果是專(zhuān)科肯定能上，如果是讀本科的話，這個(gè)分?jǐn)?shù)就很難

兔费看少妇性l交大片免费,久久精品亚洲综合专区 ,好男人在线社区www在线影院视频,一二三四视频在线观看中文版免费

世界播報(bào):大語(yǔ)言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？

為您推薦

世界播報(bào):大語(yǔ)言模型中的涌現(xiàn)現(xiàn)象是不是偽科學(xué)？

安寧市連然街道：發(fā)揮青年人才力量助推基層治理

環(huán)球速遞！10家校友企業(yè)簽約入駐天開(kāi)西青園

天開(kāi)園核心區(qū)業(yè)務(wù)全面展開(kāi)-世界視訊

市領(lǐng)導(dǎo)深入紅橋區(qū)南開(kāi)區(qū)調(diào)研文旅融合發(fā)展|世界訊息

惠濟(jì)區(qū)盛夏星空露營(yíng)季文旅促消費(fèi)系列活動(dòng)正式啟動(dòng)

朱元璋臨死前給孫子留下一名將，可惜孫子不會(huì)用，否則朱棣不會(huì)贏

《塞爾達(dá)傳說(shuō)王國(guó)之淚》武器耐久度一覽天天速看

當(dāng)前滾動(dòng):在生產(chǎn)力和生產(chǎn)關(guān)系這對(duì)矛盾中_ 多選_在生產(chǎn)力和生產(chǎn)關(guān)系這對(duì)矛盾中

世界播報(bào):福布斯中國(guó)發(fā)布消費(fèi)活力城市榜北京上海廣州位列前三

當(dāng)前報(bào)道:三字經(jīng)教案小班第一節(jié)_三字經(jīng)教案小班

中炬高新兩副總經(jīng)理已移送檢察機(jī)關(guān)審查起訴

私募行業(yè)呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)，全面注冊(cè)制與資管新規(guī)下迎來(lái)新機(jī)遇-當(dāng)前獨(dú)家

5月19日華泰柏瑞新興產(chǎn)業(yè)混合A凈值上漲1.11%_天天簡(jiǎn)訊

焦點(diǎn)消息！淘寶買(mǎi)家降權(quán)號(hào)是什么意思_淘寶買(mǎi)家號(hào)降權(quán)在哪里查

sticktodoingsth英語(yǔ)造句 sticktodoing 環(huán)球最新

第七屆世界智能大會(huì)現(xiàn)場(chǎng)報(bào)道｜跟著黎明和他的“網(wǎng)紅”機(jī)器人，為美好生活充電！天天速讀

第七屆世界智能大會(huì)現(xiàn)場(chǎng)報(bào)道｜AR與傳統(tǒng)文化碰撞出智能新“火花” 全球時(shí)訊

第六屆中國(guó)華錄杯·數(shù)據(jù)湖算法大賽19日啟動(dòng)

世界智能大會(huì)體育大賽開(kāi)賽

全球新動(dòng)態(tài)：2023年世界智能駕駛挑戰(zhàn)賽開(kāi)賽

cf如何卡怪視頻_cf如何卡bug

北京市三部門(mén)：謀劃建設(shè)國(guó)家級(jí)數(shù)據(jù)訓(xùn)練基地

北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃成員名單公布包括阿里、百度等

格力手機(jī)核心團(tuán)隊(duì)解散！官網(wǎng)已打不開(kāi)，董明珠曾稱(chēng)：不比蘋(píng)果差，分分鐘滅掉小米……|環(huán)球觀察

一季度復(fù)蘇態(tài)勢(shì)漸起，日本美妝巨頭不敢掉以輕心

人民銀行、外匯局將遏制投機(jī)炒作自律機(jī)制成員單位堅(jiān)決抑制匯率大起大落

公安部將全面實(shí)行辦案質(zhì)量終身負(fù)責(zé)制度-環(huán)球熱點(diǎn)評(píng)

全球熱訊:中考自招筆試明晚出分！面試只占20分但很重要

三全學(xué)院招生簡(jiǎn)章2020最新消息_全球微速訊

相關(guān)推薦

閱讀排行