大語言模型中的涌現(xiàn)現(xiàn)象是不是偽科學?_當前熱文
- 程序員客棧
- 2023-06-10 20:18:59
Datawhale干貨
作者:平凡@知乎,諾桑比亞大學,在讀博士
【資料圖】
今天晚上,花了一點兒時間看了兩篇文章:
《Emergent Abilities of Large Language Models》[1]
《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]
這兩篇講的都是emergent behavior,即涌現(xiàn)現(xiàn)象。
大規(guī)模神經網絡下的涌現(xiàn)現(xiàn)象在機器學習中使用大規(guī)模神經網絡時,由于增加了參數數量、訓練數據或訓練步驟等因素,出現(xiàn)了定性上的新能力和性質,這些能力和性質在小規(guī)模神經網絡中往往是不存在的。
第一篇文章舉了這個例子,每個圖都可以理解為一個任務,橫軸是神經網絡的規(guī)模,而縱軸是準確率,可以理解為模型的性能。
我們拿圖一來看,在10的22次方前,這些模型基本上的性能基本上都很穩(wěn)定在0附近,而在10的22以后,突然在10的24次方上獲得了很大的性能提升,在其他的幾個任務上都表現(xiàn)出類似的特征。
意想不到的效果第二篇文章更是有趣,我直接把推特一位博主的評論引用在這里:
作者發(fā)現(xiàn),當我們訓練用網絡計算同余加法 a+b = ? (mod c) 時,網絡在某個時間突然獲得了 100% 準確率。分析發(fā)現(xiàn),神經網絡實際上“頓悟”了使用傅立葉變換來計算同余加法!這個算法可以證明是正確的, 反人類直覺的。
從這倆例子里面我的感受是,只要數據量足夠且真實,且模型沒有硬錯誤的前提下,不斷的訓練說不定真的能夠產生一些意想不到的效果。
還有就是我覺得人類現(xiàn)在積累的知識并不少,但是系統(tǒng)的少,零星的多,如果類似ChatGPT這樣的大模型可以拿所有的人類已有知識進行不斷學習的話,我覺得有很大概率會讓它涌現(xiàn)出意想不到的能力。
甚至可能把人類的生產力解放提前很多。
參考
1.https://arxiv.org/pdf/2206.07682.pdf2.https://arxiv.org/pdf/2301.05217.pdf關鍵詞:
- 大語言模型中的涌現(xiàn)現(xiàn)象是不是偽科學?_當2023-06-10
- 1158萬人!今年高校畢業(yè)生數量再創(chuàng)歷史新高2023-06-10
- 黑龍江12件涉黑涉惡案件集中公開宣判85人獲2023-06-10
- 播報:日本羽田機場兩架飛機疑似發(fā)生碰撞2023-06-10
- 今日播報!怎么查高考生錄取狀態(tài)_怎么查高考2023-06-10
- 我有什么?你有什么?我們一起能做什么?_2023-06-10
- 佳緣科技:6月8日接受機構調研,國壽安保、2023-06-10
- 各地稅務部門不斷優(yōu)化服務 前5個月新辦涉2023-06-10
- 觀熱點:高質量發(fā)展調研行 | 在智慧港口2023-06-10
- 全球熱訊:2023福布斯全球2000強放榜,中國2023-06-10
- 全球觀熱點:計劃今年完成4座,浦東“十四2023-06-10
- 全球微動態(tài)丨日本羽田機場兩架飛機疑似發(fā)生2023-06-10
- 無畏契約東京大師賽6月11日開打,兩支中國2023-06-10
- 全球快消息!25歲女生棄世界500強企業(yè)工作2023-06-10
- 世界今亮點!醫(yī)生謊稱手術成功致患者身亡:2023-06-10
- 女生拒絕下班后團建第二天被開除:正在進行2023-06-10
- 國家出手依法懲治網暴!律師:網絡應實名化2023-06-10
- 喜訊!青島市嶗山區(qū)散打運動協(xié)會正式成立2023-06-10
- 伍詠薇美得太高調,玫紅色連衣裙大秀曼妙身2023-06-10
- “千萬工程”調研行|寧波灣底村:把村莊整2023-06-10
- 新華全媒+丨現(xiàn)場直擊:中原麥收一夜|環(huán)球看2023-06-10
- 全球最資訊丨上海交警雙管齊下治理機動車“2023-06-10
- “紀念北京建都870周年考古成果展”在北京2023-06-10
- 比利時將向烏克蘭提供新一批軍事支持2023-06-10
- 【全球快播報】哪個云盤免費空間最大2023-06-10
- 古體詩和近體詩的區(qū)別 律詩和絕句的區(qū)別 2023-06-10
- 每日資訊:于明加工作室微博 于明加微博2023-06-10
- 胡赳赳:論貝克萊的“心外無物”觀念 當前2023-06-10
- 新羅:以實干實效推進流域綜合治理和統(tǒng)籌發(fā)2023-06-10
- 前5個月全國累計新辦涉稅經營主體643.5萬戶2023-06-10