我國科研團(tuán)隊(duì)在“小樣本概念學(xué)習(xí)”領(lǐng)域取得突破
學(xué)習(xí)“小樣本” 練出“大智慧”(新知)
近日,由北京大學(xué)人工智能研究院與北京通用人工智能研究院共同完成的研究成果——“人類水平的小樣本概念學(xué)習(xí)”,在國際學(xué)術(shù)期刊《科學(xué)·進(jìn)展》上發(fā)表。這一成果首次讓人工智能系統(tǒng)在沒有大數(shù)據(jù)訓(xùn)練的情況下,能像人類一樣通過概念學(xué)習(xí)和邏輯推理的方式完成學(xué)習(xí)任務(wù)。
人工智能系統(tǒng)主要以海量數(shù)據(jù)為基礎(chǔ),利用大量算力和存儲進(jìn)行數(shù)據(jù)“檢索”,核心范式是深度學(xué)習(xí)。近年來,這類人工智能取得顯著進(jìn)展,誕生了以生成式人工智能為代表的熱門應(yīng)用。國際學(xué)術(shù)前沿追逐的另一個焦點(diǎn)是“小樣本概念學(xué)習(xí)”,這一人工智能范式旨在探索教會人工智能系統(tǒng)掌握抽象概念學(xué)習(xí)和認(rèn)知推理的能力。
論文通訊作者、北京大學(xué)人工智能研究院助理教授朱毅鑫解釋:“這是一種‘舉一反三’的能力。例如,我們在打游戲的時候,不需要打成千上萬局游戲,而是在觀察學(xué)習(xí)后就可以自己上手。又如,我們小時候通過觀察他人行為,就能學(xué)會基本的社交規(guī)范,并將其應(yīng)用到不同場合。”
在數(shù)據(jù)匱乏或僅有少量數(shù)據(jù)和抽象概念的時候,“小樣本概念學(xué)習(xí)”便有了用武之地?!斑@種方式在不需要算力或數(shù)據(jù)堆積、成本可控的情況下也能求解很多問題。”論文第一作者、北京通用人工智能研究院研究員張馳介紹,北京大學(xué)教授朱松純早在上世紀(jì)90年代就提出了一種研究思路,即用統(tǒng)計數(shù)據(jù)建模的方式找出現(xiàn)有少量數(shù)據(jù)間的聯(lián)系,用高效率的算法來代替窮舉,從而求解問題。
這一方法最早應(yīng)用于計算機(jī)視覺領(lǐng)域的圖片生成模型。朱毅鑫說,當(dāng)時計算機(jī)視覺領(lǐng)域有一類難題叫作“什么是紋理”。比如,兩張有著明顯差別的紋理圖片,如果用計算機(jī)視覺進(jìn)行逐個像素的比對,就會認(rèn)為是不一樣的,但如果用人的肉眼識別則會認(rèn)為是相同的。“這是因?yàn)槿祟愅鶕?jù)圖像中的統(tǒng)計規(guī)律來比對,如果統(tǒng)計規(guī)律一致,我們就認(rèn)為兩張圖片是一樣的?!?/P>
受此研究思路的啟發(fā),研究團(tuán)隊(duì)創(chuàng)新性地提出了高效解決抽象推理問題的方法,將一些抽象推理問題轉(zhuǎn)化為易于求解的優(yōu)化問題,使人工智能通過快速迭代和建模取得令人滿意的結(jié)果。在團(tuán)隊(duì)組織開展的多項(xiàng)測試中,該學(xué)習(xí)模型戰(zhàn)勝了高水平的人類選手,在邁向通用人工智能的道路上更進(jìn)一步。“未來我們將在智能交通、智慧醫(yī)療等領(lǐng)域推進(jìn)相關(guān)成果的落地應(yīng)用,促進(jìn)科技成果轉(zhuǎn)化?!睆堮Y表示。
《 人民日報 》( 2024年04月29日 19 版)
分享讓更多人看到