人民網(wǎng)北京9月9日電 (記者趙竹青)記者從中國科學(xué)院自動化研究所獲悉,近日,該所李國齊、徐波團(tuán)隊(duì)合作,成功研發(fā)出類腦脈沖大模型“瞬悉1.0”(SpikingBrain-1.0)。該模型的發(fā)布,為新一代人工智能發(fā)展提供了非Transformer架構(gòu)的新技術(shù)路線,并將啟迪更低功耗的下一代神經(jīng)形態(tài)計算理論和芯片設(shè)計。
據(jù)介紹,該模型僅需約主流模型2%的數(shù)據(jù)量,就能在多項(xiàng)語言理解和推理任務(wù)中達(dá)到媲美眾多主流模型的性能。其超長序列處理能力在法律/醫(yī)學(xué)文檔分析、復(fù)雜多智能體模擬、高能粒子物理實(shí)驗(yàn)、DNA序列分析、分子動力學(xué)軌跡等超長序列任務(wù)建模場景中具有顯著的潛在效率優(yōu)勢。
與前主流大模型架構(gòu)(Transformer架構(gòu))不同,“瞬悉1.0”借鑒大腦神經(jīng)元內(nèi)部工作機(jī)制,基于“內(nèi)生復(fù)雜性”理論構(gòu)建,展示了一條不斷提升模型復(fù)雜度和性能的新型可行路徑,并在國產(chǎn)GPU平臺上完成了全流程訓(xùn)練與推理。