各有關單位:
國家自然科學基金委員會現(xiàn)發(fā)布可解釋,、可通用的下一代人工智能方法重大研究計劃2025年度項目指南,請申請人及依托單位按項目指南所述要求和注意事項申請,。
可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南
可解釋,、可通用的下一代人工智能方法重大研究計劃面向人工智能發(fā)展國家重大戰(zhàn)略需求,,以人工智能的基礎科學問題為核心,發(fā)展人工智能新方法體系,,促進我國人工智能基礎研究和人才培養(yǎng),,支撐我國在新一輪國際科技競爭中的主導地位。
一,、科學目標
本重大研究計劃面向以深度學習為代表的人工智能方法魯棒性差,、可解釋性差、對數(shù)據(jù)的依賴性強等基礎科學問題,,挖掘機器學習的基本原理,,發(fā)展可解釋、可通用的下一代人工智能方法,,并推動人工智能方法在科學領域的創(chuàng)新應用,。
二、核心科學問題
本重大研究計劃針對可解釋,、可通用的下一代人工智能方法的基礎科學問題,,圍繞以下三個核心科學問題開展研究,。
(一)深度學習的基本原理。
深入挖掘深度學習模型對超參數(shù)的依賴關系,,理解深度學習背后的工作原理,,建立深度學習方法的逼近理論、泛化誤差分析理論和優(yōu)化算法的收斂性理論,。
(二)可解釋,、可通用的下一代人工智能方法。
通過規(guī)則與學習結合的方式,,建立高精度,、可解釋、可通用且不依賴大量標注數(shù)據(jù)的人工智能新方法,。開發(fā)下一代人工智能方法需要的數(shù)據(jù)庫和模型訓練平臺,,完善下一代人工智能方法驅動的基礎設施。
(三)面向科學領域的下一代人工智能方法的應用,。
發(fā)展新物理模型和算法,,建設開源科學數(shù)據(jù)庫、知識庫,、物理模型庫和算法庫,,推動人工智能新方法在解決科學領域復雜問題上的示范性應用。
三,、2025年度資助研究方向
(一)培育項目,。
圍繞核心科學問題,以總體科學目標為牽引,,擬以培育項目的方式資助探索性強,、選題新穎、前期研究基礎較好的申請項目,,研究方向如下:
1. 神經(jīng)網(wǎng)絡的新架構和新的預訓練或自監(jiān)督學習方法,。
針對圖像、視頻,、圖,、流場等數(shù)據(jù),發(fā)展更高效的神經(jīng)網(wǎng)絡新架構,、預訓練或自監(jiān)督學習方法,,并在真實數(shù)據(jù)集上進行驗證。
2. 深度學習的基礎理論,。
研究神經(jīng)網(wǎng)絡的函數(shù)空間理論及誤差分析,。研究神經(jīng)網(wǎng)絡非線性訓練過程中的重要現(xiàn)象,包括頓悟(grokking),、穩(wěn)定性邊緣(edge of stability),、損失尖峰(loss spike)和凝聚現(xiàn)象(condensation),分析損失景觀的嵌入結構,、訓練超參數(shù),、凝聚、正則化技術等對Transformer,、Mamba等架構的樣本效率,、分布外檢測、泛化能力,、推理性能的影響,。
3. 大模型的基礎問題。
研究多任務,、多數(shù)據(jù),、大模型的基礎問題,包括但不限于大模型的表示理論,、泛化理論,、樣本效率、大模型訓練的穩(wěn)定性,、標度率(scaling law),、涌現(xiàn)等現(xiàn)象;研究大模型的記憶災難(curse of memory)問題,;研究大模型的思維鏈(Chain of Thoughts),、多步推理、上下文學習(In-Context learning),、推理外推能力(如length generalization)等的機制,。
4. 以數(shù)據(jù)為中心的機器學習。
針對大模型數(shù)據(jù)側的獲取成本和效率問題,,剖析數(shù)據(jù)生成模型的優(yōu)化與泛化過程,,加速生成模型的訓練和推理;針對訓練數(shù)據(jù)的質量和數(shù)量問題,,設計多樣化和高質量的數(shù)據(jù)生成方法,,提出高效的數(shù)據(jù)選擇和配比策略,探索數(shù)據(jù)與模型協(xié)同迭代優(yōu)化的方式,,加速通用大模型的訓練,。
5. 科學領域的人工智能方法與理論。
針對典型的科學領域應用場景,,如核聚變,、藥物研發(fā)、材料設計,、電子多體等問題,,發(fā)展人工智能與物理,、化學、生物等基礎理論和模型融合的方法,,建立可通用的跨尺度人工智能輔助計算理論和方法,,解決典型復雜正反問題。
(二)重點支持項目,。
圍繞核心科學問題,,以總體科學目標為牽引,擬以重點支持項目的方式資助前期研究成果積累較好,、對總體科學目標在理論和關鍵技術上能發(fā)揮推動作用,、具備產(chǎn)學研用基礎的申請項目,研究方向如下:
1.融合邏輯和深度學習的推理方法,。
通過融合邏輯方法和深度學習方法,,提升人工智能系統(tǒng)的可靠性與處理復雜推理問題的能力。通過構建形式化數(shù)學數(shù)據(jù)庫,,優(yōu)化機器翻譯技術與證明算法,,實現(xiàn)高度自動化的定理證明,建立高度嚴謹?shù)耐评砟P汀?/span>
2. 融合物理與人工智能的幾何生成,。
融合物理仿真與深度學習方法,,實現(xiàn)面向多物理場微幾何結構的基礎生成模型;通過建立形式化與BREP表示的計算機輔助幾何(CAD)模型數(shù)據(jù)庫,,實現(xiàn)功能描述準確,、高精度CAD模型自動生成,構建高質量的幾何資產(chǎn),;增強從CAD模型生成四面體,、四邊形、高階網(wǎng)格的魯棒性,,實現(xiàn)物理仿真穩(wěn)定性與精度的提升,。
3. 新一代腦啟發(fā)的人工智能。
針對生物神經(jīng)元的節(jié)能特性與多樣化結構,,在生物神經(jīng)元與人工神經(jīng)元之間建立簡潔高效的映射,,使人工神經(jīng)元具有生物神經(jīng)元的能量優(yōu)化與樹突非線性計算功能,并提出統(tǒng)一的能量優(yōu)化算法框架,。結合神經(jīng)元網(wǎng)絡的連接結構與腦區(qū)特性,,設計生物神經(jīng)元特性約束和基于時空信息嵌入的人工神經(jīng)網(wǎng)絡模型,實現(xiàn)記憶,、決策等高級認知功能,。實現(xiàn)不少于3種生物與人工神經(jīng)元的映射及不少于3種樹突計算功能,與現(xiàn)有映射相比,實現(xiàn)精度,、性能與可解釋性的提升,。
4.類人認知學習框架。
探索類人認知學習框架,,通過智能體主動感知和交互,、模型自主學習和迭代更新,提升系統(tǒng)的智能化水平,,解決具身智能體在復雜物理環(huán)境下的交互決策難題,為因果模型構建,、物理常識生成等具身智能任務提供支撐,。
5.物理過程驅動的多智能體仿真場景可信生成。
構建基于物理原理驅動的場景模型,,實現(xiàn)高度逼真的環(huán)境動態(tài)模擬,;整合多模態(tài)信息,增強智能體與環(huán)境的交互,,確保仿真實體與現(xiàn)實世界的特性和行為相匹配,;建立完善的仿真數(shù)據(jù)可信度評估體系,確保仿真場景的可靠性,,為復雜系統(tǒng)研究和決策提供堅實的虛擬基礎,。
6. 可解釋的人工智能方法及其在化學反應復雜體系中的應用。
發(fā)展基于深度學習與物理模型融合的可解釋人工智能方法,,解析和構建化學反應網(wǎng)絡,,揭示復雜化學反應體系的微觀機理與表界面作用規(guī)律,推動可解釋的人工智能方法在能源催化,、合成化學和合成生物學等重要領域的落地應用,。
7. 人工智能驅動的虛擬細胞研究。
基于多組學數(shù)據(jù)和人工智能方法,,發(fā)展虛擬細胞技術,,模擬細胞動態(tài)生命過程,解析細胞互作原理,,預測生物體對擾動的復雜響應,。具體包括:1)虛擬單細胞:針對酵母、細胞系等典型情景,,通過多組學數(shù)據(jù)構建多尺度基因調控與信號通路網(wǎng)絡模型,,動態(tài)預測細胞行為,實現(xiàn)合成生物學或藥物篩選應用,;2)虛擬生物體:對線蟲,、胚胎等典型場景,通過影像學和組學數(shù)據(jù),構建多細胞相互作用關系和時空動態(tài)變化模型,,揭示生物體的生物學機制,。
8. 罕見病診斷決策大模型。
建立大規(guī)模罕見病臨床和遺傳信息數(shù)據(jù)庫,,覆蓋基因和臨床表現(xiàn)等多維度信息,,結合多模態(tài)數(shù)據(jù),構建可解釋的罕見病診斷決策大模型,,為罕見病診斷和治療提供關鍵依據(jù),。
9. 基于多模態(tài)大模型的耐受極端環(huán)境生物元件設計。
基于極端環(huán)境微生物數(shù)據(jù),,構建融合序列,、結構與功能的蛋白質和核酸序列多模態(tài)預訓練大模型;分析重要生物元件與環(huán)境適應性,、代謝功能等的聯(lián)系,,構建元件對極端環(huán)境適應度的預測模型;設計開發(fā)耐受高溫,、高壓,、極端pH的蛋白質和核酸等功能元件并接受濕實驗驗證,推動其在工業(yè),、醫(yī)藥等領域的產(chǎn)業(yè)化應用落地,。
(三)集成項目。
本年度擬遴選具有重大應用價值和良好研究基礎的研究方向進行集成資助,,研究方向如下:
1.記憶與推理分離,、分層的通用大模型。
設計記憶與推理分離,、分層的通用大模型新架構,,構建推理數(shù)據(jù)集,研究大模型的基礎理論及訓練方法,。具體包括:1)探索記憶與推理分離的模型架構,,實現(xiàn)可擴展、可學習,、高壓縮,、分布式、分層的記憶存儲,,設計存算高效的新型訓練方法,,通過從頭預訓練大模型(不少于7B參數(shù),1T Tokens)驗證新架構與新訓練方法的有效性,;2)實現(xiàn)文本推理數(shù)據(jù)的自動提取,,自動構建自然語言推理數(shù)據(jù)和形式化數(shù)學定理數(shù)據(jù)庫;3)闡明Next-Token Prediction訓練范式有效性的內(nèi)在機制,研究超參數(shù)和模型復雜度等對大模型推理能力的影響,。
2. 結構材料構效關系的構筑方法與應用,。
研究結構材料成分、組織結構,、工藝等知識編碼表示方法,,發(fā)展符號回歸和深度學習等材料知識構筑算法,構建物理意義明確的典型結構材料構效關系數(shù)學表達式或經(jīng)驗模型,;研究可解釋材料特征工程,、知識誘導高精度建模、材料因果推理等方法,,挖掘多組元成分,、復雜工藝、組織結構等對材料性能影響的內(nèi)稟關系,,建立材料數(shù)據(jù)庫、知識庫和工藝庫,;面向新型結構材料研發(fā)和生產(chǎn)制造全過程,,發(fā)展數(shù)據(jù)和知識雙驅動的方法,研發(fā)出2-3種高性能典型金屬結構材料,,并通過工程中試驗證,。
3. 融合環(huán)境-系統(tǒng)-模型的智能操作系統(tǒng)。
針對算力硬件和物理世界設備的泛化與智能化趨勢,,打破物理環(huán)境與智能模型邊界,,設計環(huán)境-系統(tǒng)-模型協(xié)同演進的方案,。具體包括:1)研究操作系統(tǒng),、人工智能模型,、物理環(huán)境三方面共同迭代演化方法,,保障環(huán)境-系統(tǒng)-模型協(xié)同演進,,相比分離演進整體性能提升50%以上,;2)研究面向多樣化算力硬件和物理設備的分布式操作系統(tǒng)元架構,,支撐不少于5種硬件和設備的高效抽象與適配,,相比分離抽象利用效率提升30%以上,;3)研究面向復雜物理環(huán)境的高可靠分布式數(shù)據(jù)傳輸與存儲底座,,實現(xiàn)物理空間智能元素的韌性互聯(lián)與實時協(xié)同。
四,、項目遴選的基本原則
(一)緊密圍繞核心科學問題,,鼓勵基礎性和交叉性強的前沿探索,優(yōu)先支持原創(chuàng)性研究,。
(二)優(yōu)先支持面向發(fā)展下一代人工智能新方法或能推動人工智能新方法在科學領域應用的研究項目,。
(三)重點支持項目和集成項目應具有良好的研究基礎和前期積累,對總體科學目標有直接貢獻并發(fā)揮支撐作用。
五,、2025年度資助計劃
擬資助培育項目約15項,,直接費用資助強度約為40萬元/項,資助期限為3年,,培育項目申請書中研究期限應填寫“2026年1月1日-2028年12月31日”,;擬資助重點支持項目約6項,直接費用資助強度約為300萬元/項,,資助期限為4年,,重點支持項目申請書中研究期限應填寫“2026年1月1日-2029年12月31日”;擬資助集成項目約3項,,直接費用資助強度為800-1200萬元/項,,資助期限為4年,集成項目申請書中研究期限應填寫“2026年1月1日-2029年12月31日”,。
六,、申請要求及注意事項
(一)申請條件。
本重大研究計劃項目申請人應當具備以下條件:
1. 具有承擔基礎研究課題的經(jīng)歷,;
2. 具有高級專業(yè)技術職務(職稱),。
在站博士后研究人員、正在攻讀研究生學位以及無工作單位或者所在單位不是依托單位的人員不得作為申請人進行申請,。
(二)限項申請規(guī)定,。
執(zhí)行《2025年度國家自然科學基金項目指南》“申請規(guī)定”中限項申請規(guī)定的相關要求。
(三)申請注意事項,。
申請人和依托單位應當認真閱讀并執(zhí)行本項目指南,、《2025年度國家自然科學基金項目指南》和《關于2025年度國家自然科學基金項目申請與結題等有關事項的通告》中相關要求。
1. 本重大研究計劃項目實行無紙化申請,。申請書提交日期為2025年3月1日-2025年3月15日16時,。
(1)申請人應當按照科學基金網(wǎng)絡信息系統(tǒng)中重大研究計劃項目的填報說明與撰寫提綱要求在線填寫和提交電子申請書及附件材料。
(2)本重大研究計劃旨在緊密圍繞核心科學問題,,對多學科相關研究進行戰(zhàn)略性的方向引導和優(yōu)勢整合,,成為一個項目集群。申請人應根據(jù)本重大研究計劃擬解決的核心科學問題和項目指南公布的擬資助研究方向,,自行擬定項目名稱,、科學目標、研究內(nèi)容,、技術路線和相應的研究經(jīng)費等,。
(3)申請書中的資助類別選擇“重大研究計劃”,亞類說明選擇“培育項目”,、“重點支持項目”或“集成項目”,,附注說明選擇“可解釋,、可通用的下一代人工智能方法”,受理代碼選擇T01,,根據(jù)申請的具體研究內(nèi)容選擇不超過5個申請代碼,。
培育項目和重點支持項目的合作研究單位不得超過2個,集成項目合作研究單位不得超過4個,。集成項目主要參與者必須是項目的實際貢獻者,,合計人數(shù)不超過9人。
(4)申請人在申請書起始部分應明確說明申請符合本項目指南中的資助研究方向,,以及對解決本重大研究計劃核心科學問題,、實現(xiàn)本重大研究計劃科學目標的貢獻。
如果申請人已經(jīng)承擔與本重大研究計劃相關的其他科技計劃項目,,應當在申請書正文的“研究基礎與工作條件”部分論述申請項目與其他相關項目的區(qū)別與聯(lián)系,。
2. 依托單位應當按照要求完成依托單位承諾、組織申請以及審核申請材料等工作,。在2025年3月15日16時前通過信息系統(tǒng)逐項確認提交本單位電子申請書及附件材料,,并于在線提交本單位項目申請清單。
3. 其他注意事項,。
(1)為實現(xiàn)重大研究計劃總體科學目標和多學科集成,,獲得資助的項目負責人應當承諾遵守相關數(shù)據(jù)和資料管理與共享的規(guī)定,項目執(zhí)行過程中應關注與本重大研究計劃其他項目之間的相互支撐關系,。
(2)為加強項目的學術交流,促進項目群的形成和多學科交叉與集成,,本重大研究計劃將每年舉辦1次資助項目的年度學術交流會,,并將不定期地組織相關領域的學術研討會。獲資助項目負責人有義務參加本重大研究計劃指導專家組和管理工作組所組織的上述學術交流活動,。
(四)咨詢方式,。
交叉科學部交叉科學一處
聯(lián)系電話:010-6232 8382
學校科技處計劃項目科聯(lián)系方式:8830 2962,,[email protected]
科技處
2025年1月27日