欧美精品99,欧美日韩中文一区二区,久久精品资源,日韩视频一区二区三区在线播放免费观看

登錄
首頁 > 朗逸汽車 > 又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒絕馬斯克的00后果然不同

發布時間:2025-08-11 20:31:47 發布用戶: 15210273549

27M小模型超越o3-mini-high和DeepSeek-R1!推理還不靠思維鏈。

開發者是那位拒絕了馬斯克、還要挑戰Transformer的00后清華校友,Sapient Intelligence的創始人王冠

這個27M小模型就是Sapient最新提出的開源可復現的分層推理模型Hierarchical Reasoning Model(下面簡稱HRM),模仿大腦的分層處理與多時間尺度運作機制,克服了標準Transfomer的計算局限。

2700萬參數,就實現了對現有大模型的精準超車。

不用預訓練補課,還不靠思維鏈打草稿,僅憑1000個訓練樣本,就把極端數獨、30x30迷宮玩得明明白白。

甚至連衡量通用智能的ARC-AGI測試都能碾壓一眾參數規模更大、上下文更長的Claude 3.7等“大前輩”。

有網友感嘆,這就像四兩撥千斤AI版……

所以,HRM這個小模型是如何做到的?

核心是仿腦的雙層循環模塊設計

HRM之所以能有如此出色的表現,源于其五項核心技術的巧妙設計。

首先是分層循環模塊與時間尺度分離

HRM受大腦皮層區域分層處理和時間分離機制啟發,設計了兩個相互配合的循環模塊:一個高層模塊負責慢節奏的抽象規劃,一個低層模塊處理快節奏的細節計算,不用明確監督中間過程,一次就能完成推理。

兩者在不同時間尺度上協同工作。低階模塊在每個高階周期內完成多次計算并達到臨時穩定狀態后,高階模塊才會更新決策,隨后低階模塊重置并開啟新一輪計算。

這種設計既保證了全局方向的正確性,又提升了局部執行的效率。

比如,在需要大量樹搜索和回溯的Sudoku-Extreme Full任務上,增加Transformer的寬度不能提升性能,增加深度才是關鍵,而標準架構會出現性能飽和,無法從深度增加中獲益。

HRM則克服了這一限制,能有效利用計算深度實現近乎完美的準確率。

其次是分層收斂機制

普通的循環神經網絡常出現過早收斂的問題——計算幾步就陷入穩定狀態,后續再復雜的任務也無法推進。

而HRM中,低階模塊在每輪計算中會收斂到基于當前高階狀態的局部結果,但高階模塊更新后,會給低階模塊設定新的目標,使其進入新的收斂周期。

這就像完成項目時,先攻克一個子任務,再根據整體進度調整目標,確保持續推進不偷懶。

第三項是近似梯度技術

傳統循環模型訓練時,需要存儲所有中間狀態并反向追溯,類似復盤時要回看每一步操作,既耗內存又低效。

HRM則采用一步梯度近似,只需根據最終狀態反推優化方向,如同根據考試結果直接定位薄弱知識點,內存需求恒定且計算高效,更符合生物大腦的學習規律。

第四是深度監督機制

它受大腦中神經振蕩調節學習節奏的啟發,引入了階段性測試。

模型在學習過程中被分成多個階段,每個階段結束后立即評估并調整參數,且前后階段的計算互不干擾。

這種方式能及時糾正偏差,就像學生每學一單元就測試鞏固,比期末一次性考試的學習效果更扎實。

自適應計算時間讓HRM能像人一樣靈活分配思考時間

它通過類似評估收益的算法(Q學習),動態決定是否繼續計算,在保證準確率的同時避免算力浪費,推理時還能通過增加計算資源進一步提升表現。

比如,簡單任務如簡單迷宮快速給出答案,復雜任務如高難度數獨則延長計算時間。

這些技術的融合,讓HRM在多項測試中表現不凡。

下圖通過可視化中間步驟,驗證了HRM的分層推理機制能夠有效拆解復雜任務,通過漸進式計算逼近正確結果,而非依賴黑箱式的一次性輸出。

在衡量AI通用推理能力的ARC-AGI挑戰中,HRM僅用2700萬參數和1000個訓練樣本,就達到40.3%的準確率,超過了參數規模更大的o3-mini-high(34.5%)和Claude 3.7 8K(21.2%)。

對于需要反復試錯的9x9極端數獨,現有思維鏈模型完全無法解決(準確率0%),即便是結構相似的Transformer模型,用同樣數據訓練也毫無頭緒。而HRM幾乎能全部做對。

在30x30復雜迷宮的最優路徑尋找任務中,HRM表現穩定,而1.75億參數的大型Transformer模型準確率不足20%。

雖然,HRM被指參數太小、訓練范圍有限,只針對特定領域表現好,無法泛化到領域外,并不通用。但有人認為小而精的模型或許在某些角度上更智能。

人工智能的飛躍在于創造性。

也有人認為HRM的前景更在于“仿腦”,通過精心設計的高低兩個模塊避免過早收斂,對過擬合具有極強的抵抗力

甚至有人相當樂觀,認為這種新架構是神經網絡一個巨大的進步。有可能是超越Transformer的時刻。

拒絕馬斯克,挑戰Transfomer

論文的第一作者王冠是一位00后,8歲開始學習編程,后保送至清華大學計算機系。

他是GitHub攬星5.1k開源項目OpenChat的獨立開發者,獨立完成了OpenChat全部版本的模型開發和訓練框架搭建。

也正是因為OpenChat這個項目,他和馬斯克產生了交集。

但他算得上是一個拒絕了馬斯克的男人——此前,王冠多次拒絕了xAI等一線機構創始人的加入邀請。

原因是他認為自己要做的是顛覆Transfomer

2024年,王冠和聯合創始人Austin創辦了Sapient Intelligence,并成功融資數千萬美元。致力于打造“真正具有復雜推理和規劃能力的全新大模型架構”。

Copyright 2019-2026 微推堂 版權所有  京ICP備2019123967號
欧美精品99,欧美日韩中文一区二区,久久精品资源,日韩视频一区二区三区在线播放免费观看
在线视频亚洲| 日韩精品免费视频人成| 亚洲精品一区二区妖精| 福利在线一区| 麻豆一区二区三区| 97精品久久| 少妇精品久久久一区二区| 国产精品一区二区av日韩在线| 美女精品网站| 伊人久久亚洲美女图片| 婷婷亚洲综合| 亚洲一区二区三区免费在线观看 | 日韩在线一二三区| 日韩一级网站| 亚洲欧美日韩国产一区二区| 亚洲欧美日韩一区在线观看| 欧美专区在线| 中文字幕亚洲精品乱码| 日本va欧美va瓶| 国产精品sss在线观看av| 国产精品亲子伦av一区二区三区| 欧美a级一区二区| 国产精品a级| 成人在线黄色| 亚洲午夜电影| 免费在线成人网| 欧美亚洲色图校园春色| 久久不卡日韩美女| 国产不卡av一区二区| 欧洲在线一区| 日韩中文字幕区一区有砖一区| 日韩午夜视频在线| 久久超级碰碰| 成人久久一区| 亚洲一区二区三区高清| 亚洲资源网站| 国产欧美三级| av高清不卡| 模特精品在线| 国产精品日本一区二区三区在线| 日韩av自拍| 欧美日韩视频| 青青草91视频| 国产一区二区三区国产精品| 丝袜av一区| 丝袜美腿亚洲一区二区图片| 日韩av中文字幕一区| 国产成人免费av一区二区午夜| 久久久天天操| 蜜桃视频免费观看一区| 欧美成人一二区| 日本久久成人网| 午夜亚洲福利在线老司机| 亚洲精品乱码| 国产一区二区三区网| 亚洲免费观看| 高清一区二区| 在线精品视频一区| 成人在线视频免费| 免费在线观看精品| 欧美丰满日韩| 日本欧美大码aⅴ在线播放| 偷拍精品精品一区二区三区| 亚洲欧洲国产精品一区| 日韩av有码| 亚洲欧美一级| 久久男人av资源站| 日韩超碰人人爽人人做人人添| 国产成人精品999在线观看| 天堂成人国产精品一区| 奇米777国产一区国产二区| 婷婷激情久久| 国产精品a级| 天堂av在线一区| 成人在线视频免费| 日韩综合一区二区| 久久久久.com| 国产三级一区| 蜜臀久久精品| 日韩成人一级| 尹人成人综合网| 精品久久福利| 欧美一区二区三区久久| 日韩精品一区二区三区免费观看| 精品国产日韩欧美精品国产欧美日韩一区二区三区 | 婷婷成人综合| 国产精品蜜月aⅴ在线| 久久中文字幕二区| 欧美国产另类| 日精品一区二区三区| 亚洲性色视频| 精品福利久久久| 日本不卡高清| 亚洲欧美日韩精品一区二区 | 久久激五月天综合精品| 欧美特黄一区| 日韩啪啪电影网| 国产劲爆久久| 欧美日本久久| 免费日本视频一区| 99国产精品99久久久久久粉嫩| 精品三级久久| 成人一区不卡| 久久久久久夜| 国产aⅴ精品一区二区四区| 国产伦理久久久久久妇女| 亚洲丝袜美腿一区| 一区在线视频观看| 免费不卡中文字幕在线| 99久久激情| 色老板在线视频一区二区| 神马午夜在线视频| 亚洲一级少妇| 国产麻豆久久| 久久九九精品| 久久亚洲在线| 99久精品视频在线观看视频| 日韩精品91| 久久久久久久久99精品大| av日韩中文| 精品国产乱码| 久久精品 人人爱| 91成人精品观看| 日本在线一区二区三区| 日韩一级不卡| 狠狠久久婷婷| 国产精品久久观看| 97精品国产| 国产精品videossex| 日韩欧美2区| 亚洲欧洲国产精品一区| 四虎精品永久免费| 久久99伊人| 久久精品国产亚洲夜色av网站| 国产 日韩 欧美 综合 一区| 国产日韩欧美三级| 深夜福利亚洲| 日韩1区2区3区| 亚洲精品国产日韩| 综合一区二区三区| 天堂va蜜桃一区二区三区| 亚洲激情五月| 亚洲福利免费| 午夜在线视频一区二区区别| 国内激情久久| 91精品亚洲| 久久国产电影| а√天堂8资源在线| 久久九九电影| 欧美成人基地| 亚洲午夜91| 欧美日韩在线观看视频小说| 青青青免费在线视频| 日韩成人免费| 成人在线黄色| 中文字幕人成乱码在线观看| 福利一区二区三区视频在线观看| 日产精品一区二区| 久久久国产精品一区二区中文| 亚洲精品123区| 蘑菇福利视频一区播放| 亚洲图片久久| 日韩不卡一区二区| 国产欧美亚洲一区| 亚洲精品永久免费视频| 久久精选视频| 伊人久久av| 久久久水蜜桃av免费网站| 亚洲欧美视频一区二区三区| 热久久久久久久| 日韩精品欧美大片| 国产免费久久| 久久精品国产亚洲一区二区三区| 国产欧美高清| 日韩免费小视频| 欧美午夜不卡| 亚洲狼人精品一区二区三区| 日本综合视频| 精品日韩在线| 蘑菇福利视频一区播放| 日本中文字幕不卡| 精品一区电影| 国产精品久久久久av电视剧| 日韩在线第七页| 亚洲免费福利一区| 久久99精品久久久野外观看| 四虎成人av| 午夜国产一区二区| 一区二区91| 国产在线|日韩| 日本大胆欧美人术艺术动态| 日韩国产欧美在线播放| 精品国产亚洲一区二区三区| 里番精品3d一二三区| 99国产精品99久久久久久粉嫩| 视频一区中文字幕精品| 国产一区二区三区不卡视频网站| 欧美肉体xxxx裸体137大胆| 亚洲毛片在线免费| 亚洲小说欧美另类婷婷|