欧美精品99,欧美日韩中文一区二区,久久精品资源,日韩视频一区二区三区在线播放免费观看

登錄
首頁 > 朗逸汽車 > 英偉達開源9B參數小模型,比Qwen3快6倍

英偉達開源9B參數小模型,比Qwen3快6倍

發布時間:2025-08-20 12:21:52 發布用戶: 15210273549

小模型也開始卷起來了!

在麻省理工學院衍生公司Liquid AI發布了一款小到可以裝在智能手表上的新AI視覺模型,以及谷歌發布了一款可以在智能手機上運行的小型模型之后,英偉達也加入了這場浪潮,推出了自己的新型小型語言模型(SLM):

Nemotron Nano v2

這款9B的“小”模型在復雜推理基準測試上的準確率與Qwen3-8B相當或更高,速度快6倍

再聯系到他們前些天發布的論文觀點:小模型才是智能體的未來,看來真不只是說說而已。

除了這款模型,他們首次“自豪地”開源了用于創建它的絕大部分數據,包括預訓練語料庫。

讓我們來看一下……20萬億?Nemotron Nano v2在20萬億多個token上進行預訓練?

與Qwen相比速度提升6倍

技術報告顯示,Nemotron Nano v2在復雜推理基準測試上的準確率與同等規模的領先開源模型Qwen3-8B相當或更高,同時吞吐量——也就是模型速度——最高可提升6倍。

這款模型由英偉達從頭訓練,設計目標是成為兼顧推理與非推理任務的統一模型。

模型在響應用戶查詢或執行任務時,會首先生成推理過程(reasoning trace),隨后輸出最終答案。該模型支持“思考”預算控制,在推理過程中,用戶可以指定模型被允許“思考”的token數量。

如果用戶希望模型直接給出最終答案(跳過中間推理步驟),可通過配置實現,但這一做法可能導致對復雜推理類提示的準確率下降。

相反,若允許模型先展示推理過程,通常能顯著提升最終答案的質量,尤其針對需邏輯分析的復雜任務。

面對網友“思考預算控制是如何實現的”的問題,英偉達的模型訓練師Oleksii Kuchaiev表示:

我們最初采用了與Qwen3相同的實現方法,但發現當強制要求模型直接輸出答案時,它仍會在預設的思維鏈之外進行“思考”。通過對截斷思維鏈的訓練,我們成功解決了這個問題。

基礎模型同樣開源

評估結果顯示,與其他開源小規模模型相比,Nemotron Nano v2在準確率上具有優勢。在 NeMo-Skills套件的“推理開啟”模式下測試,該模型在AIME25上達到72.1%,在MATH500上達到97.8%,在GPQA上達到64.0%,在LiveCodeBench上達到 71.1%。

在指令遵循和長上下文基準測試中的得分也有報告:在IFEval上達到 90.3%,在RULER 128K測試中達到 78.9%,在BFCL v3和HLE基準測試中也有較小但可測量的提升。

Nemotron Nano v2經過了以下訓練過程:

預訓練:模型使用FP8精度在20萬億個token上進行預訓練,采用Warmup-Stable-Decay學習率調度。隨后進入持續預訓練長上下文擴展階段,使其在不降低其他基準測試性能的情況下達到128k的能力。

后訓練:Nemotron Nano v2通過監督微調(SFT)、組相對策略優化(GRPO)、直接偏好優化(DPO)和人類反饋強化學習(RLHF)進行后訓練。約5%的數據包含故意截斷的推理軌跡,從而在推理時實現細粒度思考預算控制。

壓縮:最后,基礎模型和對齊模型均經過壓縮(剪枝和蒸餾),支持在單個NVIDIA A10G GPU(22 GiB 內存,bfloat16 精度)上進行128k token的上下文推理。這一成果是通過擴展基于Minitron的壓縮策略實現的,該策略專門針對受限條件下的推理模型壓縮需求而設計。

除了Nemotron Nano v2模型本身,英偉達還發布了兩個基礎模型NVIDIA-Nemotron-Nano-12B-v2-Base(對齊或剪枝前的基礎模型)和NVIDIA-Nemotron-Nano-9B-v2-Base(剪枝的基礎模型),對應模型訓練的不同階段,均支持128k上下文長度。

最后,Nemotron Nano v2當前支持在線試用,鏈接可見文末。

超大預訓練數據庫

除了Nemotron Nano v2,英偉達首次發布了他們用于創建模型的絕大部分數據,包括預訓練語料庫。

至于為什么是“絕大部分”,有網友問了這個問題,官方回復簡直不要太有道理(笑)。

預訓練數據集Nemotron-Pre-Training-Dataset-v1包含66萬億個優質網絡爬取、數學、代碼、SFT 和多語言問答數據,并分為四個類別:

Nemotron-CC-v2:作為Nemotron-CC的升級版本,新增收錄了2024至2025年間八個批次的Common Crawl網絡快照數據。數據已進行全球去重,并使用Qwen3-30B-A3B進行合成改寫。它還包含翻譯成15種語言的合成多樣化問答對,支持強大的多語言推理和通用知識預訓練。

Nemotron-CC-Math-v1: 一個基于Common Crawl、使用英偉達的Lynx + LLM流程生成的1330億token的數學專注數據集,在保留方程和代碼格式的同時,將數學內容標準化為LaTeX格式。這確保了關鍵的數學和代碼片段保持完整,從而生成高質量的預訓練數據,在基準測試中優于先前的數學數據集。

Nemotron-Pretraining-Code-v1: 一個大規模的精選代碼數據集,源自GitHub,并通過多階段去重、許可證執行和啟發式質量檢查進行過濾。它還包括11種編程語言的LLM生成的代碼問答對。

Nemotron-Pretraining-SFT-v1:一個綜合生成的數據集,涵蓋STEM、學術、推理和多語言領域。該數據集整合了多元化的高質量內容,包括從數學與科學核心題庫提取的復雜多選題和分析題、研究生階段的專業學術文獻,以及經過指令微調的SFT數據。

Nemotron-Pretraining-Dataset-sample:該數據集的一個小型抽樣版本提供了10個具有代表性的數據子集,涵蓋了高質量問答數據、數學專項內容、代碼元數據以及SFT指令數據。

那些數字看起來都嚇人,數零都得數半天(目移)。

One More Thing

順帶一提,最近英偉達的開源勢頭可以說是很猛了。

相比于其他國外科技巨頭陸續走向的閉源道路,英偉達構建的Nemotron生態直接把開源二字寫在了門面上。

無論是前段時間發布的Llama Nemotron Super v1.5,還是這次的Nemotron Nano v2,對標的也是國內開源模型Qwen3。

這樣的策略會給他們帶來什么?又會改變些什么?我們拭目以待。

Copyright 2019-2026 微推堂 版權所有  京ICP備2019123967號
欧美精品99,欧美日韩中文一区二区,久久精品资源,日韩视频一区二区三区在线播放免费观看
激情综合自拍| 国产免费久久| 国产欧美激情| 国产精品白丝av嫩草影院| 欧美国产不卡| 亚洲伦乱视频| 天堂成人国产精品一区| 亚洲精品在线二区| 国产乱子精品一区二区在线观看 | 日韩中文字幕| 亚洲v天堂v手机在线| 天堂va在线高清一区| 欧美国产亚洲精品| 欧美综合另类| 亚洲精品自拍| 成人一二三区| 99在线|亚洲一区二区| 91精品日本| 伊人网在线播放| 好吊日精品视频| 日韩国产精品久久久| 精品中文字幕一区二区三区| 日本韩国欧美超级黄在线观看| 久久国产高清| 欧美国产极品| 日韩精品麻豆| 日韩国产欧美视频| 日本免费一区二区三区四区| 亚洲综合五月| 日韩一区二区在线免费| 亚洲理论在线| 播放一区二区| 日韩精品第一| 国产亚洲一区二区手机在线观看 | 久久在线91| 亚洲精品91| 欧美日韩亚洲一区三区| 婷婷综合六月| 国产欧美精品久久| 亚洲一区二区三区免费在线观看 | 久久精品国产68国产精品亚洲| 日韩免费精品| 欧美一区二区性| 国产欧美日韩视频在线| 久久国产精品成人免费观看的软件| 婷婷亚洲成人| 国产一区亚洲| 亚洲主播在线| 成人在线视频免费| 蜜桃视频免费观看一区| 高清av不卡| 国产剧情一区二区在线观看| 亚洲欧美日韩国产综合精品二区 | 日本亚洲最大的色成网站www| 国产精品久久久久av电视剧| 国产精品亚洲综合久久| 日韩精品一区第一页| 亚洲综合电影| 国产麻豆一区二区三区| 蘑菇福利视频一区播放| 日本少妇一区| 国产欧美视频在线| 蜜臀久久久久久久| 欧美日韩国产一区二区三区不卡| 国产精品yjizz视频网| 国产极品久久久久久久久波多结野| 蜜臀久久久久久久| 红桃视频亚洲| 韩日一区二区三区| 日韩福利一区| 欧美www视频在线观看| 日韩国产在线观看一区| 视频一区二区三区在线| 日韩精品一区二区三区免费观影| 国产欧美日韩视频在线| 涩涩涩久久久成人精品| 99久久精品网站| 欧美一区久久久| 国内自拍视频一区二区三区| 人人爱人人干婷婷丁香亚洲| 免费人成精品欧美精品 | 国产美女高潮在线| 精品视频自拍| 久久精品国产一区二区| 国产精品最新| 国产乱码精品一区二区三区亚洲人| 日韩av网站在线免费观看| 午夜久久av| 日韩av午夜在线观看| 免费的成人av| 日韩综合一区二区三区| 日韩激情网站| 久久精品99国产精品| 国产亚洲欧美日韩精品一区二区三区| 日韩高清一区| 国产精品主播在线观看| 国产乱人伦丫前精品视频| 国产精品久久久久久模特 | 国产精品**亚洲精品| 久久国产精品免费一区二区三区| 日本欧美大码aⅴ在线播放| 日韩国产在线观看一区| 国产日韩高清一区二区三区在线 | 精品丝袜久久| 日韩欧美网址| 欧美日韩黑人| 蜜桃久久久久久| 日韩av一二三| 国产精品久久久久av蜜臀 | 亚洲精一区二区三区| 奇米色欧美一区二区三区| 青青草国产精品亚洲专区无| 欧美日韩伊人| 麻豆理论在线观看| av亚洲在线观看| 亚洲日产av中文字幕| 国产精品一区高清| 黄色在线网站噜噜噜| 欧美在线资源| 日韩av一级片| 欧美xxxx中国| 亚洲a一区二区三区| 日韩视频一区| 欧美精品中文字幕亚洲专区| 精品国产三区在线| 性感美女一区二区在线观看| 日韩一区二区久久| 国产欧美一区二区色老头| 国产精品成久久久久| 日韩一级欧洲| 国产精品一区二区av交换| 欧美成人a交片免费看| 久久高清免费观看| 欧美国产另类| 国产一区日韩欧美| 日韩精品一区二区三区中文| 欧美精品国产一区| 丝袜av一区| 日韩激情av在线| 日韩在线短视频| 亚洲精品成人一区| 热三久草你在线| 婷婷亚洲成人| 欧美日韩国产观看视频| 一级成人国产| 群体交乱之放荡娇妻一区二区| 视频一区日韩精品| 天堂资源在线亚洲| 国产精品色在线网站| 日韩视频不卡| 久草精品视频| 亚洲视频播放| 福利视频一区| 婷婷精品在线观看| 91精品亚洲| 久久成人高清| 美国三级日本三级久久99| 日本久久黄色| 欧美一级全黄| 女人天堂亚洲aⅴ在线观看| 久久久久亚洲精品中文字幕| 亚洲神马久久| 精品亚洲二区| 日韩不卡一区二区三区| 91精品国产乱码久久久久久久| 国产精品亚洲综合在线观看| 亚洲高清毛片| 精品久久久久久久| 日韩久久99| 每日更新成人在线视频| 欧美日韩视频免费观看| 久久女人天堂| 久久国产三级| 日韩美女国产精品| 乱人伦精品视频在线观看| 91精品国产乱码久久久久久久 | 综合色一区二区| 亚洲天堂黄色| 精品三级国产| 国产精品一区二区av交换| 亚洲最大av| 视频一区国产视频| 精品91久久久久| 激情欧美一区| 秋霞影院一区二区三区| 国产一区二区三区不卡视频网站 | 日韩高清不卡一区二区| 亚洲欧美日韩视频二区| 激情欧美日韩一区| 伊人久久高清| 成人精品天堂一区二区三区| 日韩av在线中文字幕| 精品一区二区三区的国产在线观看| 青青草伊人久久| 欧美日韩伊人| 欧美一区免费| 青草av.久久免费一区| 三级欧美在线一区| 午夜一区在线| 亚洲综合二区|