
2025 年是 PC 端 AI 發展的突破之年。
PC 級小語言模型 (SLM) 的準確率相比 2024 年提高近 2 倍,顯著縮小與前沿云端大語言模型 (LLM) 之間的差距。AI PC 開發工具,如 Ollama、ComfyUI、llama.cpp、Unsloth 等日趨成熟,受歡迎程度同比翻倍,下載 PC 級模型的用戶數量也較 2024 年增長 10 倍。
上述進展將推動生成式 AI 在 2026 年全面走向大眾 PC 創作者、游戲玩家和生產力用戶。
在 CES 上,NVIDIA 宣布為 GeForce RTX、NVIDIA RTX PRO 以及 NVIDIA DGX Spark 設備推出一系列 AI 升級,為 PC 上部署生成式 AI 解鎖性能,降低顯存需求,包括:
• 通過 PyTorch-CUDA 優化以及在 ComfyUI 中原生支持 NVFP4 / FP8 精度,視頻和圖像生成式 AI 性能至高提升3倍,顯存占用至多降低 60%。
• 在 ComfyUI 中集成 RTX 視頻超分辨率(RTX VSR),加速 4K 視頻生成。
• 為 Lightricks 業界領先的 LTX-2 音視頻生成模型開源權重版本做出優化,推出 NVIDIA NVFP8 量化模型。
• 為由 Blender 中的 3D 場景生成 4K AI 視頻提供了一個 AI Blueprint,實現對輸出結果的精確控制。
• 通過加速 Ollama 和 llama.cpp,將小語言模型 (SLM) 推理性能至高提升 35%。
• 為 Nexa.ai 的 Hyperlink 全新視頻搜索功能提供 RTX 加速。
這些改進讓用戶能夠在無縫運行先進的視頻、圖像和語言 AI 工作流的同時享受本地 RTX AI PC 帶來的隱私性、安全性和低延遲優勢。
在 RTX PC 上實現 3 倍加速的 4K 視頻生成
生成式 AI 能夠制作出令人驚艷的視頻內容,但僅依靠提示詞的在線工具往往難以精準控制其生成效果。而嘗試生成 4K 視頻幾乎是不可能的,因為大多數模型體量過大,難以載入個人 PC 的顯存。
1月6日,NVIDIA 推出了一套由 RTX 加速的視頻生成工作流,使創作者能夠更精準地控制生成結果,同時還能以 3 倍速度生成視頻并將其提升至 4K 分辨率 – 僅需占用一小部分顯存。
這套視頻工作流支持現代創作者從分鏡腳本出發,生成照片級寫實畫面的關鍵幀,并最終生成高質量的 4K 視頻。整個流程由三大 AI Blueprint 模塊構成,藝術家可根據需求靈活組合和調整:
• 3D 物體生成器:用于創建場景所需的資產。
• 3D 引導的圖像生成器:用戶可在 Blender 中搭建場景,并據此生成照片級寫實的關鍵幀。
• 視頻生成器:根據用戶設定的起始與結束關鍵幀來生成動畫視頻,并借助 NVIDIA RTX Video 技術將視頻升級至 4K。
這一視頻生成工作流由 Lightricks 的全新 LTX-2 模型實現,該模型于1月6日正式發布并開放下載。
LTX-2在本地 AI 視頻創作取得重要里程碑,其生成效果可與領先的云端模型媲美,能生成長達 20 秒且視覺保真度極高的 4K 視頻。模型內置音頻功能、支持多關鍵幀,并通過可控低秩適配增強的高級條件控制功能,使創作者無需依賴云端,即可獲得電影級的畫質與精細控制。
這套工作流在底層由 ComfyUI 驅動。過去數月,NVIDIA 與 ComfyUI 團隊緊密合作,使其在 NVIDIA GPU 上的性能提升了 40%,最新版本增加了對 NVFP4 與 NVFP8 的支持,在 RTX 50 系列 GPU 上采用 NVFP4 格式可實現 3 倍的性能提升、顯存占用降低 60%;采用 NVFP8 格式則可實現2倍的性能提升、顯存占用降低 40%。

目前,NVFP4 和 NVFP8 Checkpoints 現已在 ComfyUI 中直接開放給部分熱門模型,包括 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1 與 FLUX.2,以及阿里巴巴的 Qwen-Image 和 Z-Image。用戶可在 ComfyUI 中直接下載,后續還將支持更多模型。

在視頻生成完成后,用戶可通過 ComfyUI 中全新的 RTX Video 節點,在數秒內將視頻放大至 4K分辨率。該圖像放大 (Upscaler) 功能可實時運行,銳化畫面邊緣并消除壓縮偽影,輸出清晰的畫面。RTX Video 將于下個月正式登陸 ComfyUI。
為了幫助用戶突破 GPU 顯存限制,NVIDIA 與 ComfyUI 團隊合作,進一步優化了其 weight streaming 功能。啟用該功能后,當顯存不足時,ComfyUI 可調用系統內存,從而在主流 RTX GPU 上運行更大規模的模型與更復雜的多階段節點圖。
這套視頻生成工作流將于下個月開放下載,而 LTX-2 視頻模型的開源權重以及 ComfyUI 的 RTX 相關更新現已上線。
全新的 PC 文件與視頻搜索方式
幾十年來,PC 上的文件搜索方式幾乎沒有發生變化,仍主要依賴文件名和零散的元數據。這種方式讓用戶想要找到一年前的某個特定文檔變得異常困難。
Hyperlink 是由 Nexa.ai 推出的本地搜索智能體。它可以將 RTX PC 變為一個可搜索的知識庫,支持以自然語言提問,并在結果中提供可追溯的引用來源。它能夠掃描并索引文檔、PPT、PDF 以及圖像,讓搜索不再依靠猜測文件名,而是基于內容和需求本身。所有數據均在本地處理并保存在用戶的 PC 上,以確保隱私與安全。此外,Hyperlink 還支持 RTX 加速,在 RTX 5090 GPU 上,索引文本和圖像文件的速度約為 每 GB 30 秒,查詢響應時間僅3秒。相比之下,使用 CPU 索引文件每 GB 則需要約1小時,查詢響應時間長達90秒。
在 CES 2026 上,Nexa.ai 發布了 Hyperlink 的全新測試版本,新增對視頻內容的支持,使用戶可以在本地視頻中搜索物體、動作以及語音內容。這一功能可以幫助視頻創作者快速查找所需的 B-roll 素材,或讓游戲玩家找到自己贏得比賽的精彩瞬間,與好友分享。
體驗 Hyperlink 的私有測試版本,請前往 Nexa.ai 官網注冊。訪問權限將從本月起陸續開放。
小語言模型 (SLM) 性能提升高達 35%

NVIDIA 攜手開源社區,基于 llama.cpp 與 Ollama,為 RTX GPU 和 NVIDIA DGX Spark 桌面級超級計算機上的小語言模型帶來了顯著的性能提升。最新優化對混合專家模型 (MoE) 尤為有利,其中包括 NVIDIA 近期發布的 Nemotron 3 系列開放模型。
在過去四個月中,小語言模型的推理性能在 llama.cpp 上提升了 35%,在 Ollama 上提升了 30%。Ollama 的相關更新現已發布,而 llama.cpp 則已提供了用戶體驗升級,可顯著加快大語言模型的加載速度。
這些性能提升將在 LM Studio 的下一次更新中實現,并將很快應用于各種智能體應用,例如全新的 MSI AI Robot 應用。MSI AI Robot 同樣受益于 llama.cpp 的優化,使用戶能夠更便捷地控制 MSI 設備設置,并在即將發布的版本中整合最新性能的升級。
NVIDIA Broadcast 2.1 將虛擬補光帶給更多 PC 用戶

NVIDIA Broadcast 應用 AI 特效提升麥克風和攝像頭的質量,成為直播和視頻會議的理想之選。
2.1 版本對虛擬補光效果進行了性能優化。它不僅支持 RTX 3060 及以上 GPU,還能適應更多光照環境,提供更廣的色溫調節,并使用更新的 HDRi 基礎貼圖,實現常見于專業直播的雙主燈效果。查看鏈接下載 NVIDIA Broadcast 的更新版本。
熱門直播平臺Bilibili即將集成更新后的虛擬補光效果。此次更新將使更多 GeForce RTX 用戶能夠在直播中獲得更優質的面部補光效果。對 NVIDIA Broadcast 特效感興趣的開發者可查看最新版本的軟件開發工具包 (SDK)。
DGX Spark:將居家創意工作室升級為 AI 超級工作站
隨著每個月越來越多更強大的 AI 模型不斷登陸 PC 端,開發者對更高性能、更靈活的本地 AI 環境的需求持續增長。DGX Spark 是一款緊湊型 AI 超級計算機,可放置在桌面上,與主力臺式機或筆記本電腦無縫配合,使用戶能夠與現有 PC 共同進行實驗、原型設計以及運行高級的 AI 工作負載。
Spark 非常適合希望測試大語言模型、原型化智能體工作流的開發者,或希望在工作流中并行生成創作素材的藝術家,這樣他們的主力 PC 仍能繼續進行編輯工作。
在 CES 2026 上,NVIDIA 發布了 Spark 的重大 AI 性能更新,使其相較于不到三個月前首次發布時,最高可獲得高達 2.6 倍的性能提升。

NVIDIA還推出了全新的 DGX Spark Playbooks,包括用于推測解碼以及使用兩個 DGX Spark 模塊微調模型的示例方案。
NVIDIA RTX AI PC的相關信息請關注微博、抖音及嗶哩嗶哩官方賬號。
軟件產品信息請查看聲明。
關于NVIDIA
NVIDIA (NASDAQ: NVDA) 是加速計算領域的全球領導者。
# # #
媒體咨詢:
Jade Li
NVIDIA GeForce, Studio PR
郵箱:jadli@nvidia.com