NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

2026-01-06 16:03:41     来源:

ComfyUI、LTX-2、Llama.cpp、Ollama、Hyperlink 等迎来全面 RTX 加速,解锁 AI PC 上的视频、图像与文本生成应用场景

2025 年是 PC 端 AI 发展的突破之年。

PC 级小语言模型 (SLM) 的准确率相比 2024 年提高近 2 倍,显著缩小与前沿云端大语言模型 (LLM) 之间的差距。AI PC 开发工具,如 Ollama、ComfyUI、llama.cpp、Unsloth 等日趋成熟,受欢迎程度同比翻倍,下载 PC 级模型的用户数量也较 2024 年增长 10 倍。

上述进展将推动生成式 AI 在 2026 年全面走向大众 PC 创作者、游戏玩家和生产力用户。

在 CES 上,NVIDIA 宣布为 GeForce RTX、NVIDIA RTX PRO 以及 NVIDIA DGX Spark 设备推出一系列 AI 升级,为 PC 上部署生成式 AI 解锁性能,降低显存需求,包括:

通过 PyTorch-CUDA 优化以及在 ComfyUI 中原生支持 NVFP4 / FP8 精度,视频和图像生成式 AI 性能至高提升3倍,显存占用至多降低 60%。

在 ComfyUI 中集成 RTX 视频超分辨率(RTX VSR),加速 4K 视频生成。

为 Lightricks 业界领先的 LTX-2 音视频生成模型开源权重版本做出优化,推出 NVIDIA NVFP8 量化模型。

为由 Blender 中的 3D 场景生成 4K AI 视频提供了一个 AI Blueprint,实现对输出结果的精确控制。

通过加速 Ollama 和 llama.cpp,将小语言模型 (SLM) 推理性能至高提升 35%。

为 Nexa.ai 的 Hyperlink 全新视频搜索功能提供 RTX 加速。

这些改进让用户能够在无缝运行先进的视频、图像和语言 AI 工作流的同时享受本地 RTX AI PC 带来的隐私性、安全性和低延迟优势。

RTX PC 上实现 3 倍加速的 4K 视频生

生成式 AI 能够制作出令人惊艳的视频内容,但仅依靠提示词的在线工具往往难以精准控制其生成效果。而尝试生成 4K 视频几乎是不可能的,因为大多数模型体量过大,难以载入个人 PC 的显存。

1月6日,NVIDIA 推出了一套由 RTX 加速的视频生成工作流,使创作者能够更精准地控制生成结果,同时还能以 3 倍速度生成视频并将其提升至 4K 分辨率 – 仅需占用一小部分显存。

这套视频工作流支持现代创作者从分镜脚本出发,生成照片级写实画面的关键帧,并最终生成高质量的 4K 视频。整个流程由三大 AI Blueprint 模块构成,艺术家可根据需求灵活组合和调整:

3D 物体生成器:用于创建场景所需的资产。

3D 引导的图像生成器:用户可在 Blender 中搭建场景,并据此生成照片级写实的关键帧。

视频生成器:根据用户设定的起始与结束关键帧来生成动画视频,并借助 NVIDIA RTX Video 技术将视频升级至 4K。

这一视频生成工作流由 Lightricks 的全新 LTX-2 模型实现,该模型于1月6日正式发布并开放下载。

LTX-2在本地 AI 视频创作取得重要里程碑,其生成效果可与领先的云端模型媲美,能生成长达 20 秒且视觉保真度极高的 4K 视频。模型内置音频功能、支持多关键帧,并通过可控低秩适配增强的高级条件控制功能,使创作者无需依赖云端,即可获得电影级的画质与精细控制。

这套工作流在底层由 ComfyUI 驱动。过去数月,NVIDIA 与 ComfyUI 团队紧密合作,使其在 NVIDIA GPU 上的性能提升了 40%,最新版本增加了对 NVFP4 与 NVFP8 的支持,在 RTX 50 系列 GPU 上采用 NVFP4 格式可实现 3 倍的性能提升、显存占用降低 60%;采用 NVFP8 格式则可实现2倍的性能提升、显存占用降低 40%。

目前,NVFP4 和 NVFP8 Checkpoints 现已在 ComfyUI 中直接开放给部分热门模型,包括 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1 与 FLUX.2,以及阿里巴巴的 Qwen-Image 和 Z-Image。用户可在 ComfyUI 中直接下载,后续还将支持更多模型。

在视频生成完成后,用户可通过 ComfyUI 中全新的 RTX Video 节点,在数秒内将视频放大至 4K分辨率。该图像放大 (Upscaler) 功能可实时运行,锐化画面边缘并消除压缩伪影,输出清晰的画面。RTX Video 将于下个月正式登陆 ComfyUI。

为了帮助用户突破 GPU 显存限制,NVIDIA 与 ComfyUI 团队合作,进一步优化了其 weight streaming 功能。启用该功能后,当显存不足时,ComfyUI 可调用系统内存,从而在主流 RTX GPU 上运行更大规模的模型与更复杂的多阶段节点图。

这套视频生成工作流将于下个月开放下载,而 LTX-2 视频模型的开源权重以及 ComfyUI 的 RTX 相关更新现已上线。

全新的 PC 文件与视频搜索方

几十年来,PC 上的文件搜索方式几乎没有发生变化,仍主要依赖文件名和零散的元数据。这种方式让用户想要找到一年前的某个特定文档变得异常困难。

Hyperlink 是由 Nexa.ai 推出的本地搜索智能体。它可以将 RTX PC 变为一个可搜索的知识库,支持以自然语言提问,并在结果中提供可追溯的引用来源。它能够扫描并索引文档、PPT、PDF 以及图像,让搜索不再依靠猜测文件名,而是基于内容和需求本身。所有数据均在本地处理并保存在用户的 PC 上,以确保隐私与安全。此外,Hyperlink 还支持 RTX 加速,在 RTX 5090 GPU 上,索引文本和图像文件的速度约为 每 GB 30 秒,查询响应时间仅3秒。相比之下,使用 CPU 索引文件每 GB 则需要约1小时,查询响应时间长达90秒。

在 CES 2026 上,Nexa.ai 发布了 Hyperlink 的全新测试版本,新增对视频内容的支持,使用户可以在本地视频中搜索物体、动作以及语音内容。这一功能可以帮助视频创作者快速查找所需的 B-roll 素材,或让游戏玩家找到自己赢得比赛的精彩瞬间,与好友分享。

体验 Hyperlink 的私有测试版本,请前往 Nexa.ai 官网注册。访问权限将从本月起陆续开放。

小语言模型 (SLM) 性能提升高达 35%

NVIDIA 携手开源社区,基于 llama.cpp 与 Ollama,为 RTX GPU 和 NVIDIA DGX Spark 桌面级超级计算机上的小语言模型带来了显著的性能提升。最新优化对混合专家模型 (MoE) 尤为有利,其中包括 NVIDIA 近期发布的 Nemotron 3 系列开放模型。

在过去四个月中,小语言模型的推理性能在 llama.cpp 上提升了 35%,在 Ollama 上提升了 30%。Ollama 的相关更新现已发布,而 llama.cpp 则已提供了用户体验升级,可显著加快大语言模型的加载速度。

这些性能提升将在 LM Studio 的下一次更新中实现,并将很快应用于各种智能体应用,例如全新的 MSI AI Robot 应用。MSI AI Robot 同样受益于 llama.cpp 的优化,使用户能够更便捷地控制 MSI 设备设置,并在即将发布的版本中整合最新性能的升级。

NVIDIA Broadcast 2.1 将虚拟补光带给更多 PC

NVIDIA Broadcast 应用 AI 特效提升麦克风和摄像头的质量,成为直播和视频会议的理想之选。

2.1 版本对虚拟补光效果进行了性能优化。它不仅支持 RTX 3060 及以上 GPU,还能适应更多光照环境,提供更广的色温调节,并使用更新的 HDRi 基础贴图,实现常见于专业直播的双主灯效果。查看链接下载 NVIDIA Broadcast 的更新版本。

热门直播平台Bilibili即将集成更新后的虚拟补光效果。此次更新将使更多 GeForce RTX 用户能够在直播中获得更优质的面部补光效果。对 NVIDIA Broadcast 特效感兴趣的开发者可查看最新版本的软件开发工具包 (SDK)。

DGX Spark:将居家创意工作室升级为 AI 超级工作

随着每个月越来越多更强大的 AI 模型不断登陆 PC 端,开发者对更高性能、更灵活的本地 AI 环境的需求持续增长。DGX Spark 是一款紧凑型 AI 超级计算机,可放置在桌面上,与主力台式机或笔记本电脑无缝配合,使用户能够与现有 PC 共同进行实验、原型设计以及运行高级的 AI 工作负载。

Spark 非常适合希望测试大语言模型、原型化智能体工作流的开发者,或希望在工作流中并行生成创作素材的艺术家,这样他们的主力 PC 仍能继续进行编辑工作。

在 CES 2026 上,NVIDIA 发布了 Spark 的重大 AI 性能更新,使其相较于不到三个月前首次发布时,最高可获得高达 2.6 倍的性能提升。

NVIDIA还推出了全新的 DGX Spark Playbooks,包括用于推测解码以及使用两个 DGX Spark 模块微调模型的示例方案。

NVIDIA RTX AI PC的相关信息请关注微博、抖音及哔哩哔哩官方账号。

软件产品信息请查看声明。

关于NVIDIA

NVIDIA (NASDAQ: NVDA) 是加速计算领域的全球领导者。

# # #

媒体咨询:

Jade Li

NVIDIA GeForce, Studio PR

邮箱:jadli@nvidia.com

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

订单状态抬手即得,鸿蒙版小象超市“实况窗”帮你告别订单焦虑
构筑AI发展智算基座 九章云极入选机器之心“年度AI榜单”
DTS AutoStage进一步实现市场突破,将赋能奔驰数字座舱
有望近期发布?轻薄影像旗舰新品联想moto X70 Air Pro更多细节流出,配置太顶
极限压测PSD大图:唯有这款软件能大图秒开?
强脑科技荣膺具身智能产业双奖,工程化与协同能力获认可
Teads任命 Dani Cushion 为首席营销官
技术专利与精工智造:一台泳池机器人如何定义欧洲庭院新标准
高巨创新“天空之树”获二〇二六年新年致辞引用,近16000架无人机与烟花结合展现中国低空科技硬实力
引领技术革新!合肥爱尔眼科成功预约全省首批EVO+ ICL (V5)晶体!
2294元起!来京东先人一步下单荣耀Power2享国补立减15%
近视手术再升级!合肥爱尔眼科引入“全光塑”技术,开启全眼定制个性化近视手术新篇章!
最严苛的金融核心,国产系统能扛住吗?答案是:已经上线了!
海信洗衣机斩获CES 2026“最佳创新奖”,成近15年唯一获此殊荣的洗衣机品牌
数字名片玩出新高度!名片全能王三个用法助你拓展商机
双镜合璧,疏通生命通道:关菁医生团队的宫腹腔镜联合技术新实践
中国AI影视创新榜即将启幕
上天入浪,水陆空全“开战”:MOVA 携19条产品线登陆CES 2026!
打破行业续航、通信天花板 全新户外轻旗舰荣耀Power2发布
工业具身智能北京市重点实验室获批成立,灵宝CASBOT成为核心共建力量
酷省电二代系列引爆消费热潮,强势问鼎天猫销冠
广汽集团与华为终端签约,深化鸿蒙生态与AI技术合作
各省全面承接2026年京东苹果国补 iPhone 17国补后低至5499元
各省全面承接2026年京东苹果国补 iPhone 17国补后低至5499元
人脸识别、读卡读证,鸿蒙版“陕西移动网格通”让网格办公“效率翻倍”
三星推出全球首款130英寸Micro RGB,搭载新一代显示技术和前卫设计
骑雅迪 马年旺!雅迪×旺旺联名款电动车发布,独家揭秘旺车档案
身边云数字营销交付总部和灵活就业者权益保障中心在津启用
在酒店数字化浪潮中,重新审视那本关于“人与机器人”的经营账
延续“你好”系列口碑,抖音医疗纪录片《你好,急诊医生》全新上线