欧洲最大的开源项目:Sber发布了一系列先进的俄罗斯神经网络模型

2025-11-23 19:34:25     来源:

欧洲最大的开源项目:Sber发布了一系列先进的俄罗斯神经网络模型。此外,Kandinsky 5.0新系列中的所有图像和视频生成模型——Video Pro, Video Lite和Image Lite均已可用。这些先进的神经网络本地支持俄语提示,了解俄罗斯文化,并能够在图像和视频上书写西里尔文字。同时,还发布了用于视觉数据压缩的K-VAE 1.0模型,该模型是世界上同类开源模型中的最佳,且对于训练视觉内容生成模型至关重要。所有这些模型的代码和权重现已通过MIT许可证向所有用户开放,包括商业用途。

Sber开放了GigaChat系列中两款新的旗舰MoE模型——Ultra-Preview和Lightning的权重,这些模型从零开始专为俄语任务打造,同时还推出了新一代开放式GigaAM-v3模型,用于带标点符号和规范化的语音识别。

Sber高级副总裁、技术发展部门负责人安德烈·贝列夫采夫(Andrey Belevtsev)表示:

打造真正的世界级人工智能需要两样东西:巨大的资源,更重要的是世界顶级的研发团队。Sber拥有这两者。但我们的基本立场是不建设“封闭”的技术。我们的战略是成为全国开放的基础。因此我们开放了模型权重。这是关键点。当我们开放模型时,俄罗斯任何公司,从银行到初创企业,都可以在其封闭环境中安装模型,并在不向任何人泄露敏感数据的情况下进行微调。这就是真正的技术主权,AI属于整个国家,并成为业务转型和经济增长的基础。我还想指出,Ultra模型很快也会面向企业客户发布,优化拥有成本适合在公司内部部署。

GigaChat Ultra和GigaChat Lightning

GigaChat系列迎来新成员:GigaChat Ultra Preview和GigaChat Lightning。GigaChat Ultra Preview是GigaChat系列中最强大、最大的模型。这是俄罗斯首个如此规模的模型,虽然仍在训练过程中,但在当前阶段,它已经在俄语质量指标(MERA基准测试领先)上超过了DeepSeek V3.1和之前的旗舰模型GigaChat Max 2。Ultra-Preview采用开放许可,将允许在本地环境中微调,比如在对隐私、信息安全与质量要求严格的封闭企业环境中。尽管模型很大,但速度足够快,比GigaChat 2 MAX更快。相反,GigaChat Lightning是系列中最紧凑、最快的MoE模型,优化为可在笔记本本地运行,支持快速产品迭代。其质量与全球开源领域领导者竞争,在俄语任务上超过Qwen3-4B,在对话、文档分析及业务应用中表现不俗。和Ultra一样,不仅公开模型权重,还公开了加速推理技术:Lightning在同类中速度领先,接近Qwen3-1.7B速度,体积却大6倍。两者均有效整合了第三方工具系统,尤其是代码与记忆功能。代码工具可执行、分析和可视化程序,实时运行代码片段,绘制图表,计算及验证假设。记忆系统个性化交流,保存目标、偏好和对话历史,实时调整建议,过时或敏感信息会被清除,用户也可手动调整模型记忆。

GigaAM-3

GigaAM-v3是包含5款俄语自动语音识别(ASR)模型的开放套件,面向工业与商业应用。该套件支持语音助手、呼叫中心、电话分析、语音消息聚合及多模态代理。新版声学模型预训练规模从5万小时扩增到70万小时,加入了呼叫中心、音乐检索、带特征口音和自然讲话等新领域,显著提升了这些场景的识别质量。基于独特的基础模型GigaAM-v3,可以开发各类语音技术;Sber已用于语音识别、语音合成,并支持GigaChat处理视频和音频。

Kandinsky 5.0

Kandinsky 5.0系列包含Image Lite模型,支持文本生成图像及编辑,及两款视频生成模型:快速的Video Lite和强大的Video Pro,均能根据文本描述生成视频并“活化”图像。通用模型Image Lite支持高清视频分辨率,熟悉俄罗斯文化代码,能本地理解俄语和英语指令,能生成拉丁字母和西里尔字母的文字。Video Pro能生成10秒24fps高清短视频,是目前最优开源模型,超过Wan 2.2 A14B,视觉质量达到全球顶级专有模型Veo 3的水平。为降低集成门槛,Video Lite优化支持12GB以上家用显卡。训练使用近10亿图像及3亿视频,为本土文化适配额外使用了逾百万媒体素材。大规模数据训练采用多项前沿方法,有专门团队挑选高质量数据,保证作品构图、风格及视觉质量。Kandinsky模型打造了从个人创作服务到专业产业工具的广泛产品线。基于开放模型,开发者和公司可打造便于用户生成个性化视频祝贺、照片“活化”及原创视觉故事的解决方案。对导演、设计师、市场营销及动画师等专业人士,Kandinsky 5.0产品是强劲的商业宣传材料及视觉内容制作工具,推动俄罗斯生成技术开放生态发展。

K-VAE 1.0

生成模型如Kandinsky 5.0在“人眼不可见”的隐空间合成媒体内容,提升训练效率、加速计算、降低内存需求。Sber发布了自主研发的K-VAE 1.0自编码器,分别用于2D图像和3D视频,支持媒体内容与隐空间相互转换。K-VAE 1.0是同类开源模型中的世界领先产品,其开放使用将助力生成型人工智能技术实现新飞跃。
转自:i黑马

标签:

猜你喜欢

四大赛道、两种引擎,解码文创产业的“静安范式”
国产智算生态破局!曙光scaleX640超节点亮相2025世界计算大会
叮当健康:供应及服务端双重发力,全面提升用户用药可及性
抖音生活服务推出六项扶持措施,助力中小商家和烟火小店降本增收
喜讯!九方智投获评上海市2025磐石行动“优秀蓝方队伍“与“突出进步奖”
ThinkPad×奥比利:穿透工业“黑箱”,与思考者同行
致敬赛事幕后守护者|顺丰人以专业与温暖,护航十五运会圆满落幕
熔铸匠心 领航通信——记中国工程院院士王晓云的移动通信创新路
鸿蒙用户寄件更省心!京东快递成首个接入鸿蒙元服务的快递企业
海信激光电视亮相上海闪展,150英寸巨幕影院实力圈粉
​标准引领算力基石——CDCC 2025 中国数据中心标准大会盛大开幕
全国首个“天通+北斗”国产星基高精度定位服务试商用发布
2025医院SPD服务质量报告:价值共识已达成,行业进入分化期
护航十五运会与残特奥会深圳赛区,海梁HAYLION时空人工智能AI调度系统
AI开发工作站新宠:联想ThinkStation PGX引爆千亿模型算力
为AI开发打造桌面超算,联想ThinkStation PGX定义产品标准
OPPO Reno15系列开售,影像、AI全面升级,首销福利很诱人
5G新程,汇智共创 2025中国5G发展大会即将在合肥启幕
京东联合行业多方发力 游戏电视迈进规范化的3.0发展新阶段
AI工作站大牌新品,联想ThinkStation PGX小机身藏颠覆算力
一图带你读懂北京移动如何让国际游客首都之旅通信无忧(一)
2025 AI工作站推荐:联想ThinkStation PGX引领开发革命
12年服务1500万家庭,蓝犀牛搬家铸就搬家行业新标杆
数智破局信任加冕:ZCAR竹子买车定义汽车新零售2.0时代​
覆盖全球的高并发远控体系如何搭建?向日葵赋能安检行业头部企业
新一代AtomGit平台正式上线,打造“开源+AI”一体化基础设施
国内薄膜生产线企业分析
2025中国婴童洗护、个护及人群研究数据报告首发,市场决策人员必看
鳍源科技联合索尼,共同打造影视级智能水下拍摄系统
从实验室到资本市场 ——百奥蒂(BIOTICLIFE)解析生命科技的经济驱动力