十方融海率先开发出全球第一个免费使用开源可商业化中文大语言模型

2023-07-03 17:14:23     来源:

在人工智能领域,大语言模型正以前所未有的速度发展,已经成为众多企业、研究机构和个人开发者的新宠。十方融海作为以数字科技创新为展新引擎的数字职业在线教育科技企业,也将AI大语言模型作为公司科研创新主要发力方向之一,技术团队一直刻苦钻研,致力于提供开放、免费获取、公开下载、可离线部署的,具备真正认知能力和顿悟能力的大语言模型,并在多语言模型训练方面积攒了丰富的经验。

近日,十方融海集团旗下威科软件联合OpenBuddy团队宣布:领先业界推出了国内首个基于Falcon架构、可商用的中文跨语言模型——OpenBuddy-Falcon-7B。这也是全球第一个可免费使用开源的中文大语言模型,适用于大多数商业应用场景需求,且家用显卡也能轻松运行,为个人和企业提供更便捷、更全面的大语言模型智能化应用。

今年 5 月,Tii 研究机构发布了 Falcon 模型,使用 Apache 2.0 的可商用开源协议,Falcon 模型不仅在协议和数据集方面更加开放,还采用了最新的 Flash Attention 等技术,展现出了惊人的性能和内容质量。Falcon 模型一经发布,便荣登 Huggingface Open LLM Leaderboard 的首位,成为最新的 SOTA 开源大语言模型。

十方融海在Falcon模型推出之初,便对其产生了浓厚的兴趣。十方融海技术团队深知,现有的 SOTA 开源语言模型,包括 LLaMA 和 Falcon,都存在“跨语言支持能力薄弱”这一问题。这些模型主要以英语、法语等印欧语系为基础,并且缺乏跨语言对话场景的深度优化。因此,它们在理解中文等非印欧语系语言方面存在困难,更无法进行有意义的对话。

对此,为了给个人和企业提供更便捷、更全面的大语言模型智能化应用,经过不懈的研究和试错,十方融海旗下威科软件联合OpenBuddy 团队成功地掌握了 Falcon 模型的训练诀窍,推出了全球首个基于 Falcon 架构、开放可商用的中文跨语言大模型——OpenBuddy-Falcon-7B。

相较于原始Falcon模型,OpenBuddy-Falcon-7B 在跨语言能力方面更具优势,支持包括中文、日语、韩语、英语、法语、德语等多种语言。

通过采用新颖的跨语言学习技术与深度优化对话场景,大幅提高了模型对跨语言知识的理解能力和融合能力,模型可以实现在各种语言之间进行自由、流畅的对话,并能在多种语言直接切换,完成翻译等需要跨语言能力的任务。

此外,模型具备插件使用能力,能分析用户的意图,自动选取并调用插件。例如,调用Stable Diffusion 开源模型画图,调用内置的搜索引擎搜索资料等等;模型更是能够深度理解用户的需求,可以完成问答、写作、模仿、创作等多种任务,还可以完成“画一个车水马龙的街道”,“画一个丑小鸭长大后变成的动物”等复杂指令。

这并非十方融海首次推出中文大语言模型。事实上,十方融海技术团队已经在多语言模型训练方面积累了丰富的经验,早在falcon模型推出之前,十方融海联合OpenBuddy 团队就曾在 LLaMA 的 7B、13B、30B 模型上进行了反复迭代和调优,研发出了OpenBuddy-LLaMA 系列开源模型。这些模型在中文、日语、韩语等多种语言上具备优秀的问题理解和回答能力,可以利用英文论文、代码等资料学习到的知识,为中文问题提供专业的回答和见解。

作为跨语言模型,OpenBuddy-LLaMA 系列在中文、日语、韩语等多种语言上具备优秀的问题理解和回答能力,也吸引了全世界众多开放模型爱好者的关注,llama.cpp、Langport、FastChat 等开源项目均实现了OpenBuddy-LLaMA 系列模型的集成,并在社区中获得了广泛的应用。

十方融海技术团队负责人表示,OpenBuddy-Falcon-7B 的发布,标志着一个崭新的时代的到来。在这个时代里,跨语言的大模型不再是科技巨头的专利,而是开放、可商用的资源,能为全球的开发者、企业和研究者提供强大的支持。相信 OpenBuddy-Falcon-7B 的发布,将对跨语言 AI 领域的发展产生深远的影响,未来也有望见证更多基于 OpenBuddy-Falcon-7B 的创新应用和突破性技术问世,共同推动人工智能领域的繁荣发展。

值得一提的是,目前除了 7B(70亿)参数的模型以外,OpenBuddy 团队还在训练以13B(130亿)、40B(400亿)为训练参数的OpenBuddy-LLaMA-13B、OpenBuddy-Falcon-40B等百亿规模的大语言模型。

在十方融海董事长黄冠的带领下,十方技术团队在AI大语言模型上将持续取得创新和突破,在更好满足大众平等使用AI技术需求的同时,也让十方在新的AI大浪潮下走在前列。未来,十方将始终保持求是创新、拥抱变化的态度,为社会、为用户创造出更大的价值。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

猜你喜欢

扎根黔北大地 为山地农业插上科技之翼
云从科技落户天津 助推科技创新与城市发展融合
女篮亚洲杯现TCL“全球第一” 与世界一起见证国货力量!
碳索未来生态 | 西井科技携多款智能新品亮相2023WAIC
软文发布引领营销新潮流策略 软文发稿网增强消费者对产品认知度
中国联通&华为人工智能产业发展主题会议|中国联通领导发言精彩回顾
中国联通&华为人工智能产业发展主题会议|华为领导发言精彩回顾
掌阅科技入选北京市通用人工智能产业创新伙伴计划第二批成员名单
又一里程碑!天冕数据治理安全平台通过华为云鲲鹏认证
微博成为大运会独家社交资讯平台 全面助力赛事影响力扩大
对话莫界科技:消费级GPT无线AR智能眼镜背后的光学技术创新
2023数字金融论坛 以数智融合擘画金融未来
当防火墙遇上SD-WAN,“一举多得”实现制造业网络安全
一图看懂医渡科技(2158.HK)2023财年业绩亮点
数字智慧助力健康中国发展,2023全球数字经济创新大赛深圳分站赛圆满落幕
为中国而生,为世界测试,悦芯科技闪耀SEMICON China 2023
掌阅科技:对话式AI应用“阅爱聊”入选北京市通用人工智能大模型行业应用典型场景案例
2023全云在线联合微软AIGC专场沙龙:人工智能与企业创新,促进创造力的数字化转型
发现报告6周年,6重礼!总有一款适合你!
发力新消费 惠享在建邺 2023南京建邺新消费直播大赛第一季圆满落幕
浩鲸科技中国CTO钟健松:全栈数字化,助力运营商加速蝶变
浩鲸灵犀:“真正的企业级”低代码平台,打造数智增程新引擎
赛博昆仑完成近亿元A轮融资,加速网络安全创新与发展
算力赋能科技未来 西云算力亮相2023MWC上海展
荔枝树边架起抖音直播间,“电商助农”迎丰收
2023MWC上海 | 思特奇:锤炼数字技术,共赢数字经济时代
上海市科协韩志强书记一行走访千机科技集团,对无人机低空数字营销场景给予认可
千机科技无人机表演,以科技力量向建党节致敬!
2023 TCL全球生态合作伙伴大会亮点前瞻:即将官宣碳中和行动计划
漏洞防护厂商「赛博昆仑」完成近亿元A轮融资,在攻击链起点解决网络安全问题