Llama 2发布全球合作伙伴，一家低调的中国公司上榜

2023-07-31 12:15:58 来源：

随着大模型的走进公众视野，为AI领域带来了前所未有的机遇，大家期待着通过生成式AI能够解决更为复杂的问题，实现更高层次的智能。近期，Llama 2 发布的消息更是在AI圈引起了巨大轰动。

据公开资料显示，Llama 2在数据层面，相比上一代不仅使用了更多的训练数据，而且context length翻倍，达到4096。值得一提的是，Llama 2在公开测试基准上的结果显示，其在代码、常识推理、世界知识、阅读理解、数学等评测维度的能力均获得大幅提升。7B版本在很多测试集上接近甚至有超越30B的MPT模型的表现。

在 Llama 2 官网公布的50余家合作伙伴中，作为唯一的中国企业，海天瑞声榜上有名，成为 Llama 2 全球合作伙伴。同时，海天瑞声COO李科及CTO黄宇凯作为 Supporter，支持 Meta AI 的这种开源行为。可以让每个人都能从这个技术中受益良多，并为技术带来足够的透明度、审慎性和可信性。

当前在中文对话领域，公开的数据集往往量少、分布有偏、价格昂贵甚至不能商用。导致一些大模型在中文对话方面的能力，相比英文对话略逊一筹。尤其是在一些需要比较深的中文语言理解能力的对话场景，无论开源的还是闭源的大模型，都往往表现不佳。

海天瑞声正式推出「中文千万轮对话语料库 DOTS-NLP-216」。真实场景采集，符合中文表达习惯的自然对话数据，将为中文大语言模型（LLM）带来新动能。我们致力于在安全合规的基础上，为大模型提供更好的性能和鲁棒性，帮助企业更轻松的构建高质量生成式AI应用。

数据集优势：

· 中文多轮对话：符合中文表达习惯，真实场景采集的自然对话

· 超大规模：上亿级 token

· 立等可取：成品数据集

· 自有版权：安全合规，可授权商用

数据集详情：

这是一个符合中国人表达习惯的自然对话数据集，共计约1,0000,000轮，上亿级token，包含正式&非正式风格对话，使用偏口语化自然表达。覆盖工作、生活、校园等场景，及金融、教育、娱乐、体育、汽车、科技等领域。

在数据集构成上，DOTS-NLP-216包含了对真实场景的对话采集，及高度还原真实场景的模拟对话这两种方式，兼顾分布的代表性、多样性和样本规模。

样例：

据悉，海天瑞声近期还发布了再融资预案，将建设不少于10大类型的大模型数据集系列产品，用于大语言模型、多模态大模型的训练和大模型评测。

数据集传送门：海天瑞声中文千万轮对话语料库DOTS-NLP-216

标签：

相关阅读

Llama 2发布全球合作伙伴，一家低调的中国公司上榜

旷影科技携3款新品投影仪亮相2022迪拜消费电子展（GITEX）

网易严选专业宠物品牌网易天成携必胜客，推“人宠同吃”萌宠套餐

跟随「2023年携程美食林全球餐厅精选榜」，寻味澳门殿堂级美食

热烈祝贺金士吉在CFS第十二届财经峰会上喜获两项荣誉

2023 ChinaJoy高能电竞显示器来袭！LG UltraGear爆款齐聚腾讯游戏展台！

蟹状元闪耀CFS第十二届财经峰会，双项大奖加冕！

EESA第二届中国国际储能展！绝不容错过收获满满的线下聚会

华为云盘古气象大模型正式上线欧洲中期天气预报中心官网

NVIDIA RTX 带来革命性的 14 英寸笔记本电脑，并行场景编码和 5 月版 Studio 驱动现已推出

猜你喜欢

深化集团数字3.0核心战略，汉庭大规模开展国民酒店智慧清洁应用

能链智电与东方日升强强联手，携手促进农村户用光伏发展普及

2023：人工智能的“奇点”，隐私计算的“原爆点”

生生不已，心息相依西铁城x羽生结弦限量签名表「生翕」全新上市

云知声山海大模型再升级，C-Eval 全球大模型综合性考试评测超60分，成功跻身榜单前十

浪潮信息入选北京市通用人工智能产业创新伙伴, “源”大模型加速开放赋能

"科技的画师，梦想的雕塑家"——高云鹏的不平凡之路

新北洋奶品零售解决方案，助力奶企奔跑新零售赛道

视频行业20年老玩家—新壹科技在AIGC时代，重新出发

2023ChinaJoy上的中国联通主题演讲：“e启芯动造起来！”

东方甄选App4天销售额突破1.1亿元，八五折优惠延长两天

十年磨一剑砥砺成大器第十二届中国心脏重症大会召开在即

艺术遇见科技，鼎好DH3开启中关村夏日艺术盛宴！

新荣誉，新起点：国科微获“2023最具投资价值奖”

荣耀X50影像初体验 1亿像素大底主摄优势明显

名单公布！28个项目成功晋级第二届深汕创新创业大赛总决赛

Madhouse亮相2023 ChinaJoy，引领出海营销新风尚

北通参展ChinaJoy2023！玩家与轻松娱乐体验的双向奔赴

新家客厅电视怎么选？这两点要留意！

主人炫耀家中“掉毛怪”生了10个“宝宝”，网友仔细一看笑疯了…

中国经商智慧白皮书系列：当代创业家手册

英特尔大湾区科技创新中心开幕，以开放生态推动本土应用创新

沉浸互动唤醒会玩基因，三星多款电视参展2023 ChinaJoy

网易天成与中国农业大学达成战略合作推动宠物行业研发标准新升级

闽投1号·福鱼荟丨区域代理火热招募中！让高品质深海大黄鱼走进千家万户

飞书深诺旗下游戏出海平台Meetgames全新升级

Acloudear亮相思爱普云ERP高峰论坛，引领数字化转型“新”潮流

电竞玩家的梦想！CJ2023 ROG7系列展区引发打卡热潮

四块科技前瞻布局web3.0 DSFSChain安全与速度升级成首选

青少年梦想起航，科学之美永不落幕：首届国际基础科学大会圆满落幕

热点图片

要闻

聚焦宠物领养难题：如何应对“甜蜜的负担”
鲁怡城市流光璀璨，但总能看到一些孤独无依的小小身影穿梭于车水马龙间，它们或是被遗
三星新一代玄龙骑士高端Mini LED电竞显示器亮相ChinaJoy，将竞速娱乐体验提升至全新境界
7月28日，2023年第二十届ChinaJoy在上海新国际博览中心开幕。TCL华星X三星显示器联合
2023大同首届信息技术产业峰会圆满举行，共话数字经济崭新未来
7月28日，聚势而强·共领信创2023大同首届信息技术产业峰会圆满举行。本次峰会由中共
全球首个！华为全闪存存储获DEKRA德凯存储产品碳足迹和碳标签证书
7月28日，全球领先的检验、检测及认证机构DEKRA德凯为华为OceanStor全闪存存储颁发全
华为与三家同舟共济伙伴签约，携手深耕城市数字化
[中国，深圳，2023年7月28日] 华为技术有限公司(以下简称华为)与三家伙伴企业举行政
西部数据亮相ChinaJoy：专业游戏存储方案助力全景娱乐Z世代
GEEK2023年7月28日，以相伴二十载越来悦精彩为主题的2023中国国际数码互动娱乐展览
展现游戏魅力！大朋E4在CJ展上广受好评！
7月28日，第二十届China Joy回归线下，在上海新国际博览中心如期举行，全面覆盖游戏
AI大模型赋能教育，听力熊推出全球青少年通用大模型“TeeniGPT”
人工智能经过近70年的发展，迎来第三次发展浪潮，以ChatGPT为代表的生成式人工智能取
兴业数金携手华为荣获《亚洲银行家》“中国最佳数字基础设施项目奖”
[中国，北京，2023年7月28日]国际权威财经杂志《亚洲银行家》在2023中国未来金融峰会
闽投1号·福鱼荟丨区域代理火热招募中！让高品质深海大黄鱼走进千家万户
详情请关注福鱼荟微信公众号联系我们！免责声明：市场有风险，选择需谨慎！此文仅供参