日前,由联著实业全资子公司——文灵科技(北京)有限公司和新华通讯社通信技术局联合牵头起草的《中文新闻语义结构化标注》(以下简称“《标准》”)立项通过。
该《标准》是我国中文文本信息处理领域重要的国家标准,它的发布实施将对实现中文新闻语义结构化和语义结构标准化具有重要意义。
该《标准》规定了新闻写作常用表达方式所包含语义的术语和标注方法,包括新闻稿件标注说明、标注预处理、语义模板标注、新闻事件语义元标注、新闻事件关键词标注,以此形成语义标识体系,适用于报刊、广播、电视、通讯社、新闻网站、社交媒体等新闻内容提供商及媒体应用与研究机构为实现计算机自动识别新闻语义、生成知识库或神经网络训练集进行的标注工作。其中,从可提供的服务内容上看,语义标识体系不仅可以应用于新闻行业,还可延伸为文本内容数据化、语义搜索引擎、内容性质判断、主题素材汇编、知识建模、知识推理、语义模型互通和知识共享等各类服务。
在申请该《标准》前,文灵科技(北京)有限公司、新华通讯社通信技术局、北京语言大学、东南大学、中国互联网新闻中心、浙江日报报业集团、中国人民大学、中国传媒大学、新华网股份有限公司等单位已联合提出了《中文新闻语义结构化标注》(T/CAPT 005—2023)团体标准,并由中国新闻技术工作者联合会于2023年7月25日发布,2023年8月1日正式实施。本次国标申请草案就是在对此团体标准加以优化的基础上进行编制,在技术内容和实施效果等方面达到国家层面的高质量要求,更具权威性和公信力。
该规范性文件将有助于解决传统信息化技术的缺陷,让计算机更好地理解新闻语义、理解人类自然语言,突破机器思考瓶颈,实现新闻大数据的挖掘和智能化应用,让认知智能技术引领中国新闻业的数智化转型和发展。
本《标准》的发布应用将对拓宽我国人工智能发展路径产生积极作用:将有助于促进人工智能界降低训练大模型的算力成本,训练更好、更实用的大模型,增强人工智能模型的可解释性,实现仿人类的碎片化学习,摆脱大模型在数据高敏感行业落地应用的困局,建立AI大模型之间的沟通机制,消除“AI孤岛”。
此前,人工智能自然语言处理领域的标准规范绝大多数都是由欧美国家制定的,也以处理英文为主。本《标准》将开创一个人工智能界以中国人自己的方式处理中文语义的先河,有助于提升中国标准的国际影响力,同时为世界人工智能的发展作出重要贡献。
标准是一种创新资源,是企业核心竞争力的重要体现,也是促进行业有序向前发展的关键所在。作为文本信息处理领域的创新者,联著实业和文灵科技专注于文本智能技术的持续探索,以助力我国强人工智能技术实现新的跨越为己任,与科研单位深度合作等举措,标准化工作取得积极成效。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。