自从2022年11月Open AI推出人工智能聊天机器人ChatGPT以来,以大模型为基础的通用人工智能技术进入高速发展轨道。目前,国内各个行业都在大模型应用方面进行了积极的探索,也取得了丰硕的成果。
信安数据自2018年正式开始业务运作以来,一直专注于数据治理和数据要素流通领域的创新与实践,并在业内首倡“TOP”数据管理模式,面向超大型央国企及政务客户提供了一系列专业化产品及服务,包括以强大的咨询服务能力为知识导入,实现企业数据管理工作规划蓝图与落地路径;以自主研发的DataOps平台、数据空间、数据合规保护平台等产品,为客户打造全方位的技术支撑能力;以极致专业的数据治理、开发加工、流通中介等一系列运营服务,帮助客户实现数据价值利用最大化。
正是基于我们多年以来积累的行业领先的专业认知、产品服务和项目经验,为我们将大模型技术实际应用到数据管理领域、解决该领域长期存在的痼疾建立了坚实的基础。经过近几年在智能化数据治理领域的持续研发,在近期大模型领域技术突破的助力下,信安数据正式对外发布大模型驱动的新一代数据治理平台产品“数灵童”,这是国内首个数据治理领域事务级“数字人”,区别于以知识服务为主的问答型“数字人”,“数灵童”能够直接参与数据治理多方面的实施工作,分担专家和实施团队的压力,将逐渐改变高度依赖人力投入的数据治理现状,也将标志着我国数据治理领域正在打开新范式发展的机遇窗口。
众所周知,我国数据治理领域的发展已有二十多年的历。但长期以来,以传统数据治理平台为代表的技术支撑手段存在极大的局限性。比如,尽管平台提供了数据质量稽核的功能,但是数据质量规则配置、检查对象映射等均依赖人工,需要投入大量的时间和资金成本。再如,数据治理的方法因人而异,更多依赖个别专家能力,平台并不具备思考和分析能力,同时,数据治理专家的稀缺性也是造成当前很多企业数据治理成效不佳的重要原因。此外,传统数据治理平台长期存在着操作复杂、使用技术门槛高、系统友好度差、功能协同能力差、技术架构扩展性弱等问题,一直困扰着管理数据、使用数据的平台用户,亟需开辟创新一种全新的技术路线和工作模式。
而大模型技术的出现为这些痼疾的解决提供了一种全新的思路和方式。信安“数灵童”产品的核心驱动“引擎”是经过信安专业训练和调校的“事务级数据管理行业大模型”,除了具备简单的问答交互之外,还具备对数据治理专业工作的分析、推理和执行能力,可以说是数据治理“数字人”的“大脑”。正是由于这个“大脑”的存在,“数灵童”才能够成为数据治理“行业专家”,帮助企业出谋划策、答疑解惑;也能够成为数据治理工作的“统筹枢纽”,根据目标编排、调用、串接一系列智能体和工具插件;还能够成为企业数据治理的“超级员工”,替代人工开展大量机械性、分析推理类工作,工作效率“以一敌百”。
信安“数灵童”产品并不是一蹴而就的。一方面,“数灵童”产品的研发得益于公司长期以来在数据治理专业的经验积累,可以准确切中现状痛点,设计出可落地的大模型应用场景,切实解决行业问题;另一方面,“数灵童”产品的研发过程中得到了多家超大型央国企在样本数据、应用场景以及效果验证等方面的大力支持,使得产品在不断打磨优化中逐渐发展成熟。
目前,信安“数灵童”除了具备多模态数据处理、知识体管理、智能体开发、场景化编排等后台功能之外,还可以为客户提供两大类12个专项应用场景,“多点开花”帮助企业大幅提升数据治理具体场景下的工作效率。
以数据智能化盘点为例,用户只需要通过对话交互界面告知“数灵童”需要盘点的数据库及数据表范围,“数灵童”就会对这些表进行元数据盘点,除了传统元数据采集能够获取的信息外,重点是还能够通过大模型分析推理自动生成表和字段的中文名称、业务定义描述、分级分类等原来需要大量人工梳理补充的内容。从实际应用效果来看,大模型补充的业务元数据准确率达到95%以上,分级分类准确率可以达到97%以上,而时间周期缩短了92%,投入成本只占原本人工方式的27%。可见,“数灵童”正在带来一种全新的工作模式,更多承担了原来需要人力和思考的工作内容,大幅提升了生产力并降低了数据治理成本,充分代表了数据治理技术发展的未来趋势。
信安“数灵童”产品的发布在行业发展方面也具有极大的价值和意义。首先,将行业大模型从知识问答级升级到事务级,不仅仅可以组织文字进行对话,还可以承担数据治理日常执行事务,这是“驱动内核”质的变化;其次,彻底改变了传统数据治理工作方式,不再需要在系统平台上复杂配置,仅需要简单的对话和选择就可以完成一项复杂的数据治理工作,极大降低了技术门槛;再次,创新的平台技术架构带来全新的“建运一体”建设模式,随着“数灵童”基础后台能力的建设完成,上层专项应用场景可以快速拓展,并随着使用的过程不断对大模型、智能体进行优化和调校,不断提升专项应用场景的工作成效;最后,“数灵童”的发布开启了数据治理领域大模型逐步代替人力的新时代,成本投入持续降低,工作效能不断提升,数据治理工作对于企业来说将不再是难题和负担。
随着生成式人工智能的快速“进化”,大模型能力还在不断成长。未来,以大模型为驱动的新型数据管理平台必将成为辅助企业做好数据管理的“新主力”,带来数据生产力的飞跃式发展。“数灵童”产品的发布标志着信安当前在行业内仍持续处于领军地位,并为行业带来了数据治理新范式,助力企业提升新质生产力水平。“数灵童”产品就像一个初生的“小孩童”,需要在更多不同基础、不同条件、不同环境的“实战”中不断磨练、不断成长,才能成为“无所不能”的企业数据管理主力军。
最后,“数灵童”产品和信安的发展离不开所有的客户、合作伙伴以及专家同行的支持,再次表达衷心的感谢!期待我们未来能够围绕“数灵童”产品进行更多的研讨和创新,实现合作共赢,将基于大模型的数据治理新范式推向新高度。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。