近日,由省经信厅指导,数澜科技承办的2023产业数据价值化峰会暨数栖大会在杭州召开。数澜科技创始人&董事长出席并分享主题为《大模型时代下数据中台该何去何从》的主题演讲。
尊敬的各位领导、各位来宾,中午好。自ChatGPT火爆后,一聊AI不可避免都在提大模型,大模型时代是真正到来了。今天想就这个话题,结合我在数据中台的一些实践经验,分享我对数据数据价值化趋势看法和理解,供大家参考。
1、大模型的挑战:算力
数据、算力、模型是数据价值化的三大要素。5G、AI的普及应用,数据源越发丰富,数据量快速攀升让大模型研发有了更多可能。
大模型驱动 AI 全面提速,也带来了新的挑战。摩尔定律逐步失效,算力有限且需高成本投入的问题,给大模型研发和应用也将带来越来越大的阻力,算力有限是既定事实,我们要开始从数据本身去寻找解法。
2、以数据中台为枢纽的的数据组织能力构建
我认为,以数据中台为枢纽的的数据组织能力构建,可解大模型时代下算力不足的问题。
企业自身数据是企业级AI应用的根基,数据中台是企业数据枢纽。数据中台构建的核心,是为企业提供数据交换能力、数据资产化能力、数据资产服务化能力。它是从数据自身属性出发的数据价值化能力建设,最终沉淀的是企业新一代的技术体系、数据体系、运营体系和服务体系。
3、数据的组织能力建设的四大能力模型解读
以数据中台为枢纽的企业数据组织能力,又分为全域数据的适配能力、全域数据连接能力、全域数据感知能力、全域数据分析能力四个方面的子能力模型的建设。
第一,全域数据的适配能力(GDA:Global Data Adaptability),指企业具备处理各种类型的数据,包括结构化数据、半结构化数据和非结构化数据能力,并能够在多云、多异构网络上进行数据整合。
这包括不仅能从不同数据存储源中获取数据,而且还要完成全域归集和存储。全域数据适配能力,还包括数据分布式存储,合理调度计算资源,以及提升数据传输和处理效率、性能。体现在数据的获取、数据传输、数据存储、数据安全等基础能力的有效构建,为后续数据处理提供基本技术支持。
第二, 全域数据连接能力(GDC:Global Data Connectivity),指企业能够通过湖仓一体、数据虚拟化、数据编织等技术通过数据的生成、数据治理等建设能力建立统一的数据体系,从物理或逻辑层面有效整合数据,为上层应用提供统一的数据逻辑抽象层。这一能力可以让企业的数据资源得到有效地管理和使用,提升数据的利用效率。
第三,全域数据感知能力(GDP:Global Data Perception),指企业能够对数据进行业务化阐述,从而能在现在认知上更进一步了解数据,把数据转化为有价值的、可运营的资产。这需要企业有能力对业务数据进行新的、更深层次的理解,通过这种理解,可以发现数据中的价值,从而提高效益或者减低成本。这个能力需要企业具备对数据的业务价值分析,以及数据的体系化运营能力。
第四,全域数据分析能力(GDA:Global Data Analysis),企业能够让感知的内容最终落地的能力。这包括使用数据智能技术对数据进行分析,并形成体系化的分析机制,最终通过分析出的数据,能够提供企业决策的理论依据,这是企业从数据中提取价值的关键能力,它是让企业能做到全场景、持续地利用数据洞察驱动决策和行动的直接能力,在感知能力基础上,通过数据智能技术对数据进行分析,为企业的决策和行动提供数据理论依据。
数据的组织能力中的四个能力模型,是承上启下能形成闭环的。其中全域数据适配能力是其他3种能力的基础,为它们提供基本的数据存储、数据计算、数据管理等基本技术能力。
全域数据连接能力通过数据生产及数据治理,把数据资源化,能从整体层面对数据进行统一解析及处理,全域数据感知能力,是在完成数据资产化后,在进行数据流通管理、数据运营管理前提下进行数据价值评估,通过数学统计、人工智能等方法让数据在业务上能有量化认知,而产生进行一步数据理解。全域数据分析能力,是在全域数据感知能力的基础上,通过数据智能等技术,形成体系化的分析机制,在数学理论上指导企业经营。
4、数据中台建设即将面临新的挑战
每个阶段都会有新的技术出现,不论是数据中台还是AI大模型,它代表的不仅是技术革新,更是给我们带来对数据进一步理解和应用的新方式。大模型时代下的数据中台,很快也会进入到新阶段,即企业对数据中台建设会提出具备更强扩展性的数据能力架构的要求。
我的分享就到这里,谢谢大家。
嘉宾介绍
甘云锋(花名:风剑),数澜科技创始人&董事长,中国软件行业协会企业中台顾问团副主任专家,浙江省工商联数委会委员,全球首个ID-Mapping 专利发明人,参编七项大数据核心技术发明专利,近10年数据中台实战经验,20年企业大数据技术应用服务经验。