“不断降低使用数据的门槛,封装复杂性,让‘用数据’更简单。”
—— StartDT CEO、奇点云创始人 行在
5月28日,以“用数据 简单点”为主题,由StartDT(奇点云、GrowingIO)主办的2024 StartDT Day数智科技大会暨产品发布会召开。
奇点云正式发布数据云平台DataSimba敏捷版,资源更省,上手更快,建平台更简单;3款工具一齐亮相,为数据集成、数据资产管理、算法生产工程化等环节提效。
GrowingIO则带来了明星产品“增长分析”的重磅更新,以XEI多主体模型为核心,从“用户分析”升级为“全场景业务分析”,人人都可用,数据驱动业务增长更简单。
2024年版《OLAP数据库引擎选型白皮书》同期发布,为业界伙伴提供最新的选型参考。
01
更省更轻,兼容演进
DataSimba敏捷版发布,数据平台简单点
近年来,数字化带来的业务效果不断得到验证,越来越多的最佳实践涌现,也吸引到了越来越多的企业客户入局,开始建设数据平台,来支撑数据资产价值化。
但不同于数据规模PB级、数字化预算百万级的超大型企业,对于初建数据平台或希望从传统数仓升级的企业客户而言,经典的多引擎Lambda架构存在一定的“性价比”弊端,例如技术较为复杂,需要资深的数据团队,集群规模大。相比现有数据能够产生的价值,运维和数据治理性价比不高。
StartDT合伙人、CTO地雷介绍,结合中小型数据规模企业的情况,经典的主流方案(3引擎Lambda架构)可以简化为1.5个引擎:将离线引擎和即席查询引擎合并,同时存算分离,让实时引擎落盘到即席查询引擎。近年来国产MPP*数据库引擎也对此类需求做出积极回应。
奇点云数据云平台DataSimba的敏捷版,就为上述场景而生。
DataSimba敏捷版依然基于成熟的StartDT SimbaOS技术体系研发,并重点加强了对各类新MPP引擎的支撑,包括ClickHouse、Apache Doris、StarRocks等等。
· 从成本角度看,DataSimba敏捷版部署简单,在达到生产RAS(可靠性、可用性、可服务性)的标准下,最小仅需3个节点;技术栈简单,易上手;配备集成、研发、运维、服务等全链路功能,满足GB~TB级数据场景所需。
· 从架构角度看,DataSimba敏捷版并不是简单的“技术栈裁剪”,而为未来的扩展预留了兼容方案。敏捷版的核心SimbaOS Kernel支持各类新MPP引擎,同样也支持Hive、Spark、Flink等经典的大数据引擎。“在中型数据规模的阶段,先利用MPP引擎支撑数据平台;当数据量暴增时,再逐步按需打开其他引擎,例如图、时序等。我们曾经陪伴上百家企业客户,沿着演化路径不断前进。”地雷介绍。同时,DataSimba敏捷版支持Hudi、Iceberg等数据湖存储工业标准,企业可以提前统一存储格式,在后期引擎更换/升级时无需数据拷贝,从而减少相关成本。当然,敏捷版也继承了SimbaOS的诸多特性,例如支持集成50+种数据源、有完善的安全机制等等。
在地雷看来,“简单点”的本质逻辑是抽象标准能力、封装复杂性,为不断变化的数据业务需求提供简单的选择。可增可减,可切换可迭代,面向未来构建数据云,而不需要推倒重建。
此外,数据云体系中的几款工具产品也逐一亮相,让数据集成、数据资产管理、算法生产工程化简单点:
SimbaX(集成工厂),增强型全域数据集成产品,支持数据湖和字段行列处理等相关能力;SimbaFabric(资产工厂),全域数据资产管理平台,具备全链路血缘管理、自动化资产盘点等能力,为数据资产入表提供技术支持;SimbaML(算法工厂),帮助企业建立MLOps体系,一份数据同时支持数仓和算法开发,数据更安全,资源更节约。
集成工厂 SimbaX
资产工厂 SimbaFabric
算法工厂 SimbaML
02
从用户分析到业务分析
GrowingIO多主体模型发布,数据分析简单点
发布会上,分析云GrowingIO同样带来重磅产品升级:从专注支撑用户分析、用户增长的UBA(用户行为分析平台),升级为全场景覆盖、人人都可用的XBA(业务增长分析平台)。X代表企业希望分析的任何主体,“人/货/场”都可以被视为“X”。
“UBA以稳定统一的UEI模型(User用户-Event事件-Item实体)为核心,在过去数千家实践中,帮助企业用户大幅提升了数据建模、应用和价值化的效率,降低了维护成本和操作门槛。XBA在此基础上迭代,为企业全业务场景提供便捷易用的数据驱动能力。”StartDT副总裁、GrowingIO联合创始人叶玎玎介绍,“包括商品、门店、经销商、汽车在内,企业可以自定义分析多种业务主体的行为事件数据,也支持进一步对这些‘X’进行低代码标签开发、群组圈选、画像分析等等。”
从专注用户分析升级为全业务分析,分析云还带来了全新的“B24”场景,为企业不同业务需求、不同部门角色提供数据洞察,客户可以按需选择。
不设限的XEI对于业务团队来说,能告别原本定制开发的长时间等待,简单易上手,可以灵活完成自助分析;对于分析团队,则通过统一模型,让数据处理、理解和分析产出更简单高效。
“分析云的使命是帮助企业提升数据驱动能力,实现更好的增长。”叶玎玎表示,“作为新一代的智能‘业务分析平台’,期待能陪伴更多客户实现业务增长简单点。”
03
看—用—智能
不断降低数据价值化的门槛
数据云、分析云产品持续迭代升级的同时,StartDT也发现,数据系统正从边缘系统变为核心生产系统,有越来越多企业逐渐从“看数据”走向“用数据”,乃至发挥了“数据智能”的力量。
“看—用—智能,是数据价值深入的过程。”StartDT CEO、奇点云创始人行在表示,“奇点云自创立第一天起,就以‘让商业更智能’为使命,和客户站在一起,不断降低客户使用数据的门槛,支撑客户建立自主可控的数据能力。数据智能将成为企业和社会的新质生产力,也是我们全心投入的方向。”
发布会尾声,StartDT合伙人、资深战略咨询专家何夕带来了数据驱动商业的最新实践:
# 看数据:一家水果零售企业使用数据可视化工具,将每日销售数据转化为直观的图表和报告,供店铺经理查看。某区域门店曾发现毛利突降了15%,借助数据分析得出了原因——折扣率同比下降11%,促销不合理,就立即重新定价、调整策略,从而避免了更多损失。
# 用数据:一家3C电子企业,基于StartDT产品建立了自己的可视化溯源平台,改变了原本需数十人手工投入才能完成的分段追溯方式,通过数据和自动化让订单、质量、供应链的管理科学有效。
# 数据智能:一家消费零售企业在营销活动时,依托个性化推荐和预测算法,不仅达成了整体更好的转化效果,还“意外”成功唤醒了活动通常不敢触达的沉睡用户,激活了购买,并更新了客户洞察。
从大厂的独家实践,到更多公司的最佳实践;从少数派的大数据,到大多数企业拥有自己的数据能力…每个和第五要素打交道的人,都在通向未来的路上。
DT时代,StartDT期待成为更多企业伙伴的Must-have Partner,用数据,简单点!
*MPP:Massively Parallel Processing,大规模并行处理。传统的MPP数据库以Teradata为代表;近年国产数据库厂商发力,涌现新一代MPP引擎,包括TiDB、StarRocks、OceanBase等,在部分场景加强能力。业内主流观点认为,基于Hadoop体系的分布式大数据平台因其开放性、扩展性、吞吐量、容错性等优势,将彻底取代基于MPP数据库的传统数仓。而在小集群、低并发的场景,MPP仍有性价比优势。
移步奇点云官网、公众号,即可下载《OLAP数据库引擎选型白皮书(2024)》。