作者: Tarun Chopra ,IBM数据与AI 产品管理副总裁
(北京,2023年5月10日)IBM日前在Think大会上宣布,推出IBM watsonx.data,这是一个基于开放式湖仓一体(lakehouse)架构的数据存储,旨在帮助企业轻松地统一和管理其结构化与非结构化数据,无论数据位于何处,以实现高性能AI与分析。该解决方案目前处于封闭测试阶段,预计将于2023年7月正式发布。
如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网。
什么是 watsonx.data?
watsonx.data将成为IBM新的AI与数据平台IBM watsonx的核心,IBM 刚刚在 Think大会上发布IBM watsonx平台。借助watsonx,IBM将推出一个集中式AI开发平台,使企业能够访问专有的IBM以及开源的基础模型,用watsonx.data来收集和清洗数据,还有一个用于AI治理的工具包。
watsonx.data将允许用户通过单一入口点访问他们的数据,并且可以跨不同的IT环境中运行多个适合用途的查询引擎。通过工作负载优化,组织可以利用此解决方案将数据仓库的成本降低到一半(多达50%)[1]。它还提供内置的治理、自动化以及与组织现有数据库和工具的集成,以简化设置和用户体验。
支持数据管理生命周期
根据IDC Global StorageSphere报告,存储在数据中心的企业数据在2021-2026年间将以30%的复合年增长率增长。[2] 随着数据量的增加,数据孤岛、运营成本和监管压力也随之增加,这可能导致对数据、分析和AI投资以改进业务成果的更为严格的审查和需求。
数据的激增跨越每个行业,企业组织可望将数据转化为促进行动的见解,为营收战略和提升运营效率提供参考。
AMC Networks商业智能执行副总裁Vitaly Tsivin表示:“媒体和娱乐行业经历了重大的数字化转型,今天的观众在各种不同的设备和平台上消费内容。watsonx.data 使我们能够轻松访问和分析我们广泛的分布式数据,以帮助提取可促进行动的见解,同时最大限度地提高我们的资源利用率,凭借精心策划的高质量内容,为 AMC Networks的观众提供卓越的用户体验。”
值得注意的是,watsonx.data 既可以在本地运行,也可以跨多云环境运行。该解决方案将帮助企业把他们越来越孤立的数据用起来,利用先进的AI和分析来获得促进行动的见解,同时在其整个数据管理生命周期当中提供强大的数据治理和可观察性的支持。
强强联合带来强大的解决方案
watsonx.data 经过精心设计,在英特尔新的第四代Xeon Scalable Processors处理器和开源查询引擎(如 Presto、Velox 加速库和 Spark)之上采用英特尔的内置加速器,为高性能 SQL 查询、报告、商业智能和机器学习提供快速可靠的数据处理。
英特尔云和企业解决方案事业部副总裁兼高级首席工程师 Das Kamhout 说:“我们认识到 watsonx.data以及它所基于的开源组件开发的重要性。我们期待与IBM合作优化watsonx.data堆栈,通过我们对Presto开源社区的共同技术贡献,在性能上实现重大突破。“
IBM 和英特尔在数据和 AI 产品方面有着悠久的合作历史,包括在 Intel Xeon 平台上优化 IBM Db2、使用 IBM Watson NLP Library for Embed with OneAPI 进行 AI 加速,以及现在刚刚发布的 watsonx.data。
watsonx.data将允许用户使用类似数据仓库的功能实现数据存储库的现代化,同时受益于低成本的对象存储以及Iceberg等开放数据和表格格式,帮助他们在几分钟内做出数据驱动的决策。
Cloudera产品管理执行副总裁Paul Codding表示:“由Apache Iceberg表格格式提供支持的开放式湖仓一体(lakehouse)架构使组织能够灵活地使用适合用途的分析解决方案,使其数据平台面能够面向未来,适用于所有工作负载。IBM和Cloudera的客户将受益于真正开放且可互操作的混合数据平台,该平台可以推动并加速AI在越来越多的用例和业务流程当中被采用。“
IBM 和 Cloudera 拥有长期的战略合作伙伴关系,包括经认证的产品集成以及联合销售与支持等合作模式。
wasonx.data将可以通过本地、以及通过多个公有云提供商(包括IBM Cloud和AWS在内)来提供,这是基于去年IBM宣布扩大与AWS的合作关系——在AWS上提供IBM软件即服务,该解决方案也将在 AWS Marketplace 中提供。
AWS 全球战略联盟总监 So Lee 表示:“企业和组织越来越多地采用数据湖仓一体(lakehouse)架构解决方案来支持他们不断增长的数据需求,特别是当我们看到整个行业都转向AI解决方案的时候。在 AWS Marketplace 中将 watsonx.data 以即服务的方式提供给客户,可以进一步支持他们对混合云日益增长的需求,使他们能够更灵活地随时随地运行业务流程,同时为他们提供广泛的 AWS 服务和 IBM 云原生软件的选择,以满足他们的独特需求。”
watsonx.data 将扩大 IBM 在数据和 AI 领域的市场领导地位,最近一次得到业界的认可,是通过把IBM Watson的能力注入现有的 IBM 解决方案,如 StepZen、Databand.ai、IBM Watson Knowledge Catalog、IBM zSystems、IBM Watson Studio 和 IBM Cognos Analytics等,被评为“Forrester Wave:Data Management for Analytics” 的领导者。这些整合的能力使 watsonx.data 的用户能够在其数据生态系统中部署各种行业领先的数据目录、血缘、治理和可观测性解决方案。
在此发布之后,watsonx.data预计将进行持续开发,通过Velox和IBM最近收购的Ahana将最新的性能增强整合到Presto开源查询引擎中,Ahana是Presto唯一的SaaS,也是Presto开源社区强有力的贡献者。watsonx.data 的下一步开发还将结合 IBM Storage Fusion 技术,以增强跨远程源的数据缓存,同时基于 IBM 研究院的基础模型构建的语义自动化功能,通过对话式用户体验自动执行语义数据的发现、探索和丰富。
点击了解更多关于IBM watsonx.data的信息。
有关 IBM 未来方向和意图的声明仅代表目标和目的。如有更改或撤销,恕不另行通知,
[1] 将 watsonx.data 的 VPC 小时数标准化的2023年公布标价与几家主要云数据仓库供应商进行比较时。节省的费用可能因配置、工作负载和供应商而异。
[2] IDC,《全球存储领域预测(2022-2026):2021年7.9ZB 的存储容量安装基数的成本为3700亿美元 — 够了吗?》(IDC 文档 #US49051122,2022年5月)
关于IBM
IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过175个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过4000家政府和企业实体依靠 IBM 混合云平台和 Red Hat OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。
如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网