利用更丰富的NASA地球科学数据生成地理空间洞察,加速气候相关发现
北京2023年8月8日 -- 近日,IBM (NYSE: IBM) 与开源AI平台 Hugging Face 共同宣布,基于美国宇航局(NASA)卫星数据构建的IBM watsonx.ai地理空间基础模型现已在Hugging Face 发布。它将成为Hugging Face上至今最大的地理空间基础模型,也是首个与NASA合作构建的开源AI基础模型。
获取最新数据仍然是气候科学研究面临的主要挑战,因为环境条件几乎每天都在变化。尽管数据量不断增加(NASA预估到2024年,其新任务将产生25万 TB的数据),但科学家和研究人员们在分析这些大型数据集时仍面临障碍。作为与NASA签署的空间行动协议(Space Act Agreement)的一部分,IBM今年早些时候构建了一个用于处理地理空间数据的AI基础模型。现在,双方联手业内公认的开源领导者和Transformer模型库Hugging Face,共同发布上述地理空间基础模型,以扩大气候和地球科学研究中对AI技术的访问和应用,从而加速创新。
IBM研究院人工智能副总裁Sriram Raghavan表示:“在加速气候变化等关键领域的研究发现上,开源技术的角色越来越重要。IBM的基础模型旨在创建灵活、可复用的AI系统,通过将其与NASA的地球卫星数据库相结合,并发布在领先的开源AI平台Hugging Face上,我们可以利用协作的力量,实施更快速、更有影响力的解决方案,改善地球环境。”
Hugging Face产品和增长业务负责人Jeff Boudier表示:“AI仍然是一个以科学为驱动的领域,而科学进展必须通过信息共享和合作取得。这就是为什么开源AI、开放数据集和模型对于AI的持续发展如此重要,从而让更多人受益于技术。”
NASA首席科学数据官Kevin Murphy表示:“我们相信基础模型有潜力改变观测数据分析的方式,帮助我们更好地了解我们的星球。我们希望通过开源这些模型扩大其影响力。”
该基础模型由IBM和NASA共同训练,使用了过去一年在美国大陆范围内的Harmonized Landsat Sentinel-2(HLS)卫星数据,并基于洪水和焚烧区域的标记数据进行了调优。相比于目前的领先技术,该模型仅使用同等条件下一半的标记数据,便实现了15%的效果改进。通过进一步的调优,该模型还可以应用于追踪森林砍伐、预测农作物产量、检测和监测温室气体等新任务。IBM和NASA的研究人员还与克拉克大学合作,将该模型用于时间序列分割(time-series segmentation)和相似性研究等领域。
此次发布紧随双方在今年早些时候联合发布的AI模型,后者旨在加速卫星图像分析、推动科学发现。这也是NASA为期十年的开源科学倡议的一部分,该倡议旨在建立一个更为开放、包容、协作的科学共同体。
此次发布的地理空间模型借助了IBM基础模型技术,是IBM创建和训练可用于不同任务、实现多情境下信息应用的AI模型的一部分。今年7月,IBM宣布其AI和数据平台watsonx开始正式上市,它旨在基于可信任的数据,帮助企业扩大和加速领先AI技术的影响力。作为IBM watsonx的一部分,该地理空间模型的商业版将于今年晚些时候通过IBM Environmental Intelligence Suite(IBM环境智能套件,EIS)推向市场。
【关于IBM】
IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。