8月28日,2024中国国际大数据产业博览会在贵阳举办,微博首席科学家、新技术研发负责人张俊林受邀出席大会,在“智能经济创新发展”交流活动中,围绕“人工智能赋能经济社会高质量发展”议题进行了分享。
作为新一轮科技革命和产业变革的重要驱动力,人工智能正以前所未有的速度渗透到各行各业,推动经济社会各领域从数字化、网络化向智能化跃升,成为引领经济社会高质量发展的关键力量。
张俊林表示,人工智能是新质生产力的重要组成部分。如今所说的生成式人工智能最主要特征就是通用性,它能够给千行百业带来赋能、增效、提产,也能给很多领域带来全新的工具和方法。如在药物研发过程中,AlphaFold系列模型对于人体蛋白质结构的预测能力大幅提升,这项技术代表了分子建模和药物发现的巨大飞跃,对很多新药的开发都有促进作用,相信每个人未来都会从中受益。
“再如,在搜索方面,人工智能也具有显著价值。”张俊林举例,“比如用传统搜索查找信息时,成本会比较高,在搜索结果中还需要每个点开去寻找。但如果与大模型结合,只需要一句提问,基本上就能得到一个靠谱答案。目前来看这种结合非常有前景,对搜索体验的改善非常明显。”
随着通用大模型的快速发展,公开的训练数据面临枯竭。对此,张俊林表示,目前行业为了应对这一困境,已经摸索出一个通用的解决方案——合成数据,也就是大模型自主产生数据来训练下一代模型。张俊林指出,国内也在普及这个方式,“大模型怎样产生好的训练数据来训练下一代?这是通用大模型在数据方面的一个重要发展方向。”
张俊林还现场分享了微博做大模型的相关经验。“微博自研了‘知微大模型’,也开发了很多微博场景内的大模型应用,得出的经验是:在垂直场景化的应用里,其实并不需要规模特别大的模型,但前提是要有优质的行业场景数据。具体来讲,用中小规模的模型,结合高质量场景数据做出来的应用效果,比单纯用大模型、不使用高质量场景数据会好得多。”
谈及人工智能的未来发展,张俊林表示,大模型的数据来源于人,算法也是由人设计,所以人工智能的发展从始至终都应该服务于人,从数据、算法到模型服务目标,都应该以人为本。