华为徐直军谈AI算力:企业如何避免“算力陷阱”?

元描述: 华为副董事长徐直军在2024年华为全联接大会上分享了对AI算力的最新见解,指出企业并非都需要建设大规模AI算力、训练自己的基础大模型,并强调选择适合的模型才是关键。

引言: 在人工智能浪潮席卷全球的今天,企业纷纷将目光投向AI算力,希望利用其强大的计算能力来推动业务转型升级。然而,在盲目追逐“大模型”和“大算力”的热潮中,企业是否真正了解自身的实际需求?如何避免陷入“算力陷阱”?华为副董事长、轮值董事长徐直军在2024年华为全联接大会上,分享了对AI算力战略的深刻洞察,为企业指出了更务实的路径。

“算力陷阱”的真相

在人工智能领域,“算力”被誉为“石油”,是推动AI发展的关键要素。然而,并非所有企业都需要建设大规模AI算力,也不需要盲目追求训练自己的基础大模型。徐直军认为,企业应该理性看待AI算力需求,避免陷入“算力陷阱”。

1. 并非所有企业都要建设大规模AI算力

建设大规模AI算力集群面临着诸多挑战,包括:

  • 高昂的成本和复杂的环境要求: AI服务器对供电、散热等数据中心机房环境要求极高,且随着大模型的不断增大,AI算力也将走向更大规模,这将导致高昂的建设和维护成本。

  • 快速迭代的硬件产品: AI硬件产品更新换代速度快,企业难以保证每个代际的算力硬件独立完成工作,需要混合使用多个代际产品,这将导致资源调度复杂度高,并影响新一代产品性能的充分发挥。

  • 运营维护的挑战: AI技术还在不断发展,多代际产品共存带来的技术变化快,对技能要求高,使得运营维护变得困难,对很多传统IT维护能力的企业来说是重大挑战。

因此,徐直军建议,企业应该根据自身实际需求,选择适合的获取AI算力的方式,而不是一味追求建设自己的AI算力。

2. 并非所有企业都要训练自己的基础大模型

训练基础大模型需要投入大量资源,包括:

  • 大量高质量数据: 基础大模型预训练数据量进入10万亿tokens量级,企业需要获取足够多的高质量数据,这将意味着高成本和数据获取难。

  • 模型训练难度: 基础大模型参数量持续增大,模型迭代和优化难度大,通常需要数月到数年时间才能完成模型迭代训练,这对于企业来说是巨大的时间成本。

  • 人才获取难: 基础大模型涉及的相关技术更新速度快,具备实战经验的技术专家少,企业很难建立足够的技术人才资源。

因此,企业应该聚焦自身核心业务,选择更适合的方式利用现有大模型,而不是一味追求训练自己的基础大模型。

3. 并非所有的应用都要追求“大”模型

徐直军强调,企业应该根据自身不同业务场景需求选择最合适的模型,通过多模型组合来解决问题,创造价值。

  • 十亿参数模型: 可以满足科学计算、预测决策等业务场景的需求,例如降雨预测、药物分子优化、工艺参数预测,在PC、手机等端侧设备上也有广泛应用。

  • 百亿参数模型: 可以满足面向NLP、CV、多模态等大量特定领域场景的需求,例如知识问答、代码生成、坐席助手、安全检测。

  • 千亿参数模型: 面向NLP、多模态的复杂任务,可以用千亿参数模型来完成。

企业需要根据自身需求选择合适的模型,避免为了追求“大”模型而忽视实际应用效果。

从“算力陷阱”中突围

企业应该如何避免陷入“算力陷阱”,有效利用AI算力来推动业务发展呢?

  • 明确业务需求: 企业首先要明确自身的业务目标,确定AI算力的应用场景和需求,避免盲目追求大规模算力。

  • 选择合适的模型: 根据业务场景的具体需求,选择合适的模型,而不是一味追求“大”模型。

  • 利用云平台: 利用云平台提供的AI算力服务,可以减少基础设施建设和维护成本,并获得更灵活的算力资源。

  • 关注模型优化和应用: 除了算力之外,模型的优化和应用也是至关重要的。企业应该注重模型的性能优化和实际应用效果,而不是仅仅追求算力的提升。

总结

AI算力是推动人工智能发展的重要引擎,但企业需要理性看待AI算力需求,避免陷入“算力陷阱”。选择适合的模型,利用云平台,关注模型优化和应用,才能真正发挥AI算力的价值,推动业务创新发展。

常见问题解答

  1. 企业如何判断是否需要建设自己的AI算力?

企业应该根据自身业务需求、技术实力、资金投入等因素综合考虑。如果企业拥有大量数据、技术人才,并且需要进行大量模型训练,那么建设自己的AI算力可能更适合。否则,选择云平台提供的AI算力服务可能是更合理的选择。

  1. 如何选择适合的AI模型?

企业应该根据自身业务场景的具体需求,选择合适的模型。例如,对于简单的预测任务,十亿参数模型可能就足够了;而对于复杂的NLP任务,可能需要千亿参数模型。

  1. 如何有效利用云平台提供的AI算力服务?

企业可以根据自身需求选择不同的云平台服务,例如按需付费的算力资源、预训练模型、模型优化工具等。同时,企业也需要关注云平台的安全性和稳定性,选择可靠的云平台服务。

  1. 如何避免模型训练成本过高?

企业可以利用模型压缩、模型剪枝等技术来减少模型的大小和训练时间,降低训练成本。同时,也可以选择使用预训练模型,并针对自身业务场景进行微调,减少模型训练的成本。

  1. 如何提升模型的应用效果?

企业应该注重模型的性能优化和实际应用效果。例如,可以使用模型解释工具来分析模型的预测过程,并进行针对性的改进。

  1. 未来AI算力发展趋势如何?

未来AI算力发展趋势将更加注重效率和成本控制。例如,边缘计算、量子计算等新兴技术将为AI算力发展带来新的突破。

结论

AI算力是推动人工智能发展的重要引擎,但企业需要理性看待AI算力需求,避免盲目追求大规模算力。选择适合的模型,利用云平台,关注模型优化和应用,才能真正发挥AI算力的价值,推动业务创新发展。要实现智能化的可持续发展,不仅需要算力的可持续,更需要对AI算力需求的理性认知,以及对自身业务需求的深刻理解。