何宝宏:算力运力存力协同发展 推动AI开源生态建设


人民网北京7月25日电 (记者许维娜)今年的政府工作报告提出,“持续推进‘人工智能+’行动,将数字技术与制造优势、市场优势更好结合起来”。人工智能是引领新一轮科技革命和产业变革的战略性技术,是培育和发展新质生产力的重要引擎。在近日举办的人民网金台圆桌研讨会上,与会嘉宾围绕“解码中国AI产业突围之路”主题展开讨论。
以下是中国信息通信研究院云计算与大数据研究所所长何宝宏在会上发表的主要观点:
在持续提升单芯片性能的同时,需通过网络化以及运力、存力来弥补算力不足,因此算力、运力、存力协同发展成为重要突破点。
打造差异化竞争力,重点在于算力、数据、算法的协同。从技术演进看,算力发展从前段时间单纯追求用于训练的高性能,转变为高性能与多样化并行。既要追求训练时的极致性能,也要注重实用时的性价比,实现双轨发展。
在上游,要突破关键技术,完善以人工智能算力中心和AI云为代表的服务市场;在下游,要聚焦高价值场景应用。大模型应用推广和场景化宜采用分层、分节奏推进,离语言最近的场景可优先应用,其次是基于语言的知识型工作场景,最后拓展到其他场景。
人工智能耗电增长迅猛,在此背景下,电力与算力的协同发展愈发重要,人工智能驱动下核电的发展趋势也值得关注。未来,AI基础设施将逐步成型,形成类似“AI工厂”的全新形态。与传统IT基础设施相比,最大变化在于对能源的重视,因为人工智能的高耗电量使得能源成为关键因素。
在数据方面,大模型发展已到新转折点,预训练模型在部分场景已可用,缩放定律边际效应递减,在优化算法的同时需要向模型提供更好数据。一方面,数据规模训练面临挑战,全球领先大模型已消耗大量公共互联网数据,再获取新数据难度增大,千行百业数据挖掘迫在眉睫。另一方面,数据质量至关重要,其是人工智能推广的基础保障,还涉及减少幻觉和思维链发展等。
在算法方面,算法创新和工程化优化需进一步发展,如优化推理降低成本、实现可持续性,以及解决终极目标的一致性等问题。在国际化布局上,人工智能企业“走出去”可借鉴传统企业的成功经验,路径具有高度相似性。
在实现人工智能从技术可用到产业好用方面,从预训练大模型到场景化落地,路径逐渐清晰,但并非简单的“预训练+微调”。首先,预训练大模型需进行多种微调,包括对特定领域知识体系的领域微调、解决答非所问问题的任务微调,以及实现模型输出与人类价值观对齐的对齐微调。其次,鉴于模型能力有限,需借助API(应用程序接口)与知识库结合来增强能力。最后,通过与现有应用结合提升性能。
在全球化背景下,要以更开放的心态解决技术孤岛问题,重视人工智能开源社区培养。当前我国人工智能开源生态整体活跃度有待提升,未来应更多发挥社会力量,协同推动开源生态建设。
分享让更多人看到
- 评论
- 关注