巨量化首先表现在模型参数多、训练数据量大。
目前,海运在线海事服务已覆盖全球700多个港口和水域。而且平台提供授信,让我们不用和当地供应商单独申请账期,更不用提前预付款,的确非常高效。
对于标准海事服务,如船舶设备年度检验,各类具体服务均明码标价,船东可将所需要的服务加入购物车,体验和网络购物一模一样。待检修工作完成并获得船上确认后,船东在30天内向平台还款即可。平台授信让船东全球采购ADK Maritime能快速享受到优质海事服务,与平台授信密不可分。除了让船东与服务商高效对接,我们还提供平台授信这一增值服务,帮助船东解决付款问题。船东可直接在线预订相关服务。
对于使用平台授信支付的订单,如果出现质量和服务问题,海运在线平台将负责协调解决,让船东省时省心。而对于船旗国和船级社要求项目等其他海事服务,船东也只需简单填写若干信息,便可在线提交需求。进入智慧时代,相比以往的传统信息化应用,对计算能力的需求将是一个巨大的飞跃。
NPU不得不增大片上内存以应对模型越来越大的挑战,但是巨量模型的出现使得单纯增大片上内存这条路难以为继。类脑计算是全球的研究热点,清华的施路平教授在去年曾经说:碳基上能够实现的,硅基上一定能够实现。智算中心正在成为推动经济社会运行的重要基础设施,也是我国新基建的重要内容。首先来讲,是创新智算体系结构。
所以,从计算到智算,智慧计算将是智慧时代的核心动力。在3.0阶段,可以通过片内大容量缓存、片外高带宽内存等存算一体方式实现计算数据结合,突破存储墙;通过高速互连交换网络,支持更广泛的多元异构计算、支持新型存储资源池化,提高性能、降低能耗,实现更大规模资源可扩展,并进一步通过在互联处理单元中卸载控制平面,实现控制计算分离,进而达到更为灵活的资源可重构。
如此庞大的算力需求给计算技术和产品带来了巨大挑战。同时,巨量模型依赖海量数据的喂养,目前的AI算法本质上还是一种依赖量变的质变,很难从一种质变跳跃到另一种质变,例如最新的巨量模型需要万亿级的词量数据。通过IO虚拟化卸载,CPU的有效资源利用率可以提升80%、网络存储延迟达到本地延迟水平,高负载压力下电商秒杀性能提升30%、计算性价比提升 20%。在百万年以前,人类的祖先走出森林,走向草原,逐渐形成了人类智能,经历了渔猎采集时代、农业时代、工业时代和信息时代,创造了光辉灿烂的文明和科技。
我想很多人会有这样的疑问,人工智能那么好,但是这东西怎么跟我的业务,跟我的客户应用场景结合起来呢,我想用AI技术做智能化转型和升级,但是发现我这里没人懂算法,懂模型,也缺少好用的AI开发平台。2020年中国农业无人机的销量超过了1.5万架,一架无人机一天农药喷洒面积达到300亩,是人工的20倍。通过板载的大容量高速内存池,达到完全容纳GPT-3模型,避免模型分割导致的芯片利用率低,通信频繁等问题。为什么这么说?我们来看一些关于人类大脑和未来的人工智能的大脑,或者说硅基大脑和碳基大脑发展的情况。
通过上面的例子可以看出,智慧计算时代的序幕已经拉开,人工智能已经开始渗透到经济社会的方方面面,在深刻地影响着我们的工作和生活,在这个过程中,浪潮一直发挥着重要的作用。既然是思考,我们不妨把时间维度放大一点。
今后,我们会将元脑生态升级,与合作伙伴共建、共赢、共享元脑生态平台,帮助左手伙伴成长,助力右手伙伴转型升级,聚合左右手伙伴的力量,加速行业、产业智能化的进程,实现浪潮与伙伴、客户的共同发展。面向新机遇、迎接新挑战,计算技术与产业将需要构建一个新的发展格局,简单概括起来可以描述为:计算逐步向智算转型、多元算力融合和算力供给方式基建化。
那么,智算中心应该如何建设呢?在去年,浪潮联合国家信息中心发布了《智能计算中心规划建设指南》,并在《指南》中提出了智算中心的参考架构。在超大规模集群中同时满足几万块AI芯片的高性能读取,对存储系统是个极大的挑战。传统的信息化应用主要以基于数据库事务的业务为主,像OA、ERP、邮件等,计算量随着业务量的增长基本是线性增长的,但是智慧计算对计算能力的要求则是指数级增长的。现在,我们创造了无数的智慧大脑,城市大脑、交通大脑、企业大脑等等,这些正在改变世界的方方面面。就在苏州,浪潮建设了一座PCBA智慧工厂,整个生产制造过程弹性、透明、可追溯,智能技术贯穿了设计、生产、配送和检测的全流程,生产效率提升了60%以上。随着以人工智能为代表的新一代信息技术的进步,人类社会正加速度进入智慧时代,这是对终点的冲刺,还是新的百万年的开始?我想这可能是一个值得思考的问题。
十四五,数字经济推动智慧算力加速普及和升级,智慧时代,计算能力需求将出现巨大的飞跃。我们在去年的合作伙伴大会上提出了智算中心的概念。
埃森哲等咨询机构的调查报告也表明,70%以上的有技术的研究机构、科技公司缺需求场景、缺领域知识和数据,70%以上的行业用户缺技术人才、缺AI平台和实践能力。面向海量训练大数据,浪潮具有全球性能最好的存储系统,已3次打破SPC-1全球性能测试记录。
2020年GPT-3模型的参数量首次突破千亿大关,达到了1750亿。当前一颗GPU的板载高速内存容量大概是40GB,对于包含百万亿参数的巨量模型,仅是将这些参数平均分配到每个GPU内存中,就需要1万块GPU才能装得下。
在体系结构方面,我们在2014年提出了融合架构以及三步走技术路线,指明了数据中心体系结构的发展方向。在这个案例中,通过浪潮的智能网卡,在控制面实现对虚机、裸机、容器生命周期的统一管理,在数据面以硬件辅助的方式为虚拟化实例提供接近硬件性能的计算、存储、网络功能。下一步我们将持续创新以加速器为中心的体系架构,开发高性能、高效能AI系列服务器。在此,感谢大家一年来对浪潮的支持和帮助,谢谢大家!过去的一年,是极不平凡的一年。
同时,智慧计算也已经成为守护大自然的好帮手。过去一年,元脑生态建设成绩斐然,发展了15000多个合作伙伴,包括2200多个行业ISV,超过90%的方案百强企业。
通过上面的分析,大家可以看到,一方面智算需求蓬勃发展,是巨大的机遇;一方面,多元化、巨量化、生态化的挑战和困难急需解决。在这个基础上,进一步与AI技术结合,从业务上,实现基于特征感知的自适应应用编排和弹性资源调度,例如,面向视频分析、语音识别、自然语言处理、语义理解等AI典型场景,可以按需定义训练和推理系统。
在AI百强企业中85%都与浪潮有着深度的合作,这里面不仅包含BAT等互联网厂商,也包括第四范式、宽邦、暗物质、寒武纪等AI独角兽企业。面对计算新格局,作为全球领先的人工智能计算企业,浪潮启动了新的五年规划,确定了新的发展目标和策略。
在加速芯片/板卡方面,芯片多元化既是挑战,也是应对当前算力需求复杂多样的手段。目前已经从1.0走到2.0,以IO方式实现了存储资源和FPGA、GPU、xPU加速设备池化,正逐步进入3.0阶段,提供更高效、灵活、智能的体系架构。我们将从技术、产品、方案和生态四个方面不断创新,引领智算发展,具体包括:创新智算体系结构、构建智算产品体系、推动智算中心落地、建设元脑产业链生态。当天,浪潮数据中心合作伙伴大会(IPF)2021在苏州举行,王恩东在出席大会时作如上表述。
通过对野生大象的长期追踪和观测,为洞察大象物种习性、种群迁移轨迹提供帮助,进而对合理的开展亚洲象国家公园区域规划、栖息地改造、食源地优化等保护举措提供科学依据。巨量化首先表现在模型参数多、训练数据量大。
在黑龙江,浪潮与北大荒集团合作建设智慧农业,开拓了全球最大面积的无人农场,智能农机覆盖了农业生产的耕、种、管、收全流程。王恩东表示:以创新应答挑战,浪潮通过创新智算体系结构、构建智算产品体系、推动智算中心落地、建设元脑产业链生态引领智算发展。
同时,我们与伙伴开放合作,不断进行技术创新,我们联合Intel公司开展第八代服务器CPU平台参考设计,联合三星贡献业界首个NVMe池化方案,与英伟达联合开发首个支持NVlink低延迟单层链路通讯架构;在算法和应用创新方面,联合第四范式公司,突破金融票据识别技术;联合马达智数,打造数据预处理、数据三维一体展示软件;联合声扬科技,研发面向金融行业的声纹识别算法。浪潮集团执行总裁、首席科学家王恩东院士15日在浪潮数据中心合作伙伴大会上表示,智慧时代,计算需求呈指数级增长,计算技术、产品与产业面临着多元化、巨量化和生态化的新挑战。