新闻

破解运营及应用痛点,QingCloud EHPC应对高性能计算场景变革

2021-11-24e-works 王阳

505阅
QingCloud EHPC基于三层服务架构,从资源层上提供了高效的资源,从管理层上提供了方便快捷的管理服务,从用户端上提供交互使用体验极佳的用户控制台。
     随着IT技术的发展,尤其是开放架构和开源的日渐成熟,CPU从单核向多核演变,以及GPU在加速计算方面的加持,推动着高性能计算(HPC)应用越来越普及,其覆盖领域也迅速扩展。

     青云QingCloud云平台&服务部高级总监陈海泉接受记者采访时指出,超算正与大数据、人工智能等技术加速融合,由此带来存储容量大、存储类型复杂、云原生部署需求等多方面的挑战。为应对高性能计算的变革,破解运营及应用中的痛点,青云推出全新的弹性高性能计算——QingCloud EHPC,打通云平台丰富的产品和服务种类,创新云化超算的服务新模式,以更好地赋能新科研、助力新场景。

新场景变革带来的挑战

     实际上,高性能计算(HPC)并不是什么新兴技术。随着应用领域越来越广泛,高性能计算逐渐从传统的气象地理、石油石化、科研教育等领域拓展至生命科学、动漫渲染、金融医疗等越来越广泛的全新场景。

     宏观上,卫星图像、遥感数据、气象数据可以借助高性能计算来模拟地球、海洋和气侯;微观上,基于高性能计算可以模拟分子原子来了解生命的原理,使药物的研发更快速、更精确。

     在陈海泉看来,随着技术创新发展、智能化持续加速,高性能计算对算力的需求越来越大,应用场景从传统向物联网、人工智能等领域不断渗透,高性能计算在各个方面都面临着巨大的挑战。
青云
     据他观察,大数据、人工智能正在与超算融合。这表现在:高性能计算的数据规模越来越大,并且计算精度也在不断提高;其次,数据中心和算力中心互相融合,并且数据量越大,对应的算力也需要更强;其三,人工智能应用出现了爆发,为达到足够的算力,往往需要用很多的 GPU 节点。

     由此带来的问题是,高性能计算的存储容量比以前大很多,同时要针对不同的业务提供合适的存储类型,很多业务还需要用云原生的方式来部署和运行。

破解超算中心应用及运营痛点

     为应对这些挑战和痛点,EHPC提供了一种快捷、弹性、安全以及互通的基于云平台的高性能计算服务,它能支持计算资源的弹性定制,降低成本,提高资源利用率,具有极大的灵活性。

     这也是青云推出QingCloud EHPC的重要原因。

     陈海泉告诉记者,基于青云云基础设施的QingCloud EHPC可为用户提供基于公有云、专属云、混合云等多种产品形态,为科研机构、学校教育、工业生产、行业计算等领域带来弹性灵活、快捷高效、安全可靠的超算服务,完美应对生命科学、CAE仿真、海洋气象、影视渲染、石油勘探、深度学习、测绘地理等应用场景的高性能计算需求。

     除了具备云平台架构的弹性优势,QingCloud EHPC 在计算、网络、存储上具有行业领先性。CPU 单节点计算峰值达 86.4 Gflops,GPU 高配 NVIDIA A100;采用专用IB网络,计算节点与节点之间、计算节点与存储之间都能够高速通信;以 Lustre 商用版本提供专业分布式文件存储。另外,青云通过独立集群、共享队列、专属队列等多种超算模式,多样化的服务类型为用户提供了更多选择与便利。

     陈海泉特别强调,QingCloud EHPC以云计算的技术实现安全需求。包括对计算、网络跟存储的租户隔离;管理节点跟计算节点分离;此外,除了传统的VPN接入,青云还能提供零信任客户端,让用户登录到超算中心的时候更便捷和安全。

     保障安全的同时,为保证高性能计算应用更加灵活,QingCloud EHPC提供了两种不同类型的超算集群:传统的共享型超算集群和独享EHPC集群。陈海泉透露,“QingCloud EHPC还集成了化学工程、生物医药、大气海洋等多种行业软件平台,能提供一站式的使用体验。”

     值得一提的是,在2021年10月底举办的全国高性能计算学年会上,凭借在人工智能、影像渲染、航空航天、海洋气象等领域的技术及服务实力,QingCloud EHPC获得高度认可,斩获了组委会颁发的高性能计算优秀解决方案奖。

三层服务架构,提供弹性灵活的应用模式

     QingCloud EHPC产品经理苗慧介绍,QingCloud EHPC基于三层服务架构,从资源层上提供了高效的资源,从管理层上提供了方便快捷的管理服务,从用户端上提供交互使用体验极佳的用户控制台。

     具体来看,资源层主要包含青云的计算、存储和网络资源,以及相应的后台调度器、调度管理平台以及可视化服务平台;管理层则主要提供SaaS化服务,从开始作业到作业运行结束,系统将自动进行折扣信息计算、计量计费和作业监控服务,能够保证用户进来之后,对团队项目、团队项目权限等相应的管理;用户端是用户控制台,用户可以进行创建集群、管理集群、弹性伸缩、作业提交、作业编排、作业性能分析。通过用户控制台,用户可以很方便地操作作业。

     QingCloud EHPC可以提供哪些资源呢?苗慧告诉记者,除了提供行业领先的高配资源、先进的IB网络和Lustre 商用存储,QingCloud EHPC还提供超过300款应用软件,覆盖工业仿真、生命科学、汽车制造、人工智能、高校科研等多个领域。

     以工业仿真领域为例,青云结合了国内外超算中心的经验,将用户常用的应用软件集成到QingCloud EHPC中;其次,青云还针对细分领域的应用,如分子动力学、转子动力学、新材料等复杂学科内置相应的行业软件;除此之外还通过调研客户的需求,逐渐丰富软件仓库,以满足不同规模、不同行业的客户需求。

     除此之外,基于EHPC高性能计算平台,青云提供了弹性伸缩、按需计费的高性价比方案。用户既可以按超算的作业核时来计费,也可以按资源和节点计费。通过青云的弹性公网IP、公网带宽,将数据进行快速的上传、下载,与本地数据同步。整体上,QingCloud EHPC覆盖青云的终端用户,从云上计算到云下结果产出的一个全流程计算服务平台,用户可以在几分钟内,将云上工作快速运行起来,快速完成计算作业。
 
责任编辑:王阳
读者评论 (0)
请您登录/注册后再评论