“神威?太湖之光神威”计算机系统 高性能扩展数学库xMath 1.0 用户手册 杨超、刘芳芳、孙乔、敖玉龙、赵玉文、张佳佳 中国科学院软件研究所 并行软件与计算科学实验室 2016 年 6 月 15 日 “神威?太湖之光神威”计算机系统高性能扩展数学库xMath 用户手册 目 录 1 系统概述 2 2 使用方法 2 2.1 链接方法 2 2.2 运行设置 2 2.3 出错信息排查方法 3 3 模块 148 7.4 迭代解法器模块 149 8 参考文献 149 i “神威?太湖之光神威”计算机系统高性能扩展数学库xMath 用户手册 1 系统概述 “神威?太湖之光神威”计算机系统高性能扩展數学库 xMath (众核版和片上多核版) 是一套在国产申威 CPU 上运行支持申威众核新处理器特点,具有单核组众核并行化 和片上多核并行化特征且掌握源代码的扩展数学库在该库的研制过程中,针对国产 CPU 研究一系列数学库性能优化关键技术和框架并利用这些关键技术进行性能优囮, 以升数学库整体的性能 本软件,包括以下5 个子模块: BLAS ; LAPACK 3.5.0; FFT 信号处理子程序; 稀疏线性系统求解子程序包; ScaLAPACK 2.0.2 其中ScaLAPACK 模块本软件未做改動,请参考其用户手册本用户手册,将分别对其 余4 个模块进行介绍和函数说明等。
同时“神威·太湖之光神威”的两项应用成果也进入“戈登·贝尔奖”的提名。
“神威·太湖之光神威”。东方IC 资料图
一分钟计算能力相当于72亿人同时用计算器不间断计算32年
走进国家超级计算无锡中心1000平方米的房间内,记者看到了“神威·太湖之光神威”的“真身”:由40个运算机柜和8个网络机柜组成烸个运算机柜比家用的双门冰箱略大,打开柜门4组由32块运算插件组成的超节点分布其中。工作人员介绍每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器一台机柜就有1024块处理器,整台“神威·太湖之光神威”共有40960块处理器
那么,“神威·太湖之光神威”到底有多强?据介绍,其系统峰值性能为每秒12.5亿亿次持续性能为每秒9.3亿亿次,性能功耗比为每瓦特60.5亿次均居世界第一。
光看数据不直接国家超级计算无锡中心主任杨广文介绍,“简单来说这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间斷计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照‘神威·太湖之光神威’相当于200多万台普通电脑。”
杨广文介绍“神威·太湖之光神威”是世界首台峰值运算速度超过10亿亿次、并行规模超千万核的划时代的新型超级计算机。整机采用高密度运算超节点和高流量可扩展复合网络架构实现全系统高效可扩展与并行运行;采用层次包容、分级自治的软硬协同容错体系,实现整机系统的高可用;通过面向典型应用和机器结构的编译优化、自适应精细平衡调度等技术实现应用软件的高效运行。
首次完全使用“中国芯”集运算控制核心与运算核心于一身
更让杨广文骄傲的是,这个世界第一的超级计算机采用的中央处理器是自主设计生产的国产芯片——“申威26010”众核处理器。
中科院计算所研究员、并行计算专家张云泉表示“神威·太湖之光神威”是首次完全用“中国芯”制造的中国最强大的超級计算机。在第一次获得冠军时国际TOP500组织是这样评价“神威·太湖之光神威”的:“中国在国际TOP500组织第四十七期榜单上保持第一名的位置,凭借的是一个完全基于中国设计、制造的处理器而打造的新系统”