投稿邮箱:mwnews@sina.com
设为首页 点击收藏
您所在的位置: 马尾新闻网 >> 科技 >> 正文

天河二号刷新中国速度 峰值计算每秒5.49亿亿次

http://www.mwnews.cn  2013-06-18 16:26:51   来源: 科技日报    【字号

  国防科技大学研制的天河二号超级计算机系统。

  北京时间6月17日下午。德国,莱比锡。

  第41届世界超级计算机500强排名榜在此间揭晓:由中国国防科技大学研制的天河二号超级计算机,以峰值计算速度每秒5.49亿亿次、持续计算速度每秒3.39亿亿次双精度浮点运算的优异性能,继天河一号之后再次跃居榜首。它向全球宣告:中国超级计算机研制水平继续处于世界领先行列。

  不是量的简单叠加,而是质的重大跨越

  世界TOP500组织专家、美国田纳西大学杰克·唐加拉教授这样评价天河二号:“它与上一届排名世界第一的美国‘泰坦’大小相当,速度却是它两倍,制造这样强大的系统需要很强的技术。这是一个令人印象深刻的系统。”

  与该校此前研制的天河一号相比,天河二号的计算性能和计算密度均提升了10倍以上,能效比提升了2倍。二者占地面积相当,而天河二号执行相同计算任务的耗电量只有天河一号的三分之一。

  高性能、高能效从何而来?天河二号工程总指挥、总设计师廖湘科研究员说:“自主成就飞跃,创新驱动发展。”超级计算机运算性能的提升,决不是量的简单叠加,而是全系统质的跨越。天河二号的研制面临着体系结构、稳定性、能效比等一系列世界级技术难题。

  研制人员在总结天河一号成功经验的基础上,自主创新了新型异构多态体系结构,实现了多类型计算资源、输入输出资源和服务资源的灵活配置,在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用,显著扩大了天河二号的应用领域。设计实现了微异构计算阵列和新型并行编程模型和框架,提升了应用软件的兼容性、适用性和易用性。

  在国家科技重大专项支持下,天河二号在研制过程中,自主研制出当前国内主频最高的新一代高性能通用“飞腾-1500”CPU。天河二号的服务阵列就是基于“飞腾-1500”CPU构建的,用于支撑高吞吐率和高安全的信息服务类应用。

  天河二号通过采用综合化的能耗控制,设计实现了面向高效能计算的层次式优化框架、自适应能耗控制算法及低损耗、高效率的电源设计,有效提高了系统的能效比,达到了世界先进水平。

  天河二号还在高速互连、新型层次式加速存储架构、容错设计与故障管理、综合化能效控制、高密度高精度结构工艺等方面取得了一系列创新和突破。

  应用面更宽、易用性更好

  当今世界,高性能计算已成为理论与试验之外的第三种科学研究手段。研制稳定可靠、应用广泛的超级计算机,是天河人始终追求的目标。

  天河二号研制中,他们认真分析总结天河一号的研制与应用经验,对市场需求进行深入调研,根据我国特别是广东省及珠三角地区对大数据处理、智慧城市建设等方面的应用急需,创造性提出了异构多态体系结构,实现了系统的均衡设计。与国外超级计算机主要针对科学工程计算不同,天河二号在强化科学工程计算的同时,可高效支持大数据处理、高吞吐率和高安全信息服务等多类应用,使得天河二号应用面更宽、易用性更好。针对新型体系结构使用难度大的问题,科研人员开发了一种新的编程框架,将异构特征“屏蔽”起来。这就是说,用户在使用天河二号时,既能发挥它的强大运算能力,又不会因异构多态体系结构的复杂性增加编程的难度,从而有效提高了易用性。

  系统容错性能是评价超级计算机稳定性的重要指标。在天河二号中,科研人员通过采用多层次容错设计,实现了超大系统的智能化管理,可自动监控、检测、诊断、隔离系统运行时出现的故障,与天河一号相比,全系统连续稳定运行时间提高了1.5倍以上,可靠性和可用性迈上了一个新台阶。

  据了解,天河二号将于今年下半年作为广州超级计算中心的业务主机安装交付,主要应用于大科学、大工程以及产业升级和信息化建设领域。目前,天河二号已应用于生物医药、新材料、工程设计与仿真分析、天气预报、气候模拟与海洋环境研究、数字媒体和动漫设计等多个领域,开始为多家用户单位提供超级计算服务。

  “天河人”心中的“中国梦”

  令人印象深刻的是,从天河一号首次夺得世界第一,到天河二号再次摘取世界超算桂冠,“天河”高性能计算创新团队一次次创造着让世界震惊、令国人骄傲的科技奇迹。创造奇迹的奥秘何在?

  在天河二号攻关的日子里,每天晚上,天河楼的灯火都是彻夜长明。“周周5加2,天天白加黑”,成为科研人员的工作常态。今年寒假期间,他们只在春节休息了3天,有的科研骨干将老婆孩子送回老家,主动留下来,整个春节都泡在实验室里。

  天河二号主任设计师杨灿群研究员介绍,做这样大规模的系统,任何一个环节出现问题,都可能影响到整个工程的进展,所以团队每个成员都要把自己负责的工作做到极致,不能因为自己的工作没有做好影响全局。一次,一名科研人员独立负责的一项工作出现故障,一时没有找到解决的办法,他就24小时守在机房苦思冥想,领导催他回去休息一会,他却说:“问题不解决,我怎么能睡得着呢。”说这话时,他急得流下了眼泪。

  为了突破系统规模扩大带来的稳定性问题,他们经常把自己封闭起来攻关,潜心研究,直到找到解决问题的办法。“天河人”用行动传承着“胸怀祖国、团结协作、志在高峰、奋勇拼搏”的“天河精神”。

  这就是“天河人”,他们以科技强国为己任,自强不息、顽强拼搏,让超算领域的“中国梦”再次变成了现实。