首页 科技正文

牡丹江四中贴吧:性能提升20倍:英伟达GPU旗舰A100登场,全新7nm架构安培出炉

admin 科技 2020-05-16 25 0

机械之心报道

介入:李泽南

时隔三年,英伟达最强芯片 Tesla V100 有了继任者,20 倍的性能提升着实让人有些招架不住。
虽然由于新冠疫情发作,今年的 GTC 2020 大会也在最后时刻宣布转为线上,不外人们期待 7 纳米制程英伟达 GPU 的热情并没有消退。
英伟达固然明白我们的心情,在 GTC 正式开幕一天前,英伟达 CEO 黄仁勋提前放出了一段视频——在老黄美国加州 Los Altos Hills 的家中,全球最大的 GPU 正式「出炉」了:

我们说的这个「出炉」,它可真是字面意思。

事实上,黄仁勋今年的整个 GTC 大会的主 Keynote 环节都是在这个烤炉前举行的。他还示意,这是英伟达有史以来第一个「厨房 Keynote」。

和普通家庭一样,黄老板家的厨房里也摆着「煤气灶」,显得朴实无华且死板。

黄老板展示的安培(Ampere)架构 GPU 系统以最新英伟达 Tesla A100 芯片组成,被认为是迄今为止 GPU 算力最大的一步提升。
A100:面积最大,性能最强
详细提升了若干?还记得三年前推出、至今仍然业界领先的 Volta 架构芯片 Tesla V100 吗?V100 用 300W 功率提供了 7.8TFLOPS 的推断算力,有 210 亿个晶体管,但 A100 的算力直接是前者的 20 倍。
「A100 是迄今为止人类制造出的最大 7 纳米制程芯片,」黄仁勋说道。A100 接纳现在最先进的台积电(TSMC)7 纳米工艺,拥有 540 亿个晶体管,它是一块 3D 堆叠芯片,面积高达 826mm^2,GPU 的最大功率达到了 400W。
这块 GPU 上搭载了容量 40G 的三星 HBM2 显存(比 DDR5 速率还快得多,就是很贵),第三代 Tensor Core。同时它的并联效率也有了伟大提升,其接纳带宽 600GB/s 的新版 NVLink,险些达到了 10 倍 PCIE 互联速率。


随着安培架构泛起的三代 Tensor Core 对希罕张量运算举行了稀奇加速:执行速率提高了一倍,也支持 TF32、FP16、BFLOAT16、INT8 和 INT4 等精度的加速——系统会自动将数据转为 TF32 花样加速运算,现在你无需修改任何代码量化了,直接自动训练即可。,

sunbet

Sunbet和www.eyaeya.com强强联合,打造一站式全民直营平台,用资本、技术、服务在同行中获胜。Sunbet和EYAEYA网提供数十种线上纸牌、zhenren、电子游戏,致力打造公平公开公正的信誉平台。

版权声明

本文仅代表作者观点,
不代表本站保险网的立场。
本文系作者授权发表,未经许可,不得转载。

评论

好文推荐

站点信息

  • 文章总数:1555
  • 页面总数:0
  • 分类总数:16
  • 标签总数:3902
  • 评论总数:122
  • 浏览总数:207422