本页使用了标题或全文手工转换

张量处理器

维基百科,自由的百科全书
跳到导航 跳到搜索

张量处理器英语:tensor processing unit,缩写:TPU)是Google机器学习定制的专用芯片(ASIC),专为Google的深度学习框架TensorFlow而设计。

图形处理器(GPU)相比,TPU采用低精度(8位)计算,以降低每步操作使用的晶体管数量。降低精度对于深度学习的准确度影响很小,但却可以大幅降低功耗、加快运算速度。同时,TPU使用了脉动阵列英语Systolic array的设计,用来优化矩阵乘法卷积运算,减少I/O操作。此外,TPU还采用了更大的片上内存,以此减少对DRAM的访问,从而更大程度地提升性能。[1]

Google在2016年的Google I/O年会上首次公布了TPU。不过在此之前TPU已在Google内部的一些项目中使用了一年多,如Google街景服务RankBrain英语RankBrain以及其旗下DeepMind公司的围棋软件AlphaGo等都用到了TPU。[2][3]而在2017年的Google I/O年会上,Google又公布了第二代TPU,并将其部署在Google云平台之上。第二代TPU的浮点运算能力高达每秒180万亿次。[4]

世代[编辑]

第一代[编辑]

第一代的TPU使用8-bit矩陣乘法引擎,透過PCIe 3.0與CISC指令操作。晶片為28nm製程,die ≤ 331 mm2,700 Mhz,功耗在28至40瓦。

第二代[编辑]

第二代於2017年五月發表。

第三代[编辑]

第三代於2018年五月發表。

参考文献[编辑]

  1. ^ Norman P. Jouppi; 等. In-Datacenter Performance Analysis of a Tensor Processing Unit. arXiv:1704.04760 (英语). 
  2. ^ Jouppi, Norm. Google supercharges machine learning tasks with TPU custom chip. Google Cloud Platform Blog. Google. May 18, 2016 [2017-01-22] (英语). 
  3. ^ Google's Tensor Processing Unit explained: this is what the future of computing looks like. TechRadar. [2017-01-19] (英语). 
  4. ^ Google’s second generation TPU chips takes machine learning processing to a new level. TechCrunch. 2017-05-17 (英语).