您好,欢迎访问公司官网,我们将竭诚为您服务!服务热线 18620379933(刘先生)
电路板设计- 电路板打样-电路板抄板-专业电路板厂深圳市必顺隆实业有限公司
全国服务热线

18620379933

联系方式

深圳市必顺隆实业有限公司

联系人:刘先生

手 机 :18620379933

电 话:0755-23079106

址:www.bsl9933.com

地 址:深圳市宝安区西乡街道桃源社区107国道西乡段262号园艺园3栋3层


电路板资讯 |

更多>>

人工智能因它更强大 深入分析谷歌TPU2


在上周召开的Google I/O 大会上,谷歌正式公布了第二代TPU,又称Cloud TPU或TPU 2。但是,谷歌并没有详细介绍自己的新芯片,只展示了一些照片。

The Next Platform今天发布一篇文章,基于谷歌提供的图片和细节,带你深入了解谷歌的TPU2。量子位编译如下:

首先要说明的一点是,谷歌不太可能向公众出售TPU的芯片、主板或是服务器。目前看来,TPU2还是一个只供内部使用的产品。只有极少数人可以通过TensorFlow研究云(TRC)直接访问TPU2的硬件,因为这本身就是为研究人员设计的具有“高度选择性”的项目。研究人员可以分享他们发现的TPU2可加速代码类型。谷歌还推出了Google Compute Engine Cloud TPU Alpha项目,我们可以假定,这也是一个高度选择性的项目。

谷歌设计TPU2的首要目的,肯定是为了加速其面向消费者的核心软件(比如搜索、地图、语音识别和无人车的研究等项目)深度学习的工作量。我们对Google TRC的粗略解读是,Google想借此招募人员去研究适合TPU2的超网格的工作负载。

谷歌表示,TRC项目虽然开始规模较小,但之后会逐步扩大。如果Google的研究推广到一般的应用程序,那么其他人员也可以直接访问TPU2。那时Google将为其谷歌云平台的公共云增添一个TensorFlow硬件实例。

TPU2能有今天,离不开去年Google I/O大会上第一代TPU的贡献。一代TPU也是专为机器学习设计的特定目的芯片,还应用在了AlphaGo、搜索、翻译、相册等背后的机器学习模型中。TPU通过两个PCI-E 3.0 x8边缘连接器连接协处理器(参见下面两张照片的左下角),总共有16 GB/s的双向带宽。TPU消耗功率高达40瓦,远高于PCI-E 电源规格,可为8位整数运算提供每秒92万亿次的运算,或为16位整数运算提供每秒23万亿次的运算。为了进行比较,Google声称,在半精度浮点数(FP16)情况下,TPU2可以达到每秒45万亿次的浮点运算。

TPU没有内置的调度功能,也不能被虚拟化。它是一个直接连接到服务器主板的简单矩阵乘法协处理器。

 

△ 谷歌的第一代TPU卡:A图没有散热器;B图有散热器

在主板处理能力或其PCI-E 吞吐量超负载前,Google从不会透露有多少TPU连接到一个服务器主板。协处理器只需要做一件事,它需要以任务设置和拆卸的形式,从主机处理器获取大量信息,并管理每个TPU数据的传输带宽。

Google已将其TPU2设计用于四机架机柜,并将其称为pod。机柜是相对于一组工作负载的标准机架配置(从半机架到多机架)。它为大型数据中心所有者提供更轻松廉价的购买、安装和部署流程。例如,Microsoft的Azure Stack标准半机架就是一个机柜。

四机架机柜大小主要取决与Google正在使用的铜缆类型和全速运行的最大铜线长度。下图显示了机柜的高层次组织。

我们首先注意到,Google通过两根电缆将每个TPU2板连接到一个服务器处理器板上。也可能是谷歌将每个TPU2板连接到两个不同的处理器板,但是,即使是谷歌也不希望混淆该拓扑结构的安装、编程和调度复杂性。如果在服务器主板和TPU2板之间存在一对一的连接,则要简单得多。

 

△ Google的TPU2机柜:A是CPU机架,B是TPU2机架,C是TPU2机架,D是CPU机架; 固体箱(蓝色):不断电电源系统(UPS); 虚线框(红色)是电源; 虚线框(绿色)是机架式网络交换机和机架式交换机顶部

谷歌展示了TPU2机柜的3张不同照片。在这3张照片中,配置和连线方式看起来一致。TPU2连线的颜色编码有助于比较这些照片。

 

△ 三个谷歌TPU2机柜

谷歌展示了TPU2电路板的顶视图,以及电路板前面板接口的近距离视图。TPU2电路板的所有4个象限共享同一电源分配系统。我们认为,这4个TPU2电路板象限也通过简单的网络开关共享同一网络连接。看起来,每个电路板象限都是一个独立的子系统,而除此以外4个子系统之间并没有相互连接。

 

△ TPU2板的俯视图:A是四个TPU2芯片和散热片;B是2个BlueLink 25GB / s电缆/ TPU2;C是两种全路径体系结构(OPA)电缆;D是电路板电源连接器,E很可能是一个网络开关

前面板连接看起来像是QSFP网络接口,但我从未在其他地方看到过。IBM BlueLink规范定义,对于最小25GB/s的配置(称作‘子链接’),在上下行每个方向上需要8个200Gb/s信道(总共16个信道)。谷歌是OpenCAPI的成员,同时也是OpenPowerFoundation的创始成员,因此使用BlueLink规范是合理的。

2021-03-02
2021-03-02
2021-03-02
2021-03-02
2021-03-02
2021-03-02
2021-03-02
2021-03-02
2021-03-02
2021-03-02

在线客服


客户服务热线
18620379933
在线客服