当地时间4月9日(ri),GOOGLE在美国举行了“谷歌 Cloud Next 25”大会,正式发布了专为AI设计(ji)的第七代TPU(Tensor Processing Unit)加速器“Ironwood”,单芯片峰值算力可达4,614 TFLOPs。
据先容,Ironwood是GOOGLE首款在其张量核和矩阵数学单元中(zhong)支撑 FP8 计(ji)算的 TPU,而此前GOOGLE的 TPU 仅支撑用于推理的 INT8 格式和处理以及用于训(xun)练的 BF16 格式和处理。
Ironwood还大幅增加高(gao)频宽內(na)存(HBM)容量,每颗芯片的HBM容量提高(gao)到了192GB,达到了Trillium的6倍,可处理更大型的模型和数据集运算,减少频繁(fan)的数据传输需求,同时,HBM带宽也大幅提升,Ironwood单颗芯片的内存带宽可达7.2Tbps,是Trillium的4.5倍,以确保数据快速存取。