基于“斐济”图形架构,构建了解决机器和深度学习应用64计算单元,加速要求的工作负载高达8.2 TFLOPS的峰值FP32和FP16计算性能加速计算密集型机智47 GFLOPS / WATT峰值FP16 / FP32性能。为机器智能和深度学习推理应用提供惊人的性能,最先进的内存技术:4GB的HBM Memory被动冷却,175W TDP板电源 - 设计适合大多数标准服务器设计MXGPU,用于虚拟化计算工作负载- 驱动数据中心的利用率和容量在数据中心罗频软件平台提供开源超屏和HPC类解决方案ROCM软件平台提供开源超高平台开源Linux驱动程序,HCC编译器,工具和库从金属前进的Miopen完全控制深度学习框架图书馆大酒吧支持MGPU对等体MXGPU SR-IOV硬件虚拟化用于优化系统利用开放行业标准支持多个架构和行业标准互连技术ROCM软件平台提供开源HPC级平台开源Linux驱动程序,HCC用于全控制的编译器,工具和库ROM金属前向GPU架构图形核心下一(GCN)3RD Gen峰半精密(FP16)性能8.19 TFLOPS光刻28nm流处理器4096峰值单精度(FP32)性能8.19 TFLOPS OEH双精度(FP64)性能512 GFLOPS内存大小4 GB内存类型(GPU)高带宽内存(HBM)