Reading Notes: MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive
date
Jan 27, 2025
slug
mi300x-vs-h100-200
status
Published
tags
MLSys
summary
type
Post
MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive 通过 benchmarking,对比了 MI300X 和 H100/200 的性能
Key Takeaway
Key Findings
- On paper FLOPS 不可靠,靠 benchmark 才能说服人
- NVIDIA 的 out of box experience 远好于 AMD,这是由于 software stack 的质量差异带来的
- software stack 可能阻碍 user 发挥硬件的性能潜力
- software stack 的 user experience 很重要
Miscellany
- GEMM 是现代深度学习最重要的 benchmark 对象之一
- NVIDIA 高效的网络拓扑 nvlink 也是其 gpu 高性能的关键之一
