
실시간댓글
|
|
샤이닝초코 | 2026-05-07 23:03
AMD MI430X, 전통적 HPC 워크로드서 엔비디아 ‘루빈’ 대비 6배 성능 발휘… 역대 최고 성능의 FP64 GPU 등극
작성자: 하산 무즈타바 (Hassan Mujtaba)
날짜: 2026년 5월 7일
AMD의 인스팅트(Instinct) MI430X GPU가 현존 가장 빠른 FP64 칩으로 등극했습니다. 전통적인 HPC(고성능 컴퓨팅) 워크로드에서 엔비디아의 차세대 아키텍처인 ‘루빈(Rubin)’보다 최대 6배 높은 성능을 발휘합니다.
AMD, 2028년 ORNL '디스커버리' 시스템에 MI430X 공급… FP64 연산의 비약적 도약
최근 AI 분야는 FP4, FP6, FP8과 같은 저정밀도 포맷을 통해 엑사스케일(Exascale)급 연산 성능을 높여가고 있습니다. 이러한 저정밀도 포맷은 신경망 연산에서 핵심적인 역할을 하며 AI 시장을 주도하고 있지만, 과학 계산 등 고성능 컴퓨팅(HPC) 워크로드에서는 여전히 배정밀도(FP64)와 같은 고정밀 포맷의 가치가 매우 높습니다.
AMD는 전통적으로 FP64 연산 분야의 선두 주자였으며, 이번에 공개된 차세대 MI430X는 HPC GPU 중 역대 최고 수준인 최대 200 TFLOPS의 순수 FP64 성능을 제공합니다. 이러한 성능 향상은 AMD의 최신 CDNA 아키텍처와 첨단 공정 및 패키징 기술, 그리고 대용량 HBM4 메모리의 결합을 통해 실현되었습니다
.
MI430X는 AMD의 차세대 가속기 라인업인 MI400 시리즈의 일환이며, 해당 라인업에는 AI 워크로드에 특화된 가속기인 MI450X도 포함될 예정입니다.
엔비디아 루빈(Rubin)과의 성능 비교
AMD는 MI430X가 경쟁 모델인 엔비디아 루빈보다 최대 6배 더 높은 연산 능력을 제공한다고 밝혔습니다. 엔비디아 루빈 GPU는 FP64 벡터 연산에서 33 TFLOPS를, 텐서 코어 기반의 에뮬레이션 알고리즘을 사용할 경우 최대 200 TFLOPS를 제공합니다. 결과적으로 순수 벡터 연산 성능 기준으로 AMD MI430X(200 TFLOPS)는 엔비디아 루빈(33 TFLOPS)을 압도합니다.
[주요 GPU별 FP32/FP64 성능 비교]
| 특징 | Hopper (H100) | Blackwell (B200) | Rubin | MI430X |
| FP32 벡터 (TFLOPS) | 67 | 80 | 130 | 확인 중 (TBD) |
| FP32 매트릭스 (TFLOPS) | 672 | 2,270* | 4,000* | 확인 중 (TBD) |
| FP64 벡터 (TFLOPS) | 34 | 40 | 33 | 200 |
| FP64 매트릭스 (TFLOPS) | 67 | 150* | 200* | 확인 중 (TBD) |
*텐서 코어/에뮬레이션 활용 시
MI430X는 강력한 HPC 성능뿐만 아니라 업계 최고 수준의 저정밀도 AI 연산 기능까지 단일 패키지로 제공합니다. 이는 고성능 컴퓨팅의 중요성을 다시 한번 입증하는 것이며, AMD는 이를 위해 두 가지 주요 프로젝트를 발표했습니다.
미국 오크리지 국립 연구소(ORNL) '디스커버리(Discovery)' 슈퍼컴퓨터: 2028년 도입 예정이며, 에너지·생물학·국가 안보·첨단 소재 분야의 혁신을 이끌 예정입니다. 다수의 MI430X GPU와 EPYC CPU가 탑재됩니다.
유럽 '앨리스 레코크(Alice Recoque)' 시스템: 유럽 최고의 엑사스케일급 슈퍼컴퓨터를 목표로 하며, 차세대 EPYC CPU와 MI430X 가속기가 함께 배치될 예정입니다.
그런것이다
샤이닝초코
19,740
1,944,459
프로필 숨기기
64%