AMD Instinct MI300X & MI300A са едни от най-очакваните ускорители в AI сегмента, които ще бъдат пуснати следващия месец. Има много очаквания около първия пълноценен AI шедьовър на AMD и днес решихме да ви дадем обобщение на това какво да очаквате от това техническо чудо.
AMD Instinct MI300X е проектиран за GPU-ускорени AI работни натоварвания, докато MI300A се справя с HPC с най-модерния технически APU пакет
На 6 декември AMD ще бъде домакин на своята основна бележка „Advancing AI“ , където една от основните програми е да направи пълно разкриване на фамилията ускорители Instinct от следващо поколение с кодово име MI300. Това ново GPU и CPU ускорено семейство ще бъде водещият продукт в AI сегмента, който е номер 1 на AMD и най-важният стратегически приоритет в момента, тъй като най-накрая пуска продукт, който е не само усъвършенстван, но и е проектиран да отговаря на критичните Изисквания за AI в индустрията. Класът MI300 на AI ускорителите ще бъде друга мощност на чиплетите, използвайки усъвършенствани технологии за пакетиране от TSMC, така че нека да видим какво има под капака на тези AI чудовища.
AMD Instinct MI300X – Предизвикателство на AI надмощието на NVIDIA с CDNA 3 и огромна памет
AMD Instinct MI300X определено е чипът, който ще бъде подчертан най-много, тъй като е ясно насочен към ускорителите Hopper на NVIDIA и Gaudi на Intel в сегмента на AI. Този чип е проектиран единствено върху архитектурата CDNA 3 и се случват много неща. Чипът ще поддържа комбинация от 5nm и 6nm IP адреси, като всички комбинират до 153 милиарда транзистора (MI300X).
Започвайки с дизайна, основният междинен елемент е изграден с пасивна матрица, която помещава слоя за свързване, използвайки решение Infinity Fabric от следващо поколение. Интерпозерът включва общо 28 матрици, които включват осем пакета HBM3, 16 фиктивни матрици между пакетите HBM и четири активни матрици и всяка от тези активни матрици получава две изчислителни матрици.
Всеки GCD, базиран на CDNA 3 GPU архитектура, разполага с общо 40 изчислителни единици, което се равнява на 2560 ядра. Има общо осем изчислителни матрици (GCD), така че това ни дава общо 320 изчислителни и 20 480 основни единици. Що се отнася до добивите, AMD ще намали малка част от тези ядра и ще получим повече подробности за точните конфигурации след месец.
Паметта е друга област, в която ще видите огромен ъпгрейд с MI300X, който може да се похвали с 50% повече HBM3 капацитет от своя предшественик, MI250X (128 GB). За да постигне пул памет от 192 GB, AMD оборудва MI300X с 8 стека HBM3 и всеки стек е 12-Hi, като същевременно включва 16 Gb IC, което ни дава 2 GB капацитет на IC или 24 GB на стек. Паметта ще предлага до 5,2 TB/s честотна лента и 896 GB/s Infinity Fabric Bandwidth. За сравнение, предстоящият H200 AI ускорител на NVIDIA предлага 141 GB капацитет, докато Gaudi 3 от Intel ще предлага 144 GB капацитет. Големите пулове памет имат голямо значение в LLMs, които са предимно обвързани с памет, и AMD определено може да покаже своята мощ на AI, като е водеща в отдела за памет.
По отношение на консумацията на енергия, AMD Instinct MI300X е оценен на 750W, което е 50% увеличение спрямо 500W на Instinct MI250X и 50W повече от NVIDIA H200.
AMD Instinct MI300A – Плътно опаковани Exascale APU вече са реалност
Чакахме от години AMD най-накрая да изпълни обещанието за APU от клас Exascale и денят наближава, тъй като се приближаваме към пускането на пазара на Instinct MI300A. Опаковката на MI300A е много подобна на MI300X, с изключение на това, че използва оптимизиран за TCO капацитет на паметта и Zen 4 ядра.
Една от активните матрици има два CDNA 3 GCD, изрязани и заменени с три Zen 4 CCD, които предлагат собствен отделен набор от кеш и основни IP адреси. Получавате 8 ядра и 16 нишки на CCD, така че това са общо 24 ядра и 48 нишки на активната матрица. Има и 24 MB L2 кеш (1 MB на ядро) и отделен пул от кеш (32 MB на CCD). Трябва да се помни, че CDNA 3 GCD също имат отделен L2 кеш.
Завършвайки някои от подчертаните характеристики на ускорителите AMD Instinct MI300, имаме:
- Първи интегриран CPU+GPU пакет
- Насочване към пазар на суперкомпютри в екзамащаб
- AMD MI300A (интегриран CPU + GPU)
- AMD MI300X (само GPU)
- 153 милиарда транзистори
- До 24 Zen 4 ядра
- CDNA 3 GPU архитектура
- До 192 GB HBM3 памет
- До 8 чиплета + 8 стека памет (5nm + 6nm процес)
Обединявайки всичко това, AMD ще работи със своите екосистемни активатори и партньори, за да предложи MI300 AI ускорители в 8-посочни конфигурации, включващи SXM дизайни, които се свързват към дънната платка с мецанин конектори. Ще бъде интересно да се види какъв вид конфигурации ще се предлагат в тях и докато SXM платките са даденост, можем да очакваме и няколко варианта във форм факторите PCI-E.
Засега AMD трябва да знаят, че техните конкуренти също вървят с пълна пара напред в манията по AI, като NVIDIA вече обяви огромни цифри за своите графични процесори Blackwell за 2024 г., а Intel подготвя своите графични процесори Guadi 3 и Falcon Shores за пускане през следващите години. Едно нещо е сигурно в настоящия момент, клиентите на AI ще погълнат почти всичко, което могат да получат и всеки ще се възползва от това. Но AMD има много страхотно решение, което не само се стреми да бъде алтернатива на NVIDIA, но и лидер в AI сегмента и се надяваме, че MI300 може да им помогне да постигнат този успех.
AMD Radeon Instinct ускорители
Име на ускорителя | AMD Instinct MI400 | AMD Instinct MI300 | AMD Instinct MI250X | AMD Instinct MI250 | AMD Instinct MI210 | AMD Instinct MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
---|---|---|---|---|---|---|---|---|---|---|---|
Архитектура на процесора | Zen 5 (Exascale APU) | Zen 4 (Exascale APU) | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A | N/A |
GPU архитектура | CDNA 4 | Аква Ванджарам (CDNA 3) | Алдебаран (CDNA 2) | Алдебаран (CDNA 2) | Алдебаран (CDNA 2) | Арктур (CDNA 1) | Вега 20 | Вега 20 | Вега 10 | Фиджи XT | Поларис 10 |
Процесен възел на GPU | 4nm | 5nm+6nm | 6 nm | 6 nm | 6 nm | 7nm FinFET | 7nm FinFET | 7nm FinFET | 14nm FinFET | 28nm | 14nm FinFET |
GPU чиплети | TBD | 8 (MCM) | 2 (MCM) 1 (на зар) |
2 (MCM) 1 (на зар) |
2 (MCM) 1 (на зар) |
1 (Монолитна) | 1 (Монолитна) | 1 (Монолитна) | 1 (Монолитна) | 1 (Монолитна) | 1 (Монолитна) |
GPU ядра | TBD | До 19 456 | 14 080 | 13,312 | 6656 | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
Тактова честота на GPU | TBD | TBA | 1700 MHz | 1700 MHz | 1700 MHz | 1500 MHz | 1800 MHz | 1725 MHz | 1500 MHz | 1000 MHz | 1237 MHz |
FP16 Изчисляване | TBD | TBA | 383 върхове | 362 върхове | 181 върхове | 185 TFLOPs | 29,5 TFLOPs | 26,5 TFLOPs | 24,6 TFLOPs | 8.2 TFLOPs | 5.7 TFLOPs |
FP32 Compute | TBD | TBA | 95,7 TFLOPs | 90,5 TFLOPs | 45,3 TFLOPs | 23.1 TFLOPs | 14,7 TFLOPs | 13.3 TFLOPs | 12.3 TFLOPs | 8.2 TFLOPs | 5.7 TFLOPs |
FP64 Compute | TBD | TBA | 47,9 TFLOPs | 45,3 TFLOPs | 22,6 TFLOPs | 11,5 TFLOPs | 7.4 TFLOPs | 6.6 TFLOPs | 768 GFLOPs | 512 GFLOPs | 384 GFLOPs |
VRAM | TBD | 192 GB HBM3 | 128 GB HBM2e | 128 GB HBM2e | 64 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
Часовник с памет | TBD | 5,2 Gbps | 3,2 Gbps | 3,2 Gbps | 3,2 Gbps | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
Шина на паметта | TBD | 8192-битов | 8192-битов | 8192-битов | 4096-битов | 4096-битова шина | 4096-битова шина | 4096-битова шина | 2048-битова шина | 4096-битова шина | 256-битова шина |
Честотна лента на паметта | TBD | 5,2 TB/s | 3,2 TB/s | 3,2 TB/s | 1,6 TB/s | 1,23 TB/s | 1 TB/s | 1 TB/s | 484 GB/s | 512 GB/s | 224 GB/s |
Форма фактор | TBD | OAM | OAM | OAM | Двуслотова карта | Двоен слот, цяла дължина | Двоен слот, цяла дължина | Двоен слот, цяла дължина | Двоен слот, цяла дължина | Двоен слот, половин дължина | Единичен слот, цяла дължина |
Охлаждане | TBD | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане | Пасивно охлаждане |
TDP (макс.) | TBD | 750W | 560W | 500W | 300W | 300W | 300W | 300W | 300W | 175W | 150W |