AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel

AMD Instinct MI300X & MI300A са едни от най-очакваните ускорители в AI сегмента, които ще бъдат пуснати следващия месец. Има много очаквания около първия пълноценен AI шедьовър на AMD и днес решихме да ви дадем обобщение на това какво да очаквате от това техническо чудо.

AMD Instinct MI300X е проектиран за GPU-ускорени AI работни натоварвания, докато MI300A се справя с HPC с най-модерния технически APU пакет

На 6 декември AMD ще бъде домакин на своята основна бележка „Advancing AI“ , където една от основните програми е да направи пълно разкриване на фамилията ускорители Instinct от следващо поколение с кодово име MI300. Това ново GPU и CPU ускорено семейство ще бъде водещият продукт в AI сегмента, който е номер 1 на AMD и най-важният стратегически приоритет в момента, тъй като най-накрая пуска продукт, който е не само усъвършенстван, но и е проектиран да отговаря на критичните Изисквания за AI в индустрията. Класът MI300 на AI ускорителите ще бъде друга мощност на чиплетите, използвайки усъвършенствани технологии за пакетиране от TSMC, така че нека да видим какво има под капака на тези AI чудовища.

AMD Instinct MI300X – Предизвикателство на AI надмощието на NVIDIA с CDNA 3 и огромна памет

AMD Instinct MI300X определено е чипът, който ще бъде подчертан най-много, тъй като е ясно насочен към ускорителите Hopper на NVIDIA и Gaudi на Intel в сегмента на AI. Този чип е проектиран единствено върху архитектурата CDNA 3 и се случват много неща. Чипът ще поддържа комбинация от 5nm и 6nm IP адреси, като всички комбинират до 153 милиарда транзистора (MI300X).

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 2
AMD Instinct MI300X ускорител.

Започвайки с дизайна, основният междинен елемент е изграден с пасивна матрица, която помещава слоя за свързване, използвайки решение Infinity Fabric от следващо поколение. Интерпозерът включва общо 28 матрици, които включват осем пакета HBM3, 16 фиктивни матрици между пакетите HBM и четири активни матрици и всяка от тези активни матрици получава две изчислителни матрици.

Всеки GCD, базиран на CDNA 3 GPU архитектура, разполага с общо 40 изчислителни единици, което се равнява на 2560 ядра. Има общо осем изчислителни матрици (GCD), така че това ни дава общо 320 изчислителни и 20 480 основни единици. Що се отнася до добивите, AMD ще намали малка част от тези ядра и ще получим повече подробности за точните конфигурации след месец.

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 4
AMD Instinct MI300X Accelerator с CDNA 3 умира.

Паметта е друга област, в която ще видите огромен ъпгрейд с MI300X, който може да се похвали с 50% повече HBM3 капацитет от своя предшественик, MI250X (128 GB). За да постигне пул памет от 192 GB, AMD оборудва MI300X с 8 стека HBM3 и всеки стек е 12-Hi, като същевременно включва 16 Gb IC, което ни дава 2 GB капацитет на IC или 24 GB на стек. Паметта ще предлага до 5,2 TB/s честотна лента и 896 GB/s Infinity Fabric Bandwidth. За сравнение, предстоящият H200 AI ускорител на NVIDIA предлага 141 GB капацитет, докато Gaudi 3 от Intel ще предлага 144 GB капацитет. Големите пулове памет имат голямо значение в LLMs, които са предимно обвързани с памет, и AMD определено може да покаже своята мощ на AI, като е водеща в отдела за памет.

232328650_instinct_mi300a_exploded_view_01-custom232328650_instinct_mi300x_exploded_view_01-custom232328650_instinct_mi300a_exploded_view_02-custom232328650_instinct_mi300x_exploded_view_02-custom232328650_instinct_mi300a_cross_section_angle_01-custom232328650_instinct_mi300x_cross_section_angle_01-custom232328650_instinct_mi300a_exploded_view_03-custom232328650_instinct_mi300x_exploded_view_03-custom

По отношение на консумацията на енергия, AMD Instinct MI300X е оценен на 750W, което е 50% увеличение спрямо 500W на Instinct MI250X и 50W повече от NVIDIA H200.

AMD Instinct MI300A – Плътно опаковани Exascale APU вече са реалност

Чакахме от години AMD най-накрая да изпълни обещанието за APU от клас Exascale и денят наближава, тъй като се приближаваме към пускането на пазара на Instinct MI300A. Опаковката на MI300A е много подобна на MI300X, с изключение на това, че използва оптимизиран за TCO капацитет на паметта и Zen 4 ядра.

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 3
AMD Instinct MI300A ускорител.

Една от активните матрици има два CDNA 3 GCD, изрязани и заменени с три Zen 4 CCD, които предлагат собствен отделен набор от кеш и основни IP адреси. Получавате 8 ядра и 16 нишки на CCD, така че това са общо 24 ядра и 48 нишки на активната матрица. Има и 24 MB L2 кеш (1 MB на ядро) и отделен пул от кеш (32 MB на CCD). Трябва да се помни, че CDNA 3 GCD също имат отделен L2 кеш.

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 5
AMD Instinct MI300A Accelerator с CDNA 3 & Zen 4 умира.

Завършвайки някои от подчертаните характеристики на ускорителите AMD Instinct MI300, имаме:

  • Първи интегриран CPU+GPU пакет
  • Насочване към пазар на суперкомпютри в екзамащаб
  • AMD MI300A (интегриран CPU + GPU)
  • AMD MI300X (само GPU)
  • 153 милиарда транзистори
  • До 24 Zen 4 ядра
  • CDNA 3 GPU архитектура
  • До 192 GB HBM3 памет
  • До 8 чиплета + 8 стека памет (5nm + 6nm процес)

Обединявайки всичко това, AMD ще работи със своите екосистемни активатори и партньори, за да предложи MI300 AI ускорители в 8-посочни конфигурации, включващи SXM дизайни, които се свързват към дънната платка с мецанин конектори. Ще бъде интересно да се види какъв вид конфигурации ще се предлагат в тях и докато SXM платките са даденост, можем да очакваме и няколко варианта във форм факторите PCI-E.

amd-instinct-mi300-ai-ускорители-сървъри-_2amd-instinct-mi300-ai-ускорители-сървъри-_1amd-instinct-mi300-ai-ускорители-сървъри-_4amd-instinct-mi300-ai-ускорители-сървъри-_5amd-instinct-mi300-ai-ускорители-сървъри-_3

Засега AMD трябва да знаят, че техните конкуренти също вървят с пълна пара напред в манията по AI, като NVIDIA вече обяви огромни цифри за своите графични процесори Blackwell за 2024 г., а Intel подготвя своите графични процесори Guadi 3 и Falcon Shores за пускане през следващите години. Едно нещо е сигурно в настоящия момент, клиентите на AI ще погълнат почти всичко, което могат да получат и всеки ще се възползва от това. Но AMD има много страхотно решение, което не само се стреми да бъде алтернатива на NVIDIA, но и лидер в AI сегмента и се надяваме, че MI300 може да им помогне да постигнат този успех.

AMD Radeon Instinct ускорители

Име на ускорителя AMD Instinct MI400 AMD Instinct MI300 AMD Instinct MI250X AMD Instinct MI250 AMD Instinct MI210 AMD Instinct MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
Архитектура на процесора Zen 5 (Exascale APU) Zen 4 (Exascale APU) N/A N/A N/A N/A N/A N/A N/A N/A N/A
GPU архитектура CDNA 4 Аква Ванджарам (CDNA 3) Алдебаран (CDNA 2) Алдебаран (CDNA 2) Алдебаран (CDNA 2) Арктур ​​(CDNA 1) Вега 20 Вега 20 Вега 10 Фиджи XT Поларис 10
Процесен възел на GPU 4nm 5nm+6nm 6 nm 6 nm 6 nm 7nm FinFET 7nm FinFET 7nm FinFET 14nm FinFET 28nm 14nm FinFET
GPU чиплети TBD 8 (MCM) 2 (MCM)
1 (на зар)
2 (MCM)
1 (на зар)
2 (MCM)
1 (на зар)
1 (Монолитна) 1 (Монолитна) 1 (Монолитна) 1 (Монолитна) 1 (Монолитна) 1 (Монолитна)
GPU ядра TBD До 19 456 14 080 13,312 6656 7680 4096 3840 4096 4096 2304
Тактова честота на GPU TBD TBA 1700 MHz 1700 MHz 1700 MHz 1500 MHz 1800 MHz 1725 MHz 1500 MHz 1000 MHz 1237 MHz
FP16 Изчисляване TBD TBA 383 върхове 362 върхове 181 върхове 185 TFLOPs 29,5 TFLOPs 26,5 TFLOPs 24,6 TFLOPs 8.2 TFLOPs 5.7 TFLOPs
FP32 Compute TBD TBA 95,7 TFLOPs 90,5 TFLOPs 45,3 TFLOPs 23.1 TFLOPs 14,7 TFLOPs 13.3 TFLOPs 12.3 TFLOPs 8.2 TFLOPs 5.7 TFLOPs
FP64 Compute TBD TBA 47,9 TFLOPs 45,3 TFLOPs 22,6 TFLOPs 11,5 TFLOPs 7.4 TFLOPs 6.6 TFLOPs 768 GFLOPs 512 GFLOPs 384 GFLOPs
VRAM TBD 192 GB HBM3 128 GB HBM2e 128 GB HBM2e 64 GB HBM2e 32 GB HBM2 32 GB HBM2 16 GB HBM2 16 GB HBM2 4 GB HBM1 16 GB GDDR5
Часовник с памет TBD 5,2 Gbps 3,2 Gbps 3,2 Gbps 3,2 Gbps 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz
Шина на паметта TBD 8192-битов 8192-битов 8192-битов 4096-битов 4096-битова шина 4096-битова шина 4096-битова шина 2048-битова шина 4096-битова шина 256-битова шина
Честотна лента на паметта TBD 5,2 TB/s 3,2 TB/s 3,2 TB/s 1,6 TB/s 1,23 TB/s 1 TB/s 1 TB/s 484 GB/s 512 GB/s 224 GB/s
Форма фактор TBD OAM OAM OAM Двуслотова карта Двоен слот, цяла дължина Двоен слот, цяла дължина Двоен слот, цяла дължина Двоен слот, цяла дължина Двоен слот, половин дължина Единичен слот, цяла дължина
Охлаждане TBD Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане Пасивно охлаждане
TDP (макс.) TBD 750W 560W 500W 300W 300W 300W 300W 300W 175W 150W