AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel

AMD Instinct MI300X & MI300A са едни от най-очакваните ускорители в AI сегмента, които ще бъдат пуснати следващия месец. Има много очаквания около първия пълноценен AI шедьовър на AMD и днес решихме да ви дадем обобщение на това какво да очаквате от това техническо чудо.

AMD Instinct MI300X е проектиран за GPU-ускорени AI работни натоварвания, докато MI300A се справя с HPC с най-модерния технически APU пакет

На 6 декември AMD ще бъде домакин на своята основна бележка „Advancing AI“ , където една от основните програми е да направи пълно разкриване на фамилията ускорители Instinct от следващо поколение с кодово име MI300. Това ново GPU и CPU ускорено семейство ще бъде водещият продукт в AI сегмента, който е номер 1 на AMD и най-важният стратегически приоритет в момента, тъй като най-накрая пуска продукт, който е не само усъвършенстван, но и е проектиран да отговаря на критичните Изисквания за AI в индустрията. Класът MI300 на AI ускорителите ще бъде друга мощност на чиплетите, използвайки усъвършенствани технологии за пакетиране от TSMC, така че нека да видим какво има под капака на тези AI чудовища.

AMD Instinct MI300X – Предизвикателство на AI надмощието на NVIDIA с CDNA 3 и огромна памет

AMD Instinct MI300X определено е чипът, който ще бъде подчертан най-много, тъй като е ясно насочен към ускорителите Hopper на NVIDIA и Gaudi на Intel в сегмента на AI. Този чип е проектиран единствено върху архитектурата CDNA 3 и се случват много неща. Чипът ще поддържа комбинация от 5nm и 6nm IP адреси, като всички комбинират до 153 милиарда транзистора (MI300X).

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 2 — AMD Instinct MI300X ускорител.

Започвайки с дизайна, основният междинен елемент е изграден с пасивна матрица, която помещава слоя за свързване, използвайки решение Infinity Fabric от следващо поколение. Интерпозерът включва общо 28 матрици, които включват осем пакета HBM3, 16 фиктивни матрици между пакетите HBM и четири активни матрици и всяка от тези активни матрици получава две изчислителни матрици.

Всеки GCD, базиран на CDNA 3 GPU архитектура, разполага с общо 40 изчислителни единици, което се равнява на 2560 ядра. Има общо осем изчислителни матрици (GCD), така че това ни дава общо 320 изчислителни и 20 480 основни единици. Що се отнася до добивите, AMD ще намали малка част от тези ядра и ще получим повече подробности за точните конфигурации след месец.

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 4 — AMD Instinct MI300X Accelerator с CDNA 3 умира.

Паметта е друга област, в която ще видите огромен ъпгрейд с MI300X, който може да се похвали с 50% повече HBM3 капацитет от своя предшественик, MI250X (128 GB). За да постигне пул памет от 192 GB, AMD оборудва MI300X с 8 стека HBM3 и всеки стек е 12-Hi, като същевременно включва 16 Gb IC, което ни дава 2 GB капацитет на IC или 24 GB на стек. Паметта ще предлага до 5,2 TB/s честотна лента и 896 GB/s Infinity Fabric Bandwidth. За сравнение, предстоящият H200 AI ускорител на NVIDIA предлага 141 GB капацитет, докато Gaudi 3 от Intel ще предлага 144 GB капацитет. Големите пулове памет имат голямо значение в LLMs, които са предимно обвързани с памет, и AMD определено може да покаже своята мощ на AI, като е водеща в отдела за памет.

232328650_instinct_mi300a_exploded_view_01-custom

232328650_instinct_mi300x_exploded_view_01-custom

По отношение на консумацията на енергия, AMD Instinct MI300X е оценен на 750W, което е 50% увеличение спрямо 500W на Instinct MI250X и 50W повече от NVIDIA H200.

AMD Instinct MI300A – Плътно опаковани Exascale APU вече са реалност

Чакахме от години AMD най-накрая да изпълни обещанието за APU от клас Exascale и денят наближава, тъй като се приближаваме към пускането на пазара на Instinct MI300A. Опаковката на MI300A е много подобна на MI300X, с изключение на това, че използва оптимизиран за TCO капацитет на паметта и Zen 4 ядра.

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 3 — AMD Instinct MI300A ускорител.

Една от активните матрици има два CDNA 3 GCD, изрязани и заменени с три Zen 4 CCD, които предлагат собствен отделен набор от кеш и основни IP адреси. Получавате 8 ядра и 16 нишки на CCD, така че това са общо 24 ядра и 48 нишки на активната матрица. Има и 24 MB L2 кеш (1 MB на ядро) и отделен пул от кеш (32 MB на CCD). Трябва да се помни, че CDNA 3 GCD също имат отделен L2 кеш.

AMD Instinct MI300X & MI300A AI ускорители с подробности: CDNA 3 и Zen 4 се събират в усъвършенствана опаковка Marvel 5 — AMD Instinct MI300A Accelerator с CDNA 3 & Zen 4 умира.

Завършвайки някои от подчертаните характеристики на ускорителите AMD Instinct MI300, имаме:

Първи интегриран CPU+GPU пакет
Насочване към пазар на суперкомпютри в екзамащаб
AMD MI300A (интегриран CPU + GPU)
AMD MI300X (само GPU)
153 милиарда транзистори
До 24 Zen 4 ядра
CDNA 3 GPU архитектура
До 192 GB HBM3 памет
До 8 чиплета + 8 стека памет (5nm + 6nm процес)

Обединявайки всичко това, AMD ще работи със своите екосистемни активатори и партньори, за да предложи MI300 AI ускорители в 8-посочни конфигурации, включващи SXM дизайни, които се свързват към дънната платка с мецанин конектори. Ще бъде интересно да се види какъв вид конфигурации ще се предлагат в тях и докато SXM платките са даденост, можем да очакваме и няколко варианта във форм факторите PCI-E.

amd-instinct-mi300-ai-ускорители-сървъри-_2

amd-instinct-mi300-ai-ускорители-сървъри-_1

Засега AMD трябва да знаят, че техните конкуренти също вървят с пълна пара напред в манията по AI, като NVIDIA вече обяви огромни цифри за своите графични процесори Blackwell за 2024 г., а Intel подготвя своите графични процесори Guadi 3 и Falcon Shores за пускане през следващите години. Едно нещо е сигурно в настоящия момент, клиентите на AI ще погълнат почти всичко, което могат да получат и всеки ще се възползва от това. Но AMD има много страхотно решение, което не само се стреми да бъде алтернатива на NVIDIA, но и лидер в AI сегмента и се надяваме, че MI300 може да им помогне да постигнат този успех.

AMD Radeon Instinct ускорители

Име на ускорителя	AMD Instinct MI400	AMD Instinct MI300	AMD Instinct MI250X	AMD Instinct MI250	AMD Instinct MI210	AMD Instinct MI100	AMD Radeon Instinct MI60	AMD Radeon Instinct MI50	AMD Radeon Instinct MI25	AMD Radeon Instinct MI8	AMD Radeon Instinct MI6
Архитектура на процесора	Zen 5 (Exascale APU)	Zen 4 (Exascale APU)	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A	N/A
GPU архитектура	CDNA 4	Аква Ванджарам (CDNA 3)	Алдебаран (CDNA 2)	Алдебаран (CDNA 2)	Алдебаран (CDNA 2)	Арктур (CDNA 1)	Вега 20	Вега 20	Вега 10	Фиджи XT	Поларис 10
Процесен възел на GPU	4nm	5nm+6nm	6 nm	6 nm	6 nm	7nm FinFET	7nm FinFET	7nm FinFET	14nm FinFET	28nm	14nm FinFET
GPU чиплети	TBD	8 (MCM)	2 (MCM) 1 (на зар)	2 (MCM) 1 (на зар)	2 (MCM) 1 (на зар)	1 (Монолитна)	1 (Монолитна)	1 (Монолитна)	1 (Монолитна)	1 (Монолитна)	1 (Монолитна)
GPU ядра	TBD	До 19 456	14 080	13,312	6656	7680	4096	3840	4096	4096	2304
Тактова честота на GPU	TBD	TBA	1700 MHz	1700 MHz	1700 MHz	1500 MHz	1800 MHz	1725 MHz	1500 MHz	1000 MHz	1237 MHz
FP16 Изчисляване	TBD	TBA	383 върхове	362 върхове	181 върхове	185 TFLOPs	29,5 TFLOPs	26,5 TFLOPs	24,6 TFLOPs	8.2 TFLOPs	5.7 TFLOPs
FP32 Compute	TBD	TBA	95,7 TFLOPs	90,5 TFLOPs	45,3 TFLOPs	23.1 TFLOPs	14,7 TFLOPs	13.3 TFLOPs	12.3 TFLOPs	8.2 TFLOPs	5.7 TFLOPs
FP64 Compute	TBD	TBA	47,9 TFLOPs	45,3 TFLOPs	22,6 TFLOPs	11,5 TFLOPs	7.4 TFLOPs	6.6 TFLOPs	768 GFLOPs	512 GFLOPs	384 GFLOPs
VRAM	TBD	192 GB HBM3	128 GB HBM2e	128 GB HBM2e	64 GB HBM2e	32 GB HBM2	32 GB HBM2	16 GB HBM2	16 GB HBM2	4 GB HBM1	16 GB GDDR5
Часовник с памет	TBD	5,2 Gbps	3,2 Gbps	3,2 Gbps	3,2 Gbps	1200 MHz	1000 MHz	1000 MHz	945 MHz	500 MHz	1750 MHz
Шина на паметта	TBD	8192-битов	8192-битов	8192-битов	4096-битов	4096-битова шина	4096-битова шина	4096-битова шина	2048-битова шина	4096-битова шина	256-битова шина
Честотна лента на паметта	TBD	5,2 TB/s	3,2 TB/s	3,2 TB/s	1,6 TB/s	1,23 TB/s	1 TB/s	1 TB/s	484 GB/s	512 GB/s	224 GB/s
Форма фактор	TBD	OAM	OAM	OAM	Двуслотова карта	Двоен слот, цяла дължина	Двоен слот, цяла дължина	Двоен слот, цяла дължина	Двоен слот, цяла дължина	Двоен слот, половин дължина	Единичен слот, цяла дължина
Охлаждане	TBD	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане	Пасивно охлаждане
TDP (макс.)	TBD	750W	560W	500W	300W	300W	300W	300W	300W	175W	150W