В рамках конференции HotChips 34 компания Intel поделились новыми деталями о готовящихся к выпуску серверных ускорителях вычислений Ponte Vecchio, у которых на одной подложке объединены 63 отдельных элемента (47 функциональных включая GPU). В частности, эксперты компании рассказали о максимальной пропускной способности и производительности ускорителя Ponte Vecchio в вычислениях с одинарной и двойной точностью.
В составе Ponte Vecchio используются кристаллы, выполненные по трём разным техпроцессам: Intel 7 (10 нм Enhanced SuperFin), TSMC N7 (7 нм) и TSMC N5 (5 нм). Они объединены между собой с помощью новой упаковкой Foveros и шиной EMIB. В составе одного Ponte Vecchio присутствуют 128 графических ядер Xe, 128 ускорителей трассировки лучей, 64 Мбайт кеш-памяти L1 и 408 Мбайт кеш-памяти L2. Данные ускорители также получили до 128 Гбайт высокоскоростной памяти HBM2e и поддерживают интерфейс PCIe 5.0.
По словам Intel, в задачах, созданных на языке Data Parallel C++ (DPC++), ускорители Ponte Vecchio обеспечивают в 1,4–2,5 раза более высокую производительность по сравнению с серверными ускорителями вычислений NVIDIA A100. Intel также предоставила данные о производительности своего решения в ExaSMR OpenMC (современный код Монте-Карло для исследований и разработок), где Ponte Vecchio обеспечивает вдвое более высокую производительность. А в NekRS (для решения уравнений Навье–Стокса) решение Intel показывает производительность в 1,3–1,7 раза выше конкурента.
Ожидалось, что Intel Ponte Vecchio вместе с серверными процессорами Intel Sapphire Rapids Xeon дебютируют в составе первого американского эксафлопсного суперкомпьютера Aurora. Однако из-за задержки разработки это звание перехватил суперкомпьютер Frontier, оснащённый третьим поколением процессоров AMD EPYC и графическими ускорителями AMD Instinct MI250X, выдающими пиковую производительность в 1,1 Эфлопс.
Когда состоится релиз Ponte Vecchio — пока неизвестно. Однако на его замену Intel уже готовит ускоритель Rialto Bridge.
Источник: 3dnews.ru