Основой 3D-карт AMD Radeon RX Vega 64 Liquid Cooled Edition, RX Vega 64 и RX Vega 56 стала графическая архитектура нового поколения

Продолжая рассказ о 3D-картах AMD Radeon RX Vega 64 Liquid Cooled Edition, RX Vega 64 и RX Vega 56, необходимо остановиться на графическом процессоре, который служит их основой.

Он построен на новой архитектуре Vega, состоит из 12,5 млрд транзисторов и изготавливается по 14-нанометровой технологии FinFET LPP. Процессор рассчитан на работу на тактовой частоте до 1,7 ГГц и включает около 45 МБ памяти SRAM, а для внутренних соединений в нем используется шина Infinity Fabric.

В процессоре есть четыре движка асинхронного исполнения команд, четыре модифицированных геометрических движка и шестьдесят четыре вычислительных блока Compute Unit (CU) нового поколения. По словам AMD, они серьёзно переделаны по сравнению с предыдущими архитектурами. В составе этих CU находится 4096 потоковых процессоров, 256 текстурных блоков и 64 блока ROP.

При проектировании GPU инженеры AMD воспользовались опытом разработки архитектуры Zen, в частности, укоротили и оптимизировали все линии данных на критических участках, что позволило уменьшить задержки на 8%, размер кристалла — на 18%, а энергопотребление — почти вдвое.

Из других изменений отметим удвоенный до 4 МБ объем кэш-памяти второго уровня, который теперь могут использовать блоки ROP, что важно для техник, использующих рендеринг в текстуры. Также чип отличается использованием скоростной памяти HBM второго поколения с поддержкой ECC, важной для профессиональных применений, отличающейся большей плотностью (до 8 раз больший объём памяти на стек) и пропускной способностью. HBM2 имеет шину 2048 бит и работает на частоте, близкой к 1 ГГц, что даёт пропускную способность 484 ГБ/с.

В AMD считают, что память HBM нужно рассматривать как кэш для данных, которые находятся на медленных носителях. По сути, HBM2 в Vega используется как кэш-память последнего уровня для системной памяти и накопителей данных. Архитектура виртуальной памяти основана на основе страниц разного размера, неактивные из которых перемещаются в более медленное хранилище, освобождая кэш для активных страниц памяти. При этом не требуется сложного управления памятью, и хранить все данные в быстрой локальной памяти (кэше) не обязательно. Такой подход позволяет использовать виртуально бесконечный объём ресурсов из многих миллионов треугольников и сотен гигабайт текстурных данных.

Вычислительные блоки Compute Unit теперь поддерживают двойной темп для операций над данными с точностью FP16, совместимый с IEEE. По замерам AMD использование FP16 или смешанной точности по сравнению с точностью FP32 даёт в тесте 3DMark Sierra при постобработке около 20-25% преимущества без видимых потерь в качестве. И это уже можно использовать в существующих графических API.

Кроме этого, в Vega добавили 40 новых инструкций: комбинированных операций для повышения количества исполняемых операций за такт, для использования при майнинге криптовалют, для обработки видеоданных и адресации памяти. А из графических изменений отметим самую полную поддержку DirectX Feature Level 12_1, которая превосходит не только GPU AMD прошлого поколения, но и лучшие графические процессоры NVIDIA — Pascal.

В частности, появилась поддержка Raster Ordered Views, Conservative Rasterization уровня Tier 3 и Tiled Resources уровня Tier 3, что лучше, чем у GPU конкурента. Дополнительный уровень Conservative Rasterization позволяет использовать эти возможности в алгоритмах эффективного отбрасывания невидимой геометрии.

Вообще, AMD давно ратует за изменение существующего геометрического конвейера и введения новых типов шейдеров Primitive Shaders — новой аппаратной стадии конвейера, которая позволит отбрасывать невидимые примитивы очень рано, повышая общую эффективность.

Например, хотя Vega сама по себе вдвое быстрее Fiji по обработке геометрии, предлагаемое изменение конвейера позволяет повысить скорость ещё втрое. Увы, пока что это невозможно использовать в рамках текущих API, но компания сотрудничает с ведущими разработчиками для того, чтобы заинтересовать их.

Никуда не делось эффективное использование асинхронных вычислений, которое является преимуществом решений AMD. Применение этой возможности в DX12-версии игры The Division дало прирост в 13%, а специфические оптимизации основного процесса рендеринга DOOM на PS4, перенесённые на ПК, дали и вовсе 43% прироста в скорости. Были улучшены тайловые оптимизации в Draw Stream Binning Rasterizer, дающие в среднем приросты порядка 10-15% (иногда и больше) в разном программном обеспечении (не только играх), улучшены и геометрические движки для нагрузок с большим количеством геометрии.

Обо всём этом и многом другом мы расскажем подробнее в обзоре видеокарты Radeon RX Vega.
Теги:
AMD
, Vega

Комментировать

↓