Что такое gpu в компьютере

Что такое gpu в компьютере - Текстурные блоки Контроллер памяти Ядра Tensor и RT

Что такое графический процессор в компьютере? Основным чипом на материнской плате является центральный процессор (CPU). Центральный, потому что он контролирует все остальные подсистемы с помощью…

Что такое gpu в компьютере

Главный чип на материнской плате — это центральный процессор (CPU). Центральный, потому что он управляет всеми другими подсистемами, используя систему шин и набор микросхем.

Подсистема, управляющая отображением и отображением информации на экране, называется видеосистемой. Он интегрируется в материнскую плату через слот для видеокарты. Видеокарта — это инженерное решение и представляет собой карту со своим собственным процессором (следовательно, графическим процессором) и оперативной памятью.

Графический процессор NVidia Nv45 на видеокарте

Процессор на видеокарте называется GPU (Graphic Processor Unit), чтобы подчеркнуть:

  1. Что это за процессор.
  2. Что не является центральным, то есть подчиненным процессором.
  3. Которая ориентирована на обработку специальных данных — графиков.

Размещение GPU на материнской плате

Поскольку обработка графики — это специализация в обработке данных, графический процессор является специализированным процессором. Логически специализация выражается отделением GPU от CPU, физически — в том, что GPU структурирован иначе.

CPU содержит десятки ядер, GPU — тысячи

Такая реализация физического GPU оправдана необходимостью обрабатывать тысячи параллельных задач рендеринга. ЦП ориентирован на обработку данных: длинные и последовательные задачи.

Современный ЦП (ЦП) может включать в себя графический процессор.

1636661368

Четырехъядерный процессор с дополнительным графическим ядром GPU

Это решение позволяет компьютеру обходиться без видеокарты благодаря встроенному в центральный процессор графическому процессору. Это снижает потребление энергии на 30–180%. В этом случае стоимость процессора увеличивается не более чем на 20%.

Главный недостаток такой реализации — низкая производительность. Это решение подходит для офисных компьютеров, где они работают с документами и базами данных, но на нем невозможно запустить современную компьютерную игру, Photoshop будет тормозить, а AutoCAD может дать сбой.

Как узнать GPU в компьютере

Для пользователя графический процессор прочно ассоциируется с видеокартой, хотя это всего лишь процессор. Знать, какая видеокарта установлена ​​в вашем компьютере, полезно в трех случаях:

  • при установке или обновлении драйверов;
  • при оценке компьютера на соответствие программным системным требованиям;
  • показать друзьям.

Если все драйверы установлены на вашем компьютере, самый быстрый способ — поискать в Диспетчере устройств в разделе «Адаптеры дисплея:

1636661368-1

Просмотреть графический процессор в диспетчере устройств

Если драйверы не установлены, в диспетчере устройств будет отображаться только надпись на неизвестных устройствах:

1636661369

GPU в диспетчере устройств без драйверов

В этом случае скачайте утилиту CPU-Z, запустите ее и перейдите во вкладку «Графика):

Просмотрщик графических процессоров в программе CPU-Z

Рабочая температура видеокарты. Программа для измерения температуры процессора и видеокарты Современные графические ускорители, в отличие от своих предшественников, появились на заре развития…

Как проверить температуру видеокарты

Если у вас проблемы с производительностью вашего компьютера, он часто «тормозит», «заикается», особенно при игре в компьютерные игры, редактировании или воспроизведении видео, первое, что вам нужно сделать, это проверить температуру видеокарты.

Во-первых, следует отметить, что большинство видеокарт рассчитано на довольно высокие температурные пороги. Многие видеоадаптеры работают при температуре 60-70 градусов по Цельсию, и это абсолютно нормально.

1636661370

Если вы все еще подозреваете, что с вашей видеокартой что-то не так, вам следует узнать ее температуру, и если она окажется выше 100 градусов, то вам следует принять меры для охлаждения или заменить видеоадаптер. Вам необходимо выявить и устранить проблему как можно скорее, перегрев видеокарты может привести к ее поломке и повреждению остальных компонентов компьютера.

Кроме того, следует отметить, что порог в 100 градусов Цельсия не является эталонным значением. Температурные ограничения зависят от производителя видеокарты и ее типа (встроенная, дискретная, для настольного компьютера, ноутбука и т.д.).

Самый простой способ проверить температуру видеокарты — воспользоваться специализированными программами. Давайте посмотрим на некоторые утилиты, которые можно использовать для этого.

GPU-Z — очень простая программа и, на мой взгляд, лучшая программа для определения температуры видеочипа. Вы можете скачать его по этой ссылке: https://www.techpowerup.com/gpuz/

Первая «Видеокарта» показывает основные характеристики видеокарты, такие как тактовая частота, объем памяти, версия драйвера и так далее. Если у вас 2 видеоадаптера (например, встроенный и незаметный), то в нижнем левом углу окна вы можете выбрать студийную карту.

1636661371

Но нас больше будет интересовать вторая вкладка «Датчики». Здесь вы увидите желаемый параметр «Температура графического процессора», который покажет текущее значение температуры видеочипа.

1636661371-1

Если постоянно щелкать по значению температуры, будут отображаться минимальное, максимальное и среднее значения за измеренный период.

Speccy

Загрузите и установите программу по этой ссылке: https://www.piriform.com/Speccy

После запуска приложения вы увидите основные функции своего компьютера. В разделе «Графика» или «Графические устройства» (в зависимости от выбранного языка интерфейса) будет отображаться текущая температура вашего видеоадаптера.

1636661372

Левое меню содержит пункты, которые отвечают за другие компоненты вашего компьютера. Выбрав соответствующий пункт, вы можете просмотреть более подробную информацию об отдельных компонентах.

Недостатком этой программы является то, что она не всегда отображает температуру видеокарт, особенно интегрированных.

HWMonitor

Далее давайте взглянем на еще одну простую утилиту HWMonitor. Установщик или портативную версию можно скачать с официального сайта: https://www.cpuid.com/softwares/hwmonitor.html

1636661373

Здесь, как и в предыдущей программе, будут отображаться значения датчиков основных компонентов компьютера. Текущую, минимальную и максимальную температуру видеочипа можно посмотреть в соответствующем пункте.

SpeedFan

Загрузите программу здесь: https://www.almico.com/sfdownload.php

Первая вкладка справа отобразит список датчиков температуры и их значения.

1636661374

Нас будет интересовать только пункт «GPU», который будет отображать текущую температуру видеокарты.

HWinfo

Официальный сайт — https://www.hwinfo.com/

Вы можете загрузить портативные версии или установить для 32- или 64-разрядных систем.

Как и большинство подобных программ, HWinfo используется для отображения информации о различных компонентах компьютера. Чтобы узнать показания температуры видеоадаптера, нажмите кнопку «Датчики» и найдите нужный раздел в списке датчиков.

1636661375

AIDA64

Это платная программа для тестирования и диагностики компьютера, с помощью которой также можно посмотреть температуру видеочипа. Хотя приложение является платным, у него есть 30-дневный пробный период, которого достаточно для просмотра и тестирования желаемой метрики.

Сайт — https://www.aida64.ru/

После запуска приложения вам необходимо перейти к следующему пункту «Компьютеры -> Датчики» в древовидном списке слева. Здесь вы увидите список показаний основных датчиков компьютера, включая температуру видеокарты.

1636661375-1

Существуют также специализированные утилиты для некоторых моделей видеокарт (например, NVIDIA Control Panel, NVIDIA GPU Temp, ATI Tool, ATI Tray Tools и т.д.), С помощью которых также можно определить температуру видеокарты, но поскольку они не подходят для все видеоадаптеры, мы не будем их рассматривать в этой статье.

В заключение хотелось бы сказать, что основными причинами слишком высокой температуры видеокарты являются: пыль на вентиляторе карты и в системном блоке, плохой воздухообмен, выход из строя радиатора и засыхание термопасты на GPU.

Диспетчер задач Windows 10 в версиях 1709 и 1803 предоставляет подробную информацию о производительности видеокарт (GPU). Мы более подробно расскажем, как просматривать и интерпретировать данные о работе видеокарт

Как отслеживать производительность видеокарты в Windows 10

С выпуском Windows 10 (версия 1709) в диспетчере задач Windows 10 появилась возможность отслеживать данные о производительности графического процессора (GPU). Пользователи могут анализировать эту информацию, чтобы понять, как используются ресурсы видеокарты, которые все чаще используются в вычислениях.

Это означает, что все графические процессоры, установленные на ПК, будут показаны на вкладке «Производительность». Кроме того, на вкладке «Процессы» вы можете увидеть, какие процессы обращаются к графическому процессору, а данные об использовании памяти графического процессора можно найти на вкладке «Подробности”.

Как проверить поддерживается ли функция просмотра производительности графического процессора

Хотя в диспетчере задач нет особых требований для мониторинга ЦП, памяти, диска или сетевых карт, ситуация с графическими процессорами немного отличается.

В Windows 10 информация о графическом процессоре доступна в диспетчере задач только при использовании архитектуры Windows Display Driver Model (WDDM). WDDM — это архитектура графического драйвера для видеокарты, которая позволяет отображать рабочий стол и приложения на экране.

WDDM предоставляет графическое ядро, которое включает планировщик (VidSch) и диспетчер видеопамяти (VidMm). Именно эти модули отвечают за принятие решений при использовании ресурсов GPU.

Диспетчер задач получает информацию об использовании ресурсов графического процессора напрямую от планировщика и диспетчера видеопамяти графического ядра. Более того, это верно как в случае интегрированных графических процессоров, так и в случае специализированных графических процессоров. Для правильной работы этой функции требуется WDDM версии 2.0 или более поздней.

Чтобы проверить, поддерживают ли ваши устройства отображение данных графического процессора в диспетчере задач, выполните следующие действия:

  1. Используйте сочетание клавиш Windows Key + R, чтобы открыть команду «Выполнить”.
  2. Введите dxdiag.exe, чтобы открыть средство диагностики DirectX, и нажмите Enter).
  3. Щелкните вкладку «Просмотр”.
  4. В правом разделе «Драйвер» посмотрите значение модели драйвера.

1636661376

Если вы используете WDDM 2.0 или новее, диспетчер задач отобразит использование графического процессора на вкладке «Производительность”.

Как отслеживать производительность графического процессора с помощью Диспетчера задач

Чтобы отслеживать данные о производительности графического процессора с помощью диспетчера задач, просто щелкните правой кнопкой мыши панель задач и выберите «Диспетчер задач». Если активен компактный вид, нажмите кнопку «Подробности», а затем перейдите на вкладку «Производительность”.

Совет: Чтобы быстро запустить Диспетчер задач, вы можете использовать сочетание клавиш Ctrl + Shift + Esc

Вкладка Производительность

Если ваш компьютер поддерживает WDDM версии 2.0 или новее, ваш графический процессор будет отображаться на левой панели вкладки «Производительность». Если в системе установлено несколько графических процессоров, каждый из них будет отображаться с использованием номера, соответствующего его физическому расположению, например, GPU 0, GPU 1, GPU 2 и т.д.

1636661377

Windows 10 поддерживает объединение нескольких графических процессоров с использованием режимов Nvidia SLI и AMD Crossfire. Когда одна из этих конфигураций обнаружена в системе, на вкладке «Производительность» каждая ссылка будет обозначена номером (например, «Ссылка 0», «Ссылка 1» и т.д.). Пользователь сможет видеть и управлять каждым графическим процессором в комплекте.

Графический процессор

На странице, посвященной конкретному графическому процессору, вы найдете сводку данных о производительности, обычно разделенную на два раздела.

Раздел GPU содержит обновленную информацию о движках самого графического процессора, а не его отдельных ядрах.

Диспетчер задач по умолчанию отображает четыре наиболее востребованных движка графического процессора, которые по умолчанию включают 3D, копирование, декодирование видео и обработку видео, но вы можете изменить эти представления, щелкнув имя и выбрав другой движок.

1636661379

Пользователь может даже изменить отображение графика на ползунок, щелкнув правой кнопкой мыши в любом месте раздела и выбрав параметр «Изменить график> Одноядерный».

1636661380

Оперативная память

Под графиками движка находится блок данных о потреблении видеопамяти.

В диспетчере задач отображаются два типа видеопамяти: общая и выделенная.

Выделенная память — это память, которая будет использоваться только видеокартой. Обычно это объем VRAM на дискретных картах или объем памяти, доступной процессору, на котором компьютер настроен для явного резервирования.

1636661382

Параметр «Зарезервированная память» отображается в правом нижнем углу: этот объем памяти зарезервирован для видеодрайвера.

Объем памяти, выделенной в этом разделе, представляет собой объем памяти, активно используемый процессами, а объем совместно используемой памяти в этом разделе представляет собой объем системной памяти, потребляемой для графических целей.

Кроме того, на левой панели под именем графического процессора вы увидите текущий процент использования графического процессора. Важно отметить, что диспетчер задач использует самый загруженный процент движка для представления общего использования.

1636661384

Чтобы просмотреть данные о производительности с течением времени, запустите приложение с интенсивным использованием графического процессора, например видеоигру.

Вкладка Процессы

Вы также можете отслеживать производительность графического процессора на вкладке «Процессы». В этом разделе вы найдете общую сводку для конкретного процесса.

Столбец GPU показывает наиболее активное использование движка для представления общего использования ресурсов GPU конкретным процессом.

1636661388

Однако может возникнуть путаница, если несколько механизмов сообщат об использовании 100%. Дополнительный столбец «Ядро графического процессора» предоставляет подробную информацию о ядре, загруженном этим процессом.

Заголовок столбца на вкладке «Процессы» показывает общее потребление ресурсов всеми доступными графическими процессорами в системе.

1636661390

Если вы не видите эти столбцы, щелкните правой кнопкой мыши заголовок любого столбца и установите соответствующие флажки.

Вкладка Подробности

По умолчанию на вкладке Details не отображается информация о графическом процессоре, но вы всегда можете щелкнуть правой кнопкой мыши заголовок столбца, выбрать параметр Выбрать столбцы и включить следующие параметры:

  • GPU
  • Ядро графического процессора
  • Выделенная память графического процессора
  • Общая память графического процессора

На вкладках Память отображается общий и выделенный объем памяти, используемый конкретным процессом, соответственно. Столбцы GPU и Core GPU показывают ту же информацию, что и вкладка «Процессы”.

1636661390

При использовании вкладки Details имейте в виду, что дополнительная память, используемая каждым процессом, может быть больше, чем общая доступная память, поскольку общая память будет подсчитана несколько раз. Эта информация полезна для понимания использования памяти в процессе, но вам необходимо использовать вкладку «Производительность», чтобы просмотреть более точную информацию об использовании графики.

Вывод

Microsoft стремится предоставить пользователям более точный инструмент для оценки производительности графической подсистемы по сравнению со сторонними приложениями. Обратите внимание, что работа над этой функцией продолжается, и в ближайшем будущем возможны улучшения.

Что такое графический процессор в компьютере? Главный чип на материнской плате — это центральный процессор (CPU). Центральный, потому что он контролирует все другие подсистемы, используя

Что такое GPU и для чего нужен

Графический процессор отвечает за создание (рендеринг) изображения.

Упрощая, роль и значение графического процессора можно описать следующим образом:

Графический процессор получает данные от центрального процессора (ЦП) для обработки, необходимой для построения изображения, затем обрабатывает их и подготавливает к дальнейшим операциям, значительно ускоряя процесс формирования изображения и снижая нагрузку на центральный процессор

Графический процессор является дополнительным компонентом и может управляться с центрального.

В отличие от центрального процессора, графический процессор из-за разницы в архитектуре (структурах, устройствах) способен обрабатывать определенные типы операций в десятки, сотни, тысячи раз быстрее, например, обработку данных для построения изображения и не только.

1636661391

Графический процессор может быть дискретным, то есть он может быть частью видеокарты, разработанной как карта (устройство) расширения, установленная в слот расширения на материнской плате, и в этом случае все надстройки находятся на одной печатной плате, которая могут быть легко удалены или заменены в любое время.

1636661392

Или он интегрирован в ту же материнскую плату, что и устройство, и в этом случае графический процессор находится на материнской плате, а все надстройки находятся рядом. Он используется в персональных компьютерах, смартфонах, игровых консолях и так далее.

Часто задаваемые вопросы о видеокартах GeForce: что нужно знать о видеокартах?

FAQ по видеокартам GeForce: что следует знать о графических картах?

Ядро CUDA, потоковый процессор и шейдерный блок — все это синонимы вычислительного блока графического процессора, который выполняет вычисление данных. NVIDIA традиционно называет их ядром CUDA, где CUDA означает Compute Unified Device Architecture. Ядра CUDA отличаются от ядер процессора, намного менее сложны и имеют высокую степень специализации для обрабатываемых данных. Сегодня графические процессоры могут делать гораздо больше, чем просто визуализировать графику через конвейер, поэтому объединение под названиями унифицированного потокового процессора или шейдерного блока вполне разумно.

Потоковый процессор обрабатывает непрерывный поток данных, которых много сотен, и работает параллельно на многих потоковых процессорах. Современные графические процессоры оснащены несколькими тысячами потоковых процессоров и отлично подходят для высокопараллельных задач. Это и графический рендеринг, и научные расчеты. Это, помимо прочего, позволило графическим процессорам закрепиться в серверном сегменте в качестве вычислительных ускорителей.

1636661392-1

Однако потоковые процессоры — довольно общий термин; на практике современные графические процессоры более сложны. Графические процессоры могут выполнять вычисления с плавающей запятой (FP) и целочисленные (INT) с различной точностью. Для графики наиболее важными вычислениями являются FP32 и INT32 с 32-битной точностью. В случае научных расчетов все большее значение приобретают вычисления с большей точностью, то есть FP64. Поэтому теперь у графических процессоров есть выделенные вычислительные блоки для типа данных FP64. Однако не все вычисления требуют 32- и 64-битной точности. Были разработаны методы для выполнения менее точных вычислений с блоками INT32, таких как одновременное выполнение операций с двумя 16-разрядными целыми числами.

Еще одним прорывом можно назвать интеграцию ядер Tensor в архитектуру NVIDIA Volta и Turing, которые способны эффективно вычислять менее сложные числа INT8 и INT4, но об этом позже.

1636661393

Мы рассмотрим структуру вычислительных блоков на основе архитектуры Тьюринга, которые организованы в определенные структуры. Графический процессор TU102 имеет шесть кластеров обработки графики (GPC), 36 кластеров обработки текстур (TPC) и 72 потоковых мультипроцессора (SM). Но на GPU видеокарты GeForce RTX 2080 Ti активны только 34 TPC. Каждый GPC содержит шесть TPC, каждый TPC содержит два потоковых мультипроцессора SM. Последние предлагают 64 потоковых процессора, поэтому 34 потоковых процессора TPC x 2 SM x 64 обеспечивают ровно 4352 потоковых процессора на видеокарте GeForce RTX 2080 Ti.

NVIDIA масштабирует архитектуру Turing с GeForce RTX 2060 до GeForce RTX 2080 Ti. Ниже представлен обзор видеокарт GeForce RTX:

Технические характеристики GeForce RTX

Шаблон GeForce RTX 2080 Ti GeForce RTX 2080 GeForce RTX 2070 GeForce RTX 2060
Цена от 72,600 ₽ от 47 000 от 31 500 с 21.100
Технические характеристики
Архитектура Тьюринг Тьюринг Тьюринг Тьюринг
GPU ТУ102 ТУ104 ТУ106 ТУ106
Технический процесс TSMC 12 нм TSMC 12 нм TSMC 12 нм TSMC 12 нм
Количество транзисторов 18,6 миллиарда 13,6 миллиарда 10,8 миллиарда 10,8 миллиарда
Хрустальная область 754 мм² 545 мм² 445 мм² 445 мм²
Потоковые процессоры 4 352 2 944 2,304 1,920
Тензорные ядра 544 368 288 240
Ядро RT 68 46 36 тридцать
Блоки утка 272 184 144 120
Геометрические блоки 34 23 18 15
ROP 88 64 64 42
Частота GPU (базовая) 1350 МГц 1,515 МГц 1410 МГц 1365 МГц
Частота GPU (Boost) 1,635 МГц 1800 МГц 1710 МГц 1680 МГц
RTX-OPS 78 TRTX-OPS 60 TRTX-OPS 45 TRTX-OPS 37 TRTX-OPS
Гигалучей / с 10 сбоев / с 8 сбоев / с 6 Глуч / с 5 сбоев / с
Частота памяти 1750 МГц 1750 МГц 1750 МГц 1750 МГц
Тип памяти GDDR6 GDDR6 GDDR6 GDDR6
Объем памяти 11 ГБ 8 ГБ 8 ГБ 6 ГБ
Ширина шины памяти 352 бит 256 бит 256 бит 192 бит
Пропускная способность 616 ГБ / сек 448 ГБ / сек 448 ГБ / сек 336 ГБ / сек
TDP 260 Вт 225 Вт 185 Вт 160 Вт
Добавить питание 2x 8-контактный 1x 8 контактов + 1x 6 контактов 1x 8-контактный 1x 8-контактный
SLI / NVLink 2x NVLink 1x NVLink

на рынок также была представлена ​​видеокарта Titan RTX, основанная на полной версии графического процессора TU102. NVIDIA продает Titan RTX как «Ultimate PC GPU», графическую карту, предназначенную для исследователей, ученых и разработчиков в области глубокого обучения и искусственного интеллекта. Полная версия TU102 GPU оснащена шестью кластерами графической обработки (GPC), 36 TPC (кластерами обработки текстур) и 72 потоковыми мультипроцессорами (SM). В случае с Titan RTX мы получаем 4608 потоковых процессоров, 576 ядер Tensor и 96 ядер RT. Полная конфигурация памяти составляет 384 бита, NVIDIA подключает 12 микросхем памяти GDDR6. В случае с Titan RTX NVIDIA использует чипы памяти Samsung на 2 ГБ, которые предлагают до 24 ГБ памяти.

1636661393-1

1636661394

1636661394-1

1636661395

1636661395-1

Одновременные операции с целыми числами и числами с плавающей запятой

Как уже было сказано, вычислительные блоки FP32 могут работать в режиме 2x FP16, то же самое и для INT16. Чтобы повысить производительность обработки и сделать ее более гибкой, архитектура NVIDIA Turing предоставляет возможность одновременно вычислять числа с плавающей запятой и целые числа. NVIDIA проанализировала эти вычисления конвейера рендеринга в десятках игр и обнаружила, что на каждые 100 вычислений FP выполняется около трети вычислений INT. Однако значение среднее, на практике оно колеблется от 20% до 50%. Конечно, если вычисления FP и INT выполняются одновременно, конвейер иногда должен «замедляться» в случае соединений.

1636661396

Во всех предыдущих архитектурах NVIDIA одновременное выполнение целочисленных вычислений и вычислений с плавающей запятой не поддерживалось. В случае Тьюринга все изменилось. Параллельная обработка FP и INT ускоряет рендеринг, поэтому NVIDIA просто добавила его в архитектуру Turing. Turing SM имеет 64 блока FP32 и 64 блока INT32, что не совсем типично для конвейера рендеринга. Но одновременная работа блоков позволила значительно повысить вычислительную производительность.

Потоковые процессоры давно превратились в вычислительные блоки общего назначения в графических процессорах. Конечные вычислительные характеристики зависят от их количества, но здесь следует учитывать точность расчетов.

Текстурные блоки

Потоковые процессоры выполняют так называемые шейдеры, которые представляют собой небольшие программы. Вершинные шейдеры используются для геометрических вычислений и динамически изменяющихся объектов. Шейдеры геометрии позволяют рассчитать окончательную геометрию и структуру объекта по точкам, линиям и треугольникам. Шейдеры тесселяции обеспечивают дальнейшее разделение примитивов (тех же треугольников).

Блоки наложения текстур (TMU) отвечают за обеспечение того, чтобы все поверхности были покрыты соответствующими текстурами. TMU — это специализированные арифметические блоки графического процессора. В случае архитектуры Тьюринга текстурный блок объединяет 16 потоковых процессоров. Данные для блоков кадров хранятся в видеопамяти и могут считываться и записываться оттуда. Поскольку блоки TMU больше не являются полностью внешними арифметическими блоками, а интегрированы в конвейер рендеринга, каждый блок текстуры может обрабатывать объекты несколько раз. Фактически, для рендеринга объекта простых текстур уже недостаточно, использование нескольких слоев позволяет получить трехмерный вид вместо плоской текстуры. Раньше объекты приходилось вычислять несколько раз, и каждый раз, когда блок текстуры применял текстуру, сегодня достаточно обычного процесса рендеринга, блок текстуры может получать данные для многократной обработки из буфера.

Контроллер памяти

Высокая пропускная способность памяти так же важна, как и производительность обработки графического процессора. Только если данные могут быть быстро считаны из видеопамяти в графический процессор и перезаписаны, вычисления будут выполняться достаточно быстро. С одной стороны, есть графический процессор, который выполняет вычисления, а с другой — система кеширования и памяти. Архитектура графического процессора предназначена для использования преимуществ высокой пропускной способности памяти. Производители стараются выжать максимум из подсистемы памяти, поэтому контроллер памяти имеет решающее значение.

Начиная с архитектуры Pascal, NVIDIA придерживается почти идентичной структуры графического процессора для работы с памятью GDDR. Интерфейс памяти разделен на 32-битные блоки. В полной версии NVIDIA предоставляет ширину шины 384 бита, но из-за отключенного 32-битного блока мы получаем от GeForce RTX 2080 Ti 352 бита. Микросхема памяти подключается через каждый 32-битный интерфейс. 352 бит / 32 бит обеспечивает 11 каналов и 11 микросхем памяти GDDR6. В случае GeForce RTX 2080 и GeForce RTX 2070 ширина шины ограничена 256 битами, что составляет восемь каналов и восемь микросхем памяти GDDR6.

Ядра Tensor и RT

Тензорные ядра

В архитектуре Тьюринга NVIDIA представила два новых вычислительных блока, ранее не использовавшихся в графических процессорах. Конечно, ядра Tensor знакомы нам по архитектуре Volta, но там они использовались для научных расчетов. В случае графических процессоров Turing и видеокарт GeForce RTX эти блоки играют особую роль.

Тензорные ядра предназначены для выполнения умножения матриц. Умножение матриц (BLAS GEMM) является наиболее важным компонентом для обучения и вывода сетей глубокого обучения. Операции с матрицами включают получение значений матриц A и B (путем сложения и умножения), после чего результат будет записан в матрицу C. Для матриц 4×4 эти операции выполняются для всех 16 полей. В архитектуре Pascal для выполнения этих операций использовались блоки FP32, поэтому скорость оставляла желать лучшего.

1636661396-1

Тензорные ядра в архитектуре Тьюринга могут запускать INT16, INT8 и INT4. Вычислительная производительность INT8 вдвое выше, чем у INT16, так как можно выполнять две операции INT8 вместо INT16. То же верно и для сравнения INT4 и INT8. В большинстве графических процессоров TU102 NVIDIA перечисляет 576 тензорных ядер. Но с GeForce RTX 2080 мы получаем только 544 тензорных ядра, для которых NVIDIA указывает вычислительную производительность 110 TFLOPS FP16 для игр и обработки изображений. В случае вычислений INT8 получаем 220 TOPS, а INT4, которые еще не используются, уже 440 TOPS.

Основное использование ядер Tensor — это NVIDIA Neural Graphics Framework (NGX). NGX предоставляет интерфейсы для вычислений Deep Learning Super Sampling (DLSS) и различных эффектов постобработки через ANSEL. Но на этом мы остановимся чуть позже.

Ядра RT — это второй тип специальной аппаратной конструкции в архитектуре Тьюринга, которая используется впервые. Полная трассировка лучей отнимает слишком много времени и ресурсов даже при наличии тысяч потоковых процессоров на графический процессор. Именно по этой причине NVIDIA добавила в архитектуру Turing ядра RT, которые выполняют необходимые вычисления для трассировки лучей. И некоторые типы вычислений очень эффективно обрабатываются ядрами RT. Все технологии трассировки лучей сегодня стараются снизить вычислительную нагрузку, для этого используют разные алгоритмы.

Все они основаны на том принципе, что удаленные от луча примитивы не могут с ним пересекаться. Поэтому рассчитывать их нет смысла. Экспоненциальный рост количества лучей приводит к тому, что для каждого луча нужно обрабатывать как можно меньше примитивов, чтобы не увеличивать вычислительную нагрузку.

1636661392-1

Один из способов выбора примитивов — это иерархия ограничивающих объемов (BVH). В случае BVH сцена делится на меньшие и меньшие блоки, в которых присутствуют примитивы. Радиус должен обрабатываться только с теми блоками, которые он пересекает на пути к примитиву. Этот подход чем-то напоминает воксели, которые NVIDIA использует для Voxel Global Illumination (VXGI). BVH — это дерево, в котором вы можете увидеть, какой блок и, в конечном итоге, примитив следует учитывать при вычислениях трассировки лучей.

BVH на классической архитектуре GPU или на CPU может запускаться только через программное обеспечение. Следовательно, потоковые процессоры должны выполнять несколько тысяч инструкций на радиус, включая несколько циклов для поиска блоков и, в конечном итоге, один примитив. Только после нахождения примитива можно выполнять затенение лучей. Вот здесь и пригодятся ядра RT. Они содержат специальные функциональные блоки SFU (Special Function Unit), оптимизированные для поиска необходимых вам блоков и примитива, с которым пересекается луч. Потоковый процессор принимает действие, затем передает его в ядро ​​RT, которое возвращает результат потоковому процессору, и потоковый процессор может выполнять рендеринг дальше по конвейеру.

Оцените статью
The Elder Scrolls Online
Добавить комментарий