.kkrieger
Nvidia популярнее, но AMD не сильно отстает по используемым технологиям, а конкуренция только на пользу рынку.
Производители видеокарт
Интегрированные (встроенные) видеокарты
Дискретные (не встроенные) видеокарты
AGP
PCI-Express x16 (v1.1; v2.0; v2.1; v3.0)
Пропускная способность шины PCI Express
PCI Express 2.0
GPU - Graphic Processing Unit
Графические процессоры видеокарт
Объём и тип памяти видеокарты
Сколько памяти необходимо для видеокарты.
Размеры видеокарт
Разъемы и выходы
Выбор системы охлаждения графического адаптера
Охлаждение видеокарт
Примеры видеокарт разных ценовых сегментов
Начальные игровые видеокарты
Начальные игровые видеокарты
Средние игровые видеокарты
Средние игровые видеокарты
Хорошие видеокарты
Хорошие видеокарты
Топовые видеокарты
Топовые видеокарты
Выбираем профессиональную видеокарту
Выбираем профессиональную видеокарту
Tesla
NVS
Quadro
Для чего требуются профессиональные видеокарты
Полигон
Ключевые отличия между игровой и профессиональной видеокартой
Видеопамять
Заключение
Мультимедийные видеокарты 
В чем разница между видеокартами Nvidia и ATI ?
Начнем с Nvidia:
А теперь посмотрим на аналоги AMD:
кранчинг / майнинг
Какая видеокарта лучше для ноутбука?
Выбор комбинации из двух и более видеокарт (CrossFireX и NVIDIA SLI)
ATI CrossFire
Принципы построения
CrossFire-систему можно организовать тремя способами:
Алгоритмы построения изображений
Алгоритмы построения изображений
Алгоритмы построения изображений
NVIDIA SLI
SLI AA
энергопотребление видеокарты.
Физические ускорители 
Разница между CPU и GPU в параллельных расчётах
CUDA
Где используются CUDA?
Где будут полезны ядра?
Компания NVIDIA приводит такой график роста производительности CPU и GPU
Это лишь некоторые примеры ускорений синтетического кода на GPU против SSE-векторизованного кода на CPU (по данным NVIDIA):
Перечислим основные характеристики CUDA:
Что представляют собой системы аппаратного ускорения видео?
ATI Stream Technology
16.06M
Category: electronicselectronics

Kkrieger. Полная версия игры

1.

2.

3.

4.

5.

6. .kkrieger

Полная версия игры занимает всего 97,280 байт дискового пространства, благодаря тому, что все
игровые ресурсы — текстуры, модели, геометрия уровня, музыка и звук — генерируются программно с
помощью различных алгоритмов. Текстуры генерируются «на лету» методом процедурного
текстурирования. Исполняемый файл игры запакован программой Kkrunchy. Музыка и звук в игре
сделаны с помощью многофункционального синтезатора V2[1], который синтезирует звук и
воспроизводит музыку в реальном времени. По словам разработчиков, сам по себе,.kkrieger занимал
бы около 200—300 МБ если бы для хранения использовался традиционный метод.
The "official" minimum specs for .kkrieger: chapter 1 beta are:
• A 1.5GHz pentium 3 / athlon or faster.
• 512MB of RAM.
• a GeForce4Ti (or higher) or ATI Radeon8500 (or higher) graphics card supporting pixel shaders
1.3, preferably with 128MB or more of VRAM.
• some kind of sound hardware.
• DirectX 9.0b.
however, there's bad news: due to an unnoticed build error in the actual released version
of .kkrieger, there are severe shadow bugs on Geforce4 and Radeon8500/9000 cards. the game
should be playable, but everything will be way to dark.
the full list of known bugs (which will of course be fixed in the final version) is:
• shadow bugs on GeForce4 and Radeon8500/9000 cards.
• "everything is red" bug on some NVidia Card/Driver combinations.
• sudden big framerate drops that go away when a certain monster gets killed.
• several collision bugs.
• alt-tab doesn't work properly.
• crashes during the "loading" phase.

7.

8. Nvidia популярнее, но AMD не сильно отстает по используемым технологиям, а конкуренция только на пользу рынку.

• В видеокартах Nvidia используется технология
трассировки лучей, по-английски Ray tracing. Суть
её в том, что в играх лучи света работают как в
реальном мире, благодаря чему улучшаются
эффекты освещения, теней и отражений. Это
делает трёхмерную графику более реалистичной.
• Nvidia и AMD являются разработчиками видеокарт,
они отвечают за устройство графического
процессора и базовый дизайн видеокарты.
Видеокарты, выпущенные Nvidia и AMD
называются референсными и служат серийным
рабочим образцом устройства.

9. Производители видеокарт

• За массовый выпуск видеокарт отвечают
различные компании, такие как ASUS,
Gigabyte, Palit, Zotac и другие.
• Каждый из этих производителей не
копирует референсный дизайн, а
выпускает несколько собственных
моделей, отличающихся компоновкой
платы, системой охлаждения, частотами
графического процессора и памяти.

10.

Технические характеристики видеокарт любых производителей и
поколений легко сравнить, так как их построение не меняется на
протяжении многих лет.
Перечислим их:
• - тип архитектуры ядра;
• - количество вычислительных блоков ядра (универсальных
шейдеров и растровых блоков);
• - число использованных транзисторов при изготовлении ядра;
• - тонкость технологического процесса изготовления ядра;
• - частота работы ядра;
• - ширина шины памяти;
• - тип видеопамяти;
• - частота работы видеопамяти;
• - объем видеопамяти;
• - энергопотребление/тепловыделение;
• - цена.

11.

• Обычно видеокарта является платой
расширения и вставляется в разъём
расширения, универсальный (ISA, VLB, PCI,
PCI-Express) или специализированный
(AGP), но бывает и встроенной
(интегрированной).

12. Интегрированные (встроенные) видеокарты

• Недостатками таких видеоускорителей являются: отсутствие "своей" видеопамяти, встроенные видеокарты
используют общую оперативную память системы; - ядра,
встроенные в чипсет материнской платы, используют
общую систему охлаждения чипсета, что может негативно
сказаться на температуре моста; - низкая
производительность, об играх не может быть и речи.
• Преимуществами встроенных видеокарт можно назвать: цена, самое дешёвое решение для офиса и интернеткафе; - иногда , такие видеокарты "идут бонусом", при
покупке процессора и(или) подходящей материнской
платы. - при необходимости, встроенные видеокарты
могут быть заменены на дискретные. А встроенная
отключается.

13. Дискретные (не встроенные) видеокарты

подключаются к специальному VGA-слоту
(разъёму) на материнской плате. VGA слоты
бывают :
1) AGP (устаревший)
2) PCI-E x16, 32, 64
(новые и ныне используемый).

14.

Что такое, для чего нужна и как выглядит видеокарта?

15. AGP

• AGP (от англ. Accelerated Graphics Port, ускоренный
графический порт) — разработанная в 1997 году
компанией Intel, специализированная 32-битная
системная шина для видеокарты. Появилась
одновременно с чипсетами для процессора Intel
Pentium II. Основной задачей разработчиков было
увеличение производительности и уменьшение
стоимости видеокарты, за счёт уменьшения
количества встроенной видеопамяти. По замыслу
Intel большие объёмы видеопамяти для AGP-карт
были бы не нужны, поскольку технология
предусматривала высокоскоростной доступ к
общей памяти.

16.

Её отличия от предшественницы, шины PCI:
• работа на тактовой частоте 66 МГц;
• увеличенная пропускная способность;
• режим работы с памятью DMA и DME;
• разделение запросов на операцию и
передачу данных;
• возможность лучшего питания

17. PCI-Express x16 (v1.1; v2.0; v2.1; v3.0)

• Меняется только версия PCI-E x16: v1.1 ;
v2.0 ; v2.1; v3.0, но они остаются
совместимы между собой.

18.

• PCI Express или PCIe или PCI-E, (также известная как 3GIO for 3rd
Generation I/O; не путать с PCI-X или PXI) — компьютерная шина,
использующая программную модель шины PCI и
высокопроизводительный физический протокол, основанный
на последовательной передаче данных.

19.

20.

21.

22.

• В отличие от шины PCI, использовавшей для
передачи данных общую шину, PCI Express, в общем
случае, является пакетной сетью с топологией типа
звезда, устройства PCI Express взаимодействуют
между собой через среду, образованную
коммутаторами, при этом каждое устройство
напрямую связано соединением типа точка-точка с
коммутатором.
Кроме того, шиной PCI Express поддерживается:
• горячая замена карт;
• гарантированная полоса пропускания (QoS);
• управление энергопотреблением;
• контроль целостности передаваемых данных.

23.

• Соединение между двумя устройствами PCI
Express называется link, и состоит из одного
(называемого 1x) или нескольких (2x, 4x, 8x,
12x, 16x, 32x и х64) двунаправленных
последовательных соединений lane.
Каждое устройство должно поддерживать
соединение 1x.

24. Пропускная способность шины PCI Express

• Пропускная способность соединения lane составляет 2,5 Гбит/с.
Для расчета пропускной способности соединения link
необходимо учесть то, что в каждом соединении передача
дуплексная, а также учесть применение кодирования 8B/10B (8
бит в 10). Например, дуплексная пропускная способность
соединения 1x (P1x) составляет:
ГБ/с
• где 2,5 — пропускная способность одного lane, Гбит/с;
• 2 — учёт того, что соединение 1x состоит из двух lane;
• 0,8 — коэффициент, учитывающий использование кода 8B/10B;
— коэффициент для перевода Гбит/с в ГБ/с.

25.

Использование подобного подхода имеет
следующие преимущества:
• карта PCI Express помещается и корректно
работает в любом слоте той же или большей
пропускной способности (например, карта x1
будет работать в слотах x4 и x16);
• слот большего физического размера может
использовать не все lane'ы (например, к слоту
16x можно подвести линии передачи
информации, соответствующие 1x или 8x, и
всё это будет нормально функционировать;
однако, при этом необходимо подключить все
линии «питание» и «земля», необходимые для
слота 16x).

26.

• Пропускная способность, с учётом
двунаправленной передачи, для шин PCI
Express с разным количеством связей
указана в таблице:Используется связей
1x
2x
4x
8x
12x
16x
32x
• Пропускная способность PCI Express 1.0,
ГБ/c
0,5 1
2
4
6
8
16
• Пропускная способность PCI Express 2.0,
ГБ/c
1
2
4
8
12 16 32

27. PCI Express 2.0

• Увеличенная пропускная способность. — cпецификация PCI Express 2.0
определяет максимальную пропускную способность одного
соединения lane как 5 Гбит/с, при этом сохранена совместимость с PCI
Express 1.1 таким образом, что плата расширения, поддерживающая
стандарт PCIE 1.1 может работать, будучи установленной в слот PCIE 2.0.
Внесены усовершенствования в протокол передачи между
устройствами и программную модель.
• Динамическое управление скоростью — для управления скоростью
работы связи.
• Оповещение о пропускной способности — для оповещения ПО
(операционной системы, драйверов устройств и т.п.) об изменениях
скорости и ширины шины.
• Расширения структуры возможностей — расширение управляющих
регистров для лучшего управления устройствами, слотами и
интерконнектом.
• Службы управления доступом — опциональные возможности
управления транзакциями точка-точка.
• Управление таймаутом выполнения
• Сброс на уровне функций — опциональный механизм для сброса
функций (имеются в виду PCI funcs) внутри устройства (PCI device).
• Переопределение предела по мощности — для переопределения
лимита мощности слота при присоединении устройств, потребляющих
бо́ льшую мощность.

28. GPU - Graphic Processing Unit

29.

• 1. Тип архитектуры ядра.
От данного параметра зависит, сколько
операций вычислительное ядро выполнит за
1 вычислительный такт или 1 Гц рабочей
частоты. Графические ядра разных
архитектур, работающие на одинаковой
частоте, всегда будут показывать разную
производительность, которая иногда может
достигать 100%. Чем новее архитектура ядра
у данного производителя - тем она более
прогрессивная и выполняет больше операций
за один вычислительный такт.

30. Графические процессоры видеокарт


Самая важная вещь, на которую нужно обращать внимание при выборе видеокарты
— это модель графического процессора. Например, его название выглядит так:
Nvidia GeForce RTX 2060 Ti. Именно он больше чем на 90 процентов определяет
производительность.
• У Nvidia в названии графического процессора первые две цифры означают
поколение, или семейство, к которому он принадлежит, а две последующие —
конкретный процессор в рамках одного поколения. Например, в названии RTX 3090
в начале 30 — это значит, что процессор поколения RTX 30XX, 90 — что это самая
производительная модель. Приставка Ti обозначает модель выше классом.
Например, RTX 3060 Ti быстрее, чем RTX 3060, но медленнее, чем RTX 3070. В старых
видеокартах применялась другая классификация.
• У AMD первая цифра обозначает поколение, оставшиеся три — модель.
Применяется приставка XT, аналогичная по смыслу приставке Ti у Nvidia.
Выбрав модель графического процессора, мы можем выбирать модель
видеокарты от конкретного производителя, которая подходит нам по цене,
размерам, мощности и типу охлаждения.

31.

2. Количество вычислительных блоков ядра
(универсальных шейдров и растровых блоков) значительно влияет на производительность
видеокарты. Некоторые видеокарты разных
ценовых категорий могут быть построены на
одних и тех же ядрах, но иметь разное
количество активированных вычислительных
блоков.

32.

33.

• Обе видеокарты построены на одном ядре GM204. Но
младшая видеокарта имеет урезанное количество
шейдерных блоков с 2048 до 1664 штук.
• Урезание вычислительных блоков производителями
делается по одной из двух причин: либо чип оказался с
дефектным блоком(ами) и заблокировав их часть, на их
основе выпустили более дешевые видеокарты, либо
более дорогие видеокарты не продаются и их после
урезания пустили на производство более дешевых
видеокарт. Последнее долгие годы позволяли
оверклокерам, разблокировав заблокированные блоки,
превращать дешевые видеокарты в более дорогие. К
сожалению, последние поколения видеокарт редко
преподносят подобную удачу своим владельцам.

34.

• 3. Число использованных транзисторов при изготовлении
ядра. Другой важный параметр графического ядра
видеокарты. Связано это с тем, что чем больше
транзисторов используется в производстве видеокарты,
тем больше оно потребляет электричества в момент
пиковых нагрузок.
• GeForce GTX 970 имеет меньшее количество
вычислительных блоков. Зачастую отключенные блоки все
равно продолжают потреблять электричество на
определенном минимальном уровне, поэтому средняя
рабочая температура при равных рабочих частотах у
видеокарт окажется сопоставимой. Последнее
обстоятельство делает урезанную видеокарту всегда
менее энергоэффективной, чем старшая при сравнении
соотношений производительность/потребляемая
мощность электричества.

35.

• 4. Тонкость технологического процесса изготовления ядра.
Техпроцесс изготовления ядер данных видеокарт достиг 14
нанометров. У центральных процессоров компании Intel
технологический процесс старается стать более тонким.16
апреля 2019 года анонсировала освоение технологического
процесса 6 нм в рисковом производстве.
• Чем меньший технологический процесс, тем меньше ядро
потребляет электричества и тем больше транзисторов можно
разместить на кремниевой пластине, тем самым удешевив
производство. Но последние поколения ядер показывают, что
уменьшение технологического процесса повышает среднюю
рабочую температуру, так как повышение плотности
транзисторов приводит к повышению тепловыделения на
единицу площади. В любом случае, если обеспечено адекватное
охлаждение, чем тоньше технологический процесс изготовления
ядра, тем лучше для конечного пользователя.

36.

• 5. Частота работы ядра. Чем выше рабочая
частота у одинаковых графических ядер,
тем лучше, так как оно будет обеспечивать
больший уровень производительности.

37. Объём и тип памяти видеокарты

• В настоящее время можно встретить DDR, GDDR2,
GDDR3, GDDR4, GDDR5 и GDDR6. Для того, чтобы
графический процессор мог работать
максимально продуктивно, ему требуется не
только достаточный объем памяти, но и высокая
скорость чтения/записи данных в нее. Чем Выше
номер памяти, тем лучше ее характеристики.

38. Сколько памяти необходимо для видеокарты.

Количество видеопамяти должно
соответствовать вашему монитору, а точнее разрешению монитора.
1024х768 достаточно 256 Mb;
1280x1024 и 1440х900 - 512 Mb;
1400х1050 и 1600x900 - 768-1024 Mb;
1920х1080 (Full HD) - 1024-2048 Mb;
2560х1600 и выше - 2048 Mb и больше.

39.

• 6. Ширина шины памяти. Чем шире шина обмена
данными у видеокарты, тем лучше. Но следует
помнить, что данное утверждение будет
правдивым только в том случае, если
видеокарты имеют одинаковый тип
видеопамяти и одинаковую ее рабочую частоту.
Яркими примерами могут служить топовые
видеокарты двух конкурентов - GeForce GTX 980
и Radeon R9 290X, где несмотря на вдвое более
широкую шину обмена данными у последней видеокарта GeForce GTX 980 демонстрирует
большую производительность из-за другой
архитектуры ядра и более высоких рабочих
частот.

40.

• 7. Тип видеопамяти. Чем более
современный тип видеопамяти, тем при
большей рабочей частоте и с большей
пиковой производительностью она может
работать. Следует брать видеокарты на том
же типе видеопамяти, что и эталонная
версия производителя во время анонса NVIDIA или AMD.

41.

• 8. Частота работы видеопамяти. Чем выше
рабочая частота видеопамяти, тем лучше.
Данное утверждение справедливо при
сравнении двух видеокарт с одинаковой
шириной шины обмена данными.

42.

• 9. Объем видеопамяти.
• Нередко современные производители нагло
обманывают покупателей, предлагая по одной и той же
цене две видеокарты с большим и меньшим объемом
распаянных чипов видеопамяти. Сопоставимая
стоимость, как правило, достигается за счет применения
более примитивного типа видеопамяти, например,
вместо GDDR5 распаяна GDDR3 и т.д. На данную уловку
вестись ни в коем случае не следует - лишний объем
видеопамяти вам мало чего даст, а вот более
медленная видеопамять приведет к значительным
потерям производительности графического решения.

43.

• 10. Энергопотребление/тепловыделение.
Здесь все ясно, чем ниже
энергопотребление и тепловыделение, тем
лучше. При сравнении видеокарт следует
обратить внимание на количество
элементов на печатной плате и их качестве.
Чем меньше пустых мест из-под
конденсаторов, стабилизаторов
напряжения, тем стабильнее будет
работать видеокарта при перепадах
напряжения на стороне блока питания.

44. Размеры видеокарт

45. Разъемы и выходы

• DVI — Digital Visual Interface, цифровой видеоинтерфейс,
предназначен для передачи изображения на цифровые
устройства отображения, такие как мониторы
и проекторы. Поддерживаемое разрешение до 2560×1600 точек
• HDMI — High-Definition Multimedia Interface, цифровой
видеоинтерфейс предназначен для передачи видео высокой
четкости и цифровых аудио сигналов с защитой от копирования.
Поддерживает разрешение до 4096×2160 при 24 Гц. Так же с
версии 1.4 заявлена поддержка 3D-изображения
• DisplayPort — интерфейс предназначен для передачи сигнала на
цифровые дисплеи. Версия 1.2 принята в 2010 г. Можно
подключить до двух мониторов с разрешение до 2560 х 1600
точек или 4 с разрешение 1920 х 1200 точек. При подключении
одного монитора разрешение возрастает до 3840 х 2400 точек.
поддерживает 3-D изображение. Это самый современный
интерфейс подключения аудио и видеоаппаратуры

46.

47.

48. Выбор системы охлаждения графического адаптера

• Пассивная. Предполагает охлаждение
видеоадаптера без вентиляторов. Из
положительных сторон: тишина и
отсутствие каких либо вибраций связанных
с работой «карлсонов». Из минусов:
огромные габариты и невысокая
производительность видеоадаптеров из за
невозможности отвода достаточного
количества тепла. Стоимость у пассивных
моделей обычно чуть выше их шумных
аналогов

49. Охлаждение видеокарт

• Графический процессор и
память видеокарты выделяют
достаточно много тепла,
особенно при нагрузках. Чтобы
рассеивать тепло, используется
радиатор. Радиатор на мощных
видеокартах включает
тепловые трубки, которые
улучшают теплоотвод. Для
обдува радиатора используется
один или несколько
вентиляторов.
• Если вентиляторов нет, то
охлаждение называют
пассивным. Главный плюс
такого решения — полное
отсутствие шума. Пассивное

50.

Дискретные видеокарты подразделяются на:
• профессиональные;
• мультимедийные;
• игровые.

51. Примеры видеокарт разных ценовых сегментов

• Видеокарты нижнего ценового сегмента
предназначены для простейших задач —
таких, как просмотр видео или офисная
работа. Игры с двухмерной графикой,
браузерные, ретро-игры здесь могут
работать. Но игры с навороченной графикой
будут безбожно тормозить.

52. Начальные игровые видеокарты

• Позволяют играть в современные
трёхмерные игры, но на минимальносредних настройках качества графики и на
разрешении FullHD 1920x1080. Многие
популярные онлайн-игры вроде World of
Tanks тоже пойдут на них без проблем.
• Сюда можно отнести модели Nvidia RTX
3050, GTX 1660 и AMD Radeon RX 6500 XT.

53. Начальные игровые видеокарты

54. Средние игровые видеокарты

• Тянут современные игры уже на
настройках, близким к максимальным, но с
уменьшением сглаживания, на умеренном
разрешении. Мультиплеерные
многопользовательские проекты, скорее
всего, пойдут на максимальных
настройках.
• Характерные примеры — Nvidia RTX 3060
Ti или AMD Radeon RX 6600.

55. Средние игровые видеокарты

56. Хорошие видеокарты

• Эти видеокарты тянут максимально
требовательные игры на высоких настройках
графики, но не позволяют при этом
использовать большие разрешения,
например 4K 3840×2160.
• Например, это Nvidia GeForce RTX 3080 или
AMD Radeon RX 6800.

57. Хорошие видеокарты

58. Топовые видеокарты

• На них можно позволить себе играть в высоком
разрешении на максимальных настройках
качества в любые игры. Как правило, стоимость
таких видеокарт сильно завышена по
сравнению с их производительностью.
• Сюда можно отнести Nvidia RTX 4090, Nvidia
RTX 4060 Ti и AMD Radeon RX 6900 XT

59. Топовые видеокарты

60. Выбираем профессиональную видеокарту

61. Выбираем профессиональную видеокарту

• Профессиональные видеокарты обладают
узкой специализацией, они предназначены
для высокопроизводительных задач:
используются в дата-центрах, при глубоком
обучении искусственного интеллекта, при
создании спецэффектов, в работе с
графикой и вычислениями, а также для
работы с множеством мониторов.

62. Tesla

• Видеокарты NVIDIA Tesla используются для
высокопроизводительных задач, в датацентрах, а также в сфере глубокого
обучения искусственного интеллекта. В
нашем каталоге представлена одна такая
модель — это PNY nVidia Tesla RTCST4M-PB с
объемом видеопамяти GDDR6 ECC 16GB на
шине 256-bit.

63. NVS

• Видеокарты NVIDIA NVS предназначены для систем с
большим количеством мониторов: такие видеокарты
поддерживают до четырех или восьми экранов. В нашем
каталоге представлены две такие модели:
• — PNY nVidia NVS 510 VCNVS510VGA-PB с объемом
видеопамяти DDR3 2GB на шине 128-bit и портами
4xMiniDisplayPort.
• — PNY nVidia NVS 810 VCNVS810DP-PB с объемом
видеопамяти DDR3 4GB на шине 128-bit и портами
8xMiniDisplayPort.

64. Quadro


Это платформа визуальных вычислений для совершенно разных задач: от отраслевых проектов до
создания продвинутых спецэффектов и сложной научной визуализации. Платформа Quadro имеет
развитую экосистему программно-аппаратных средств и инструментов.
С объемом видеопамяти GDDR5 4GB на шине 128-bit и портами 4xMiniDisplayPort представлены
следующие модели:
— PNY nVidia Quadro P1000 VCQP1000BLK-1 и VCQP1000DVI-PB;
— PNY nVidia Quadro K2200 VCQK2200BLK-1;
— Dell nVidia Quadro P1000 490-BDXO и 490-BDXN;
— Lenovo nVidia Quadro P1000 4X60N86661.
Большим объемом и шиной — 5GB на шине 160-bit — отличаются еще четыре модели:
— PNY nVidia Quadro P2000 VCQP2000BLK-1 и VCQP2000-PB;
— HP nVidia Quadro P2000 1ME41AA;
— Dell nVidia Quadro P2000 490-BDTN.
Следующие модели обладают объемом видеопамяти GDDR5 8GB на шине 256-bit и портами 4xDisplayPort:
— Lenovo nVidia Quadro P4000 Short Extender 4X60N86663 и Long Extender 4X60N86664;
— PNY nVidia Quadro P4000 VCQP4000BLK-1, VCQP4000-PB и M4000 VCQM4000BLK-1.
Остальные модели отличаются тем, что оснащены портами 1xDVI-D и 4xDisplayPort. Все они обладают разными
характеристиками:
— PNY nVidia Quadro P5000 VCQP5000-PB с объемом видеопамяти GDDR5X 16GB на шине 256-bit;
— PNY nVidia Quadro P6000 VCQP6000-PB с объемом видеопамяти GDDR5X 24GB на шине 384-bit;
— PNY nVidia Quadro GP100 VCQGP100-PB с объемом видеопамяти HBM2 16GB на шине 4096-bit;
— PNY nVidia Quadro GV100 VCQGV100-PB с объемом видеопамяти HBM2 32GB на шине 4096-bit.

65. Для чего требуются профессиональные видеокарты

• Каждая видеокарта решает одну основную
задачу – отображает картинку, которая
предварительно обрабатывается графическим
процессором. Информация на графический чип
подается в полном объеме – расположение
объектов, оттенки, степень освещения, уровень
видимости и многое другое. Раньше в играх
применялась классическая пиксельная графика,
но ее время прошло. Теперь 3D-сцены
формируются с помощью полигонов.

66. Полигон


Полигон
Полигон – это определенная плоскость, а точнее плоский многогранник, в
трехмерном изображении. В большинстве играх применяются треугольные
полигоны. С их помощью формируется полноценная картинка. Чем больше
таких треугольников, тем качественней результат.
Если вспомнить, то в старых играх герои выделялись несколько угловатой
моделью. Это было связано с нехваткой мощностей. Количество применяемых
полигонов было минимальным. Однако постепенно видеокарты
совершенствовались, а персонажи приобретали реалистичность. В этом легко
убедиться, достаточно изучить игры, которые обновлялись с определенной
периодичностью.
На создание одного персонажа затрачиваются колоссальные ресурсы, от 15 до
45 тысяч треугольников. В некоторых играх цифры еще более солидные,
достигают 80 тысяч полигонов и более. Задача игрового видео чипа,
воспроизводить яркую и насыщенную картинку с отменной цветопередачей и
различными эффектами.
Профессиональные видеокарты выполняют практически идентичные задачи,
что и игровые. Однако здесь акцент делается на точность. Обусловлено это тем,
что на базе проектов создаются реальные вещи. По этой причине количество
полигонов может существенно превышать, чем в игровом формате.

67. Ключевые отличия между игровой и профессиональной видеокартой

• Дальше подробнее выделим основные
моменты, которые и разделяют видеокарты
на несколько категорий.
Видеопамять
Вот здесь скрывается одно из базовых отличий. Если взглянуть на
ведущую игровую карту RTX 3090, объем памяти составляет 24 ГБ.
Довольно солидный показатель, который с лихвой закрывает все текущие
потребности в играх. Однако у топовой профессиональной модели Quadro
RTX 8000 памяти 48 ГБ. Причем двукратная разница наблюдается и в
предыдущих моделях. Скорее всего, сохранится в ближайшем будущем.

68. Видеопамять

• ECC-память
Как уже отмечали, в профессиональных устройствах точность стоит на первом месте.
Ошибки в процессе проведения работ недопустимы. Чтобы исключить даже малейшие
неточности, применяется ECC-память. Ее главная особенность – это быстро выявление
и исправление ошибок в битах.
• OpenGL
Такое программное обеспечение применяется при разработке приложений в формате
2D/3D графикой. Поддержквсевозможныха на уровне системы существенно ускоряет
многие процессы. Однако значительно возрастает финальная стоимость изделия.
• Драйвера
Для профессиональной видеокарты разработаны специальные драйвера. Они открывают
доступ к различным дополнительным настройкам и полезным опциям. Также
присутствует ряд специальных инструментов для мониторинга. Игровые драйвера
такими возможностями не обладают. Более того, разработчики NVIDIA создали BIOS
для Quadro, позволяющий еще более повысить производительность чипа. Например,
карта позволяет выбирать - нужен повышенный объем памяти или коррекция ошибок.
Увеличена производительность задач с двойной четностью из-за дополнительных
блоков в чипе.

69. Заключение

• Профессиональные видеокарты кардинально
отличаются от игровых своими возможностями и
программным обеспечением. Создаются они
исключительно для разработки и реализации
различных проектов, связанных с различными
сферами производства, обработки видео и так
далее. Игровые модели полностью адаптированы
на развлечения. В профессиональной
деятельности они себя покажут не с лучшей
стороны, так как не обладают для этого
должными возможностями и инструментами.

70. Мультимедийные видеокарты 

Мультимедийные видеокарты
• это видеоускорители, нижнего ценового диапазона. Их
назначение сводится, в основном, к выводу
качественного изображения на LED-панели
(плазменные телевизоры), в высоком разрешении (Full
HD). Чтобы выбрать и приобрести мультимедийную
видеокарту, нужно чтобы она соответствовала таким
критериям: - поддержка DirectX11 (для Windows 7, 8); для разрешения 1920х1080 (Full HD) достаточно 1 Gb
DDR5 видеопамяти; - обязательное наличие HDMI
разъёма, для подключения LED-панели.

71.

72.

73. В чем разница между видеокартами Nvidia и ATI ?

В чем разница между
видеокартами Nvidia и ATI ?
Разница в самой идеологии (в железном и
программном смысле). Нельзя говорить о том,
что видеокарты Nvidia лучше ATI или наоборот,
потому что все зависит от класса приложения.
Например, любая игра создается под
конкретную технологию (Nvidia или ATI). Таким
образом, если взять две примерно одинаковые
по параметрам видеокарты Nvidia иATI, то в
одной игре лучший результат покажет первая
модель, а в другой вторая модель видеокарты.

74. Начнем с Nvidia:

• Nvidia SLI – благодаря данной технологии, несколько видеокарт,
подключенных в разные PCI-Express слоты, работают совместно,
тем самым увеличивая мощность системы.
• Nvidia 3DVision – позволяет подключать до трех FullHD
мониторов, чтобы обеспечить полное погружение в трехмерное
пространство.
• Nvidia CUDA – программно-аппаратная архитектура,
позволяющая осуществлять несколько типов вычислений при
помощи графического процессора видеокарты. Опять же,
серьезно влияет на производительность в лучшую сторону, так
как теперь центральный процессор работает совместно с
процессором.
• PhysX Software – кроссплатформенный движок, позволяющий
симулировать физические явления: обрабатывать твердые тела,
ткани и жидкости. Поддержкой данной функции укомплектованы
все решения от Нвидеа, за исключением самых старых.

75. А теперь посмотрим на аналоги AMD:

• Crossfire– по сути, та же SLI, только теперь для карт от АМД.
Объединяет несколько видеоадаптеров и оказывает
положительный эффект на производительность. Технология
ничем не уступает конкуренту.
• Eyefinity – позволяет транслировать изображение с одной
видеокарты на 6 мониторов. А имея сверхновую,
модифицированную систему, пользователь сможет подключить
аж 24 монитора. В этом пункте однозначное лидерство занимают
Radeon’ы.
• FireStream – менее технологичный аналог CUDA. Как следствие,
получивший гораздо меньшую известность.
• HavokPhysics – полноценной замены Nvidia PhysX у AMD не
нашлось, поэтому с 2009 года они стали использовать
альтернативу, предоставленную им ирландской компанией
Havok.

76. кранчинг / майнинг

77. Какая видеокарта лучше для ноутбука?

78. Выбор комбинации из двух и более видеокарт (CrossFireX и NVIDIA SLI)

Выбор комбинации из двух и
более видеокарт (CrossFireX
и NVIDIA SLI)

79. ATI CrossFire

• ATI CrossFire — технология, позволяющая
одновременно использовать мощности
двух и более видеокарт Radeon для
построения трёхмерного изображения.
Каждая из видеокарт, используя определённый алгоритм, формирует свою часть
изображения, которое передаётся в чип Composing Engine мастер-карты, имеющий
собственную буферную память. Этот чип объединяет изображения каждой видеокарты и
выводит финальный кадр.
В будущем видеокарты на основе CrossFire облегчат работу процессора с графикой. Две
видеокарты будут обрабатывать графику, а одна — физику.

80.

81.

82.

83. Принципы построения

Для построения компьютера на основе CrossFire
необходимо иметь:
• материнскую плату с двумя и более разъёмами PCI
Express x16 с чипсетом AMD или Intel определённой
модели;
• мощный блок питания;
• видеокарты с поддержкой CrossFire.
• Видеокарты должны быть одной серии, но
необязательно одной модели. При этом
быстродействие и частота CrossFire-системы
определяется характеристиками чипа наименее
производительной видеокарты.

84. CrossFire-систему можно организовать тремя способами:

• Внешнее соединение — видеокарты объединяются с
помощью кабеля, при этом карта, на которой распаян
чип Compositing Engine, называется мастер-картой
(Master card). Остальные видеокарты могут быть
любыми в пределах серии.
• Внутреннее соединение — видеокарты соединены
посредством гибкого мостика. Драйвером
определяется, какая из них будет мастер-картой.
• Программный метод — видеокарты не соединяются,
обмен данными идёт по шине PCI Express x16, при этом
их взаимодейтсвие реализуется с помощью драйверов.
Недостатком данного способа являются потери в
производительности на 10-15% по сравнению с двумя
вышеназванными способами.

85. Алгоритмы построения изображений

SuperTiling
Картинка
разбивается на
квадраты 32x32
пикселя и
принимает вид
шахматной
доски. Каждый
квадрат
обрабатывается
одной
видеокартой.

86. Алгоритмы построения изображений

Scissor
Изображение разбивается
на несколько частей,
количество которых
соответствует
количеству видеокарт в
связке. Каждая часть
изображения
обрабатывается одной
видеокартой
полностью, включая
геометрическую и
пиксельную
составляющие.

87. Алгоритмы построения изображений

Alternate Frame Rendering
Обработка кадров
происходит поочередно:
одна видеокарта
обрабатывает только
чётные кадры, а вторая —
только нечётные. Однако, у
этого алгорима есть
недостаток. Дело в том, что
один кадр может быть
простым, а другой
сложным для обработки.

88.

• SuperAA
Данный алгоритм нацелен на
повышение качества
изображения. Одна и та же
картинка генерируется на
всех видеокартах с
разными шаблонами
сглаживания. Видеокарта
производит сглаживание
кадра с некоторым шагом
относительно
изображения другой
видеокарты. Затем
полученные изображения
смешиваются и выводятся.
Таким образом
достигается максимальные
чёткость и
детализованность
изображения. Доступны
следующие режимы
сглаживания: 8x, 10x, 12x и
14x.

89. NVIDIA SLI

• NVIDIA SLI — технология, позволяющая
использовать мощности нескольких
видеокарт для обработки трехмерного
изображения.

90.

• SLI (Scalable Link Interface - масштабируемый
объединительный интерфейс) - программноаппаратная технология NVIDIA, обеспечивающая
установку и совместную работу двух видеокарт
в режиме Multi-GPU Rendering. Нагрузка между
ними распределяется динамически, что
позволяет значительно увеличить
производительность видеосистемы и получить
высокое качество отображения трехмерной
графики.

91.

92.

• Split Frame Rendering
Изображение разбивается
на несколько частей,
количество которых
соответствует
количеству видеокарт в
связке. Каждая часть
изображения
обрабатывается одной
видеокартой
полностью, включая
геометрическую и
пиксельную
составляющие.
Аналог в CrossFire —
алгоритм Scissor

93.

Alternate Frame Rendering
• Обработка кадров
происходит поочередно:
одна видеокарта
обрабатывает только
четные кадры, а вторая —
только нечетные. Однако у
этого алгорима есть
недостаток. Дело в том, что
один кадр может быть
простым, а другой
сложным для обработки.
• Этот алогоритм,
запатентован ATI во время
выпуска двухчиповой
видеокарты.

94. SLI AA

• Данный алгоритм нацелен на повышение качества
изображения. Одна и та же картинка генерируется на
всех видеокартах с разными шаблонами сглаживания.
Видеокарта производит сглаживание кадра с
некоторым шагом относительно изображения другой
видеокарты. Затем полученные изображения
смешиваются и выводятся. Таким образом достигается
максимальные четкость и детализованность
изображения. Доступны следующие режимы
сглаживания: 8x, 10x, 12x, 14x, 16x и 32x.
• Аналог в CrossFire — SuperAA.

95. энергопотребление видеокарты.

Для этого необходимо:
- просчитать энергопотребление всей системы, так
называемым Калькулятором мощности БП,
полученное число и будет необходимой
мощностью БП.
- - посмотреть на официальном сайте
производителя видеокарты, рекомендуемый для
вашей модели блок питания, вернее
рекомендуемую мощность БП.

96. Физические ускорители 

Физические ускорители
Физические ускорители (PPU - Physics Processing Unit) являются узкоспециализированными
устройствами, дополняющими традиционную связку CPU-GPU и освобождающие их от
обязанности обсчитывать физические эффекты в современных трехмерных компьютерных
играх. "Первой ласточкой" процессоров нового типа стал PPU PhysX, разработанный
компанией Ageia в 2005 году.

97.

• Хоть PhysX является открытым стандартом, но в
силу факторов конкуренции Nvidia CUDA и AMD
FireStream, компания AMD начинает в 2009 году
использование альтернативного движка
ирландской компании, под названием Havok
Physics.

98.

99. Разница между CPU и GPU в параллельных расчётах

• CUDA — это технология, запатентованная
NVIDIA и используемая только в их
видеокартах. Ядра CUDA похожи на
обычные, используемые в процессорах.
CUDA означает Compute Unified Device
Architecture, что в переводе
Вычислительная Унифицированная
Архитектура Устройства.

100. CUDA

• Ядро CUDA отличается от обычного
процессорного архитектурой. Они
нацелены на то, чтобы эффективно
работать параллельно . Ядра CUDA проще
по устройству, но в видеокарте их очень
много. Если в процессоре могут быть 2-16
ядер, то в видеокарте их сотни, а то и
тысячи. Например, у карты GeForce RTX
3080 их 8960, а у GeForce GTX 980 — 2048.

101.

102. Где используются CUDA?

• В первую очередь в игровых видеокартах NVIDIA.
• Видеокарты с ядрами CUDA призваны взять на себя самые
тяжелые элементы. Процессор в компьютере с такой
видеокартой играет роль администратора, решая базовые
задачи. В данном случае CUDA решают только графические
задачи. Обработка графики требует большого количества
одновременных вычислений, на это «заточены» ядра CUDA, и
поэтому их так много. Одновременные вычисления — это суть
игр, ведь в игре стреляют, бегут, едут, летят, плывут, и все это в
один момент. CUDA же решают задачи вместе и сразу.
• Это исключает ситуации, когда одно ядро ждет, пока другие ядра
выполняют свои задачи, и потери производительности из-за
такого ожидания.

103. Где будут полезны ядра?

В играх
Ядра от NVIDIA влияют на производительность всей графики в игре, но в первую очередь
на тени, освещение, сглаживание, физические модели. Их работа делает игру
реалистичнее и детальнее.
В рабочих задачах
Спектр применения CUDA в рабочих задачах очень широк. Как сказано в названии, это
унифицированный вычислительный юнит, который может делать всё. Наиболее часто
CUDA-вычисления применяются в: вычислительной математике, для работы с
искусственным интеллектом, анализа Big Data, финансовой аналитике, прогнозах погоды.

104. Компания NVIDIA приводит такой график роста производительности CPU и GPU

105.

106. Это лишь некоторые примеры ускорений синтетического кода на GPU против SSE-векторизованного кода на CPU (по данным NVIDIA):

• Флуоресцентная микроскопия: 12x;
• Молекулярная динамика (non-bonded force
calc): 8-16x;
• Электростатика (прямое и многоуровневое
суммирование Кулона): 40-120x и 7x.

107. Перечислим основные характеристики CUDA:

• унифицированное программно-аппаратное решение для
параллельных вычислений на видеочипах NVIDIA;
• большой набор поддерживаемых решений, от мобильных до
мультичиповых
• стандартный язык программирования Си;
• стандартные библиотеки численного анализа FFT (быстрое
преобразование Фурье) и BLAS (линейная алгебра);
• оптимизированный обмен данными между CPU и GPU;
• взаимодействие с графическими API OpenGL и DirectX;
• поддержка 32- и 64-битных операционных систем: Windows XP,
Windows Vista, Linux и MacOS X;
• возможность разработки на низком уровне.

108.

Преимущества CUDA перед традиционным подходом к GPGPU
вычислениям:
• интерфейс программирования приложений CUDA основан на
стандартном языке программирования Си с расширениями, что
упрощает процесс изучения и внедрения архитектуры CUDA;
• CUDA обеспечивает доступ к разделяемой между потоками памяти
размером в 16 Кб на мультипроцессор, которая может быть
использована для организации кэша с широкой полосой пропускания,
по сравнению с текстурными выборками;
• более эффективная передача данных между системной и
видеопамятью
• отсутствие необходимости в графических API с избыточностью и
накладными расходами;
• линейная адресация памяти, и gather и scatter, возможность записи по
произвольным адресам;
• аппаратная поддержка целочисленных и битовых операций.
Основные ограничения CUDA:
• отсутствие поддержки рекурсии для выполняемых функций;
• минимальная ширина блока в 32 потока;
• закрытая архитектура CUDA, принадлежащая NVIDIA.

109.

• Слабыми местами программирования при помощи
предыдущих методов GPGPU является то, что эти
методы не используют блоки исполнения
вершинных шейдеров в предыдущих
неунифицированных архитектурах, данные хранятся
в текстурах, а выводятся во внеэкранный буфер, а
многопроходные алгоритмы используют
пиксельные шейдерные блоки. В ограничения
GPGPU можно включить: недостаточно
эффективное использование аппаратных
возможностей, ограничения полосой пропускания
памяти, отсутствие операции scatter (только gather),
обязательное использование графического API.

110.

• Работает ли CUDA вообще? Да. Вы получите 35% снижение
времени перекодирования с включённым ускорением GPU, так
что CUDA действительно помогает. Но вот что интересно:
системы AMD и Nvidia показывают одинаковое время
кодирования в режиме "только CPU", но поддержка Stream
даёт 108% прирост производительности, легко обгоняя
преимущество CUDA, и при этом нагрузка на CPU оказывается
на 40% меньше, чем под CUDA.
• Иногда CUDA показывает себя лучше. Но тесты, доказывают, что
концепция "сбалансированной платформы" AMD даёт
реальные преимущества, это не просто маркетинговый термин,
чтобы продавать больше процессоров.

111. Что представляют собой системы аппаратного ускорения видео?

Системы аппаратного ускорения видео AMD Avivo и
NVIDIA PureVideo HD осуществляют аппаратную
декомпрессию HD-видеофайлов (30 кадров в секунду с
разрешением 1920 x 1080), закодированных в H.264/AVC.
Это позволяет существенно снизить требования к
производительности центрального процессора и, тем
самым, обеспечить плавное воспроизведение HD. Кроме
того, обе технологии позволяют несколько улучшить
качество картинки HD (впрочем, как и DVD) за счет
подавления шума, сглаживания границ объектов и
наложения различных фильтров.

112. ATI Stream Technology

• Это полный аналог технологии CUDA от Nvidia.
Он предоставляет возможность использования
шейдеров графического процессора для запуска
вычислительных программ. Интерфейс
программирования осуществляется через
OpenCL. Это дает возможность ускорения
вычислений, и может быть использовано, в том
числе, в игровой сфере, для ускорения просчетов
физики, если движок физики поддерживает
OpenCL. Это создает полный аналог PhysX,
последний также исполняется программно на
шейдерах CUDA.

113.

MPEG-2 и H.264
English     Русский Rules