Tehnografi.com - Технологические новости, обзоры и советы

RTX 2080 против Radeon VII против 5700 XT: производительность рендеринга и вычислений

RTX 2080 против Radeon VII против 5700 XT: производительность рендеринга и вычислений 1Большая часть нашего охвата GPU сфокусирована на потребительской стороне бизнеса и на тестировании игр, но я обещал изучить вычислительную сторону производительности еще во время запуска Radeon VII. С 5700 XT, недавно дебютировавшим, у нас была возможность вернуться к этому вопросу с новой архитектурой GPU от AMD и сравнить RDNA с GCN.

На самом деле, общая вычислительная ситуация находится на интересном перекрестке. AMD заявила, что хочет быть более серьезным игроком в корпоративных вычислительных средах, но также заявила, что GCN будет продолжать существовать вместе с RDNA в этом пространстве. Radeon VII – это потребительский вариант ускорителя AMD MI50 с поддержкой полускоростной FP64. Если вы знаете, что вам нужно вычисление FP64 с двойной точностью, например, Radeon VII заполняет эту нишу так, как никакой другой графический процессор в этом сравнении не делает.

RTX 2080 против Radeon VII против 5700 XT: производительность рендеринга и вычислений 2

Radeon VII обладает самой высокой пропускной способностью ОЗУ и является единственным графическим процессором в этом сравнении, обеспечивающим высокую производительность с двойной точностью. Но хотя эти графические процессоры имеют относительно схожие бумажные характеристики, между ними существует существенное расхождение с точки зрения производительности – и цифры не всегда ломаются так, как вы думаете.

Одна из главных тем AMD с 5700 XTSEEAMAZON_ET_135 см. Amazon ET коммерция Сейчас Navi представляет принципиально новую архитектуру графического процессора. 5700 XT показал себя умеренно быстрее, чем Vega 64 в нашем тестировании на стороне потребителя уравнения, но мы также хотели проверить ситуацию в вычислениях. Имейте в виду, однако, что новизна 5700 XT также работает против нас немного здесь. Некоторые приложения могут нуждаться в обновлении, чтобы в полной мере использовать его возможности.

Относительно Blender 2.80

Результаты нашего теста содержат данные как от Blender 2.80, так и от отдельного бенчмарка Blender 1.0beta2 (выпущен в августе 2018 года). Blender 2.80 является основным выпуском приложения и содержит ряд значительных изменений. Автономный тест не совместим с семейством RTX от Nvidia, что требовало тестирования с использованием последней версии программного обеспечения. Первоначально мы тестировали бета-версию Blender 2.80, но затем окончательная версия упала, поэтому мы сбросили результаты бета-тестирования и провели повторную проверку.

RTX 2080 против Radeon VII против 5700 XT: производительность рендеринга и вычислений 3

Изображение Блендер

Существуют значительные различия в производительности между тестом Blender 1.0beta2 и 2.80, и одна сцена, Classroom, не отображается должным образом в новой версии. Эта сцена была исключена из наших 2.80 сравнений. Blender позволяет пользователю указывать размер плитки в пикселях, чтобы контролировать, сколько сцены обрабатывается одновременно. Код в файлах Python для бенчмарка Blender 1.0beta2 указывает, что в тесте используется размер тайла 512 × 512 (координаты X / Y) для графических процессоров и 16 × 16 для процессоров. Однако большинство файлов сцен, фактически содержащихся в бенчмарке, по умолчанию используют размер плитки 32 × 32, если они загружены в Blender 2.80.

Мы тестировали Blender 2.80 в двух разных режимах. Сначала мы протестировали все совместимые сцены, используя размер мозаики по умолчанию, в который загружены эти сцены. Это было 16 × 16 для Barbershop_Interior и 32 × 32 для всех других сцен. Затем мы протестировали те же рендеры с размером плитки по умолчанию 512 × 512. До сих пор правило с размерами листов было то, что большие размеры были хороши для графических процессоров, в то время как меньшие размеры были хороши для процессоров. Похоже, что это немного изменилось с Blender 2.80. Графические процессоры AMD и Nvidia демонстрируют очень разные отклики на большие размеры плиток: графические процессоры AMD ускоряются при увеличении размеров плиток и графические процессоры Nvidia теряют производительность.

Поскольку файлы сцен, которые мы тестируем, были созданы в более старой версии Blender, возможно, это повлияет на наши общие результаты. В течение нескольких недель мы интенсивно работали с AMD, чтобы изучить аспекты производительности Blender на графических процессорах GCN. GCN, Pascal, Turing и RDNA демонстрируют различную структуру результатов при переходе с 32 × 32 на 512 × 512, при этом Turing теряет меньшую производительность, чем Pascal и RDNA, набирающую большую производительность в большинстве случаев, чем GCN.

Все наши графические процессоры существенно выиграли от не используя размер плитки 16 × 16 для Barbershop_Interior. Хотя этот тест по умолчанию равен 16 × 16, он не очень хорошо рендерится при таком размере тайла на любом графическом процессоре.

Устранение различных результатов, которые мы увидели в бенчмарке Blender 1.0Beta2 по сравнению с бета-версией Blender 2.80 и, наконец, финалом Blender 2.80 задержал этот обзор в течение нескольких недель, и во время работы над ним мы обменялись несколькими драйверами AMD. Поэтому все результаты Blender 2.80 были выполнены с использованием Adrenaline 2019 Edition 19.8.1.

Настройка теста и примечания

Все графические процессоры были протестированы на системе Intel Core i7-8086K с использованием материнской платы Asus Prime Z370-A. Vega 64, Radeon RX 5700 XT и Radeon VII были протестированы с использованием Adrenalin 2019 Edition 19.7.2 (16.07.2009) для всего но Блендер 2.80. Все тесты Blender 2.80 были выполнены с использованием 19.8.1, а не 19.7.2. Nvidia GeForce GTX 1080 и Gigabyte Aorus RTX 2080 были протестированы с использованием драйвера Nvidia 431.60 Game Ready (23.07.2009).

CompuBench 2.0 проводит графические процессоры через серию тестов, предназначенных для измерения различных аспектов их вычислительной производительности. Однако разработчики CompuBench Кишонти, похоже, не предлагают какого-либо существенного разбора в том, как они разработали свои тесты. Моделирование набора уровней может относиться к использованию наборов уровней для анализа поверхностей и форм. Подразделение Catmull-Clark – это техника, используемая для создания гладких поверхностей. Моделирование N-тела – это моделирование динамических систем частиц под действием таких сил, как гравитация. Оптический поток TV-L1 – это реализация метода оценки оптического потока, используемого в компьютерном зрении.

SPEC Workstation 3.1 содержит много тех же самых рабочих нагрузок, что и SPECViewPerf, но также имеет дополнительные вычислительные рабочие нагрузки на GPU, которые мы разберем отдельно. Полное описание теста рабочей станции и его набора приложений можно найти здесь. Рабочая станция SPEC 3.1 была запущена в собственном тестовом режиме 4K. Хотя этот тестовый прогон не был представлен в SPEC для официальной публикации, наше тестирование рабочей станции SPEC 3.1 выполнялось в соответствии с установленными в организации правилами тестирования, которые можно найти здесь.

Графические процессоры NvidiaSEEAMAZON_ET_135 см. Amazon ET коммерция всегда были протестированы с CUDA, когда CUDA был доступен.

Мы подготовили для вас два набора результатов – синтетическую серию тестов, созданных с помощью SiSoft Sandra, и исследуют различные аспекты сравнения этих чипов, включая вычислительную мощность, задержку памяти и внутренние характеристики, и более широкий набор тестов, которые касаться производительности вычислений и рендеринга в различных приложениях Поскольку все тесты SiSoft Sandra 2020 являются уникальными для этого приложения, мы решили разбить их на собственное слайд-шоу.

Результаты Gigabyte Aorus RTX 2080 следует считать приблизительно эквивалентными RTX 2070S. Два графических процессора работают почти одинаково в рабочих нагрузках потребителя и должны соответствовать друг другу на рабочей станции.

SiSoft Sandra 2020

SiSoft Sandra – это универсальная служебная информация о системе и полнофункциональный пакет для оценки производительности. Несмотря на то, что это синтетический тест, он, вероятно, является наиболее полнофункциональной утилитой для синтетической оценки, и Адриан Силаси, ее разработчик, десятилетиями совершенствовал и улучшал ее, добавляя новые функции и тесты по мере развития процессоров и графических процессоров.

Наши специфические результаты SiSoft Sandra приведены ниже. Некоторые из наших результатов OpenCL немного странны в отношении 5700 XT, но, по словам Адриана, у него еще не было возможности оптимизировать код для выполнения на 5700 XT. Считайте эти результаты предварительными – интересными, но, возможно, еще не показательными – в отношении этого графического процессора.

Наши тесты SiSoft Sandra 2020 указывают в основном на то же направление. Если вам нужна двойная точность с плавающей точкой, Radeon VII – вычислительный монстр. Хотя неясно, сколько покупателей попадает в эту категорию, есть определенные места, такие как обработка изображений и высокоточные рабочие нагрузки, где сияет Radeon VII.

Radeon 5700 XT на основе RDNA делает меньше, чтобы отличиться в этих тестах, но мы также связываемся с Silasi по вопросам, с которыми мы столкнулись во время тестирования. Улучшенная поддержка может изменить некоторые из этих результатов в ближайшие месяцы.

Результаты теста

Теперь, когда мы рассмотрели производительность Sandra, давайте обратимся к остальной части нашего набора тестов. Наши другие результаты включены в слайд-шоу ниже:

Выводы

Что эти результаты говорят нам? Много довольно интересных вещей. Прежде всего, РДНК совершенно впечатляет. Имейте в виду, что мы протестировали этот графический процессор в профессиональных и вычислительно-ориентированных приложениях, ни одно из которых не было обновлено или исправлено для работы на нем. Есть явные признаки того, что это повлияло на наши результаты тестов, включая некоторые тесты, которые либо не запускались, либо выполнялись медленно. Несмотря на это, 5700 XT впечатляет.

Radeon VII впечатляет тоже, но по-разному, чем 5700 XT. SiSoft Sandra 2020 демонстрирует преимущество, которое эта карта может принести для рабочих нагрузок с двойной точностью, где она обеспечивает гораздо большую производительность, чем что-либо еще на рынке. В последнее время ИИ и машинное обучение стали намного важнее, но если вы работаете в области, где двойная точность GPU является ключевой, Radeon VII обладает огромной огневой мощью. SiSoft Sandra включает тесты, основанные на D3D11, а не на OpenCL. Но, учитывая, что OpenCL является главным конкурентом CUDA, я решил придерживаться его во всех случаях, кроме тестов на задержку памяти, которые в глобальном масштабе показали меньшую задержку для всех графических процессоров при использовании D3D по сравнению с OpenCL.

Ранее AMD заявляла, что намерена сохранить GCN на рынке для вычислений, при этом Navi ориентирована на потребительский рынок, но нет никаких признаков того, что фирма намерена продолжать развивать GCN по отдельной траектории от RDNA. Скорее всего, это означает, что GCN не будет заменен на вершине рынка вычислений до тех пор, пока Big Navi не будет готов в какой-то момент в 2020 году. Исходя из того, что мы увидели, на этом фронте есть что взволновать. , Уже есть приложения, в которых RDNA значительно быстрее, чем Radeon VII, несмотря на огромную разницу между картами с точки зрения возможности двойной точности, пропускной способности ОЗУ и объема памяти.

Blender 2.80 представляет интересную серию сравнений между РДНК, GCN и CUDA. Использование больших размеров листов оказывает огромное влияние на производительность графического процессора, но будет ли это различие хорошим или плохим, зависит от того, какую марку графического процессора вы используете и к какому архитектурному семейству оно принадлежит. Графические процессоры Pascal и Turing работают лучше при меньших размерах плитки, в то время как графические процессоры GCN работают лучше с большими. Размер плитки 512 × 512 был лучше в целом для всех графических процессоров, но только потому, что он улучшил общее время рендеринга на Barbershop_Interior более чем на вред, который наносил вред времени рендеринга любой другой сцены для графических процессоров Turing и Pascal. RTX 2080 был самым быстрым графическим процессором в наших тестах Blender, но 5700 XT показал отличные результаты в целом.

Я не хочу делать глобальные заявления о настройках Blender 2.80; Я не эксперт по 3D рендерингу. Эти результаты испытаний показывают, что Blender работает лучше с большими настройками плитки на графических процессорах AMD, но что меньшие настройки плитки могут дать лучшие результаты для графических процессоров Nvidia. В прошлом как графические процессоры AMD, так и Nvidia извлекали выгоду из больших размеров тайлов. Однако этот шаблон также может быть связан с конкретными сценами, о которых идет речь. Если вы запускаете Blender, я предлагаю поэкспериментировать с различными сценами и размерами плиток.

В конечном итоге эти результаты показывают, что на некоторых из этих профессиональных рынков производительность графических процессоров значительно больше, чем мы можем ожидать от игр. Существуют специальные тесты, в которых 5700 XT заметно быстрее, чем RTX 2080 или Radeon VII, и другие тесты, где он резко отстает от них. Незрелость драйвера OpenCL может объяснить некоторые из них, но мы видим вспышки яркости в этих показателях производительности. Производительность Radeon VII с двойной точностью в некоторых отношениях делает его собственным классом, но Radeon RX 5700 XT является гораздо менее дорогой и более тихой картой. В зависимости от того, какое у вас целевое приложение, новый графический процессор AMD за 400 долларов может стать лучшим выбором на рынке. В других сценариях и Radeon VII, и RTX 2080 предъявляют особые и особые требования к тому, чтобы быть самой быстрой из доступных карт.

Особенность изображения – это финальная визуализация сцены Benchmark_Pavilion, включенной в автономный бенчмарк Blender 1.02beta.

Сейчас читаю: