среда, 14 июля 2010 г.

CUDA accelerated applications & NVIDIA Quadro GPU’s

Наконец добрался до первых тестов и замеров производительности, в приложениях использующих технологию NVIDIA CUDA. На этот раз я пошел достаточно простым путем – взял стандартное приложение из CUDA SDK 3.1 и мой любимый пример N-Body Simulation.
Данный пример отлично показывает производительность GPU при вычислениях с одинарной точностью, а так же значение производительности в GFLOP’s.
Первая была протестирована карта NVIDIA Quadro FX 1800, которая используется в моей рабочей станции уже на протяжении последнего года. Данная модель GPU показала, как и ожидалось производительность в 94 – 99,8 GFLOP’s. Иногда конечно и выскакивала за рубеж в 100 GFLOP’s.

Первый пример на рабочей станции с Quadro FX 1800 768 Mb.
При этом, хочется отдельно заметить, что частота воспроизведения кадров была равна 26 – 34 fps. Что конечно меня впечатлило не только от самой GPU, так и всей системы в целом. Ведь приложение, которое задействовалось, использует и возможности CPU (буквально 40 – 50% @ Intel Core 2 Duo).
На второй станции от компании FORSITE (http://www.forsite-company.ru/) была задействована модель NVIDIA Quadro FX 3800. Она же, в свою очередь, обладая 1Gb GDDR3 памяти, и 192 ядрами CUDA, выдала результат, который я конечно и ожидал, но, хотел убедиться лично, в 240 – 304 GFLOP’s. Это особенно полезно, когда специалистам приходится использовать GPU accelerated средства визуализации, о чем мы погорим ниже.

Пример на рабочей станции FORSITE с Quadro FX 3800 1024 Mb.
Стоит отметить, что станция FORSITE выполнена достаточно качественно, и за счет использования высокоскоростных элементов памяти и накопителей скорость обработки данных, конечно же, возрастает. Процессор же нагружен был максимум на 12 – 20% при этом благодаря наличию в Intel Core i7 технологии Intel TurboBoost, мы получили возможность увеличения производительности.
Но, а как же обстоят дела в приложениях специально ориентированных на применение GPU в качестве мощнейшего сопроцессора? Ответ на этот вопрос наглядно может дать демонстрационное видео, сделанное мною по ходу экспериментов с визуализатором Octane Render.

Сравнение производительности при визуализации в Octane Render на NVIDIA Quadro FX 1800 & NVIDIA Quadro FX 3800. Материал сделан специально для компании FORSITE.
Ну что могу сказать, различия в производительности между этими двумя GPU заметны невооруженным взглядом. Особенно при визуализации на GPU NVIDIA Quadro FX3800. Главное то, что сам GPU практически не превышает свою температуру и справляется с задачей на тех частотах, которые были заданы в спецификации для производителей.
Тут конечно так же заметно, что при применении Quadro FX1800 частота кадров обновления сцены в Octane Render равна порядка 1 – 3 fps, на Quadro FX3800, все намного лучше, обновление сцены и выполнение навигации по ней на этой GPU одно удовольствие. Плюс конечно, достаточно мощная система в целом.
Но на этом всем мы не останавливаемся, и уже скоро здесь будут представлены результаты и других визуализаторов, новый Buckspeed SHOT и легендарный mental ray с технологией iray.

1 комментарий:

  1. так же, графические станции можно купить в http://www.adelsy.ru/

    ОтветитьУдалить