Компьютер-Информ || Архив || Рубрики || Поиск || Подписка || Работа || О "КИ" || Карта

ЗАО "Техно-СПб" Системная интеграция

Сравнительное тестирование ATI RADEON 8500


Материал любезно предоставлен сайтом iXBT.com
Окончание, начало в ╚КИ╩ ╧ 21/2001

Oтметим, что карта выполняет шейдеры версии 1.4. В комплекте с RADEON 8500 поставляется демо-программа, которая позволяет увидеть визуальную разницу между реализациями PS1.1 и PS1.4 (сверху 1.1, снизу 1.4).

Производительность версии 1.4 адекватна производительности предыдущих версий на аналогичных задачах. Шейдеры 1.4 гораздо более гибки при выборке значений из текстур, и существует класс эффектов, которые с ними реализуются проще либо вообще нереализуемы без них. Впрочем, несмотря на очевидное архитектурное превосходство, потребность сравнивать скорость выполнения новой версии шейдеров в предельных тестах не возникнет у нас никогда═≈ NVIDIA не планирует поддерживать шейдеры 1.4, а следующий продукт ATI будет уже совместим с DirectX 9 и, как следствие, c пиксельными шейдерами версии 2.0.

EMBM рельеф

Этот тест измеряет падение производительности при использовании наложения карт отражения (Environment) и рельефа на основе карт отражения (EMBM ≈ Environment Bump). Для тестирования использовалось разрешение 1280х1024, т.═к. именно при нем различия между картами и разными режимами текстурирования выражены наиболее резко.

График 1.

В тесте Environment + Bump виден небольшой проигрыш RADEON 8500, несмотря на превосходство в обычном текстурировании и наложении карт среды. Судя по всему, последняя стадия EMBM ≈ пертурбация (смещенная выборка значений из текстуры) ≈ выполняется чипом неуверенно.

Аппаратная реализация N-Patches

Так как пока нет приложений, в которых можно было бы нормально протестировать зависимость производительности аппаратной реализации N-Patches от уровня детализации, мы попросили автора RADEON Screen Saver Филиппа Герасимова модифицировать его программу (одна из загружаемых сцен которой демонстрирует N-Patches), добавив туда возможность регулировать детализацию. Так мы получили следующую тестовую сцену (на двух представленных скриншотах
1 ≈ без N-Patches, 2 ≈ с использованием технологии Truform).

Очевидно, что практическое использование N-Patches возможно только с числом разбиений порядка 2 или менее. В случае одного разбиения (треугольник превращается в 4) ≈это легко, но уже в случае 2 мы наблюдаем двукратное падение производительности. Большие уровни детализации практически бессмысленны: скорость падает почти на порядок. В защиту RADEON отметим, что этот тест несколько синтетичен. В реальных приложениях N-Patches, как правило, используются только с моделями, в то время как вся окружающая сцена выводится обычным образом, да и уровень детализации 2 уже сам по себе существенно сглаживает модель. Данная технология позволяет воплотить в трехмерных объектах образы, уже очень близкие по форме к человеку:

А ведь это ╚лицо прекрасной девушки╩ состоит из неимоверного числа полигонов (уже после отработки TruForm):

Подытожим предельные тесты. Несколько раз отдельные блоки GeForce3 демонстрировали подавляющее преимущество над RADEON 8500, а несколько раз и RADEON как минимум вдвое опережал GeForce 3.

Тестирование эффективности HSR

Для того чтобы оценить эффективность реализации HSR, применен тест с большим уровнем OverDraw ≈ VillageMark v.1.17.

График 2. Результаты со включенным и отключенным HSR

Очевидно, что эффективность HSR у RADEON существенно выше, но с ростом разрешения выигрыш от включения HyperZ II падает быстрее, нежели в случае Ti 500. Итак, у RADEON 8500 налицо добротная реализация HSR.

3D Mark 2001 ≈ синтетические тесты

Скорость закраски
Измерялась только для 32-битной глубины цвета.

График 3.

Мы выбрали разрешение 1600х1200, чтобы минимизировать зависимость от других видов производительности чипа (например, геометрической). Наибольший результат этого теста всегда достигается при максимальном разрешении ≈ здесь чипу остается только красить бескрайние поля экрана. Напомним, что теоретические пределы для данного теста (также изображены на диаграмме) составляют 960 млн пикселей в секунду для Ti 500 и 1100 для RADEON 8500 соответственно. Последний наиболее близко подобрался к своему потолку, продемонстрировав отличную организацию кэширования и работы с памятью, а также прекрасную сбалансированность архитектуры (рис. 4).

График 4.

И в случае максимального использования мультитекстурирования (4 текстуры для Ti 500 и 6 текстур для RADEON 8500) все повторяется. Теоретические пределы в этом тесте составили соответственно 1920 для Ti 500 и 2200 для RADEON 8500. Нет сомнений в совершенстве архитектуры RADEON, особенно если вспомнить успешную и ╚холодную╩ работу с более медленной формально, нежели у Ti 500, памятью на более высоких частотах.

Сцена с большим количеством полигонов

Этот тест мы проводили в небольшом разрешении, дабы снизить влияние закраски на полученные результаты.

График 5.

При наличии одного источника света результат RADEON не только значительно (более чем на разницу частот) превосходит Ti 500, но и (что более важно) вплотную приблизился к практическому пределу пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK, в отличие от GeForce 3, существенно сдавшей в более ╚реальном╩ тесте.

График 6.

В случае с 8 источниками света производительность RADEON упала втрое. Но у Ti 500 ≈ еще хуже. В играх будущего (например, Next Doom), вероятно интенсивное использование большого числа аппаратных источников света. Именно в таких приложениях RADEON сможет продемонстрировать свое архитектурное преимущество над семейством GeForce3.

Рельефное текстурирование

Этот тест проводился в разрешении 1024х768, наиболее характерном для современных игр. Ведь слишком маленькое разрешение чревато заметной зависимостью от геометрической производительности карты, а слишком большое ≈ от пропускной полосы шины памяти.

График 7.

Более медленная по скорости закраски Ti 500 справилась с этим тестом существенно лучше, даже в сравнении с разогнанной RADEON. Это и предвещал предельный тест EMBM производительности из DirectX SDK. Недостатки реализации EMBM в 8500 налицо. Перейдем к DOT3 рельефу.

График 8.

GeForce3 ≈ лучше. Остается посетовать на потенциальные ╚драйверные╩ проблемы RADEON, которые не дают полностью раскрыть частотный запас в этих тестах. Однако с приходом пиксельных шейдеров эти 2 теста начинают терять свою важность ≈ ибо с помошью шейдеров можно реализовать много различных методов рельефного текстурирования, в том числе с попиксельным расчетом освещения.

Вершинные шейдеры

Мы приводим результаты этого теста в нескольких разрешениях.

График 9.

Если производительность Ti500 медленно падает с ростом разрешения, что говорит
о зависимости от геометрической производительности чипа, то RADEON явно упирается не столько в собственный интерпретатор шейдеров, сколько в скорость закраски. То есть даже интенсивный синтетический тест не смог застать программируемый TCL блок RADEON врасплох═≈ его производительность всегда оставалась ╚достаточной╩. Остается пожелать создателям 3DMark2001 усовершенствовать этот тест, сделав его более тяжелым для геометрического блока ускорителя, и констатировать как минимум двукратное преимущество RADEON над Ti 500. Вспомнив полученные ранее на предельный тестах из DirectX SDK результаты, отметим, что в менее синтетической сцене из 3D Mark 2001, RADEON показывает завидную производительность в условиях реальной сцены.

Пиксельный шейдер

Проведем этот тест в привычном 1024х768.

График 10.

Преимущество RADEON фактически коррелирует с разницей в тактовых частотах соперников и чуть ниже ожидаемого из этих соображений результата. Это подтверждает полученные ранее на предельном тесте MFCPixelShader результаты. Впрочем, общий баланс чипа удовлетворителен: нет потенциально возможного двукратного проигрыша RADEON.

Спрайты

Приведем наименьшее разрешение, т.═к. в остальных взаимная картина не меняется.

График 11.

RADEON существенно обыгрывает Ti 500, в основном благодаря геометрической производительности. Закраска плоских спрайтов крайне проста, скорость их вывода все время упирается в геометрический аспект ≈ спрайтов очень много, и перед закраской надо преобразовать множество координат.

Подытожив синтетические тесты из 3D Mark 2001, отметим, что при переходе от предельных тестов SDK к более ╚реальным╩, но все же синтетическим сценам 3D Mark, RADEON, как правило, получает преимущество благодаря хорошо сбалансированной архитектуре.

Результаты тестирования в игровых приложениях
и 3DMark2001 (игровые тесты)

3DMark2001, DirectX 8.0

Общие результаты

Перманентная═победа RADEON 8500 над NVIDIA GeForce3 Ti 500! Означает ли это, что в DirectX играх RADEON станет полновластным лидером? Рассмотрим по отдельности каждый игровой тест, входящий в 3DMark2001, попутно отметив, что при переходе с Pentium4-1500 на Athlon-1400 производительность обеих карт практически не изменилась.

Окончание следует


       КОМПЬЮТЕР-ИНФОРМ 
          Главная страница || Статьи ╧ 22'2001 || Новости СПб || Новости России || Новости мира

Анкета || Рубрики || Работа || Услуги || Поиск || Архив || Дни рождения
О "КИ" || График выхода || Карта сайта || Подписка

Главная страница

Сайт газеты "Компьютер-Информ" является зарегистрированным электронным СМИ.
Свидетельство Эл ╧ 77-4461 от 2 апреля 2021 г.
Перепечатка материалов без письменного согласия редакции запрещена.
При использовании материалов газеты в Интернет гиперссылка обязательна.

Телефон редакции (812) 118-6666, 118-6555.
Адрес: 196084, СПб, ул. Коли Томчака, д. 9
Пейджер 238-6931(аб.3365)
e-mail:
Для пресс-релизов и новостей