ОБЪЕКТИВНОСТЬ БЕЗ КОМПРОМИССОВОбъективность Без Компромиссов В Мире Компьютеров
НОВОСТИ САЙТАТЕСТИРУЕМ ВМЕСТЕИНТЕРНЕТ и ПОВСЯКО-РАЗНОСОФТ ПРОЕКТЫНАШИ ССЫЛКИ
ГЛАВНАЯ >> ТЕСТИРУЕМ ВМЕСТЕ >> ВИДЕОКАРТЫ: NVIDIA G80: Новый уровень производительности

НАЗВАНИЕ СТАТЬИ: NVIDIA G80: Новый уровень производительности
АВТОРСТВО: Алекс Наб
ДАТА НАПИСАНИЯ: Декабрь 2006 года
ДАТА ПЕЧАТНОЙ ПУБЛИКАЦИИ: Февраль 2007 года ( ISSN 0235-3520 )
ДАТА ПОСЛЕДНЕЙ РЕДАКЦИИ: Январь 2007 года
Алекс Н.

СОДЕРЖАНИЕ

  • Вступление
  • Как мы тестировали
  • FOXCONN GeForce 8800GTX 768Mb (GeForce 8800GTX)
  • Chaintech GeForce 8800GTX 768Mb (GeForce 8800GTX)
  • BFG GeForce 8800GTS 640Mb (GeForce 8800GTS)
  • Leadtek WinFast PX8800 GTS TDH 640Mb (GeForce 8800GTS)
  • Gigabyte GV-3D1-7950-RH 2x512Mb (GeForce 7950GX2)
  • MSI NX7900GTX-T2D512E 512Mb (GeForce 7900GTX)
  • Sapphire Radeon X1950 XTX 512Mb (Radeon X1950 XTX)
  • ASUS EAX1900XTX/2DHTV 512Mb (Radeon X1900 XTX)
  • Что показали тесты
  • РАЗМАХАЙКА: Вопросы качества
  • РАЗМАХАЙКА: Полезные советы для энтузиастов
  • Таблица 1. Сравнительные характеристики видеоадаптеров
  • Таблица 2. Результаты игровых тестов при AA:00 и AF:00
  • Таблица 3. Результаты игровых тестов при AA:04 и AF:16
  • Таблица 4. История развития Shader Model разных версий

    Так уж получается, что в потребительской оценке 3D-ускорителя большую роль играют показатели производительности, а характеристики эргономики устройства, его комплектация и сопроводительная поддержка оказываются на вторых ролях. Даже в методике испытаний видеоплат американского журнала PC World ( http://www.pcworld.com/printable/article/id,122816/printable.html ) критерий с названием performance имеет вес 50% в итоговом рейтинге протестированного продукта.
    А между тем производительность графической платы - это объем "3D-работы", проделанный за единицу времени. В программных тестах эта характеристика измеряется в кадр/с (или FPS - Frames Per Second). И для определения компьютерной 3D-производительности используются как специальные синтетические тесты (например, 3DMark, AquaMark, D3D RightMark, SPECViewperf и т.д.), так и тестовые наборы из настоящих игровых приложений.
    Конечно, синтетические тесты в ходе измерительных работ способны максимально нагрузить графические процессоры передовыми алгоритмами и в самых неожиданных режимах. Но так ли важны для потребителя результаты специализированных измерений, если во многих режимах тестового пакета 3DMark06 самые мощные ускорители 2006 г. еле-еле дотягивают до показателя в 20 кадр/с, но при этом данные видеоплаты прекрасно справляются со всеми актуальными играми?
    Разумеется, полезно знать, как поведет себя графическая подсистема в проблематичной ситуации, но для пользователей гораздо важнее информация о производительности в реальных приложениях и в типичных ситуациях. Поэтому в наших исследованиях вычислительного потенциала ПК мы будем использовать специальный сценарий SmartFPS.com, написанный на языке C# и вызывающий измерительный модули популярных игр Call of Duty 2, Battlefield 2, Serious Sam 2, Call of Juarez, Quake 4, Prey и The Chronicles of Riddick: EFBB.
    По результатам своей работы программа-скрипт выдает информацию о производительности протестированной конфигурации в средних показателях кадр/с (AvgFPS) для каждой игры. При этом уникальная фиксация условий запуска игровых приложений придает сопоставлениям графических подсистем высокую степень корректности и исключает возможность появления многих ошибок в измерениях.
    Итак, давайте по-честному в самых популярных играх столкнем новую гвардию империи NVIDIA на базе процессоров GeForce 8800GTX и GeForce 8800GTS со старой сборной из графических кристаллов GeForce 7950GX2, GeForce 7900GTX, Radeon X1950 XTX и Radeon X1900 XTX. Возможно, новейшая линейка GeForce 8800 окажется бесполезной в играх нашего времени и ее эпоха наступит лишь с появлением первых приложений для DirectX 10.

    Изображение 1. Игра Flight Simulator X для DX9
    Изображение 2. Игра Flight Simulator X для DX10
    внимание на водную поверхность, облака, освещение гор и лесов

    Как мы тестировали
    Тестирование проводилось под управлением английской версии операционной системы Windows XP Professional SP2 (build 2600 + официальные обновления и "заплатки"). Для работы с графическими подсистемами использовались видеодрайверы ForceWare 97.44, ForceWare 93.71 и Catalyst 6.11.
    В качестве измерительного инструментария применялся сценарный тест SmartFPS.com v1.2 ( www.smartfps.com ) для автоматизированного определения производительности в игровых приложениях Call of Duty 2, Battlefield 2, Serious Sam 2, Quake 4, Prey и The Chronicles of Riddick: EFBB.
    Все запуски тестовых сценариев выполнялись с использованием монитора Philips Brilliance 202P7 в графических разрешениях 1280x1024, 1600x1200 и 2048x1536 точек с глубиной цвета 32 бита. При этом исследование 3D-производительности видеоплат проводилось в двух режимах качества отображения игровой картинки: с отключенными полноэкранным сглаживанием и анизотропной фильтрацией, а также с включенными четырехкратным сглаживанием (AA:04) и 16-кратной анизотропной фильтрацией (AF:16). Все настройки качества визуализации контролировались с помощью глобальных установок в соответствующих видеодрайверах NVIDIA ForceWare и ATI Catalyst (при отключенных Temporal AA, Adaptive AA и High Quality AF).
    Аппаратная конфигурация тестового стенда в корпусе Compucase LX-7X31BS была следующей: ЦП Intel Core 2 Extreme X6800, системная плата Foxconn 975X7AB, двухканальное ОЗУ на базе модулей Corsair XMS2-6400 CM2X1024-6400PRO (2x1 Гбайт, DDR2, 800 МГц, 5-5-5-18), жесткий диск Hitachi Deskstar HDT7250VLA380 (SATA2, 7200 об/мин, 250 Гбайт), оптический DVD-привод TEAC DV-516, блок питания Thermaltake Pure Power-680APD. Энергопотребление системного блока (без монитора) контролировалось сертифицированным прибором учета электроэнергии "Меркурий 200.02" (классы точности 1 и 2).

    Изображение 3. Игра Company of Heroes для DX9
    Изображение 4. Игра Company of Heroes для DX10
    внимание на взрыв и тени от него

    FOXCONN GeForce 8800GTX 768Mb (GeForce 8800GTX)
    В новом году компания Microsoft не просто выпустила на рынок операционную систему Windows Vista, а породила более удобный интерфейс взаимодействия между создателями графических ускорителей и игровых приложений - библиотеку функций API DirectX 10. И теперь, как водится, все будет по-другому, а первой ласточкой "другой эпохи" стал кристалл G80, который лег в основу платы FOXCONN GeForce 8800GTX, точной копии эталонной платы NVIDIA. Но что же принципиально нового в этом решении?

    Изображение 5. Блок-схема ГП GeForce 8800GTX 768Mb (NVIDIA G80)

    Во-первых, в новейшей архитектуре нет деления вычислительных блоков на пиксельные и вершинные, а есть 128 универсальных процессоров, которые могут просчитывать как пиксельные, так и вершинные шейдеры (для сравнения: на кристалле GeForce 7900GTX расположено всего 24 пиксельных и восемь вершинных блоков). Причем такой вычислительный батальон из 128 универсалов поделен на восемь подразделений (по 16 скалярных процессоров), которые еще включают в себя по четыре текстурных блока (всего 32 "текстурника") и по кэшу первого уровня (всего восемь кэшей L1). И здесь нужно добавить, что все компоненты шейдерного батальона, работают на частоте 1350 МГц, которая значительно превышает основную частоту работы кристалла G80 (575 МГц).
    Во-вторых, увеличилась ширина шины обмена данными с видеоОЗУ с привычных 256 до 384 бит (шесть 64-х битных контроллеров), что, в свою очередь, позволило довести максимальный объем памяти ускорителя GeForce 8800GTX до 768 Мбайт. По пути отметим, что контроллер управления памятью G80 поддерживает работу как с GDDR3, так и с GDDR4, а значит, после разумного понижения цен на ОЗУ типа GDDR4 мы сможем увидеть на рынке плату NVIDIA GeForce 8900GTX (G81) на основе видеопамяти стандарта GDDR4 объемом 768 Мбайт.

    Изображение 6. Устройство потоковых процессоров G80 и текстурных блоков

    В-третьих, улучшена работа алгоритмов анизотропной фильтрации и полноэкранного сглаживания (добавлена схема CSAA - Coverage Sampling Antialiasing), а также появилась возможность одновременной работы разных методов сглаживания и технологии HDR (High Dynamic Range - визуализация в широком динамическом диапазоне), что было присуще раньше лишь графическим решениям ATI.
    И в-четвертых, графический процессор G80 умеет работать с геометрическими шейдерами (программы, обрабатывающие параметры геометрических примитивов) и способен просчитывать различные физические эффекты в рамках технологии NVIDIA Quantum Effects. И эти инновации стали реальностью отчасти благодаря революционной возможности записи и передачи промежуточных данных прямо из шейдеров.

    Изображение 7. Видеокарта FOXCONN GeForce 8800GTX 768Mb

    Chaintech GeForce 8800GTX 768Mb (GeForce 8800GTX)
    Не стоит удивляться, что большинство ускорителей на базе микросхем GeForce 8800GTX и GeForce 8800GTS будут отличаться от эталонных образцов NVIDIA лишь наклейками на радиаторах и разными комплектами поставок. Вот и плата Chaintech представляет собой точную копию акселератора NVIDIA GeForce 8800GTX, который поражает воображение специалистов количеством инноваций на каждый квадратный миллиметр кристалла.

    Изображение 8. Сравнение качества анизотропной фильтрации плат Radeon X1950 XTX (слева)
    и GeForce 8800GTX (справа); настройки: ATI - High Quality, NVIDIA - Default

    Причем впечатляющие характеристики решения GeForce 8800GTX не возникли из воздуха, а достигнуты с помощью логической схемы из 681 млн. транзисторов, которые требуют эффективного охлаждения, впрочем, как и 12 модулей памяти GDDR3 вокруг микропроцессора. Поэтому давайте внимательней посмотрим на новый охладитель NVIDIA, ведь ему приходится особенно жарко в работе.
    В его основе лежит радиаторная рама с медной вставкой посередине, к основанию которой подводится капиллярная трубка, на которую буквально нанизано большое число алюминиевых пластин. Вся эта конструкция заключена в пластиковый кожух, где с одного края установлен вентилятор, который забирает воздух внутри компьютера и транспортирует его через воздуховод наружу. Благодаря внушительным размерам и продуманности конструкции система охлаждения GeForce 8800GTX эффективно справляется со своими задачами и работает очень тихо даже в горячие моменты игровых баталий.
    Огорчает другое. Длина печатной платы NVIDIA GeForce 8800GTX составляет 27 см (для сравнения: ускоритель GeForce 7900GTX имеет длину 22 см), и во многих корпусах она упирается в блок установки жестких дисков, так что некоторым владельцам ПК вместе с GeForce 8800GTX придется покупать и новые корпуса. К тому же для полноценной работы GeForce 8800GTX потребуется очень мощный блок питания (с двумя разъемами 3х2 для видеоплат), самый производительный ЦП и скорее всего новый монитор с высоким разрешением (от 1600x1200 точек и выше). Вот и получается, что затраты на 3D-акселератор NVIDIA GeForce 8800GTX и сопутствующие расходы очень трудно назвать приемлемыми.

    Изображение 9. Видеокарта Chaintech GeForce 8800GTX 768Mb

    BFG GeForce 8800GTS 640Mb (GeForce 8800GTS)
    Приятно отметить, что графический процессор G80 обладает одним важным конкурентным преимуществом - он хорошо масштабируется по количеству вычислительных блоков и по ширине шины доступа к видеоОЗУ. Поэтому если в кристалле GeForce 8800GTX отключить два набора унифицированных процессоров из восьми и забыть про один 64-х битный контроллер доступа к памяти из шести, то легко получится решение GeForce 8800GTS, которое хотя и будет обладать более скромными техническими характеристиками, но зато при доступной цене.

    Изображение 10. Пример нефотореалистичного рендеренга NPR с помощью геометрического шейдера (DX10)

    Так, видеоплата BFG GeForce 8800GTS имеет всего 96 потоковых процессоров (шесть наборов по 16 вычислительных блоков), урезанную до 320 бит шину доступа к памяти GDDR3 (с максимально допустимым объемом 640 Мбайт) и пониженную частотную формулу - 500/1200/1600 (основная частота работы/частота шейдерных блоков/эффективная частота видеоОЗУ). Но в плюсах у этой модели числятся небольшие габариты (длина платы 22 см) и приемлемая стоимость.
    Кроме того, в необычном комплекте поставки BFG можно обнаружить фирменную футболку, а также тефлоновые наклейки для мышки, которые, согласно заявлению компании, улучшат ее скольжение.

    Изображение 11. Видеокарта BFG GeForce 8800GTS 640Mb

    Leadtek WinFast PX8800 GTS TDH 640Mb (GeForce 8800GTS)
    В эпоху нашествия клонов на базе ГП NVIDIA G80 можно долго восхищаться всякими дизайнерскими изысками вроде небрежно установленных светодиодов на инженерной плате FOXCONN GeForce 8800GTX. И тем не менее оригинальный кожух охладителя GeForce 8800GTS мило выделяет плату Leadtek WinFast PX8800 GTS TDH 640Mb на фоне современных ускорителей - по приведенному здесь изображению можете сами оценить металлическую накладку в виде воздухозаборника спортивного автомобиля.
    А вот по производительности акселератор WinFast PX8800 GTS не отличался от показателей инженерного образца NVIDIA GeForce 8800GTS. Оно и понятно, ведь в основе продукта Leadtek заложены те же самые характеристики и параметры. Так что нам остается еще похвалить глянцевое покрытие упаковки WinFast да парочку устаревших игр в комплекте (Spell Force 2 и Trackmania).

    Изображение 12. Видеокарта Leadtek WinFast PX8800 GTS TDH 640Mb

    Gigabyte GV-3D1-7950-RH 2x512Mb (GeForce 7950GX2)
    Видеоплата Gigabyte GV-3D1-7950-RH по сути представляет собой эталонное решение NVIDIA GeForce 7950GX2, в основе которого лежат два ускорителя GeForce 7900GTX, объединенные в специальную SLI-упряжку. Но здесь есть несколько нюансов, достойных упоминания.
    Во-первых, две платы на базе ГП NVIDIA G71 работают с пониженными частотами - 500/1200 МГц (ядро/память) вместо типичных 650/1600 МГц. Во-вторых, для работы SLI-акселератора Gigabyte GV-3D1-7950-RH достаточно одного разъема PCI Express 16x на системной плате, ведь соответствующие контакты у решения GeForce 7950GX2 имеются лишь на нижней PCB, в то время как верхний ускоритель жестко связан с нижним через специальный мост. И в-третьих, две SLI-упряжки NVIDIA GeForce 7950GX2 можно еще раз объединить в режим SLI и получить "четырехъядерное" графическое решение, и такая Quad-система годится для использования в самых высокопроизводительных станциях (например, в платформе AMD 4x4).
    Кстати, обе платы, объединенные в ускорителе Gigabyte GV-3D1-7950-RH, имеют собственные системы охлаждения, в основе которых лежит радиатор с впаянной пластиной из меди и небольшой вентилятор с приемлемым уровнем шума. И хотя в процессе тестирования двухуровневая конструкция Gigabyte все равно сильно грелась, она работала без сбоев и замечаний не вызывала.

    Изображение 13. Видеокарта Gigabyte GV-3D1-7950-RH 2x512Mb

    MSI NX7900GTX-T2D512E 512Mb (GeForce 7900GTX)
    Ускоритель MSI NX7900GTX-T2D512E является полным аналогом инженерного образца NVIDIA GeForce 7900GTX, в основе которого лежит кристалл G71 с классической архитектурой NVIDIA (восемь вершинных и 24 пиксельных конвейера, по одному текстурному блоку на каждом). В производстве самой микросхемы G71 был использован техпроцесс 90 нм, который и сейчас применяется на заводе компании TSMC ( www.tsmc.com ) при создании новейшего ГП NVIDIA G80.
    Разумеется, с появлением линейки высокопроизводительных решений NVIDIA GeForce 8800 судьба моделей семейства GeForce 79xx становится предопределенной, хотя пока на прилавках магазинов они встречаются чаще, чем ускорители с ГП NVIDIA G80.

    Изображение 14. Видеокарта MSI NX7900GTX-T2D512E 512Mb

    Sapphire Radeon X1950 XTX 512Mb (Radeon X1950 XTX)
    В то время как создатели графического кристалла NVIDIA G80 уверяли ИТ-специалистов, что ожидают окончательного утверждения стандарта памяти GDDR4, инженеры компании ATI вывели на рынок готовое решение Radeon X1950 XTX на базе видеоОЗУ типа GDDR4 объемом 512 Мбайт с эффективной частотой функционирования 2000 МГц. В этом и состоит основная разница между видеоплатами серий Radeon X1950 XTX и Radeon X1900 XTX, поскольку соответствующие процессоры R580+ отличаются от R580 только усовершенствованным контроллером памяти.
    Однако помимо небольшой оптимизации интегральной микросхемы ATI R580 налицо серьезная переработка эталонной системы охлаждения высокопроизводительных акселераторов ATI. Теперь она более эффективна и к тому же функционирует значительно тише. Можно даже предположить, что именно эту конструкцию начнут устанавливать на некоторые будущие платы линейки Radeon X2000 на базе микросхем ATI R600 и R620.
    В основе нового охладителя ATI лежит массивный радиатор из медного сплава и капиллярная трубка, обеспечивающая отвод тепла к многочисленным тонким пластинам. Как и в системе охлаждения G80, конструкция ATI Radeon X1950 XTX заключена в пластиковый кожух, где с одного края установлена турбина со специальными лопастями, которые усиленно гонят нагретый воздух изнутри корпуса ПК наружу через воздуховод.
    Остается добавить, что в нашем обзоре решение ATI Radeon X1950 XTX было представлено высокоточной копией производства Sapphire. На российский рынок она поставляется с двухлетней гарантией и с неудачной игрой The Davinco Code в комплекте.

    Изображение 15. Видеокарта Sapphire Radeon X1950 XTX 512Mb

    ASUS EAX1900XTX/2DHTV 512Mb (Radeon X1900 XTX)
    На первый взгляд решение ASUS на базе Radeon X1900XTX (R580) очень сильно напоминает продукт из устаревшей линейки Radeon X1800XT (R520). Но в отличие от соответствующего кристалла ATI R520, где имелось всего четыре квада пиксельных процессоров (т.е. 16 пиксельных блоков), ускоритель ATI R580 имеет 12 вычислительных "квартетов" (т.е. 48 пиксельных блоков), и в некоторых играх это обстоятельство дает особое преимущество в плане производительности.
    Но все же в большинстве актуальных игр значительное количество пиксельных конвейеров в Radeon X1900XTX никак не сказывается, ведь процессор ATI R580, как и R520, имеет всего 16 текстурных блоков (для сравнения: GeForce 7900GTX обладает 24 "текстурниками"), и таким образом интегральная микросхема выбирает лишь 16 текстур за такт. Так что многие результаты игровых тестов для платы ASUS EAX1900XTX/2DHTV оказались самыми скромными в нашем обзоре.

    Изображение 16. Видеокарта ASUS EAX1900XTX/2DHTV 512Mb

    Что показали тесты
    Анализируя результаты измерения игровой производительности протестированных ускорителей (см. табл. 2,3), не перестаешь удивляться. Ведь по старой доброй традиции компания NVIDIA заявляет о том, что ее новинка с кодовым названием G80 раскроет свой потенциал лишь с появлением соответствующих игр для интерфейса DirectX 10, а между тем мы видим потрясающий прогресс уже сейчас.
    И вовсе не обязательно покупать ОС Windows Vista и ждать выхода специальных версий игровых проектов Age of Conan, FPS Creator, Company of Heroes и Flight Simulator X с поддержкой новой версии Direct3D. Даже в играх нашего времени мы констатируем порой двукратный рост производительности платы GeForce 8800GTX по сравнению с вчерашними лидерами NVIDIA и ATI. Разумеется, самый большой прогресс наблюдается в наиболее высоких экранных разрешениях, и далеко не все мониторы поддерживают такие режимы работы. Но приятно, что технический прорыв все же могут наблюдать и обычные пользователи, а ведь так бывает далеко не всегда.
    Вспомните момент появления на рынке 64-х битных ЦПУ компании AMD в 2003 г. И много с тех пор вы видели владельцев ЦП AMD Athlon 64, которые получают выгоду от возможностей 64-разрядных вычислений? А между тем к 2007 г. первые процессоры Athlon 64 успели безнадежно устареть, так и не порадовав нас резким скачком производительности в 64-х битных ОС.
    Очевидно, внедрение графических процессоров GeForce 8800GTX пойдет по другому сценарию и массовое проникновение G80 в игровые компьютеры - лишь вопрос цены и времени. И жаль, что пока не всем любителям игр по карману видеоплаты FOXCONN GeForce 8800GTX или Chaintech GeForce 8800GTX.
    Но при желании сэкономить 150-200 долл. ситуация выглядит неоднозначно. Ведь решение GeForce 8800GTS по цене соответствует ускорителю GeForce 7950GX2, однако по производительности оно значительно уступает "бутербродной" конструкции NVIDIA в играх Call of Duty 2, Quake 4, Prey и The Chronicles of Riddick: EFBB. Конечно, в пользу приобретения плат BFG GeForce 8800GTS и Leadtek WinFast PX8800 GTS TDH говорит поддержка DirectX 10 и Shader Model 4.0, а также усовершенствованные методы анизотропной фильтрации и сглаживания. Однако акселераторы NVIDIA GeForce 7950GX2 предпочтительней в плане игровой производительности и к тому же пока доступней в компьютерных магазинах.
    Что касается решений GeForce 7900GTX, Radeon X1950 XTX и Radeon X1900 XTX, то по производительности они находятся в самом низу таблицы результатов испытаний и соперничают между собой с переменным успехом. Но если цены на вчерашних победителей видеообзоров упадут еще немного, то для большинства игроманов покупка экс-чемпионов будет выгодной, ведь в разрешениях 1280x1024 и 1600x1200 они пока выдают комфортный уровень частоты смены кадров в играх. А вопрос о целесообразности использования высоких настроек анизотропной фильтрации и полноэкранного сглаживания каждый пользователь должен решать индивидуально, выбирая между субъективным ощущением улучшения качества изображения и уменьшением количества кадров в секунду.

    Вопросы качества
    При сравнении видеоплат кроме показателей производительности в игровых приложениях большая роль отводится качеству отображения, которое складывается из самых сложных режимов анизотропной фильтрации (AF) и полноэкранного сглаживания (AA), а также фирменных методов реализации этих технологий (см. "Нанометровая граница позади").
    Например, ускорители ATI начиная с моделей Radeon 9700, а также платы NVIDIA начиная с акселераторов GeForce6 использовали похожие алгоритмы фильтрации, которые были достаточно экономичны с точки зрения использования вычислительных ресурсов. В то же время эти методы таили в себе упущения по качеству визуализации.
    Представьте себе сцену из игры, где вы располагаетесь рядом с наклонным спуском (см. рисунок). Достаточно очевидно, что поверхности, находящиеся на одном и том же расстоянии от вас, будут видны одинаково хорошо. Однако весь секрет упрощенной анизотропной фильтрации в том, что далеко не все плоскости обработаны с равной четкостью. Выбранный уровень анизотропии (2х, 4х, 8х и 16х) работает только для определенных поверхностей, которые наклонены к оси зрения (перпендикулярно поверхности экрана) пользователя под углами, близкими к 0, 45, 90, 135, 1800. В остальных случаях плоскости обрабатываются в упрощенных режимах и качество AF при определенных углах наклона опускается ниже отметки 2x, что особенно заметно при установке уровня анизотропной фильтрации в режимах 8х и 16х.

    Изображение 17. Пример работы алгоритмов типичной фильтрации (наверху) и
    анизотропной фильтрации G80 (внизу) в игре Unreal Tournament 2004 (внимание на секции B и C)

    Но теперь все будет иначе. Для устранения упомянутых недочетов AF в работе видеоплат ATI можно включать опцию High Quality AF, которая приводит к улучшению качества изображения и уменьшению количества кадров в секунду (см. таблицу). А в продукции компании NVIDIA начиная с линейки GeForce 8800 текстурные модули изначально спроектированы с расчетом на повышение эффективности работы анизотропной фильтрации. И в кристалле G80 число возможных выборок текстур было повышено в 2 раза по сравнению с общим количеством текстурных модулей нового поколения. Такие оптимизации сделали возможным использование анизотропной фильтрации полноценного качества, при котором все поверхности обрабатываются в соответствии с уровнем анизотропии, выставленным через драйвер.
    Кроме того, падение производительности при включении AF на платах GeForce 8800GTX и GeForce 8800GTS оказалось ничуть не выше, чем у карт предыдущего поколения. При сравнении производительности стоит также иметь в виду, что качество визуализации предлагаемое ускорителями NVIDIA GeForce 8800 GTS и GTX, находится на более высоком уровне. Поэтому в тестировании более корректные выводы в плане производительности можно делать в процессе анализа результатов в режимах с отключенными анизотропной фильтрации и полноэкранным сглаживанием.
    Что же касается сглаживания, то тут есть свои нюансы, требующие отдельного исследования. Пока же мы можем сказать, что появилось несколько новых режимов более высокого качества, чем то, что мы привыкли видеть (примеры см. на рисунке).

    Изображение 18. Пример работы нового режима полноэкранного сглаживания
    CSAA 16x в игре Battlefield 2 на плате NVIDIA GeForce 8800 GTX

    Таблица зависимости производительности от качества анизотропной фильтрации на примере платы ATI Radeon X1950 XTX, при AA:04 и AF:16, кадр/с

    Полезные советы для энтузиастов
    Самые высокопроизводительные платы NVIDIA и ATI используются в высоких экранных разрешениях (вроде 1600x1200) с активированными настройками анизотропной фильтрации (AF) и полноэкранного сглаживания (AA). Именно в таких режимами игровая производительность ускорителей Hi-End находится на критическом в смысле комфортности рубеже 60-70 кадр/с.
    Но вот незадача, алгоритмы AF и AA на акселераторах GeForce и Radeon работают по-разному да при этом обеспечивают различные ощущения роста качества визуализации и несопоставимые степени падения производительности. Поэтому видеоплаты корректней тестировать с отключенными функциями AF и AA, а чтобы максимально нагрузить графическую подсистему, нужно использовать экранное разрешение 2048x1536, которое поддерживают далеко не все ЭЛТ-мониторы, не говоря уже о ЖК-панелях. Что же делать?
    Если отбросить вариант с покупкой нового монитора, то остается испытанный метод с подменой драйверов. Итак, загружаем драйвер дисплея, который наверняка поддерживает высокие разрешения (например, видеодрайвер нашего монитора Philips Brilliance 202P7) и устанавливаем их в операционную систему вместо драйверов вашего дисплея. Конечно, Windows для приличия может сопротивляться, но жмите кнопку "Все равно продолжить", и в режимах работы видеоплаты появится самое высокое разрешение 2048x1536.
    Вот в общем-то и все. Можно переходить к запускам различных тестов в самых высоких экранных разрешениях. Конечно, на 15-дюймовом мониторе вы не увидите сам процесс игрового сценария в разрешении 2048x1536, но по его окончании вы получите вполне корректные результаты, которые позволят в сравнении судить о потенциале ускорителя.

    Таблица 1. Сравнительные характеристики видеоадаптеров PCI Express (технология производства 90 нм, TSMC)
    Модель видеоплаты Графический процессор Количество пиксельных и вершинных блоков Количество текстурных/ ROP блоков Основная частота работы (частота шейдерных блоков), МГц Эффективная частота работы видеоОЗУ, МГц Шина доступа к видео ОЗУ, бит Дополнительные особенности Срок гарантийного обслуживания, мес. Ориентировочная цена, долл. Обобщающая оценка *, баллы
    FOXCONN GeForce 8800GTX 768Mb GeForce 8800GTX (G80) 128 32/24 575 (1350) 1800 384 Джойстик в комплекте, подсветка из электролюминесцентных диодов 12 600 90
    Chaintech GeForce 8800GTX 768Mb GeForce 8800GTX (G80) 128 32/24 575 (1350) 1800 384 Скромная комплектация 24 600 90
    BFG GeForce 8800GTS 640Mb GeForce 8800GTS (G80) 96 24/20 500 (1200) 1600 320 Футболка в комплекте 60 450 85
    Leadtek WinFast PX8800 GTS TDH 640Mb GeForce 8800GTS (G80) 96 24/20 500 (1200) 1600 320 Игры в комплекте 12 450 85
    Gigabyte GV-3D1-7950-RH 2x512Mb GeForce 7950GX2 (2xG71) 2x(24+8) 2x(24/16) 500 1200 2x256 Суперигра Serious Sam 2 в комплекте, опциональный Quad-SLI 36 450 85
    MSI NX7900GTX-T2D512E 512Mb GeForce 7900GTX (G71) 24+8 24/16 650 1600 256 Игры в комплекте 36 400 80
    Sapphire Radeon X1950 XTX 512Mb Radeon X1950 XTX (R580+) 48+8 16/16 650 2000 256 Игры в комплекте 24 450 80
    ASUS EAX1900XTX/2DHTV 512Mb Radeon X1900 XTX (R580) 48+8 16/16 650 1550 256 Игры в комплекте 36 400 75
    * - Составляющие обобщающей оценки: особенности - 20%, производительность - 40, эргономика - 15, цена - 25.

    Таблица 2. Результаты игровых тестов SmartFPS.com v1.2 при AA:00 и AF:00, кадр/с

    Таблица 3. Результаты игровых тестов SmartFPS.com v1.2 при AA:04 и AF:16, кадр/с

    Таблица 4. История развития Shader Model разных версий
      DirectX8 SM1.x DirectX9 SM2 DirectX9 SM3 DirectX10 SM4
    Vertex Instructions 128 256 512 64K
    Pixel Instructions 4+8 32+64 512
    Vertex Constants 96 256 256 16x4096
    Pixel Constants 8 32 224
    Vertex Temps 16 16 16 4096
    Pixel Temps 2 12 32
    Vertex Inputs 16 16 16 16
    Pixel Inputs 4+2 8+2 0 32
    Render Targets 1 4 4 8
    Vertex Textures n/a n/a 4 128
    Pixel Textures 8 16 16
    2D Tex Size
    Int Ops
    Load Ops
    Derivatives
    Vertex Flow Control n/a Static Static/Dyn Dynamic
    Pixel Flow Control n/a n/a Static/Dyn

    >> НАВЕРХ СТРАНИЦЫ <<