ГЛАВНАЯ >> ТЕСТИРУЕМ ВМЕСТЕ >> ВИДЕОКАРТЫ: AMD Radeon HD 6970: в ожидании чуда
НАЗВАНИЕ СТАТЬИ: AMD Radeon HD 6970: в ожидании чуда
АВТОРСТВО: Алекс Наб
ДАТА НАПИСАНИЯ: Декабрь 2010 года
ДАТА ПЕЧАТНОЙ ПУБЛИКАЦИИ: Январь 2011 года ( ISBN 460-3-9540-0002-5 )
ДАТА ПОСЛЕДНЕЙ РЕДАКЦИИ: Декабрь 2010 года
| |
СОДЕРЖАНИЕ
Вступление
Солидный тюнинг
Питаемся правильно
Право на ошибку
Куда целим
Как мы тестировали
Что показали тесты
Технические характеристики
Результаты тестов 3DMark 11
Результаты игровых тестов
Давайте порадуемся - конкуренция на рынке дискретных ускорителей между фирмами AMD и NVIDIA достигла своего апогея. Новые графические решения сыпятся со всех сторон, а по пути свежеиспеченные цены подкупают все больше пользователей.
Не успела NVIDIA анонсировать GeForce GTX 580 и разослать несколько пресс-релизов на тему «самый быстрый ускоритель», как вот вам ответное решение - Radeon HD 6970. И оно поспело, как нельзя вовремя. По статистики системы Steam почти три четверти реальных пользователей (всего более 30 млн.) используют акселераторы поколения DirectX 10. А значит в свете тотального нашествия игрушек под DirectX 11 грядет заметная волна модернизации компьютеров всех энтузиастов - AMD и NVIDIA в предвкушении больших денег.
Прошлый раз мы аплодировали плате GeForce GTX 580, теперь пришла очередь Radeon HD 6970. И можно только посочувствовать разработчикам обоих компаний, ведь их горячие новинки приходится делать в условиях застойного техпроцесса 40 нм.
Так инженеры AMD выполнили задачу по модернизации архитектуры Cypress, легшей в основу плат серии 5800. Новое ядро Cayman получилось производительнее, компактнее и энергоэкономнее. В результате ИТ-мир облетела обнадеживающая новость про ГПУ-архитектуру VLIW4, вместо VLIW5, использовавшейся в предыдущей линейке Evergreen.
Протестированная видеокарта AMD Radeon HD 6970
Солидный тюнинг
Специалисты AMD серьезно переработали существующую шейдерную архитектуру. Во-первых, увеличили число SIMD кластеров до 24. Напомним, что в процессорах Radeon HD 5850 и Radeon HD 5870 содержится 18 и 20 активных, так называемых SIMD engines, а в ГП 6850 и 5870 их число составляет 12 и 14 соответственно. Нарастили количество текстурных блоков до 96. Во-вторых, изменили структуру потоковых процессоров. Если раньше один такой блок состоял из пяти, так именуемых юнитов (Unit), отличающихся функциональным возможностям. То теперь в каждом потоковом блоке по четыре юнита, выполняющих все типы операций. Такое преобразование по заверениям AMD позволило уменьшить число транзисторов, сократить площадь кристалла на 10% и при этом сохранить эффективность в плане производительности.
Уверены, довольно скоро инженеры AMD вернут размеры графического кристалла в прежние рамки, а за счет «лишних» юнитов, приумножающих показатели вычислительной мощности. Ждем решения AMD-ATI Radeon HD 6980.
По пути отметим некоторые улучшения в так называемых бэкэндов (Back-Ends) блоков растеризации, занимающихся записью пикселей в буфер кадра. Проведенная оптимизация скажется при включении антиалиасинга и тяжелых режимов HDR (High Dynamic Range - визуализация в широком динамическом диапазоне). Помниться еще четыре года назад (до пришествия парочки GeForce 8800GTX и GeForce 8800GTS) возможность одновременной работы разных методов сглаживания и технологии HDR была присуща лишь решениям ATI.
Сегодняшние пользователи стали еще привередливей, помимо связки AA+HDR, они ждут особой эффективности в работе с вычислениями над числами с плавающей точкой в 32-битном формате. И в этом плане Radeon HD 6970 мало кого разочарует.
Если заниматься обсчетом игровых кадров, то основной поток данных, состоящий в основном из текстур и вершин, посылается в одном курсе - от центрального процессора к графическому. Но если сосредоточиться на других прикладных задачах, то информационный поток будет идти во всех направлениях. И тут ядро Cayman радует вторым дополнительным блоком DMA с прямым доступом к памяти. Независимо от основного, DMA-engine 2 может слать данные в обратную сторону по линиям PCI Express. Разумеется, это увеличивает эффективность вычислений с двойной точностью и выводит на новый уровень показатели DP (double precision) для плат серии 6900.
Теперь несколько слов о самом важном, что есть в DirectX 11, т.е. о тесселяции. Это было слабым местом в архитектуре Cypress, но с выходом серий плат 6800 и 6900 проблема исчезла. Инженеры AMD-ATI удвоили число внутренних блоков , связанных с технологией тесселяции (так называемых растеризаторов и тесселяторов). В результате в синтетических тестах, где фактор тесселяции соответствует девяти, производительность AMD Radeon HD 6970 выросла втрое по сравнению с AMD Radeon HD 5870. В реальных играх, вроде Metro 2033, Aliens vs. Predator и Lost Planet 2, показатели прогресса новинки гораздо скромнее - всего +30%.
Отметим, что в дополнении к новому режиму сглаживания Morphological AA, появившемуся с платами серии 6800, возник еще один режим антиалиасинга - Enhanced Quality AA. При обычном антиалиасинге в буфере кадра хранится большое число семплов (например, четыре для AA:4х или восемь для AA:8х), что ведет к загрузке видеопамяти и увеличению объемов передачи данных из памяти и обратно. На практике большинство информации теряется, ведь весь набор со-пикселей сжимается до одного. Вся избыточная нагрузка нужна лишь для того чтобы понять какую часть пикселя перекрывает определенная текстура. Так вот при включении Enhanced Quality AA в буфере хранится вдвое меньше семплов для каждой точки, но при этом учитывается попадает ли текстура на оставшиеся субпиксели. Получается удивительная зарисовка, когда при включении Enhanced Quality AA 4х качество игровой картинки доходит до Multi Sampling AA 8x, а производительность остается на обычном уровне AA:4х.
Более того, поверх EQAA можно включить Morphological AA, напоминающий собой работу сглаживающих фильтров из программ Adobe Photoshop и Corel Photo-Paint над кадром из фреймбуфера. Когда нет никакого значения где лежит пиксель, на краю треугольника или внутри текстуры - идет дополнительный проход по конкретной картинке и все «лестницы» сглаживаются автоматически. Что получится в визуальном плане судить придется пользователям со своими предпочтениями, но вот падение производительности можно гарантировать всем. Поэтому экспериментируйте на игровых хитах прошлых лет - например, Serious Sam 2 или The Chronicles of Riddick.
Питаемся правильно
В процессе проектирования нового ядра полет инженерной мысли ограничен предельным уровнем энергопотребления. Приходится экспериментировать с рабочими частотами кристалла и памяти, для того чтобы удержаться в заданных рамках. При этом максимальные нагрузки умеют создавать лишь синтетические приложения, далекие от реальных игр (например, Furmark). И вот какую технологию придумали в AMD, дабы выжать из ускорителей максимум производительности (за счет частотных характеристик) и не потерять в надежности.
По разным областям графического ядра Cayman разбросаны сотни специальных сенсеров, следящих за состоянием чипа. По сути, они проверяют включен ли тот или иной набор транзисторов в логике кристалла. Вся полученная информация анализируется внутри интегрированного контроллера, оценивающего уровень текущего энергопотребления. Если в оценке загрузки ГП обнаруживаются недопустимые значения, то рабочие частоты кристалла снижаются - между тактами появляются пустоты. Это позволяет удержаться в пределах TDP (Thermal Design Power – метрика тепловой мощности), а заодно охладить процессор.
Представленная технология носит имя AMD PowerTune - полностью аппаратная, от работы драйверов не зависит. Понять на какой частоте работает кристалл в данный момент времени не представляется возможным. Однако мало что в будущем сможет помешать программистам AMD добавить частотную вкладку в панель Catalyst Control Center или сделать соответствующую утилиту.
Отметим, в актуальной версии CCC в окне AMD Overdrive появился ползунок Power Control settings. Он позволяет сдвигать границу срабатывания инновации AMD PowerTune в пределах 20%, как в одну, так и в другую стороны. Так смещение троттлинга в позицию «-10%» в тестовой игре Aliens vs. Predator не сказывается на играбельности показателей кадр/с, но зато дает заметно снижение энергопотребления всего ПК. Более того, по данным испытаний AMD холостой режим работы ГП включается крайне редко. Пока в настройках по умолчанию добиться троттлинга удается для плат AMD Radeon HD 6950 в тестовом сценарии 3DMark Vantage: Perlin Noise. При этом временное снижение тактовых частот мало сказывается на итоговой производительности.
Кстати, технология AMD PowerTune может ускорить появления двойного Cayman-а, ведь основная проблема платы будущей платы Radeon HD 6990 будет заключаться в планке TDP.
Право на ошибку
В продолжение разговора про технологию AMD PowerTune надо указать, что основные настройки срабатывания задаются в BIOS-прошивке платы. Там же можно задать рабочие частоты для кристалла и памяти. Дерзайте и не переживайте за печальный исход, когда ваши желания превзойдут возможности ускорителя.
На эталонных платах AMD Radeon HD 6970 и AMD Radeon HD 6950 есть две области хранения BIOS и соответствующий переключатель (рядом с контактной площадкой CrossFireX). В стандартном положении «1» можно модифицировать подпрограмму BIOS, как угодно. Получите черный экран - перейдите в не убиваемый режим «2» и загрузитесь с фабричными установками. На наш взгляд, функцию Dual BIOS оценят все любители разгона, и не только они.
Главный рычаг технологии AMD Dual BIOS
Куда целим
Давайте похвалим маркетологов компании AMD за неожиданную скромность. В рыночном позиционировании AMD Radeon HD 6970 (рекомендованная цена 369 долл.) поставили ниже конкурирующего решения Nvidia GeForce GTX 580 (рекомендованная цена 499 долл.), а Radeon HD 6950 (рекомендованная цена 299 долл.) опустили за спину GeForce GTX 570 (рекомендованная цена 399 долл.).
Однако в AMD работают специалисты с изрядным чувством юмора. Знаете какая плата на самом верху маркетинговой елки из продуктов класса Hi-End? Тут находится довольно устаревшее двухпроцессорное решение AMD Radeon HD 5970 с рекомендованной ценой в 499 долл. Именно эта одиночная плата зафиксировала мировой рекорд производительности в тесте 3DMark Vantage на уровне отметки x14240. И столь знаменательное событие произошло всего за пару недель до официального анонса видеоплаты AMD Radeon HD 6970, т.е. 1 декабря.
Видеоплата Nvidia GeForce GTX 570
Очевидно, что компания AMD остается привержена своей устоявшейся философией, когда для ultra-производительных решений создаются двухпроцессорные карты. И если в момент появления акселератора AMD Radeon HD 6990 на основе парочки «кайманов», у компании Nvidia будут пустые рукава мы увидим избиение младенца.
Что касается технических характеристик при сравнении Radeon HD 6970 и Radeon HD 5870, мы видим прыжок вперед лишь в вычислительной мощности на операциях с двойной точностью – 675 Гфлопс. В большой плюс запишем и 2 Гбайт видеопамяти GDDR5, что особенно необходима при построении мультидисплейной технологии Eyefinity или при работе в режиме CrossFireX. Есть позитивные подвижки по частотам ядра и числу текстурных блоков.
Видеоплата Nvidia GeForce GTX 580
Как мы тестировали
Все испытания проводились на основе тестового стенда следующей конфигурации: процессор AMD Phenom II X4 970, системная плата Gigabyte GA-880GA-UD3H, память Transcend TX2000KLU-4GK (DDR3, 1333 МГц, 4 Гбайт, 9-9-9-24, 2-канальный режим), жесткий диск Western Digital Caviar Black WD1002FAEX (2 Гбайт, SATA 6 Гбит/с, кеш 64 Мбайт, 7200 об/мин), оптический привод Plextor DVDR PX-810SA, блок питания Tagan SuperRock TG880-U33II (880 Вт). Работа с тестовой платформой осуществлялась при подключенном мониторе Philips Brilliance 202P7 при графических разрешениях 1600 x 1200, 2048 x 1536, 1366 x 768 и 1920 x 1080.
Программные тесты выполнялись под управлением ОС Windows 7 Ultimate 64 бит. Для работы с графической подсистемой использовались видеодрайверы ForceWare 64-bit версии 262.99 и Catalyst 64-bit версии 8.79.6.2RC2/10.10. В качестве измерительного инструментария применялся сценарный тест SmartFPS.com версии 1.13 для автоматизированного определения производительности в игровых приложениях Aliens vs. Predator (DirectX 11), DiRT 2 (DirectX 11), Crysis (DirectX 10), Serious Sam 2 (DirectX 9), Call of Juarez (DirectX 9), Unreal Tournament 3 (DirectX 9), Enemy Territory - QUAKE Wars (OpenGL), The Chronicles of Riddick (OpenGL). Также использовался тестовый пакет 3DMark 11 v1.0.
Исследование 3D-производительности проводилось в режиме с включенными четырехкратным сглаживанием (AA:04) и 16-кратной анизотропной фильтрацией (AF:16). Все настройки качества визуализации контролировались с помощью глобальных установок в соответствующих видеодрайверах.
Что показали тесты
Во всех хитах под OpenGL, в самых разных разрешениях, ускоритель GeForce GTX 580 обходит и Radeon HD 6970, и Radeon HD 5970 - тут проигрыш AMD-ATI стал традиционным. В DX9-игре Call of Juarez сложилась довольно любопытная картина, когда Radeon HD 6970 заметно проигрывает GeForce GTX 580, но при это «древний» Radeon HD 5970 идет с Nvidia ноздря в ноздрю. Меняем местами HD 6970 и HD 5970 в результатах к DX9-тесту Serious Sam 2 - двухпроцессорное решение в проигрыше, а вот Cayman выступает против GeForce GTX 580 на равных.
Отдельным абзацев остановимся на играх под DirectX 11. И в Aliens vs. Predator, и в DiRT 2 чувствуем схожую производительность между Radeon HD 6970 и GeForce GTX 580, но Nvidia чуть лучше. При этом похлопаем старичку Radeon HD 5970 - он бьет и своих, и чужих. А от фантазий на тему «что будет с выходом двухпроцессорного AMD Radeon HD 6990» захватывает дух.
Итак, мы уже знаем что крупные кристаллы дороги в производстве. К тому же вырастает вероятность попадания в отбраковку. Решив все вопросы в свою пользу инженерам компании AMD удалось выжать максимум из прежних наработок и предложить еще большую производительность по цене, доступной большинству энтузиастов. Подождем однопроцессорный AMD Radeon HD 6980, может он и превзойдет Nvidia GeForce GTX 580 по всем фронтам.
Технические характеристики AMD Radeon HD 6970
Вычислительная мощность (IEEE754-SP) |
2,7 Тфлопс |
Вычислительная мощность (IEEE754-DP) |
675 Гфлопс |
Число потоковых SIMD-кластеров |
24 |
Число потоковых ALU-юнитов |
1536 |
Число текстурных блоков |
96 |
Число ROP-блоков |
32 |
Число Z-Stencil |
128 |
Частота ядра |
880 МГц |
Тип памяти |
256-бит GDDR5 |
Объем памяти |
2 Гбайт |
Эффективная частота памяти |
1375 МГц |
Разъемы питания |
6-pin и 8-pin |
Видеоразъемы |
2 DVI, 2 miniDP, 2 HDMI |
Максимальная мощность |
300 Вт |
Рекомендованная цена |
369 долл. |
Результаты тестов 3DMark 11 v1.0 (Extreme-установки)
Испытание\Плата |
ATI Radeon HD 6970 |
Nvidia GeForce GTX 580 |
Nvidia GeForce GTX 570 |
Итоговая оценка 3DMark Score, баллы |
X1756 |
X1908 |
X1654 |
Обобщающая оценка Graphics Score, баллы |
1607 |
1762 |
1523 |
Обобщающая оценка Physics Score, баллы |
4341 |
4306 |
4300 |
Обобщающая оценка Combined Score, баллы |
2058 |
2142 |
1794 |
Combined Test, кадр/с |
9,6 |
10 |
8,3 |
Graphics Test 1, кадр/с |
7,6 |
8,9 |
7,8 |
Graphics Test 2, кадр/с |
9,1 |
9,1 |
7,9 |
Graphics Test 3, кадр/с |
7,9 |
8,7 |
7,4 |
Graphics Test 4, кадр/с |
4,9 |
5,4 |
4,7 |
Physics Test 1, кадр/с |
13,8 |
13,7 |
13,6 |
Результаты игровых тестов SmartFPS.com v1.13 при AA:04 и AF:16, кадр/с
Испытание\Плата |
ATI Radeon HD 6970 |
Nvidia GeForce GTX 580 |
Nvidia GeForce GTX 570 |
ATI Radeon HD 5970 |
Aliens vs. Predator (DirectX 11) |
1600 x 1200 (4:3) |
66,2 |
69,3 |
60 |
93,9 |
2048 x 1536 (4:3) |
43,2 |
46,5 |
40 |
57,5 |
1366 x 768 (16:9) |
66,3 |
94,6 |
82 |
113,7 |
1920 x 1080 (16:9) |
63,2 |
69,4 |
58 |
90,6 |
DiRT 2 (DirectX 11) |
1600 x 1200 (4:3) |
94,4 |
145,9 |
133.8 |
-- |
2048 x 1536 (4:3) |
72 |
76,8 |
100 |
-- |
1366 x 768 (16:9) |
121,2 |
110,2 |
148.9 |
-- |
1920 x 1080 (16:9) |
89,6 |
119,8 |
128 |
-- |
Crysis (DirectX 10) |
1600 x 1200 (4:3) |
77,4 |
77,5 |
70,5 |
81 |
2048 x 1536 (4:3) |
58 |
53,2 |
48,1 |
72,3 |
1366 x 768 (16:9) |
73,3 |
70,4 |
68,4 |
74,9 |
1920 x 1080 (16:9) |
70 |
67 |
62,5 |
72,7 |
Serious Sam 2 (DirectX 9) |
1600 x 1200 (4:3) |
183,1 |
185,9 |
189,9 |
177,4 |
2048 x 1536 (4:3) |
176,8 |
173,7 |
168,4 |
163,7 |
1366 x 768 (16:9) |
197,4 |
197 |
191,7 |
181,6 |
1920 x 1080 (16:9) |
189,6 |
196,1 |
186,7 |
171,2 |
Call of Juarez (DirectX 9) |
1600 x 1200 (4:3) |
108,1 |
155,1 |
135,8 |
154,6 |
2048 x 1536 (4:3) |
77 |
111 |
95,8 |
108,3 |
1366 x 768 (16:9) |
132 |
215,7 |
191,4 |
214,8 |
1920 x 1080 (16:9) |
99,3 |
143,9 |
127 |
140,6 |
Unreal Tournament 3 (DirectX 9) |
1600 x 1200 (4:3) |
196,7 |
250 |
239,1 |
189,5 |
2048 x 1536 (4:3) |
142,4 |
210,2 |
182,5 |
172,6 |
1366 x 768 (16:9) |
233,8 |
261,3 |
249,1 |
193,5 |
1920 x 1080 (16:9) |
175,5 |
232,6 |
205,9 |
187,3 |
Enemy Territory - QUAKE Wars (OpenGL) |
1600 x 1200 (4:3) |
102,1 |
113 |
113,8 |
95,4 |
2048 x 1536 (4:3) |
96,3 |
108,1 |
98,6 |
94,7 |
1366 x 768 (16:9) |
104 |
116,7 |
115,3 |
95,4 |
1920 x 1080 (16:9) |
102,9 |
112,6 |
113,9 |
95,3 |
The Chronicles of Riddick (OpenGL) |
1600 x 1200 (4:3) |
199 |
246,7 |
208,4 |
201,6 |
2048 x 1536 (4:3) |
174,2 |
170,8 |
139,9 |
192,1 |
1366 x 768 (16:9) |
224,3 |
306,9 |
289,8 |
217,4 |
1920 x 1080 (16:9) |
201 |
244,8 |
202,8 |
206,3 |
>> НАВЕРХ СТРАНИЦЫ <<
|
|