ГЛАВНАЯ >> ТЕСТИРУЕМ ВМЕСТЕ >> ПРОЦЕССОРЫ: AMD Turbo CORE: наследница турбокнопки
НАЗВАНИЕ СТАТЬИ: AMD Turbo CORE: наследница турбокнопки
АВТОРСТВО: Алексей Набережный
ДАТА НАПИСАНИЯ: Август 2010 года
ДАТА ПЕЧАТНОЙ ПУБЛИКАЦИИ: Сентябрь 2010 года ( 4603954000025 )
ДАТА ПОСЛЕДНЕЙ РЕДАКЦИИ: Сентябрь 2010 года
| |
СОДЕРЖАНИЕ
Вступление теоретическое
Роль «мамки» в турбоускорении
Как мы тестировали
Вспомнить все и быстро
Что показали тесты
Результаты PCMark Vantage
Результаты SiSoftware Sandra
Результаты тестов ОЗУ
Результаты игровых тестов
Производительность процессора зависит от многих факторов, но среди них есть два самых важных – тактовая частота и число ядер. Чем выше частота, тем быстрее работает ЦП. Чем больше ядер, тем скорее выполняются многозадачные приложения.
Первые частотные заигрывания с пользователями начались довольно давно, примерно 20 лет назад. Тогда большинство системных корпусов оснащались кнопкой Turbo, увеличивающей частоту функционирования ЦП в режиме реального времени. Уверены, многим до сих пор вспоминается взаимодействие турбокнопки и компьютерной игры «Поле чудес» - скорость вращения виртуального барабана напрямую зависела от положения включателя Turbo.
Затем игры с частотами переместили в настройки BIOS, и чтобы разогнать систему пользователям приходилось менять опорные частоты и множители, а затем перегружаться. Разумеется, можно было «переборщить» и система намертво висла – сбрасывать настройки приходилось перемычками.
С появлением нескольких ядер в одном процессоре появились новые забавы. В ряде случаев можно отключать часть ядер в BIOS и работать на оставшихся. Такие трюки позволяют оценить эффективность однопоточного и многопоточного кода для разных ситуаций, а по пути снизить энергопотребление.
Современным воплощением кнопки Turbo и желанного ускорения стали технологии Intel Turbo Boost и AMD Turbo CORE. Инновация Intel появилась первой. Почти два года назад, вместе с ядрами Core i7 и Core i5. Турбоподъем от Intel повышает тактовую частоту процессора автоматически, в режиме реального времени. Но при этом потребление электроэнергии находится в рамках спецификации теплового пакета TDP (Thermal Design Power). Алгоритм работы Turbo Boost выглядит достаточно сложным. В зависимости от вычислительной нагрузки управляющий модуль поднимает частоты с шагом 133 МГц. Если речь идет о выполнении кода на одном ядре, то его частота может вырасти вначале на 133 МГц, а затем на 266. Если придется поднимать частоты на двух, трех, четырех (и т.д.) ядрах, то их частотные характеристики вырастут строго на одну ступеньку (т.е. на 133 МГц). Для примера, эталонная характеристика Intel Core i7 Extreme Edition i7-980X (Gulftown) или Intel Core i7 Extreme Edition i7-975 (Bloomfield) составляет 3,33 ГГц, а в моменты максимального турбирования – 3,6 ГГц. И это не предел, серверный ЦП Intel Xeon X5677 (Westmere-EP) с рабочей частотой 3,46 ГГц самоускоряется до 3,73 ГГц. Интересно, что все работает по умолчанию – никаких турбокнопок или сложных настроек в BIOS.
Стоит ли говорить о популярности технологии Intel Turbo Boost – пользователи прониклись рекламными слайдами и эффектными презентациями. И тут специалистам AMD оставалось лишь разводить руками, ведь от программной утилиты AMD OverDrive толку мало.
Все изменилось с появлением шестиядерных новинок AMD Phenom II X6 - Phenom II X6 1090T и Phenom II X6 1055T. Изюминкой обоих моделей стала буква T в наименовании, она обозначает поддержку инновации Turbo CORE. Технология AMD Turbo CORE выжимает максимум производительности в ряде вычислительных задач. Турбированные процессоры в случае обнаружения нагрузки только на одно, два или три ядра могут повышать скорость работы автоматически, путем увеличения частоты и напряжения питания. Это позволяет обеспечить более высокую производительность на задачах, которые не умеют или не могут использовать преимущества шестиядерной архитектуры. Для примера, в жаркие моменты на активные ядра Phenom II X6 1090T подается напряжение 1,475 В, вместо 1,325, и функционируют они на частоте 3,6 ГГц, вместо 3,2. Что касаемо модели Phenom II X6 1055T, то напряжение на ее ядрах может вырасти с 1,3 В до 1,45, а частота повысится на 500 МГц (с 2,8 ГГц до 3,3).
Протестированный процессор AMD Phenom II X6 1090T
По сути, технология AMD Turbo CORE работает в рамках стандарта управления питанием ACPI версии 4.0, включающего характерные уровни управления системой (S-State), подсистемой, устройством (D-State), шиной, процессором (C-State и P-State). Турбированные процессоры AMD распознают запросы операционной системы по режимам P-States (Processor Performance States, рабочее состояние процессора), указывающим на правильные комбинации напряжение/частота процессора для разных нагрузок. Если утрировать, то вот как все выглядит.
На первом шаге, операционная система анализирует накопленную статистику простоев и решает, что требуется сделать переход от одного P-State к другому. Для турбоускорения процессора его драйвер ожидает вызова состояния P0. При этом важно, чтобы число загруженных ядер не превышало трех.
На втором шаге, ОС получает позитивную отмашку и начинается осуществление перехода на новый P-State. Энергопотребление всего процессора остается ограниченным сверху штатным значением TDP (в зависимости от модели шестиядерного процессора это или 125 Вт, или 95 Вт), поскольку часть ядер бездействуют.
На третьем шаге, повышается напряжение на активных ядрах, а затем меняется и частота их функционирования. Причем, новое частотное значение достигается сразу за счет изменения множителя.
На четвертом шаге, активные ядра работают на максимальной частоте. Осуществляется термоконтроль в рамках TDP.
Сам процесс турбирования продолжается пока выполняются два условия. Первое, три или более ядер не имеют нагрузки и находятся в состоянии сна. Второе, операционная система использует максимальным образом вычислительную мощь активных ядер. В противном случае поступает запрос на состояние P1 и все характеристики ЦП возвращаются к исходному положению.
Схема работы AMD Turbo CORE
Роль «мамки» в турбоускорении
По мнению специалистов компании AMD технология Turbo CORE, интегрированная в шестиядерные процессоры Phenom II X6, заработает на любой материнской плате на базе фирменных микросхем серии 8xx. Однако на практике не все так гладко.
В документации к большинству системных плат нет прямых указаний на поддержку AMD Turbo CORE. Более того, зачастую нет и следов этой инновации в настройках BIOS (даже после обновления прошивки). В таких случаях хочется верить: Turbo CORE включен в обязательном порядке и его нельзя отключить.
Порадуемся, что в нашем тесте все прошло без сомнений на базе топовой платы Gigabyte GA-890FXA-UD7 (rev. 2.0). Даже в майской прошивке F2 был «включатель» AMD Turbo CORE. Правда, назывался он иначе – Core Performance Boost. Но это результат автоматического перевода слов Turbo CORE с английского языка на китайский, а потом назад.
BIOS системной платы Gigabyte GA-890FXA-UD7
Пробежимся по самой платформе Gigabyte GA-890FXA-UD7 – она попала к нам впервые и на ее основе мы осуществили несколько тестирований. В ее гнездо AM3 можно устанавливать процессоры семейства Phenom? II и Athlon II. Модель GA-890FXA-UD7 построена на связке системных микросхем AMD 890FX (северный мост) и AMD SB850 (южный мост), выпускаемых на заводах TSMC по техпроцессу 65 нм. В четыре разъема DIMM можно установить до 16 Гбайт оперативной памяти типа DDR3 в двухканальном режиме. Пропускная способность шины Hyper Transport 3.0 составляет 5200 МТранзакций/с.
Аудиоподсистема формата High Definition Audio реализована на кодеке Realtek ALC889. Можно подключать до 8 динамиков акустической системы, и даже больше. Если подключить звук по схеме 7.1, а по пути вывести аудиопоток по двум стереоканалам с разъемами на передней панели системного корпуса.
Сетевые возможности модели опираются на два(!) контроллера Realtek RTL8111D (10/100/1000 Мбит), реализующих технологию Smart Dual LAN. Один из режимов работы SDL называется Teaming, в нем пропускная способность двух независимых соединений объединяется и в теории максимальная скорость передачи данных составляет 2 Гбит/с. На базе платы GA-890FXA-UD7 можно построить файловый сервер.
Из разъемов для плат расширения есть два порта PCI Express x16, еще два разъема PCI-E х16, работающий в режиме х8, плюс еще два порта PCI-E х16, работающий в режиме х4. Можно без проблем масштабировать технологию 2-/3-/4-Way ATI CrossFireX. Впечатляет?
Есть и один разъем «устаревшего» интерфейса PCI – пользователи смогут установить либо TV-тюнер, либо WiFi-модуль. Не забываем и про «устаревший» контроллер iTE IT8720 – к нему подключаются «флоппики».
Теперь про USB. У модели GA-890FXA-UD7 есть 14 портов USB. 8 из них уже есть на задней панели, включая два комбинированных порта eSATA/USB. Напомним, что универсальные разъемы eSATA/USB позволят пользователя подключать внешний НЖМД без дополнительного кабеля энергопитания. Еще 4 порта USB можно вывести на дополнительную планку. Плюс еще два ультрамодных разъема USB 3.0/2.0, функционирующих за счет микросхемы NEC D720200F1.
Присутствие сертифицированного чипа Texas Instruments TSB43AB23 порадует двумя портами IEEE 1394a на задней панели. Еще один выносной IEEE 1394 можно подключить непосредственно к системной плате.
К материнской платформе Gigabyte GA-890FXA-UD7 можно подключит шесть дисков SATA 3.0 c пропускной способностью до 6 Гбит/с. Появляется возможность организовать дисковые массивы уровней RAID 0, 1, 5, 10 или JBOD. Контроллер Gigabyte SATA2 обеспечивает работу одного порта IDE и двух разъемов SATA для устройств SATA 2.0 с пропускной способностью до 3 Гбит/с. Можно строить RAID-массивы уровней RAID 0, 1 или JBOD. А благодаря дополнительной микросхеме JMicron JMB362 через заднюю панель подключаются еще два внешних SATA 2.0 – еще массив уровней RAID 0, 1 или JBOD.
Серийная плата Gigabyte GA-890FXA-UD7 относится к премиум-классу и на ее борту есть масса полезных решений. Аккуратными кнопками дублируются функции включения и перезагрузки ПК, сброса настроек BIOS. Есть двухзначный светодиодный индикатор POST-кодов, отображающий текущее состояние вычислительной системы. Рядом с важными разъемами есть отдельные светодиоды, помогающие быстро выявить и устранить возможные неполадки. В комплекте с моделью GA-890FXA-UD7 прилагается модуль дополнительной системы охлаждения Hybrid Silent-Pipe с полноценным радиатором и тепловыми трубками, обеспечивающими более эффективный теплоотвод из зоны ЦП и НМС.
Материнская плата Gigabyte GA-890FXA-UD7
Как мы тестировали
Тестирование технологии AMD Turbo CORE проводилось с использованием следующее конфигурации: ЦП AMD Phenom II X6 Black Edition 1090T, системная плата Gigabyte GA-890FXA-UD7 (прошивка F2), память Transcend TX2000KLU-4GK (DDR3, 1333 МГц, 4 Гбайт, 9-9-9-24, двухканальный режим), видеоплата ASUS EAH5830, жесткий диск Western Digital Caviar Black WD1002FAEX (2 Гбайт, SATA 6 Гбит/с, кэш 64 Мбайт, 7200 об/мин), оптический привод Plextor DVDR PX-810SA. Испытания проводились при подключенном мониторе Samsung SyncMaster PX2370 с графическим разрешением 1920x1080.
Все программные тесты проводились под управлением ОС Windows 7 Ultimate 64-бит. Задействовались измерительные комплексы PCMark Vantage 1.0.2, SiSoftware Sandra Pro 2009 SP3. В качестве игровых тестов использовались Crysis, Serious Sam 2, The Chronicles of Riddick: EFBB и Enemy Territory - QUAKE Wars. Запуски игровых приложений осуществлялись с помощью утилиты SmartFPS.com v1.11.
Вспомнить все и быстро
Знаете в чем отличие дорогой оперативки от дешевой? Дорогостоящие модули смогут надежно работать на более высоких частотах, оставляя тайминги на недопустимо низком уровне. Так вначале мы тестировали технологию AMD Turbo CORE с использованием модулей памяти Transcend TX2000KLU-4GK, работающих на рекомендованных частотах в рамках SPD. Т.е. на эффективной частоте 1333 МГц с таймингами 9-9-9-24. Но DDR3-плашки от Transcend способны на большее.
Мы подняли частоту модулей TX2000KLU-4GK до 1600 МГц и при этом сохранили тайминги 9-9-9-24. И в таком режиме испытательная платформа на основе Gigabyte GA-890FXA-UD7 работала надежно даже в специальных стресс-тестах.
Что касаемо производительности, то в большинстве синтетических тестах на пропускную способность памяти мы наблюдали позитивный эффект – смотрите таблицу с результатами специальных тестов SiSoftware Sandra 2009. А чтобы ощутить прирост производительности в реальных приложениях, потребуется более высокие частоты и тонкие настройки таймингов.
Так в SPD памяти Transcend помимо JEDEC-стандарта 1333 МГц, с таймингами 9-9-9-24, при напряжении 1,5 В, есть поддержка XMP-стандарта с частотой 2000 МГц, при таймингах 9-9-9-24 и напряжении 1,6 В. И с такими характеристиками модель TX2000KLU-4GK работает без нареканий – была бы поддержка со стороны контроллера памяти в ЦП.
Можно сказать, что двухканальный комплект Transcend TX2000KLU-4GK увеличивает производительность системы за счет низкого напряжения питания, высокой тактовой частоты и низких таймингов. Отметим и алюминиевый радиатор с вентиляционными столбиками, позволяющими эффективно отводить тепло и сохранять рабочую температуру на низком уровне.
Что показали тесты
У специалистов AMD есть любимая песня про «нечестные» ядра Intel, когда многоядерные ЦП получаются путем банального объединения двух кристаллов в одном корпусе. Так вот, у специалистов Intel появилась приятная возможность говорить в ответ о «нечестной» турботехнологии AMD. Дело в том, что Intel Turbo Boost реализована на аппаратном уровне, а вот в инновации AMD Turbo CORE большую роль играет операционная система.
Тем не менее, технология турбоускорения от AMD работает и в ряде тестов демонстрирует ощутимый прирост. Так в однопоточных сценариях Memories, TV and Movies, Music, Communications прогресс очевиден. В моменты, когда нагружается одно ядро ЦП Phenom II X6 1090T частота процессора повышается и мы видим ощутимый прирост. А вот в ряде случаев с многоканальными вычислениями наблюдается обратная картина. Прыжки с шести ядер до трех, и назад, вызывают небольшие задержки в работе и в результате прилагается небольшой регресс в плане производительности. Аналогичное зрелище выходит и в чистой «синтетике».
В качестве игровых тестов мы выбрали пару «устаревших» игр, когда о многопоточном коде даже не мечтали (Serious Sam 2 и The Chronicles of Riddick: EFBB) – фиксируем заметный позитив. В более свежих игрушках Crysis и Enemy Territory QUAKE Wars с небольшой оптимизацией под несколько потоков мы видим регресс.
Получается странная ситуация, ведь большинство владельцев Phenom II X6 1090T и Phenom II X6 1055T вместе с купленными процессорами получают в подарок серьезную дилемму «включать или не включать» опцию AMD Turbo CORE. Можно выиграть, а можно проиграть. Причем в повседневных задачах трудно разобраться есть толк от Turbo CORE или нет.
Честно говоря, мы и сами озадачены. В тестах современных процессоров Intel технология Intel Turbo Boost всегда включена – хуже не будет. А вот как быть с новейшими процессорами от AMD? Придется выполнять двойную работу.
Результаты тестов PCMark Vantage, баллы
|
TurboCore |
Без TurboCore |
Обобщающая оценка PCMark |
8405 |
8474 |
Memories |
6962 |
6843 |
TV and Movies |
5631 |
5555 |
Gaming |
8034 |
8276 |
Music |
7828 |
6152 |
Communications |
8634 |
8156 |
Productivity |
7994 |
8067 |
HDD |
5649 |
5808 |
Результаты тестов SiSoftware Sandra 2009 SP3
|
Арифметический тест
процессора |
Мультимедийный тест
процессора |
Многоядерная эффективность |
Производительность
криптографии |
Пропускная способность
памяти |
Латентность памяти при
произвольном доступе (фактор скорости), нс |
Пропускная способность
кэш/память (фактор скорости), Гбайт/с |
Тест Dhrystone ALU, GIPS |
Тест Whetstone iSSE3, GFLOPS |
Тест Multi-Media Int x16 aSSE2, MPixel/s |
Тест Multi-Media Float x8 iSSE2, MPixel/s |
Тест Multi-Media Double x4 iSSE2, MPixel/s |
Скорость передачи данных, Гбайт/с |
Латентность, нс |
Скорость криптографии AES256 CPU,
Мбайт/с |
Скорость хэширования SHA256 CPU, Мбайт/с |
Int Buff'd iSSE2, Гбайт/ |
Float Buff'd iSSE2, Гбайт/с |
TurboCore |
67,75 |
56,31 |
216,75 |
136,56 |
74,56 |
4,48 |
93 |
736 |
887 |
13,28 |
13,32 |
84 |
73,14 |
Без TurboCore |
69,14 |
56,23 |
223 |
136,52 |
74,6 |
4,5 |
92 |
729 |
887 |
13,33 |
13,31 |
83 |
73,42 |
Результаты специальных тестов ОЗУ в программе SiSoftware Sandra 2009 SP3
|
Пропускная способность
памяти Int Buff'd iSSE2, Гбайт/ |
Пропускная способность
памяти Float Buff'd iSSE2, Гбайт/с |
Латентность памяти |
Пропускная способность кэш/память,
Гбайт/с |
Тест Assignment |
Тест Scaling |
Тест Addition |
Тест Triad |
Тест Assignment |
Тест Scaling |
Тест Addition |
Тест Triad |
Произвольный доступ, нс |
Кеш L1, такт |
Кеш L2, такт |
Кеш L3, такт |
Кэш/память |
Кеш L1 |
Кеш L2 |
Кеш L3 |
Transcend TX2000KLU-4GK (1333 МГц, 9-9-9-24,
двухканальный режим) |
12,86 |
12,77 |
13,79 |
13,72 |
12,79 |
12,74 |
13,84 |
13,9 |
84 |
3 |
15 |
65 |
73,14 |
301,84 |
192,25 |
72,72 |
Transcend TX2000KLU-4GK (1600 МГц, 9-9-9-24,
двухканальный режим) |
12,8 |
12,64 |
13,83 |
13,8 |
12,69 |
12,7 |
13,87 |
13,9 |
82 |
3 |
15 |
65 |
74,88 |
303 |
194,48 |
64,3 |
Результаты игровых тестов SmartFPS v1.11 в режиме SVGA (800х600), кадр/с
|
TurboCore |
Без TurboCore |
Crysis |
73,5 |
75,3 |
Serious Sam 2 |
161,2 |
156,2 |
Enemy Territory - QUAKE Wars |
95,1 |
97 |
The Chronicles of Riddick: EFBB |
174,7 |
163,8 |
>> НАВЕРХ СТРАНИЦЫ <<
|
|