ОБЪЕКТИВНОСТЬ БЕЗ КОМПРОМИССОВОбъективность Без Компромиссов В Мире Компьютеров
НОВОСТИ САЙТАТЕСТИРУЕМ ВМЕСТЕИНТЕРНЕТ и ПОВСЯКО-РАЗНОСОФТ ПРОЕКТЫНАШИ ССЫЛКИ
ГЛАВНАЯ >> ТЕСТИРУЕМ ВМЕСТЕ >> ПРОЦЕССОРЫ: "Прожорливость" процессоров в теории и на практике. Часть 2

НАЗВАНИЕ СТАТЬИ: "Прожорливость" процессоров в теории и на практике. Часть 2
АВТОРСТВО: Алекс Наб
ДАТА НАПИСАНИЯ: Январь 2005 года
ДАТА ПЕЧАТНОЙ ПУБЛИКАЦИИ: Март ( ISSN 0235-3520 )
ДАТА ПОСЛЕДНЕЙ РЕДАКЦИИ: Январь 2005 года
Алекс Н.

СОДЕРЖАНИЕ

  • Предварительные материалы ( "Процессоры AMD разорят РАО "ЕЭС России"? Часть 1" )
  • Вступление
  • В теории
  • На практике
  • Анализ результатов тестов
  • Таблица 1. Потребление электроэнергии
  • РАЗМАХАЙКА: Geyserville 3 ( GV3 ) и Hyper-Threading ( HT )
  • РАЗМАХАЙКА: P-State объекты управления питанием ACPI 2.0
  • РАЗМАХАЙКА: Athlon 64: уникальное вложение в будущее?

    Все-таки прав был философ Эммануил Кант, когда догадывался, что процессор - это "вещь в себе". Конечно, последний можно использовать по прямому назначению в вычислительных системах, но, с другой стороны, центральные процессоры могли бы неплохо отапливать небольшие помещения, выступать в роли декоративных брошек или, будучи положены ножками вверх на стул школьной учительницы, заменить собою целую россыпь канцелярских кнопок.
    А если серьезно, то и для обычных пользователей, и для продвинутых экспертов центральный процессор таит в себе массу загадок и неожиданностей. Еще бы, даже непосредственные разработчики микропроцессоров не знают точно, как поведет себя их логическая схема узлов после воплощения в кусочке обычного кремния.
    Мог ли кто предположить несколько лет назад, что ядра процессоров Athlon/Athlon 64 и R3xx/R4xx позволят компаниям AMD и ATI на равных тягаться с гигантами Intel и nVidia? А между тем лишь благодаря технической фортуне да пытливости журналистов новинки AMD и ATI буквально ворвались в компьютерные системы многих домашних пользователей.
    Вот и сейчас, задумав серию материалов об энергосберегающих технологиях в "настольных" процессорах, в ряде тестов мы получили очень неожиданные данные, от которых глаза технических специалистов Intel и AMD становились круглыми, а амбиции знатоков - скромными :) . Но давайте сначала познакомимся с теоретическими выкладками технологий AMD Cool'n'Quiet ( аналог AMD PowerNow! ) и Intel Geyserville 3 ( аналог Enhanced Intel SpeedStep ), а затем оценим их реальную эффективность.

    Изображение 1. ПК DESTEN eStudio-832P и счетчик СО-505
    ПК DESTEN eStudio-832P и счетчик СО-505

    В теории
    Если раньше интересные процессорные технологии сначала появлялись в дорогих серверных системах, а затем медленно спускались в класс домашних и мобильных компьютеров, то с энергосберегающими технологиями AMD и Intel все произошло иначе. Зародившись несколько лет назад под именами AMD PowerNow! и Enhanced Intel SpeedStep в мобильных платформах, они постепенно перекочевывают в сегменты настольных и серверных компьютеров.
    Действительно, зачем круглые сутки гонять на 100% корпоративный почтовый сервер, если известно, что основная нагрузка ложится на него лишь с девяти до шести часов? И зачем нужна энергозатратная производительность ЦП в офисных приложениях или во время простоя домашнего ПК? Согласитесь, потребителю есть, где сэкономить на электроэнергии..
    Отметим сразу, энергосберегающие технологии от компаний AMD и Intel, за исключением небольших технических нюансов, очень сходны между собой. А вот настольные процессоры Pentium 4, в отличие от микропроцессоров Athlon 64, пока поддерживают технологию Intel Geyserville 3 лишь в умах маркетологов да в некоторых инженерных образцах, коих мы так и не смогли раздобыть. Однако уже в первой половине 2005 г. ситуация должна кардинально поменяться.
    Разумеется, все новейшие процессоры AMD и Intel поддерживают стандарт управления питанием ACPI версии 2.0, который включает характерные уровни управления системой ( S-State ), подсистемой, устройством ( D-State ), шиной, процессором ( C-State и P-State ). Самым интересным здесь представляется подмножество состояний процессора C-States: C1( Halt ), C2( Stop Grand ), C3( Sleep ) и C0( интересующий нас набор режимов управления ЦП - P-States ). Все современные центральные процессоры можно условно разделить на устройства с поддержкой С0( или P-States ) и без нее ( более подробную информацию о стандартах управления питанием и используемой терминологии можно найти на сайте www.acpi.info ).
    Режимы P-States ( Processor Performance States, рабочее состояние процессора ) - это правильные комбинации напряжений и частот работы ядра процессора для разных нагрузок. Идеально подобранная пара "напряжение-частота" позволяет адекватно выставить необходимую производительность для выполнения текущих задач, что в свою очередь позволит снизить энергопотребление и тепловыделение ЦП в большинстве рабочих ситуаций.
    Различные процессоры могут иметь разное число возможных режимов P-States, например, в процессорах Pentium 4 количество запрограммированных комбинаций "напряжение-частота" может колебаться от двух ( в дешевых образцах ) до 16 ( в самых продвинутых ЦП ). Аналогичный маркетинговый подход мы видим и в процессорах AMD Athlon 64, а полную раскладку по типам существующих процессоров AMD и возможным режимам P-States мы привели в таблице к статье "Процессоры AMD разорят РАО "ЕЭС России"?" .
    Важная роль в энергосберегающих технологиях процессоров отводится соответствующей поддержке в системных платах, поскольку используемая BIOS должна:

  • уметь определять наличие поддержки режимов P-States в установленном ЦП ( т.е. анализировать поля CPUID и возвратное значение функции 8000_0007h );
  • иметь полную таблицу комбинаций "напряжение-частота";
  • иметь набор микросхем и системных ограничений для работы с/без поддержки объектов P-States, описанных стандартом ACPI версии 2.0.

    С учетом поддержки современными операционными системами объектов ACPI, вырисовывается следующий алгоритм выполнения переходов между состояниями P-States по четырем шагам:
    ШАГ 1. ОС, проанализировав накопленную статистику простоев, решает, что требуется сделать переход от одного P-State к другому и вызывает драйвер процессора ( допустим, для повышения производительности ).
    ШАГ 2. Драйвер процессора сообщает ОС, что необходимый переход допустим, и начинает его осуществление.
    ШАГ 3. Драйвер процессора поэтапно повышает напряжение ядра до необходимого максимума с одинаковыми шагами MVS ( Maximum Voltage Step ) за одинаковые промежутки времени VST ( Voltage Stabilization Time ).
    ШАГ 4. Драйвер процессора, достигнув необходимого напряжения, меняет частоту работы ядра на новое значение, которое запросила система ( и в этот короткий промежуток времени ЦП недоступен, так что чем этот промежуток меньше, тем лучше ).
    Когда системе требуется пониженный P-State, то выполняется точно такой же алгоритм действий, но с учетом необходимого понижения напряжения на ядре.
    Наглядно представить весь процесс смены состояний P-States помогут две схемы восходящих переходов в процессорах AMD и Intel ( см. графики 1 и 2 ). Налицо некоторая разница: технология AMD Cool'n'Quiet на третьей ступеньке нашего алгоритма к необходимому новому напряжению добавляет небольшой задел RVO ( Ramp Voltage Offset - превышение напряжения ), который убирается сразу после смены частот ядра ( шаг 4 ) и частотно-вольтажные показатели нового состояния P-State возвращаются к стандартным. Такое поведение придает надежности работе процессора Athlon 64, но отнимает лишние 100 мкс для полного выполнения всего перехода. А все эти мгновения складываются в доли секунды, уже ощутимые для человека.
    Шаги изменения напряжения ядра ( MVS ) в процессорах Athlon 64 в два раза больше, чем у процессоров Pentium 4, а значит, нужные значения напряжения выставляются за меньшее количество стабилизационных периодов. Но вот стабилизационное время у процессоров AMD в 20 раз больше, чем у конкурентных решений, и поэтому процессоры Pentium 4 выигрывают у семейства Athlon 64 по необходимому времени стабилизации для итогового изменения состояния P-State. Более того, в момент, когда процессор недоступен ( на этапе смены частоты ), провал ЦП Athlon 64 должен быть заметней, но напомним, это лишь в теории. На практике мы уже более года плотно работаем с технологией AMD Cool'n'Quiet, а вот процессоров Pentium 4 с поддержкой технологии Intel Geyserville 3 пока не видели вообще.

    График 1. Восходящий переход между состояниями ( P-States ) в процессоре AMD Athlon 64
    Ф1: Фаза увеличения напряжения; Ф2: Фаза увеличения частоты ( процессор недоступен ); Ф3: Фаза VID-перехода и нивелирования RVO
    Восходящий переход между состояниями ( P-States )

    График 2. Восходящий переход между состояниями ( P-States ) в гипотетическом процессоре Intel Pentium 4 с технологией GV3
    Ф1: Фаза увеличения напряжения; Ф2: Фаза увеличения частоты ( процессор недоступен )
    Восходящий переход между состояниями ( P-States )

    На практике
    Надеемся, с теорией мы разобрались, теперь можно перейти к реальным тестам энергопотребления современных процессоров в различных рабочих ситуациях. Поскольку начало нашему тестированию было положено в вышеупомянутой статье "Процессоры AMD разорят РАО "ЕЭС России"?" при работе с ПК Formoza S320+ на базе процессора AMD Athlon 64 3200+, то на этот раз мы подобрали серийный ПК Desten eStudio-832P на базе 3,2-ГГц процессора Intel Pentium 4 ( Northwood ).
    На техническом уровне компьютеры Formoza S320+ и DESTEN eStudio-832P отличались друг от друга лишь процессором, системной платой и корпусом. Так что сравнение "прожорливости" процессоров прошло максимально корректно ( тем более, что в системный блок ПК DESTEN мы установили БП Thermaltake XP480, используемый в ПК Formoza S320+ ). Пользуясь таким случаем, мы еще сняли показания с компьютера DESTEN eStudio-832P, заменив в нем штатный процессор на 3,2-ГГц Intel Pentium 4E ( Prescott ).
    Для уверенности в полученных результатах и наших выводах мы замеряли энергопотребление по ГОСТ 6570-96 счетчиком СО-505, а потребляемую мощность - сертифицированным прибором SATURN LF-202 SE. И полученные с разных измерительных устройств данные оказались взаимосвязанными.

    Изображение 2. ПК DESTEN eStudio-832P и счетчик СО-505: Тестовый стенд готов к работе
    ПК DESTEN eStudio-832P и счетчик СО-505: Тестовый стенд готов к работе

    Общий анализ результатов тестов показывает гипотетическую выгоду в затратах на электроэнергию при эксплуатации системы на базе процессора AMD Athlon 64 3200+. Но необходимо помнить, что системная плата компьютера должна поддерживать технологию AMD Cool'n'Quiet, иначе более привлекательным становится ПК на базе 3,2-ГГц Intel Pentium 4 ( Northwood ).
    Пока процессор Pentium 4 не поддерживает энергосберегающие технологии GV3, но тем не менее управление питанием системной платы GIGABYTE GA-8IK1100, использующейся в ПК DESTEN, позволяет аккуратно работать с энергоресурсами в ситуациях частого простоя и при решении офисных задач.
    Как и предполагалось, самым "прожорливым" в тестах оказался ЦП Prescott, но в среднем его результаты лишь чуть хуже показателей Athlon 64 с отключенной функцией Cool'n'Quiet. А поскольку свое будущее компания Intel связывает именно с ядром Prescott, то вывод один: нужно скорее внедрять технологию Geyserville 3 в настольные системы. Иначе в руках конкурентов останутся важные козыри.
    Но самое интересное содержится в первом столбце таблицы результатов. Из него видно, что даже "выключенный" ПК использует немало электроэнергии по дежурной шине +5Vsb. Потребляемая мощность по ней составляет 25 Вт у процессора Northwood и 16-17 Вт у альтернативных ЦП. И если сделать элементарный подсчет, то видно, что простой сетевой фильтр типа "пилот" с кнопкой выключения позволит хорошо сэкономить и без технологии AMD Cool'n'Quiet ( главное - как можно реже включать компьютер :) . Кстати, это первый неожиданный результат тестирования, но возможно, он обусловлен влиянием 400-Вт блока питания Thermaltake XP480.
    А вот то, что в выключенном состоянии системная плата на базе Northwood потребляла больше электроэнергии, чем аналогичная платформа с процессором Prescott, стало для нас откровением. Что это, скрытые сюрпризы электропитания процессора нового поколения или все дело в плате? По возможности мы обязательно проверим разные гипотезы и вскоре сообщим результаты.
    Если заглянуть в близкое будущее, то не за горами появление в наших ПК двухядерных процессоров и пока можно лишь предсказать их завидную производительность при использовании специального программного обеспечения и прогнозируемый проигрыш в устаревших тестах. Но сразу очевидно одно: в целях энергосбережения и последующего снижения тепловыделения разработчики новейших ЦП ( с двумя ядрами ) заложат в них возможность отключения одного вычислительного центра в случаях простоя компьютера ( или его низкой загрузки ). А как иначе? На рынок пришло время бережного отношения к финансам пользователя.

    Таблица 1. Потребление электроэнергии по счетчику СО-505, кВт*ч
    Режимы работы Cутки в выключенном состоянии Сутки простоя Сутки цикличного выполнения теста 3DMark 05 Сутки максимальной нагрузки Среднеарифметические сутки работы ПК в среднестатистической нагрузке Потребление электроэнергии за год постоянной работы ( 365 дней ) в среднестатистической нагрузке
    ПК Formoza S320+ на базе Athlon 64 3200+ с включенной технологией AMD Cool'n'Quiet 0,4 1,8 3,5 3,8 2,0 730
    ПК Formoza S320+ на базе Athlon 64 3200+ с отключенной технологией AMD Cool'n'Quiet 0,4 2,6 3,6 3,8 2,8 1022
    ПК DESTEN eStudio-832P на базе процессора Intel Pentium 4 3,2ГГц ( Northwood ) 0,6 2,2 3,9 4,6 2,5 912,5
    ПК DESTEN eStudio-832P на базе процессора Intel Pentium 4 3,2ГГц ( Prescott ) 0,4 2,5 4,2 4,7 2,8 1022

    Перекресток технологий Geyserville 3 ( GV3 ) и Hyper-Threading ( HT )
    Операционная система рассматривает Hyper-Threading как два логических процессора, но сам физический процессор может находиться лишь в одном состоянии P-State. При этом оба логических устройства используют одну и ту же пару значений "напряжение-частота".
    Важно отметить, что каждый логический ЦП может запрашивать свое состояние P-State, и BIOS координирует эти требования. По умолчанию выставляется самый высокий P-State из требуемых процессорами режимов.
    Пока в обычных процессорах Intel Pentium 4, при загрузке одной ли нитки Hyper-Threading или двух - разницы в энергопотреблении нет. Впрочем, если технологию HT просто отключить в BIOS, различия в "прожорливости" тоже не будет.

    P-State объекты управления питанием ACPI 2.0
    Для систем поддерживающих переходы P-State программное обеспечение BIOS для системных плат должно поддерживать работу со следующими объектами ACPI 2.0: _PCT( Performance Control ), _PSS( Performance-Supported States ), _PPC ( Performance Present Capabilities ),PSTATE_CNT и CST_CNT.
    Объект _PCT определяет регистр управления, регистр состояния и проверяет переходы P-State. Функционирование объекта _PCT жестко определено, и драйвер процессора точно знает, как инициализировать и подтвердить переход P-State.
    Объект _PSS следует сразу после _PCT в пространстве имен \_PR в операционных системах с поддержкой переходов P-States. Зная о максимальных напряжение и частоте конкретного процессора, BIOS системной платы будет работать с объектом _PSS в зависимости от необходимого режима P-State в соответствии с процессорной таблицей допустимых пар "напряжение-частота".

    Каждый режим P-State в объекте _PSS имеет 6 полей: частота ядра ( CoreFreg ), рассеиваемая мощность ( Power ), латентность перехода ( TransitionLatency ), латентность шины ( BusMasterLatency ), управление ( Control ), состояние ( Status ). Одним из важных полей является _PSS Control Field, которое заполняется системным BIOS и содержит техническую информацию инициализации переходов P-States. Поле _PSS Control Field имеет следующий формат:

  • Bits 31-30: IRT ( Isochronous Relief Time )
  • Bits 39-28: RVO ( Ramp Voltage Offset )
  • Bit 27 : Зарезервирован, т.е. объявлен как zero
  • Bits 26-20: PLL_LOCK_TIME ( Phase-Locked Loop Time )
  • Bits 19-18: MVS ( Maximum Voltage Step )
  • Bits 17-11: VST ( Voltage Stabilization Time )
  • Bits 10-06: NewVID ( напряжение ядра P-State запрошенное ОС )
  • Bits 05-00: NewFVID ( частота ядра P-State запрошенная ОС )
    Кстати, в битах 17-11 можно задать стабилизационное время для малейших изменений напряжений. В процессорах Athlon 64, значение VST соответствует 100 микросекундам ( 7'h05 ). А вот двумя битами 19 и 18 в процессорах AMD можно задавать значение шагов напряжения MVS в вариантах: 25мВ ( 00 ), 50мВ ( 01 ), 100мВ ( 10 ), 200мВ ( 11 ). Аналогично два бита перевольтажа RVO варьируются в значениях: 0мВ ( 00 ), 25мВ ( 01 ), 50мВ ( 10 ), 75мВ ( 11 ).

    Объект _PPC используется, чтобы ограничить максимальный режим P-State в любое время. Если производитель BIOS не использует объект _PPC, то BIOS должен всегда возвращать 0 для _PPC, после чего доступны все состояния P-States, описанные объектом _PSS. Обычно возможности объекта _PPC активно используются в мобильных компьютерах.
    Объект PSTATE_CNT описывает вход в фиксированную таблицу ACPI Description Table ( FADT ). Если PSTATE_CNT выдает 0, то это сообщает BIOS о том, что система управления питанием не выполняет переходы P-States.
    А если значение другого объекта CST_CNT ( вход в FADT ) нулевое, то это означает процессорную поддержку ACPI версии 1.0b. Иначе, значение CST_CNT записывается операционной системой в регистр SMI_CMD и показывает поддержку объекта _CST и состояний C-States.

    Athlon 64: уникальное вложение в будущее? Athlon 64, Socket 939
    С появлением в процессорах Pentium 4 технологии Intel EM64T ( Intel Extended Memory 64 Technology ) уникальность маркетинговых атак AMD под названием "вложение в будущее" канула в Лету. А между тем долгожданное "будущее" наступило - 64-разрядные операционные системы и соответствующее ПО уже доступны. Так что конкуренты явно оказались хитрее, выбив в нужный момент 64-битовые козыри из рук компании Advanced Micro Devices.
    Но, как говорится, "не было бы счастья, да несчастье помогло". В результате утечки схемы расположения транзисторов в ЦП Athlon 64 ( gate-level netlist ) появилась технологическая возможность разблокировки множителя процессора - достаточно сфокусировать в нужном месте на определенной глубине пучок высококонцентрированного источника энергии. И, отметьте, не на всю толщину подложки - иначе смерть процессора гарантирована.
    Если раньше для "разблокирования" AMD K6 и K7 достаточно было навести специальные "мостики", то теперь придется очень аккуратно перерезать дорожку внутри корпуса процессора. Разумеется, сделать это через защитную крышку хитспредер невозможно, а вот со стороны текстолита - запросто. Теперь для этого достаточно в совершенстве владеть лазерным резаком и обладать специальными "китайскими инструкциями".
    Не сомневаемся, что пока такой "дырокол" найдется не везде, но как только процесс лазерной резки начнет проникать на наши кухни, ЦП AMD Athlon 64 4000+ запросто сможет превратиться в AMD Athlon 64 5000+.
    Так что уже сейчас мы настоятельно рекомендуем нашим читателям соблюдать осторожность при покупке процессора AMD Athlon 64. Конечно, вероятность нарваться на "продырявленный" процессор невелика, но тем не менее приобретать ЦП лучше в боксовой упаковке и у официальных дилеров AMD. Если же риск - ваше хобби, а низкая цена только возбуждает, то обязательно прихватите с собой на радиорынок мощную лупу - после разблокирования на текстолите основания ЦП остается еле заметное микроотверстие.

    >> НАВЕРХ СТРАНИЦЫ <<