ComplHardware 

Процессоры | Системные платы | Видеосистема | Носители информации | Мультимедиа | Периферия | Коммуникации | Поиск по сайту

 

          iXBT Banner Network

Обзор процессора AMD K6-III 400 МГц

Вслед за выходом очередного процессора от Intel, Pentium III, появилась новинка и от AMD - процессор K6-III. Этот процессор должен был позволить AMD подняться из ниши дешевых систем и начать конкуренцию с Intel на рынке более дорогих машин, подготавливая почву для нанесения решающего удара по позициям микропроцессорного гиганта блокбастером K7. Долгое ожидание, чтение спецификаций и первые впечатления от AMD K6-III давали все основания для того, чтобы надеяться на то, что позиции Intel пошатнутся. Но, традиционно, AMD выступает в роли догоняющего, а для победы в этом случае, согласно военной тактике, требуется немалое превосходство в силе. Но, тем не менее, новый раунд сражения AMD против Intel, Socket7 против Slot1, Давид против Голиафа, начался.

Посмотрим, что же предлагает нам AMD. Вот технические данные процессора AMD K6-III:

Как видно из спецификации, AMD K6-III - это AMD K6-2 плюс 256 Кбайт кэша второго уровня, интегрированного в ядро и работающего на его частоте. Помня, какие чудеса производительности показывает Intel Celeron, от AMD K6-III ожидается также немалый прирост в быстродействии, тем более, что шина памяти - главное узкое место в системе, хоть она и работает на частоте 100 МГц. К тому же L2 кэш e К6-III имеет размер в два раза больший, чем у Celeron и в два раза более быстрый (хотя и вдвое меньший), чем у Pentium II. Не следует к тому же забывать и про кэш, установленный на материнской плате - он становится кэшем третьего уровня и добавляет еще несколько процентов производительности.

Надо уделить внимание и еще одному факту, а именно буквам CXT в названии ядра. Это ядро появилось в процессорах K6-2 совсем недавно и отличается от предшествующего наличием функции пакетной записи в память Write Allocate. То есть, новое ядро позволяет передавать данные по шине не как придется, а по мере накопления 8-ми байтовыми пакетами, что дает небольшой выигрыш в производительности при передаче данных по 64-битной шине. Правда, новой эту функцию назвать нельзя, так как Write Allocate имеется и в интеловских процессорах еще со времен Pentium Pro.

Что касается 3DNow!, то тут по сравнению K6-2 все осталось совсем без изменений. Однако, надо констатировать, что приложений использующих эту технологию на рынке не много, а поддержка 3DNow! в драйверах видеокарт и DirectX не дает практически ничего. Также как и в случае с SSE, для получения значимого прироста в быстродействии, необходимо использование SIMD-инструкций при расчете геометрии 3D-сцены, так как функции, оптимизированные в DirectX работают недостаточно быстро и не используются разработчиками.

После такого вступления начинает казаться, что Intel сможет конкурировать с AMD K6-III только после выхода Coppermine - следующего ядра в линейке Pentium II/Pentium III. Напомним, что Coppermine будеть иметь тоже 256 Кбайт L2-кэша, работающего на частоте ядра и, возможно, тоже 64 Кбайта кэша первого уровня. В этом новом ядре будет также содержаться поддержка интеловских SIMD-инструкций SSE. Таким образом, по крайней мере по объему кэша первого и второго уровня, также как и по времени появления 3DNow! на рынке, AMD Intel обогнал.

В результате единственным параметром спецификации, по которому AMD K6-III проигрывает Intel Celeron/Pentium II/Pentium III, остается медленный неконвейерный арифметический сопроцессор, используемый для расчетов, в частности, в большом числе игр. Еще в момент выхода K6-2, AMD обозначила свою позицию по этому поводу - компания ожидала отказ от использования FPU в пользу 3DNow!. Но на данный момент сказать, что она оказалась права, нельзя. Удасться ли K6-III с медленным сопроцессором переплюнуть интеловские процессоры за счет кэша, покажут тесты.

Мы же отметим тот факт, что для поддержки новых K6-III подойдут и старые Socket7 системные платы, для которых есть BIOS с поддержкой ядра CXT и имеющие возможность выставления напряжения питания ядра 2.3-2.5В. Однако, если в руководстве к системной плате не указан способ выставления этих напряжений, отчаиваться рано. В большинстве случаев существуют недокументированные установки для такого напряжения питания.

Первым делом, что нам захотелось проверить, это скорость работы с кэш-памятью различных уровней и с системной памятью. Для этого были испытаны 4 разных процессора AMD K6-2, AMD K6-III, Intel Celeron и Intel Pentium II, работающие на одинаковой частоте - 450 МГц (100 х 4.5). Результаты получились очень любопытными:

Видно, что L2-кэш в K6-III работает даже быстрее чем в Celeron. Это неплохой повод для радости, которую, впрочем, омрачает тот факт, что как всегда AMD подвела скорость работы с основной памятью, в чем, отчасти виноваты и "смежники" - производители чипсетов под Socket7. Однако, если учитывать тот факт что прокачка объемов данных, больших 256 Кбайт происходит достаточно редко, на общую скорость процессора такая неприятность должна влиять не сильно. На это как раз и расчитывала AMD, вводя в свой кристалл дополнительный быстродействующий L2-кэш.

Теперь перейдем к основным тестам. В нашей ситеме использовалось следующее оборудование:

Первым делом мы рассмотрели производительность в офисных приложениях:

Как того и следовало ожидать, K6-III показал здесь замечательные результаты. Впрочем, так было всегда - процессоры AMD очень хорошо работают с целыми числами, а именно они и используются в большинстве своем в офисных приложениях. Тест CPUMark99, меряющий целочисленное быстродействие, еще раз подтверждает этот факт:

Да, действительно, на K6-III можно гордо навесить ярлык "лучший процессор для целых чисел". Здесь же можно пронаблюдать, как выросла производительность по сравнению с AMD K6-2 за счет введения быстрого L2-кэша. Но, к сожалению, немалое значение, особенно в играх, имеет и скорость работы FPU. А это - давнее бельмо на глазу AMD.

 

Да, лучше бы нам этого не видеть. При операциях с вещественной арифметикой AMD K6-III демонстрирует полную неконкурентоспособность. Неконвейерность сопроцессора дает о себе знать и портит все впечатление от новинки. К счастью, в следующем процессоре от AMD, K7, блок FPU будет полностью переделан, что дает надежду на исправление ситуации в будущих CPU этого производителя.

Но все же главное применение процессоров сегодня - это игры, которые требуют мобилизации всех вычислительных мощностей. Для оценки производительности, которую могут показывать процессоры при обработке 3D-сцен, мы воспользовались тестом CPU 3DMark, входящем в тестовый пакет 3DMark 99 MAX. Этот тест просчитывает 3D-геометрию, но не выводит результат на экран. Таким образом, можно померить пиковую производительность процессора в игровом 3D, не зависящую от установленной видеокарты. Быстродействие K6-2 и K6 III мы исследовали в двух вариантах - с включенным и выключенным блоком 3DNow!.

 

Результаты очень интересны. Первое, что бросается в глаза - это более чем двухкратный прирост скорости AMD K6-III при включении 3DNow!. Но, к сожалению, это не столько результат работы очень быстрых SIMD-инструкций, сколько результат медленного функционирования FPU. Дело в том, что, как и предполагал AMD, разработчики будут отказываться от использования сопроцессора в пользу 3DNow!. Действительно, SIMD-инструкции в K6-2 (и K6-III, естественно) работают гораздо быстрее FPU, потому при наличии 3DNow! большинство расчетов переносится на него с арифметического сопроцессора. То есть, когда 3DNow! включено, обходится один из главных тормозов при расчете 3D сцен - сопроцессор, за счет чего мы видим небывалый прирост в скорости.

Далее, нельзя не заметить, что если используется оптимизация под 3DNow!, то K6-III оказывается самым быстрым процессором. Значит, как и всегда, дело будет упираться в производителей игр - пока не будет повсеместной и качественной оптимизации под 3DNow!, К6-III лидером стать не сможет. А оптимизированных приложений, к сожалению, пока не много. Поддержка же со стороны DirectX ничего не решает - оптимизированными функциями этого API никто практически не пользуется. Возможно, ситуация изменится с выходом DirectX 7, по крайней мере, Microsoft обещал переделать ядро этого API с целью добиться приемлемых для разработчиков игр характеристик.

Тем не менее, посмотрим, как же ведет себя новый процессор в реальных играх. Первый на очереди - Quake2, который в свое время использовался AMD для демонстрации возможностей 3DNow! и специально оптимизированный под этот процессор. Поэтому, мы запускали тест massive1 как со включенной оптимизацией, так и без нее. Вот что было получено при работе через 3dfx OpenGL miniport:

Результаты, конечно, не такие радужные, как при использовании синтетического теста CPU 3DMark, но, тем не менее, K6-III ведет себя достойно. Производительность K6-III 400 со включенным 3DNow! оказывается на уровне Intel Pentium II 450. Но при отключении этого блока, число fps падает практически в полтора раза и никакой конкуренции не получается.

Если же использовать в тестировании OpenGL-драйвер Riva TNT, то расклад получается такой:

Как мы видим, прирост от 3DNow! в этом случае - всего пара fps, а результат значительно ниже, чем у конкурентов. Вывод только один - сказывается плохая оптимизация драйверов Riva TNT, которая портит всю картину.

Посмотрим теперь, какова производительность K6-III в Unreal - самой "тяжелой" для CPU игре последнего времени, не имеющей глубокой оптимизации под 3DNow!.

Здесь K6-III не так уж и плох, хоть и не дотягивает до Pentium II.

В целом, картина ясна - все дело в оптимизации. Есть оптимизация - есть производителность. Нет оптимизации - нет производительности. Так что, желающим использовать процессор с 3DNow! надо внимательно следить за списком игр на сайте AMD, поддерживающих эту технологию.

Следующим пунктом нашей программы явилось изучение влияния размеров L3-кэша, установленного на системной плате, на производительность системы в целом. TriLevel Cache архитектуре, означающей наличие трех кэшей, AMD уделяет особое внимание. Но следует ли гоняться за большим размером кэша на материнской плате? Вот результаты теста:

Ответ очевиден - гоняться не надо. Более 1 Мбайта кэша на системной плате прироста в производительности практически не дают.

Теперь о разгоне. Побывавшие в наших руках 2 экземпляра процессоров AMD K6-III 400 из разных партий проявили крайнее нежелание работать на частоте, большей штатной. Хоть множитель у них и не зафиксирован, запаса прочности по частоте у этих кристаллов практически нет. Кстати, повышение производителем напряжения ядра на 0.2В говорит как раз о том же - возможности 0.25 мкм технологии AMD практически исчерпала и этой мерой пытается добиться большего выхода рабочих кристаллов. Так что, чудес разгона будем теперь ждать только от 0.18 мкм кристаллов.

Выводы

Таким образом получается, что на данный момент AMD K6-III самый быстрый процессор (имеется в виду, естественно, только семейство x86) для работы с целыми числами. То есть, работая в большинстве офисных приложений вы будете восхищаться его скоростью (если, конечно, вы в состоянии заметить изменение производительности MS Word :). Это, естественно, не может являться причиной для перехода со Slot1 на Socket7, так как при работе с вещественной арифметикой у AMD K6-III наблюдаются проблемы. Если же вас интересует возможность быстрой игры в новые игры, то здесь все решает поддержка технологии 3DNow!. Если приложение имеет соответствующую оптимизацию, то процессор показывает хорошую производительность. При этом не надо забывать, что на данный момент лучшим 3D ускорителем для K6-III является семейство Voodoo, имеющее качественную поддержку SIMD в драйверах. Так что для апгрейда с K6-2 новый процессор является достойным выбором.

Ну и в заключение хочется добавить, что следующий процессор от AMD будет освобожден от главного недостатка K6-III, медленного FPU. Также претерпит изменение и системная шина. А это значит, что если K7 реально выйдет в срок, то это будет выдающийся продукт. А на сегодня, самым выгодным приобретением остается Intel Celeron, по крайней мере до тех пор, пока AMD K6-III не станет стоить, столько, сколько стоит K6-2.

Процессор AMD K6-III 400 предоставлен для тестов компанией Altech computers


8 апреля 1999 г.
Илья Гавриченков (gavric@ixbt.com)

 

 

   ComplHardware 

Процессоры | Системные платы | Видеосистема | Носители информации | Мультимедиа | Периферия | Коммуникации | Поиск по сайту

Copyright (c) Compl, 2000
Design (с) Федоров Денис.

Hosted by uCoz