Компьютерра, 2006 № 30 (650) (Журнал «Компьютерра») - страница 37

Проблемы архитектуры K8, которая, в отличие от NetBurst, использует очень простые и изящные схемы вместо навороченных монстров вроде отдельных функциональных блоков, работающих внутри ядра на удвоенной частоте, диаметрально противоположны проблемам, с которыми столкнулась Intel. Если инженеры последней, грубо говоря, пострадали за то, что были «слишком умными» и погнались за лучшим в ущерб хорошему, то в истории разработки K8 остро ощущается огромный разрыв между тем, какие средства расходует на R amp;D Intel и какие расходы на разработки может себе позволить больше озабоченная проблемой выживания AMD. Core 2 производится по 65-нм технологическому процессу, Athlon 64 - по 90-нм, причем чем дальше, тем разрыв в возможностях Intel и AMD больше. Там, где в Intel параллельно работают две-три команды над разными вариантами процессоров, команда AMD занята совершенствованием одного; там, где Intel успевает выкатить три степпинга, AMD обновляет два, и т. д. При таком соотношении сил AMD просто не имеет права на серьезную ошибку, равно как и на смелый эксперимент, - и в итоге продвигается вперед маленькими осторожными шажками. Причем по иронии судьбы, похоже, именно такой «маленький и неспешный» метод работает лучше всего: Core 2, в отличие от Pentium 4, тоже «вырос» не сразу, а медленно и постепенно, еще от первых Pentium Pro к Pentium II, Pentium III, Pentium M и Core «Yonah». Однако вечно играть на ошибках соперника таким образом невозможно - что мы нынче и наблюдаем.

Что касается Intel Core 2 Duo, я не стану принижать его возможности и говорить, что это простой или неинтересный процессор. Израильская команда разработчиков великолепно доработала то, что было создано их предшественниками, практически «вылизав» кристалл настолько, насколько вообще было возможно. Огромная производительность оперативной памяти и схемы «умной» предвыборки, в 98% случаев заранее угадывающих, какие данные потребуются в следующий момент. Чрезвычайно быстрая кэш-память второго уровня, разделяемая между ядрами, и очень быстрые и подключенные по широким шинам кэши первого уровня. Целых три функциональных устройства, каждое из которых реализует все операции с упакованными 128-битными операндами SSE (это могут быть четыре 32-битных или два 64-битных числа) всего за один такт. Нигде, насколько мне известно, раньше не применявшаяся новаторская система обработки микроинструкций, записывающих данные в оперативную память. Интересная реализация декодирования x86-инструкций, позволяющая превращать две инструкции в одну микрооперацию. И - что поражает больше всего - практическое отсутствие «узких мест». Фактически из архитектуры P6, которая неявно лежит в основе Core 2, разработчики «выжали» все что можно. AMD, несмотря на то что ее K8 в принципе гораздо перспективнее P6, о таком остается только мечтать, - многие ее «узкие» места давно известны, но не «расширяются» годами.