Кросспост
http://igor-dzhadan.livejournal.com/150103.html?view=631639#t631639
Поскольку евроамериканцы и их подпевалы любят чморить русских за якобы "неумение работать", периодически буду выкладывать старые материалы, опровергающие подобные высокомерные глупости. В данный момент выложу парочку ссылок 2008 года о российском процессоре, который обгоняет американские аналогичной частоты в несколько раз. ЭВМ на основе этого процессора продолжают поставляться военным.
Реализация архитектуры "Эльбрус"
Описанная архитектура реализована в микропроцессоре
"Эльбрус" (технология 130 нм, тактовая частота 300 МГц, площадь кристалла – 189 мм2, 75,8 млн. транзисторов)
и в двухпроцессорном вычислительном комплексе "Эльбрус-3М1" на его основе (рис.3), государственные испы-
тания которых успешно завершились в конце 2007 года,
а в 2008 году началось серийное производство и постав-
ки. Успешно прошли испытания и общее программное
обеспечение ВК "Эльбрус-3М1". Оно включает защищен-
ную операционную систему МСВС‑Э, систему програм-
мирования (содержит оптимизирующий компилятор, биб-
лиотеку поддержки языков высокого уровня и другие со-
ставляющие систем языкового программирования, а так-
же системы двоичной трансляции для исполнения двоич-
ных кодов платформы Intel x86), комплекс пользователь-
ских сервисных программ и др. – всего более 100 млн.
строк С/С++, вновь разработанных и доработанных под
платформу "Эльбрус".
На испытаниях была зафиксирована пиковая произ-
водительность микропроцессора для 32-разрядных дан-
ных 6,9 GIPS / 4,8 GFlops. Эффективность оптимизирующе-
го компилятора (точнее, эффективность оптимизирующей
компиляции применительно к архитектуре "Эльбрус") под-
твердило сравнение пиковой производительностью микро-
процессора c его производительностью на реальных зада-
чах. В частности, для задач умножения матриц (DGEMM) с
32- и 64-разрядными данными реальная производитель-
ность составила 4,5 и 2,3 GFlops, соответственно, при пико-
вой 4,8 и 2,4 GFlops. В целом удельная производительность
микропроцессора составила 16 GFlops/Гц.
Реализуя архитектуру "Эльбрус", компания МЦСТ вышла
на новый, гораздо более высокий уровень проектирования
микросхем по сравнению с серийно выпускаемым микро-
процессором "МЦСТ-R500" (на этом же уровне разработан
и выпущен процессор "МЦСТ –R500S"). Однако технология
уровня 130 нм и полузаказное проектирование не позволи-
ли в микропроцессоре "Эльбрус" поднять тактовую частоту
выше 300 МГц. Тем не менее, следовало экспериментально
показать достоинства архитектуры "Эльбрус" относительно площадь кристалла – 189 мм2, 75,8 млн. транзисторов)
и в двухпроцессорном вычислительном комплексе "Эль-
брус-3М1" на его основе (рис.3), государственные испы-
тания которых успешно завершились в конце 2007 года,
а в 2008 году началось серийное производство и постав-
ки. Успешно прошли испытания и общее программное
обеспечение ВК "Эльбрус-3М1". Оно включает защищен-
ную операционную систему МСВС‑Э, систему програм-
мирования (содержит оптимизирующий компилятор, биб-
лиотеку поддержки языков высокого уровня и другие со-
ставляющие систем языкового программирования, а так-
же системы двоичной трансляции для исполнения двоич-
ных кодов платформы Intel x86), комплекс пользователь-
ских сервисных программ и др. – всего более 100 млн.
строк С/С++, вновь разработанных и доработанных под
платформу "Эльбрус".
На испытаниях была зафиксирована пиковая произ-
водительность микропроцессора для 32-разрядных дан-
ных 6,9 GIPS / 4,8 GFlops. Эффективность оптимизирующе-
го компилятора (точнее, эффективность оптимизирующей
компиляции применительно к архитектуре "Эльбрус") под-
твердило сравнение пиковой производительностью микро-
процессора c его производительностью на реальных зада-
чах. В частности, для задач умножения матриц (DGEMM) с
32- и 64-разрядными данными реальная производитель-
ность составила 4,5 и 2,3 GFlops, соответственно, при пико-
вой 4,8 и 2,4 GFlops. В целом удельная производительность
микропроцессора составила 16 GFlops/Гц.
Реализуя архитектуру "Эльбрус", компания МЦСТ вышла
на новый, гораздо более высокий уровень проектирования
микросхем по сравнению с серийно выпускаемым микро-
процессором "МЦСТ-R500" (на этом же уровне разработан
и выпущен процессор "МЦСТ –R500S"). Однако технология
уровня 130 нм и полузаказное проектирование не позволи-
ли в микропроцессоре "Эльбрус" поднять тактовую частоту
выше 300 МГц. Тем не менее, следовало экспериментально
показать достоинства архитектуры "Эльбрус" относительно процессоров семейства Intel х86, работающих на несравненно более высокой частоте. Для этого было выполнено
прямое исполнение в кодах Intel x86 более 20 операционных
систем (MSDOS, Windows XP, Linux, QNX и др.) и более 1000
популярных приложений. Продемонстрированная при этом
полная совместимость позволила провести "гонки" на про-
изводительность с микропроцессором Pentium 4 (1,4 ГГц)
(рис.4). В результате на 21 задаче пользователей произво-
дительность ВК "Эльбрус-3М1" в однопроцессорном режи-
ме была равна в среднем производительности компьютера
на основе Pentium 4 с тактовой частотой 2 ГГц.
Испытания ВК "Эльбрус-3М1" в однопроцессорном
режиме показали увеличение быстродействия в сред-
нем в 5,2 раза относительно ВК "Эльбрус-90 микро"
(500 МГц) и в 1,44 раза относительно компьютера на осно-
ве Pentium 4 (1,4 ГГц). При столь высокой производитель-
ности энергопотребление процессора мало – отношение
производительности к мощности превышает 0,4 GFlops/Вт,
что является превосходным показателем для универсаль-
ных одноядерных микропроцессоров. Он достигнут за счет
эффективной загрузки аппаратуры распараллеливающим
программу компилятором.
Реализовав логическую составляющую архитектуры
"Эльбрус" в первом процессоре, компания МЦСТ планиру-
ет развивать эту линию аналогично своей серии микропро-
цессоров с архитектурой SPARC. В 2009 году появится од-
ноядерный микропроцессор "Эльбрус-S" с тактовой часто-
той 500 МГц, спроектированный по технологическим нор-
мам 90 нм. По сравнению с микропроцессором "Эльбрус",
в "Эльбрус-S" восьмикратно увеличен объем кэш-памяти
(до 2048 Кбайт) и вдвое возросла пропускная способность
канала памяти (8 Гбайт/с). Введено три дуплексных канала
межпроцессорного обмена и канал доступа к подсистеме
ввода-вывода с пропускной способностью в одном направ-
лении 2 и 1 Гбайт/с, соответственно.
На основе "Эльбрус-S" предусматривается создание вы-
числительных модулей в четырехпроцессорной конфигурации
с распределенной когерентной оперативной памятью, аналогичных приведенной на рис.2б. В дальнейшем они должны
стать элементом многопроцессорных высокопроизводитель-
ных вычислительных систем платформы "Эльбрус".
Платформа "Эльбрус"
для российского суперкомпьютера
Одна из тенденций в современной практике создания су-
перкомпьютеров – использование микропроцессоров, раз-
работанных лидерами мирового компьютеростроения, ко-
торые стали своего рода стандартом и выпускаются мас-
совыми сериями для самых различных применений. Среди
критериев, определяющих выбор базового микропроцес-
сора, помимо экономических соображений особое значе-
ние имеют вычислительная мощность (в первую очередь,
тактовая частота), отработанная на нескольких поколени-
ях микропроцессоров архитектура, и, естественно, воз-
можность установить мощную современную операционную
систему, предоставляющую программистам богатые сер-
висные возможности и самый широкий набор актуальных
программных приложений. Мировой опыт показывает, что
по совокупности этих и других характеристик предпочте-
ние, как правило, отдают микропроцессорам с архитекту-
рой Intel x86. Из этого следует, что в последующие годы
во всем мире основной объем программного обеспечения
для суперкомпьютеров будет рассчитан на эту платформу.
Другая принципиальная проблема – опережающий
рост вычислительной мощности современных микропро-
цессоров по отношению к времени обращения в память.
Особенно негативно влияние этого фактора на выполне-
ние задач со слабой пространственно-временной локали-
зацией данных. Наиболее адекватно данная проблема ре-
шалась в многопроцессорных системах с общей памятью
с мощным параллельным доступом к ней и когерентным
протоколом кэширования. Эти ключевые моменты хорошо
соответствуют решениям, заложенным в платформу "Эль-
брус". При высокой логической скорости, особенно на при-
ложениях, свойственных суперкомпьютерам, она гаранти-
рует полную и эффективную совместимость с платфор-
мой Intel x86. В том числе – при выполнении прикладных
программ под управлением операционной системы Linux.
Напомним, технологию двоичной компиляции еще в 2002
году реализовала фирма Transmeta в серийных микропро-
цессорах Crusoe для обеспечения их совместимости с Intel
х86. Вычислительная система на основе Crusoe отличалась
высокой надежностью, компактностью и малым энерго-
потреблением. Но ее производительность на приложени-
ях, активно использующих вещественные операции, была
недостаточной из-за сравнительно небольшой производи-
тельности микропроцессора.
В отличие от Crusoe, производительность микропроцес-
сора "Эльбрус" на вещественных операциях на порядок
выше благодаря оптимизирующему компилятору. При этом
он также характеризуется низким энергопотреблением. Су-
щественно и то, что архитектура "Эльбрус" за счет устройс-
тва предварительной подкачки данных обеспечивает мощ-
ный параллельный поток обращений в память с темпом
подкачки два байта на одну вещественную операцию. Это
соответствует характеристикам лучших, самых современ-
ных суперкомпьютеров, таких как Cray BlackWidow (2 бай-
та/операция) или NEC SX-9 (2,5 байта/операция) – лидера
по этому параметру.
Тщательная оценка возможностей компании МЦСТ и
перспектив отечественной микроэлектроники показыва-
ет реальность выполнения программы по созданию серии
компьютеров высокой и сверхвысокой производительности
на базе платформы "Эльбрус" (рис.5).
Если требования национальной безопасности заставят от-
казаться от создания и использования суперкомпьюте-
ров, построенных на импортных компонентах (в первую
очередь, это касается микропроцессоров), то архитектур-
ная платформа "Эльбрус" и технология двоичной компиля-
ции позволят "мягко" перейти на полностью российский су-
перкомпьютер. При необходимости она обеспечит полную
и достаточно эффективную совместимость с архитекту-
рой Intel x86, доминирующей сегодня в суперкомпьютерах.
В этом случае открывается возможность для интегральных
решений, позволяющих соединить в едином проекте на-
иболее перспективные отечественные разработки.