Начались продажи компьютеров на базе процессоров «Эльбрус-4С»

Аватар пользователя KGB

ЗАО “МЦСТ” и ПАО “ИНЭУМ им. И.С.Брука” выпустили персональный компьютер АРМ “Эльбрус-401″, предназначенный преимущественно для офисного использования, а также сервер «Эльбрус-4.4».  На сайте приводятся характеристики данных решений.

Офисный ПК АРМ Эльбрус-401 выполнен в корпусе MiniTower и включает: один процессор Эльбрус-4С, работающий на частоте 800 МГц, 24 ГБ оперативной памяти (с возможностью наращивания до 94 ГБ), интегрированную графику Silicon Motion SM718, видеокарту AMD Radeon «серии 6000». Уровень пиковой производительности заявлен равным 50 Гфлопс.

Дисковая подсистема представлена одним HDD 3.5-дюймовым SATA2 объёмом 500 ГБ и приводом DVD-RW (также SATA2) Опционально можно заказать SSD объёмом 128 ГБ, который устанавливается в имеющийся на материнской плате разъём mSATA. Также имеется ещё один свободный SATA2. Из внешних интерфейсов присутствуют Gigabit Ethernet, USB 2.0, RS-232.

В основе сервера Эльбрус-4.4 лежит два варианта конфигурации (с одним или двумя южными мостами) из четырёх процессоров Эльбрус-4С, работающих на частоте 800 МГц и объединённых по схеме NUMA (неоднородная общая память). Штатно установлено 48 ГБ оперативной памяти, с возможностью увеличения до 384 ГБ, для чего имеется 12 слотов DIMM DDR3 (ЕСС), максимальная эффективная частота памяти при этом – 1600 МГц. Сервер выполнен в стоечном корпусе для установки в стандартную 19” стойку высотой от 1U. Пиковая производительность заявлена равной 200 Гфлопс одинарной точности. Роль интегрированного графического ядра выполняет GPU Silicon Motion SM718, оснащённый 16 МБ видеопамяти и подключенный к шине PCI (видеовыход – D-Sub, разрешение – до 1920 х 1080).

Дисковая подсистема состоит из одного HDD объёмом 1 ТБ с интерфейсом SATA2. Допускается её расширение до 4 (Эльбрус-4.4 с одним южным мостом) или 8 накопителей (Эльбрус-4.4 с двумя южными мостами), в том числе, с построением RAID-массивов.

Программная часть представлена операционной системой «Эльбрус», которая построена на основе ядра Linux, но при этом заявлена поддержка ОС, ориентированных на платформу Intel x86/х86-64. Отдельно подчёркивается возможность эксплуатации Windows XP. Цену на новинки компания публично не уточняет.

В компании «МЦСТ» также вскоре завершатся опытно-конструкторские работы по созданию российского процессора нового поколения. Речь идет о восьмиядерном микропроцессоре «Эльбрус-8С» с пиковой производительностью более 150 Гфлопс, выполненного по технологии в 32 нм.

Как заявляется, предсерийные образцы процессоров “Эльбрус-8С”, которые будут доступны для тестирования сторонними организациями, как ожидается, появятся в конце 2015 года. Следующее поколение российских микропроцессоров под наименованием «Эльбрус-16С» будет иметь производительность 1 Тфлопс и будет производиться по техпроцессу менее 28 нм. Начало выпуска данного процессора ожидается к 2018 году.

Взято тут

Комментарии

Аватар пользователя alexsword
alexsword(13 лет 1 месяц)

баян

Аватар пользователя RusKaz
RusKaz(10 лет 7 месяцев)

.

Аватар пользователя Имперский шут
Имперский шут(10 лет 3 месяца)

Отлично. осталось оперативку, жесткий, материнку, видеокарту, чипсет и програмное обеспечение российскими сделать.

Аватар пользователя Kawa
Kawa(10 лет 7 месяцев)

Мда брендинг и дизайн из 90х блин ну вот почему пафоса не нагнать, дизайн крутой не сделать, презентацию в стиле аппла не устроить где расказать и показать все фишки в стиле вау это релволюшен и проч? Потом удивляются что никто не ведется колхозники. И да этот пост именно о пользе грамотных маркетологов и дизигнеров.

Аватар пользователя Старичок
Старичок(11 лет 3 месяца)

А смысл? Камень работает на частоте 800МГц. Его сутьба - офисные приложения с минимумом графики.

Аватар пользователя tokomak
tokomak(12 лет 11 месяцев)

У него широкое командное слово (VLIW) т.е. такая архитектурная особенность, которая обеспечивает процессору так называемый явный параллелизм. А в архитектуре x86 - танцы с бубнами (причем они происходят в самом процессоре - тратя энергию и требуя кучу дополнительных устройств, транзисторов), чтоб обеспечить параллельное выполнение нескольких инструкций на одном вычислительном ядре. Поэтому x86 архитектуру постоянно расширяют (например SIMD), ибо по своей сути она устарела и тянет прогресс процессоростроителей назад, но ради обратной совместимости её сохраняют. А нам обратная совместимость не нужна, ну, просто не с чем совмещать.

Так что частота – это дело вторичное, если не третичное.

Аватар пользователя Старичок
Старичок(11 лет 3 месяца)

Подождите. "Ядро" камня - это сумматор? Который суммирует(с плавающей там точкой, с инверсией - это уже дело техники). Сл-но, чем выше частота тактовых(когда я учился говорили ещё "тактирующих", было смешно) импульсов - тем чаще он суммирует, нет?

Аватар пользователя tiriet
tiriet(11 лет 8 месяцев)

ядро- это не только и не столько сумматор, там еще и конвеер команд, например, и кэш, в котором данные лежат и очень много еще чего, что не является сумматором.

и частота не всегда определяет "быстродействие" системы в целом. последние лет 5-6 уже как частота перестала быть определяющим параметром.

вот данные по википедии для современных процессоров интела:

  • Intel Core i7-4930K (Ivy Bridge), частоты 3,7–4,2 ГГц, 6 ядер (2013) — 130—140 гигафлопсов (теоретический пик 177 GFlops)
  • Intel Core i7-5960X (Haswell), частоты 3,0-3,5 ГГц (2014) — до 350 гигафлопсов (теоретический пик 384 ГФлопс на 3 ГГц)[38]

6 ядер, 130-140 гигафлопов, частота 3,7 ГГц.

Сабж, при частоте 0,8 ГГц обещает 50 гигафлопов. если это реальные гигафлопы, которые можно выжать в какой-нибудь числодробилке- то это очень даже приличный камень на фоне Core i7. не топовый, но и отнюдь не "прошлый век", а весьма крепкий середнячок. Фаркрай под него может и не оптимизирован, но для промышленных нужд- на посчитать- пообрабатывать данные- очень даже подойдет.

Аватар пользователя tokomak
tokomak(12 лет 11 месяцев)

Ну, если совсем простыми словами, то в ядре основное - это набор АЛУ. Их там много. Они бывают разные (для чисел с фиксированной точкой, для чисел с плавающей точкой и всякое прочее).

Так вот, нынешние процессоры (каждое их ядро) делают операции не за несколько тактов, как было раньше, давно, а делают несколько операций за один такт.

Т.е. за один такт процессор может, например, сделать несколько сложений одновременно, или вычитаний...

В x86 - сам процессор "думает" над этой проблемой, пытается понять можно ли делать какие операции паралельно, или, например, есть зависимоти по результатам от предидущих (ещё не доделанных) операций, и следующие - запускать нельзя. Это называется суперскалярная архитектура. Благодаря использованию суперскалярной архитектуры процессор может выполнять несколько команд за 1 такт.

Ещё там (в x86) есть динамическое (спекулятивное) исполнение, это технология, позволяющая процессору динамически предсказывать порядок инструкций и выполнять их в той очередности, которая способствует повышению производительности.

Вот, для пояснения, сильно упрощенная схема одного из типичных участков кода программы.

команда 1: R1 = А + 2;

команда 2: R3 = R1 + 5.

команда 3: R2 = В + 3;

Здесь для выполнения команды 2 требуется результат команды 1, и поэтому команда 2 не может быть выполнена, пока не будет завершена команда 1. Команда 3 не зависит от других команд.

Но если выполнять команды только строго последовательно - будет плохо, т.е., пока не будет выполнена команда 1, вычислительные блоки простаивают. По идее, в это время можно было бы выполнять другую полезную вычислительную работу.

И вот процессору приходится проверять зависимость команды от результата предыдущих команд на много шагов вперед. Этот механизм называется "анализом потока данных".

Процессор тогда может выполнять команды в порядке, отличном от их порядка следования в коде программы.

В примере, сначала будут выполнены команды 1 и 3, а только потом 2. Это некое "опережающее" выполнение команд. Кстати, результат опережающего выполнения записывается в специальные регистры временного хранения...

В общем там всё очень сложно.

Но это всё позволяет за один такт исполнить до 5-ти команд. Однако цена этого - сложный процессор, очень сложный...

А вот теперь предствьте, что всю эту работу - по распаралеливанию кода, берёт на себя компилятор в процессе компиляции программы. А процессор имеет очень много АЛУ, которые могут работать одновременно, и есть много регистров...

Тогда можно сразу запустить хоть с десяток операций в один такт. Кстати (SIMD) расширения для x86 - они в принципе идут в эту же сторону...

Вот для примера, как может работать Эльбрус:


№ командБлок №1Блок №2Блок №3Блок №4Блок №…Блок №N
1R1=R2+3R6=R7+3R11=R12+3R16=R17+3R26=R27+3R101=R102+3
2R3=R1*R2R8=R6*R7R13=R11*R12R18=R16*R17R28=R26*R27R103=R101*R102
3R4=R3+2R9=R8+2R14=R13+2R19=R18+2R29=R28+2R104=R103+2
4R5=R4*R4R10=R9*R9R15=R14*R14R20=R19*R19R30=R29*R29R105=R104*R104

Видите, здесь под командой 1 - сразу подразумевается не одна команда, а набор команд, кстати, команды в наборе - могут быть совершенно разные, это я одни и те же написал - типа алгоритм параллельной обработки изобразил.

Регистров общего назначения в Эльбрусе чуть ли не 200 штук... И блоков где могут одновременно выполняться команды - тоже много.

Вот этот явный параллелизм и может дать большую производительность при низкой частоте.

Правда есть некий класс алгоритмов, которые не распараллеливаются...

Аватар пользователя Старичок
Старичок(11 лет 3 месяца)

Так как же тогда оценивать производительность? Количеством выполненных операций в сек.? Так это не только от самого камня зависит, но и от (даже не знаю, как называется теперь)прошивки(алгоритма) работающих с ним контроллеров(?)...

Аватар пользователя tokomak
tokomak(12 лет 11 месяцев)

Её оценивают в Гфлопс... В итоге - это количество выполненных операций за секунду с числами с плавающей запятой.

Для оценки существует целый набор специальных математических алгоритмов предназначенных для тестирования. Эти алгоритмы что-то разное и хитрое считают и замеряют количество операций за секунду... А какой уж там процессор - им не важно. Одним набором алгоритмов можно измерять производительность очень большого количества разных процессоров. Берёшь тестовые задачи, компилируешь их и запускаешь...

Вот пример: типовые тестовые задачи из SPECfp2006:

Название задачиЯзыкОписание
410.bwavesFortran-77Вычислительная гидрогазодинамика. Программа численного решения задачи распространения взрывной волны в трехмерном пространстве в переходном околозвуковом ламинарном вязком потоке.
416.gamessFortranКвантово-химические расчеты. Задача основана на популярной квантово-химической программе GAMESS, позволяющей рассчитывать широкий круг квантово-химических задач.
433.milcCФизика, квантовая хромодинамика. Задача основана на последовательной (однопроцессорной) версии программы su3imp, применяемой для симуляции поведения фундаментальных составляющих материи — кварков и глюонов согласно теории калибровочных полей.
434.zeusmpFortran-77Физика, магнитогидродинамика. Программа основана на ZEUS-MP, ядре вычислительной гидрогазодинамики для симуляции астрофизических явлений.
435.gromacsC/FortranБиохимия, молекулярная динамика. Задача основана на многоцелевом пакете молекулярной динамики GROMACS, осуществляющем решение уравнений движения Ньютона для систем, состоящих из большого числа частиц (от сотен до миллионов).
436.cactusADMC/Fortran-90Физика, общая теория относительности. Представляет собой комбинацию свободно распространяемой среды решения задач Cactus и вычислительного ядра BenchADM, применяемого в численных задачах общей теории относительности.
437.leslie3dFortran-90Вычислительная гидрогазодинамика. Основана на программе вычислительной гидрогазодинамики LESlie3d, применяемой для изучения широкого спектра явлений турбулентности.
444.namdC++Структурная биология, классическая молекулярная динамика. Задача представляет собой внутренний цикл вычисления межатомных взаимодействий параллельной программы симуляции больших биомолекулярных систем NAMD.
447.dealIIC++Анализ конечных элементов. Задача использует библиотеку deal.II, направленную на решение уравнений в частных производных с помощью адаптивного метода конечных элементов и оценки ошибок.
450.soplexC++Линейное программирование, оптимизация. Основана на программе SoPlex Version 1.2.1 для решения линейных программ Симплекс-методом.
453.povrayC++Компьютерная визуализация, трассировка лучей.Основана на популярном пакете визуализации изображений методом трассировки лучей POV-Ray.
454.calculixC/Fortran-90Структурная механика. Основана на бесплатной программе CalculiX для решения линейных и нелинейных трехмерных задач структурной механики с помощью классической теории конечных элементов.
459.GemsFDTDFortran-90Вычислительная физика, электромагнетизм.Программа решения уравнений Максвелла в трехмерном пространстве временных интервалов с помощью метода конечных разностей временных интервалов (FDTD).
465.tontoFortran-95Квантовая кристаллография. Программа основана на свободно распространяемом квантово-химическом пакете Tonto, адаптированном для решения кристаллографических задач.
470.lbmCВычислительная гидрогазодинамика. Программа реализует так называемый «метод решеток Больцмана» (Lattice Boltzmann Method, LBM) для симуляции поведения несжимаемых текучих сред.
481.wrfC/Fortran-90Предсказание погоды. Основана на модели исследования и предсказания погоды (Weather Research and Forecasting, WRF) — численной системе предсказания погоды, предназначенной как для практического предсказания погоды, так и теоретического исследования атмосферных явлений.
482.sphinx3CРаспознавание речи. Задача основана на широко известной системе распознавания речи Sphinx-3.
Аватар пользователя tokomak
tokomak(12 лет 11 месяцев)

Вот, в вики прочитал: Эльбрус-8С способен выполнять на каждом ядре до 25 операций за один машинный такт, что обеспечивает высокую производительность при умеренной тактовой частоте. Ну, и у него 8 ядер...

Аватар пользователя kroog
kroog(10 лет 9 месяцев)

смысл в том, что быстродействие компьюетров измеряется не в тактовой частоте, а в Гфлопсах , то бишь в количестве операций с плавающей точкой за один такт работы процессора
для примера сервер, построенный на Intel Xeon E3-1275 (4 cores @ 3.574GHz) (свежий серверный проц от пендосов) выдает 228 Гфлопс

А ПК от МЦСТ, приведенный в статье, с процем Эльбрус-4С (1891ВМ8Я) (800 МГц, 4 ядра) выдает 50 Гфлопс

Серверный проц от того же МЦСТ Эльбрус 8С (1,3ГГц, 8 ядер) дата начала серийного выпуска - 2 половина 2015 года выдает 250 Гфлопс

Дело не в гигагерцах, а в архитектуре процев 

Аватар пользователя Телеграфист
Телеграфист(11 лет 9 месяцев)

Назначение эльбруса - работать в приложениях, где импортные камни ставить неудобно. И соответственно, выпускаться в корпусах для жестких условий эксплуатации. Кстати, у вероятного союзника лучший камень, сертифицированый по MIL883 это Pentium1 x 160 MHz. Есть еще 400 МГц радиационно стойкий RISC камень Хьюллет-Паккард, но он ни разу не х86 архитектура.

Для информации. MIL883 процессоры поставляются только с разрешения Правительства США, так же, как любое серьезное оружие. В страны БРИКС не поставляются процессоры даже INDUSTRIAL GRADE.

А представленный в статье компьютер - результат начальственной (Рогозинской) придури, распорядившийся сделать офисный комп из процессора, заточенного на встраиваемые и бортовые применения.

Аватар пользователя tiriet
tiriet(11 лет 8 месяцев)

вау! 50ГФлоп во встраиваемом процессоре? да еще и с VLIW-архитектурой? да еще и под Linux? вы его с 1986ВЕ91Т не путаете?

Аватар пользователя tiriet
tiriet(11 лет 8 месяцев)

в догонку: удобно ли ставить секретарше Шойгу офисный компьютер с импортным камнем?

а если учесть, что к этому камню так же идет импорнтая мать, , с импортными контроллерами мостов, с интегрированной сетевухой и в которой стоит БИОС на 8МБ, из которых для работы собственно компа- достаточно 500кб, а остальные 7.5 МБ- заняты интереснейшим зашифрованным содержимым? так что если это даже и Рогозинская придурь- то она не такая придурь, как на самом деле.

Аватар пользователя невежда
невежда(12 лет 5 месяцев)

Дизайн абсолютно нормальный,  это производственные компы а не для игр дома. Вопрос только цены.