Как я понял, предыдущий чип был всего 256 ядер под контролем 32 ядер.
Intel Core i7-3820, 49 fps, 2,60 W/fps
Kalray MPPA-256, 52 fps, 0,14 W/fps
А это чудо сваяли чтобы выделиться. Доказать себе и другим, что кроме распила еще что-то есть в мире.
0,7Вт при работе в 1/15 от максимума.. это если грубо делить ггц, то 1,78/15,5=115Мгц на ядро?
думаю что в качестве транзистора или ключа это круто, но вот насчет эффективности по сравнению с ядрами процов из принтеров на такой же частоте — это отстой.
А уж если сравнивать с видеокартами, как бы это не было некорректно, 1,78тфлопс и 2Гфлопс у видюх 3 поколения назад (давно не следил за новинками).. то это.. какой-то.. позор..
Вопрос в другом, На сегодняшний день не одна операционка не умеет распределять задачи по ядрам. Интел совершенно бесплатно раздавал 80 ядерные процессоры, любым разработчикам, кто сможет придумать как задействовать ядра... это было 10 лет назад.
А зачем ему ОСь? Это специфическая штука, со своей архитектурой, своим кодом и под свои задачи. Будет отдельный вычислительный модуль (-и, может и несколько), под управлением компа общего назначения, с ОСью и пр. Как сейчас вычисления на видеокарте
Сейчас куча процессоров, с множеством ядер. В каждое ядро загружается 1 команда и ядра работают по очереди. Но не все вместе!
На сегодня, не придумали программного обеспечения для работы большого количества ядер, одновременно.
Что за ерунда... Каждое ядро в проце общего назначения работает полностью независимо. Проблемы возникают только с одновременным доступом к общим ресурсам — памяти и пр.
В видяхе своя специфика — там на блок процессоров одна программа, но у каждого свои данные.
Другой вопрос, что машинный код, допустим x86, на самом деле интерпретируется и исполняется в соответствии с микропрограммой камня (еще со времен Пентиума, если даже не 486DX). Поэтому говорить об эффективности того или иного проца некорректно.
есть такие программы, но не на х86 архитектуре. сама архитектура х86 препятствует параллельной обработке данных и пока она используется все эти сотни ядер в процессоре будут мусором.
О виртуализации что-нибудь доводилось слышать? Или там об облаках. На физическом сервере может находиться дофига виртуальных, и вот им-то многочисленные ядра очень пригодятся. Ну а дома да, от 80-ядерного процессора толку ноль. Разве что биткойны майнить, да уже поздно, эффективность не та.
вся эта виртуализация, облака и прочее это костыли для старой х86 архитектуры. в суперкомпьютерах такие костыли не нужны и они на полную используют все возможности распараллеливания данных.
хорошо, есть у тебя несколько задач и эти задачи не совмещаются на одной оси, но при этом не нагружают конечное железо на 100%. Ты для каждой задачи будешь покупать комп или включишь виртуализацию и решишь задачу?
"инженер", блин.
Чушь. Не знаю, как там винда, с 2008 года с ней дел не имею, но любой Linux/FreeBSD/кто там ещё элементарно задействует любой количество ядер. На сервере. Нахрена на персональном компьютере больше 4-х (к примеру) ядер — этого я не знаю. Но на сервере сколько ни будет — все можно использовать.
мне кажется вы путаете ядро, возможность его задействовать и реальную эффективность..
если программа может работать только на 1 ядре, то никакой линь не заставит ее работать на 8ми.. в этом и дилемма..Либо виртуалить многоядерный проц в единый и терять в производительности т.к. на распределение тоже уходят ресурсы и электричество, либо писать новые апи и менять всю структуру написания программ чтобы те работали с распределением по ядрам самостоятельно. Можно на 20-ти ядерном проце заставить линь раздавать ресурсы каждому процессу по ядру, но остается вопрос общего доступа к памяти т.к. чем больше хаотичных запросов от разных процессов, тем ниже скорость. И там идет уже прогрессия по уменьшению скорости.
Второй момент.. если даже процессор с 1000 ядер удастся запустить под обычные нужды, то нагрузка на память и шину просто нивелирует всю его скорость, а логика матери просто сожрет всю его эффективность к херам. Как я уже говорил, там нагрузка возрастает в геометрической прогрессии.
Я ничего не путаю. Практически любая серверная программа запускает несколько процессов/тредов. Apache, nginx, MySQL, PostgreSQL, Tomcat — несть им числа. А уж если это гипервизор (VMWare, Xen. HyperV) — то тем более. Накладные расходы при многоядерности, конечно, присутствуют, но всяко проще выдать каждой виртуалке по нескольку ядер, чем постоянно переключать контексты в одном мегаядре.
ну так опять..25.. это процессы, а не программа.. вы разницу чувствуете?
у одной программы может быть несколько активных процессов, кто-то не кушает вообще, а кто-то загружает ядро по полной.. так вот, эффективность будет считаться по самому нагружающему процессу т.к. это узкое горлышко программы..
если программа написана под многоядерные процы, то нагружающие процессы делят задачу на части и работают независимо на своем ядре.. это то что я лично вижу на распределенных вычислениях типа FAH или биткоинах. но никакой фотошоп с единым процессом не будет работать эффективно в многоядерной среде пока его полностью не перепишут.. пока мс и интел дает какие-то костыли в виде апи и распределителей, но у каждого костыля есть свой предел и эффективность.
Простой пример из практики.
Биткоин считается на 4-х ядрах, 1-е самое медленное т.к. всякие фоновые процессы в основном сидят на нем, второе и третье примерно равны, они одинаково не загружены другими программами, а вот четвертое почему-то работает даже хуже первых 3х и не загружено на максимум..
А все просто, процесс распределения команд висит на первом ядре, которое перегружено, а ширины шины памяти не хватает на всех, из-за чего 4-й процесс тупо простаивает ожидая задач на выполнение.. На видюхах немного по другому, там другой тип памяти, шина шире, доступ независимый и программы по другому написаны с учетом специфики конкретного процессора. А где универсализация, там по любому будут потери производительности.. Играл на Атари в авиасимулятор, он загружался с дискеты 3.5 в память и дальше можно было играть без дискеты.. весила программа порядка пол. дискеты, сколько загружала не знаю.. Но там был полноценный симулятор, в кабине все датчики работали, была кое-какая детализация ландшафта и все летало.. Напиши сейчас этот симулятор на яве — современный комп тупо встанет и будет рисовать покадрово.. все долно писаться под конкретную железку, а если пишется универсальными языками — то железка должна считать в тысячи раз быстрее.
Поэтому все эти 1000 ядерные процессоры не жизнеспособны, если под них не напишут прикладную программу и не сделают готовый продукт.
Ещё раз — такие программы есть. Любое серверное приложение или гипервизор. Мы говорим о совершенно разных задачах. А то, что такое количество ядер на персональном компе нафиг не нужно — это я уже писал.
Есть много задач, которые способны загрузить все эти процессоры. Кстати в статье об этом написано: "...В настоящее время разработчики уже создали приложения для кодирования/декодирования сигналов беспроводной связи, обработки видео, шифрования и другое ПО, ориентированное на работу с большим количеством вычислений..."
Я бы туда же добавил рендеринг для тех же графических станций, которые современные фильмы рисуют.
о просвети меня бог науки.. или только фекалиями разобрался как работать?
к вашему сведению, работа с гпу у майнеров сложилось меньше 8 лет назад.. я "майнил" FAH когда они только запустили первый бета клиент для гпу.. а биткоин начал считаться силами гпу только через пару лет после этого.. даже не хочу лезть в архивы чтобы даты указать..
Ну да, естественно, я говорю о реально достижимом на данный момент количестве ядер. Скажем, до 100. Что там будет при 1000 — фиг знает. Но что-нибудь придумают.
Если я правильно понял из вашего сообщения то ОС должна распределять нагрузку по всем ядрам равномерно ? Или я ошибаюсь ?
Почему тогда у меня из 64 нагрузка лежит на двух или трех ?
Комментарии
Intel Core i7-3820, 49 fps, 2,60 W/fps
Kalray MPPA-256, 52 fps, 0,14 W/fps
А это чудо сваяли чтобы выделиться. Доказать себе и другим, что кроме распила еще что-то есть в мире.
3dnews.ru
ROTFL
думаю что в качестве транзистора или ключа это круто, но вот насчет эффективности по сравнению с ядрами процов из принтеров на такой же частоте — это отстой.
А уж если сравнивать с видеокартами, как бы это не было некорректно, 1,78тфлопс и 2Гфлопс у видюх 3 поколения назад (давно не следил за новинками).. то это.. какой-то.. позор..
А чего еще от бездуховных-то ждать?
а сколько ещё предстоит не сделать!
ага
На сегодня, не придумали программного обеспечения для работы большого количества ядер, одновременно.
В видяхе своя специфика — там на блок процессоров одна программа, но у каждого свои данные.
Другой вопрос, что машинный код, допустим x86, на самом деле интерпретируется и исполняется в соответствии с микропрограммой камня (еще со времен Пентиума, если даже не 486DX). Поэтому говорить об эффективности того или иного проца некорректно.
"инженер", блин.
если программа может работать только на 1 ядре, то никакой линь не заставит ее работать на 8ми.. в этом и дилемма..Либо виртуалить многоядерный проц в единый и терять в производительности т.к. на распределение тоже уходят ресурсы и электричество, либо писать новые апи и менять всю структуру написания программ чтобы те работали с распределением по ядрам самостоятельно. Можно на 20-ти ядерном проце заставить линь раздавать ресурсы каждому процессу по ядру, но остается вопрос общего доступа к памяти т.к. чем больше хаотичных запросов от разных процессов, тем ниже скорость. И там идет уже прогрессия по уменьшению скорости.
Второй момент.. если даже процессор с 1000 ядер удастся запустить под обычные нужды, то нагрузка на память и шину просто нивелирует всю его скорость, а логика матери просто сожрет всю его эффективность к херам. Как я уже говорил, там нагрузка возрастает в геометрической прогрессии.
у одной программы может быть несколько активных процессов, кто-то не кушает вообще, а кто-то загружает ядро по полной.. так вот, эффективность будет считаться по самому нагружающему процессу т.к. это узкое горлышко программы..
если программа написана под многоядерные процы, то нагружающие процессы делят задачу на части и работают независимо на своем ядре.. это то что я лично вижу на распределенных вычислениях типа FAH или биткоинах. но никакой фотошоп с единым процессом не будет работать эффективно в многоядерной среде пока его полностью не перепишут.. пока мс и интел дает какие-то костыли в виде апи и распределителей, но у каждого костыля есть свой предел и эффективность.
Простой пример из практики.
Биткоин считается на 4-х ядрах, 1-е самое медленное т.к. всякие фоновые процессы в основном сидят на нем, второе и третье примерно равны, они одинаково не загружены другими программами, а вот четвертое почему-то работает даже хуже первых 3х и не загружено на максимум..
А все просто, процесс распределения команд висит на первом ядре, которое перегружено, а ширины шины памяти не хватает на всех, из-за чего 4-й процесс тупо простаивает ожидая задач на выполнение.. На видюхах немного по другому, там другой тип памяти, шина шире, доступ независимый и программы по другому написаны с учетом специфики конкретного процессора. А где универсализация, там по любому будут потери производительности.. Играл на Атари в авиасимулятор, он загружался с дискеты 3.5 в память и дальше можно было играть без дискеты.. весила программа порядка пол. дискеты, сколько загружала не знаю.. Но там был полноценный симулятор, в кабине все датчики работали, была кое-какая детализация ландшафта и все летало.. Напиши сейчас этот симулятор на яве — современный комп тупо встанет и будет рисовать покадрово.. все долно писаться под конкретную железку, а если пишется универсальными языками — то железка должна считать в тысячи раз быстрее.
Поэтому все эти 1000 ядерные процессоры не жизнеспособны, если под них не напишут прикладную программу и не сделают готовый продукт.
Я бы туда же добавил рендеринг для тех же графических станций, которые современные фильмы рисуют.
Ну тогда вы лет на 8, как затормозили. И вале мнение уже безнадёжно устарело.
к вашему сведению, работа с гпу у майнеров сложилось меньше 8 лет назад.. я "майнил" FAH когда они только запустили первый бета клиент для гпу.. а биткоин начал считаться силами гпу только через пару лет после этого.. даже не хочу лезть в архивы чтобы даты указать..
Почему тогда у меня из 64 нагрузка лежит на двух или трех ?