Параллельная Обработка Данных, 04 лекция (от 25 сентября)

Материал из eSyr's wiki.

(Различия между версиями)
Перейти к: навигация, поиск
(Новая: Распростарненные ком технологии: *FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для ...)
Текущая версия (11:42, 13 декабря 2013) (править) (отменить)
(Распространенные коммуникационные технологии)
 
(8 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
Распростарненные ком технологии:
+
[[Параллельная Обработка Данных, 03 лекция (от 18 сентября)|Предыдущая лекция]] | [[Параллельная Обработка Данных, 05 лекция (от 02 октября)|Следующая лекция]]
-
*FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров чере мпи обычно удается достичь 6-7
+
=Коммуникационные среды и технологии=
-
МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.
+
-
*Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках мпая удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у фаст. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клстерах как самое дешевое решение, или ис пользуют как вспомогательную сеть, если есть высокопроизв ком среды.
+
==Распространенные коммуникационные технологии==
-
Специализированные ком среды:
+
-
*Myrinet 2000. Пиковая пропускная сопособность 2 гигабита(250 МБ/сек). В рамках мпиая порядка 200 МБ/сек. лтентность 10 мкс. Но это уже другой уровень стоимотсти. За такую ком среду надо платить примерно столько же сколько за выч узлы.
+
*FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров через MPI обычно удается достичь 6-7 МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.
-
*SCI(SCalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет сохдавать двух-трехмерные торы, в ней отстутвует понятие коммутатор, вся ком ведется спец платами, вставляемые в выч узлы. Давал скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность он потерял. ТОже дорогая технология.
+
*Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках MPI удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у FastEthernet. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клаcтерах, как самое дешевое решение, или используют как вспомогательную сеть, если есть высокопроизводительные коммуникационные среды.
-
* Сейчас наиболее популярна Infiniband. ПОпулярна в дорогом сегменте. Изначально был рассчитан на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных блиизко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.
+
==Специализированные коммуникационные среды==
-
Это красткие характер 5 основных ком технологий, используемых в кластерах. Заачстую используются несколько ком сред.
+
*Myrinet 2000. Пиковая пропускная способность 2 гигабита(250 МБ/сек). В рамках MPI порядка 200 МБ/сек. Латентность 10 мкс. Но это уже другой уровень стоимости. За такую коммуникационную среду надо платить примерно столько же сколько за вычислительные узлы.
-
Есть множество других сетевых решений. Эти -- наиболее распространенный.
+
*SCI(Scalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет создавать двух-трехмерные торы, в ней отсутствует понятие коммутатор, вся коммутация ведется специальными платами, вставляемыми в вычислительные узлы. Давала скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность она потеряла. Тоже дорогая технология.
-
Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компов с распр памятью.
+
-
На производительность влияют
+
*Сейчас наиболее популярна Infiniband. Популярна в дорогом сегменте. Изначально была рассчитана на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных близко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.
-
-Не забываем закон Амдала, который важен для компьютеров с распр памятью.
+
 
 +
Это краткие характеристики 5 основных коммуникационных технологий, используемых в кластерах. Зачастую используются несколько коммуникационных сред.
 +
 
 +
Есть множество других сетевых решений. Эти -- наиболее распространенные.
 +
 
 +
Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компьютеров с распределенной памятью.
 +
 
 +
=Что же влияет на производительность?=
 +
 
 +
-Не забываем закон Амдала, который важен для компьютеров с распределенной памятью.
-латентность и пропускная способность
-латентность и пропускная способность
-
-возможность асинхронно посылки сообщений - влияет на то что проц не проставивает когда общается с другими процами
+
-возможность асинхронной посылки сообщений -- влияет на то, что процессор не простаивает, когда общается с другими процессорами.
-
-равномерная загрузка узлов - очень важный фактор. надо строить задачу таким образом, что бы все процам которые есть давалась
+
-равномерная загрузка узлов - очень важный фактор. Надо строить задачу таким образом, что бы все процессорам, которые есть, давалась
-
примерно одинаковое колво данных насчет, чтобы процессоры не проставивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью разной памятью)
+
примерно одинаковое количество данных на счет, чтобы процессоры не простаивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью, разной памятью).
-
Далее, если сускаться на более низкий уровень:
+
Далее, если спускаться на более низкий уровень:
-
-производительность процессора.Каждый проц может иметь свою архитектуру.
+
-производительность процессора.Каждый процессор может иметь свою архитектуру.
Строка 36: Строка 42:
-
И как крайню точку комп с распр памятью рассмотрим ещё один класс.
+
=GRID=
-
Если мы двигаемя от компов с общей памятью через компы с массивно параллельной пмятью, через кластеры, то крайней точкой можно рассматривать такое поянтие как мета компьютинг, когда в качестве компьютера рассмартивают компы хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как выч мощность такого компьютера потенциально ужасно огромна. GRID технологии.
+
И как крайнюю точку компьютеров с распределенной памятью рассмотрим ещё один класс.
 +
Если мы двигаемся от компьютеров с общей памятью через компьютеры с массивно-параллельной памятью, через кластеры, то крайней точкой можно рассматривать такое понятие, как мета компьютинг, когда в качестве компьютера рассматривают компьютеры хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как вычислительная мощность такого компьютера потенциально ужасно огромна. GRID технологии.
 +
 
 +
==Весьма известные и распространенные проекты==
 +
 
 +
*PACX-MPI - расширение MPI. MPI работающий через TCP/IP. Было продемонстрировано использование 2 компьютеров(Германия-США), решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
 +
 
 +
*Condar. Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое ПО, есть реализации под различные операционные системы.
-
Весьма изщвестные и распространненые проекты:
+
==Проекты решающие конкретные прикладные задачи==
-
*PACX-MPI - расширение мпи. мпи работающий через тсп/ип. Было продемонтсрировано использование 2 компов(германия-сша) решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
+
*SETI@home - всем желающим было предложено анализировать данные радиолокаторов и иаскть следы внеземных цивилизаций, но вроде ничего не нашли. Но был один из наиболее известных проектов, привлекший внимание к подобным затеям.
-
* Condarю Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое по, есть реализации под различные оси.
+
*distributed.net -- продолжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров.
-
Проекты решающие конкретные прикладные залачи:
+
-
*SETI@home - всем желающим было предложено нализировать данные радиолокаторов и искть следы внеземных цивилизаций, но вроде ничего не нашли. НО был один из наболее извсетных проектов, привлекший внимание к подобным затеям.
+
*GIMPS - ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.
-
*distributed.net - продалжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров
+
Проектов последнее очень много, желающие могут найти информацию. Но это -- решение конкретных задач, а что делать если хочется создать более менее универсальный мета компьютер?
 +
==Универсальные GRID==
 +
Наиболее популярны:
-
*GIMPS- ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.
+
*Globus. Недостаток - сложность установки и настройки. чтобы подключиться надо проделать много магических движений, что бы настроить прочитать много документации. Это является значительным недостатком.
-
Проекто последнее очень много, желающие могут найти информацию. НО это -- решение конкретных задач, а что делать если ххочется создать более менее универсальный мета компьютер?
+
-
Наиболее популярнs
+
-
*Globus недостаток - сложность установки и настройки. чтобы одключиться надо проделать много магических движений, что бы настроить прочитать много документции. Это явл значительным недостатком. Тем не менее много сетей ора
+
{{Параллельная Обработка Данных}}
 +
{{Lection-stub}}

Текущая версия

Предыдущая лекция | Следующая лекция

Содержание

[править] Коммуникационные среды и технологии

[править] Распространенные коммуникационные технологии

  • FastEthernet. Сейчас на нем кластеры уже почти не делают, но приведем для сравнения.Скорость 100 мегабит(12.5 мегабайт). Это пиковые характеристики. При общении процессоров через MPI обычно удается достичь 6-7 МБ/сек. Латентность зависит от производителя. В среднем 70 мкс. Сейчас он уже считается слишком слабым для построения кластеров.
  • Следующее поколение Gigabit Ethernet . Его достаточно широко используют в кластерах (125 МБайт/сек). В рамках MPI удается получить порядка 45 МБайт/сек. Латентность как правило больше, чем у FastEthernet. В среднем 90-100 мкс, но можно получить и более низкую латентность. Часто используют в клаcтерах, как самое дешевое решение, или используют как вспомогательную сеть, если есть высокопроизводительные коммуникационные среды.

[править] Специализированные коммуникационные среды

  • Myrinet 2000. Пиковая пропускная способность 2 гигабита(250 МБ/сек). В рамках MPI порядка 200 МБ/сек. Латентность 10 мкс. Но это уже другой уровень стоимости. За такую коммуникационную среду надо платить примерно столько же сколько за вычислительные узлы.
  • SCI(Scalable Coherent Intropy). Правда последнее время о ней не слышно. В отличие от остальных сетевых решений не базируется на свитчах, позволяет создавать двух-трехмерные торы, в ней отсутствует понятие коммутатор, вся коммутация ведется специальными платами, вставляемыми в вычислительные узлы. Давала скорость 400 МБ/сек. И латентность 1.2 мкс. Но новых версий не выходит, поэтому популярность она потеряла. Тоже дорогая технология.
  • Сейчас наиболее популярна Infiniband. Популярна в дорогом сегменте. Изначально была рассчитана на скорость 1 ГБ/сек. Сейчас уже продают 20 ГБ/сек. К этому никто из остальных близко не подходит. Ведутся разработки ещё более быстрых. Латентность сначала была порядка 7 мкс, сейчас примерно 1.5 мкс.


Это краткие характеристики 5 основных коммуникационных технологий, используемых в кластерах. Зачастую используются несколько коммуникационных сред.

Есть множество других сетевых решений. Эти -- наиболее распространенные.

Краткий обзорчик кластеров мы на этом закончим. И подойдем к завершению темы компьютеров с распределенной памятью.

[править] Что же влияет на производительность?

-Не забываем закон Амдала, который важен для компьютеров с распределенной памятью.

-латентность и пропускная способность

-возможность асинхронной посылки сообщений -- влияет на то, что процессор не простаивает, когда общается с другими процессорами.

-равномерная загрузка узлов - очень важный фактор. Надо строить задачу таким образом, что бы все процессорам, которые есть, давалась примерно одинаковое количество данных на счет, чтобы процессоры не простаивали. Это относительно легко, когда система однородная, но становится намного сложнее если система неоднородная(узлы с разной производительностью, разной памятью). Далее, если спускаться на более низкий уровень:

-производительность процессора.Каждый процессор может иметь свою архитектуру.


Таких факторов много, это только основные И нужно учитывать, что все эти факторы действую одновременно.


[править] GRID

И как крайнюю точку компьютеров с распределенной памятью рассмотрим ещё один класс. Если мы двигаемся от компьютеров с общей памятью через компьютеры с массивно-параллельной памятью, через кластеры, то крайней точкой можно рассматривать такое понятие, как мета компьютинг, когда в качестве компьютера рассматривают компьютеры хоть как-то умеющие друг с другом общаться(даже через интернет).Это направление очень модное, так как вычислительная мощность такого компьютера потенциально ужасно огромна. GRID технологии.

[править] Весьма известные и распространенные проекты

  • PACX-MPI - расширение MPI. MPI работающий через TCP/IP. Было продемонстрировано использование 2 компьютеров(Германия-США), решающих одну задачу. Это хорошо когда в задаче выделяются большие независимые части. Расширение было разработано в конце 90 годов.
  • Condar. Занимает нерабочее время корпоративных компьютеров на полезную работу. Свободно распространяемое ПО, есть реализации под различные операционные системы.

[править] Проекты решающие конкретные прикладные задачи

  • SETI@home - всем желающим было предложено анализировать данные радиолокаторов и иаскть следы внеземных цивилизаций, но вроде ничего не нашли. Но был один из наиболее известных проектов, привлекший внимание к подобным затеям.
  • distributed.net -- продолжается даже сейчас, решает ряд задач, в первую очередь расшифровки различных шифров.
  • GIMPS - ищут простые числа. В рамках этого проекта найдено максимальное простое число 2^13466917-1.

Проектов последнее очень много, желающие могут найти информацию. Но это -- решение конкретных задач, а что делать если хочется создать более менее универсальный мета компьютер?

[править] Универсальные GRID

Наиболее популярны:

  • Globus. Недостаток - сложность установки и настройки. чтобы подключиться надо проделать много магических движений, что бы настроить прочитать много документации. Это является значительным недостатком.


Параллельная Обработка Данных


01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16


Календарь

вт вт вт вт вт
Сентябрь
04 11 18 25
Октябрь
02 09 16 23 30
Ноябрь
06 13 20 27
Декабрь
04 11 18

Материалы к зачету

Вопросы к зачету по курсу Параллельная обработка данных


Эта статья является конспектом лекции.

Эта статья ещё не вычитана. Пожалуйста, вычитайте её и исправьте ошибки, если они есть.
Личные инструменты
Разделы