Конференція Високопродуктивні обчислення, Київ, 13-15 жовтня 2014

Проблеми архітектур HPC

Якісні стрибки у розвитку суперкомп’ютерів пов’язані із вирішенням технічних та теоретичних проблем, а часто навіть із зміною парадигми побудови обчислювальних систем. Такі фундаментальні проблеми часто називають стінами (Walls), які мають бути подолані або відсунуті вперед для подолання наступних екзафлопсних рубежів.

Питання живлення та охолодження стануть ще важливішими для суперкомп’ютерів та великих ЦОД, які будуються для сучасних соціальних мереж, хмар та пошукових машин. Архітекторам таких комп’ютерних систем, які зазвичай мають досвід у електротехніці або комп’ютерних науках, у сучасних умовах необхідно думати про новітні прогресивні системи теплообміну.

І хоча, з одного боку, за останні кілька років у світі з’явилось багато різних передових систем охолодження, лише одиниці з них готові до впровадження у масштабах HPC з десятками тисяч серверів, і ще менша кількість придатних для велетенського ЦОД з сотнями тисяч серверів.

Перспективні методи, які зараз розробляються у цій галузі, включають охолодження серверів водою кімнатної температури, на відміну від систем з охолодженою водою, а також повторне використання теплової енергії. Системи типу суперкомп’ютера CLUMEQ протягом кількох років показують потенціал повторного використання тепла, і проблема зараз – лише розвинути подібні технології до промислових масштабів.

Швидке сховище. Звичайно, можна масштабувати паралельну файлову систему Lustre до десятків петабайт і більше. Деякі великі HPC центри розглядають розподілені технології типу Hadoop для розв’язання проблеми «великих даних». Але чи є більш фундаментальні зміни технології, які зможуть значно вплинути на методи збереження даних у цьому десятилітті?

Існує багато проектів із розробки швидших сховищ на основі технологій SSD. У найближчій перспективі (1-2 роки) не станеться революційних змін у флеш технологіях. Флеш пам’ять розвивається логічно та поступово. Однак, введення серверного інтерконекта і нових флеш-контролерів PCIeGen3 обіцяє появу нових цікавих можливостей. Для отримання переваг пропускної здатності PCIeGen3 необхідно буде змінити деякі програмні інтерфейси. Доведеться позбутись усталених протоколів (FC, SCSI, SAS тощо), і тільки тоді файлова система матиме повну потужність.

У довгостроковій перспективі флеш-технології надихатимуть появу нових технологій пам’яті, таких як мемристор, які вийдуть не тільки на новий рівень продуктивності, а й потребуватимуть значно менших витрат енергії.

Швидші мережі — це не просто перехід з 10 Gbit на 40 Gbit Ethernet або з QDR Infiniband на FDR Infiniband. Це зміна підходу до управління та масштабованості сучасних мереж у HPC. Попереду нас чекають цікаві часи у сфері мереж, оскільки поширення «виробників кремнію» як Intel, Mellanox, Broadcom та інших мотивуватиме нові проекти на боротьбу так, як це було десять років тому у випадку з Linux та виробниками серверів.

Якщо взяти, наприклад, мережевий комутатор, то можна сміливо робити ставку на виробників ПЗ, яке зможе на ньому працювати. З часом комутатори стануть все більше схожими на звичайні сервери, а різниця між ними буде зникати. Ваш сервер працює як комутатор чи на вашому комутаторі запускаються додатки? Додайте до цього альтернативні економні процесори та нові програмні моделі, і розробники суперкомп’ютерів придумають їм безліч задач на багато років уперед.

Кілька тем, які останнім часом жваво обговорюються.

По-перше, важко змагатись з відкритими промисловими стандартами.

По-друге, масштаб має значення. Привабливими стануть такі технології, які можна застосувати всюди, а не на окремих спеціалізованих системах, якими користуватиметься кілька клієнтів.

І насамкінець, у цій галузі є безліч можливостей для інновацій незалежно від того, чи це найбільша комп’ютерна компанія світу, чи це невеликий проект з двох десятків людей. Єдина річ, яка до сьогодні не змінилась з часів першого суперкомп’ютера Cray-1, це те, що високопродуктивні обчислення є локомотивом технологій.

Marc Hamilton — віце президент HP Marc.

Теги: Cray, HPC, Infiniband, Intel, Lustre, Mellanox, SSD, екзафлопс, інтерконект, охолодження, пам'ять, суперкомп'ютер, сховище, технології

Матеріали за темою:

Коментарі