Конференція Високопродуктивні обчислення, Київ, 13-15 жовтня 2014

Top500 святкує двадцятирічний ювілей

Ганс МоєрВашій увазі пропонується переклад інтерв’ю з Гансом Моєром, засновником рейтингу найпотужніших суперкомп’ютерів світу Top500 та організатором щорічної міжнародної конференції ISC. З Гансом спілкувався Том Табор, засновник та директор Tabor Communications, компанії, яка видає журнал HPCWire.

Вже 20 років Top500 є основним рейтингом комп’ютерних систем, який дає можливість порівнювати обчислювальні системи та ставить задачі виробникам. Top500 став корисним та популярним тестом. В певній мірі він став основним способом вимірювання продуктивності, заснованим на задачах лінійної алгебри з інтенсивним використанням операцій над дійсними числами, які пов’язані з задачами кібернетики та техніки.

Однак, за останні роки з’явились нові задачі з великими обсягами даних, які все більше навантажують підсистему пам’яті нерівномірними звертаннями до даних. Тож з’являються нові тести, такі як Graph500, який визначає придатність машини для роботи з великими масивами даних, та Green500, який визначає найбільш енергоефективні суперкомп’ютери світу.

З появою чергового випуску рейтинг стає предметом широкого обговорення. Нещодавно я зустрів професора Ганса Моєра, який вважається головним ідеологом та рушієм проекту, та дізнався його думки про минуле, теперішнє та майбутнє проекту Top500.

Том Табор: Гансе, наскільки вчасною є ця тема на ISC’12?

Ганс Моєр: 39-та редакція списку буде опублікована 18 червня на відкритті конференції. Залишається опублікувати лише один список у листопаді на конференції SC'12, і можна буде сказати, що Top500 виповнилось рівно 20 років. Якщо говорити про святкування 20-ї річниці створення рейтингу, то я і мої колеги, Ерік Стромаєр, Джек Донгара та Хорст Сімон, виступаємо на ISC’12 та запрошені на конференцію SC'12, де буде спеціальний стенд, присвячений розвитку нашого проекту. Для нас це буде дійсно цікавий рік.

Табор: Давайте повернемось на початок історії. Як ви, Джек, Хорст та Ерік зустрілись та чи був у вас намір створити такий рейтинг?

Моєр: Ми всі знайомі давно. Ерік прийшов до мене на роботу в Університет Мангейма у 1990 році, та був задіяний у проекті Top500 із самого його початку. Я запросив Джека на другий суперкомп’ютерний семінар в Університеті Мангейма у 1987 році, а Хорст регулярно відвідував наші конференції з HPC починаючи з 1990 року. Як не дивно, ми не зустрічались спеціально, коли започаткували свій проект навесні 1993 року. Останнім часом ми зустрічаємось на конференціях ISC та SC, щоб обговорити проект.

Табор: Як з’явилась ідея Top500?

Моєр: Протипом рейтингу була статистика суперкомп’ютерів, яка велась в університеті Мангейма. Вона містила лише назви суперкомп’ютерів, і як раз на початку 90-х вона перестала бути інформативною. З’явилась потреба у новій статистиці, яка б відображала розподіл суперкомп’ютерів, величезний розрив у продуктивності між найбільшими та найменшими системами, зростаючу доступність MPP систем, активний розвиток комп’ютерних потужностей від виробників SMP.

Щоб зробити цю нову статистику, ми з Еріком у 1993 році почали збирати інформацію про 500 найпотужніших комп’ютерних систем. Також ми з самого початку вирішили використовувати для ранжування значення Rmax – найкращий показник продуктивності у тесті Linpack. Перший список було закінчено у червні 1993 року. З того часу, за допомогою виробників та власників HPC систем, цей список збирається двічі на рік.

Ми з Еріком є засновниками Top500, Джек – автор тесту Linpack, він приєднався до нас у 1993, а Хорст – у 2000.

Табор: Хто придумав назвати рейтинг «Top500»?

Моєр: Це була моя ідея, у назви є дві причини. Перша причина – на момент закінчення проекту Mannheim Supercomputing Statistics, в ньому було рівно 530 систем, і я вважав, що буде логічно починати з того, на чому ми зупинились. Інша причина емоційна. Мене завжди захоплював список Forbes 500 найзаможніших та найуспішніших особистостей та корпорацій світу. Ось чому ми зосередились на 500 найпотужніших суперкомп’ютерах світу!

Табор: Ви коли-небудь уявляли, що ваш список стане основним у світі суперкомп’ютерів?

Моєр: Ні.

Табор: Коли вперше список набув популярності?

Моєр: Якось у кінці 90-х, під час однієї з сесій на конференції SC, доповідач у своїй доповіді послався на «список», як на загальновідому річ, не уточнюючи його назву «Top500».

Табор: Згадуючи перший список, хто посів перше місце та з яким показником продуктивності?

Моєр: Це був Thinking Machines CM-5/1024 в Національній лабораторії Лос-Аламос, з найкращим показником у Linpack на рівні 59,7 ГФлопс та піковою продуктивністю 131 ГФлопс. До речі, у безкоштовному додатку на Apple Store міститься докладна інформація про усі попередні списки.

Табор: Які найважливіші особливості рейтингу Top500, на вашу думку, зробили його популярним?  

Моєр: З самого початку нас критикували за вибір Linpack у якості тесту, але на 20-й рік існування рейтингу я впевнений, що саме цей вибір став причиною успіху Top500. Ні тоді, ні зараз просто немає інших прийнятних альтернатив тесту Linpack. Всі інші тести показують схожі результати, але є не настільки універсальними для різних суперкомп’ютерних архітектур. Однією з переваг Linpack є його масштабованість у тому сенсі, що протягом останніх 19-ти років він добре підходить для оцінювання систем, продуктивність яких зросла на 11 порядків. Іншою значною перевагою рейтингу є сприяння конкуренції між виробниками, країнами та обчислювальними центрами.

Успіх рейтингу Top500 полягає у зборі та аналізі даних. Ми змогли точно виявити та відслідкувати майже всі розробки у сфері HPC за 19 років, включаючи виробників та користувачів високопродуктивних систем, архітектури, інтерконекти, процесори, операційні системи тощо. Додатковою перевагою Top500 є його надзвичайна надійність у якості інструмента для передбачення розвитку потужностей суперкомп’ютерів.

Табор: Якби у вас не було на що орієнтуватись, чи запропонували б ви сьогодні рейтингування суперкомп’ютерів на основі Linpack?

Моєр: Так, тому що Linpack залишається корисним, загальновизнаним та ґрунтовним тестом навіть багато років потому. Наразі немає іншої альтернативи для його заміни.

Табор: Що вам подобається чи не подобається у тесті Linpack?

Моєр: Перевагою Linpack як міри продуктивності є один чесний показник, який легко визначити та порівняти, дозволяє з плином часу змінювати розмір задачі відповідно до можливостей машини та сприяє конкуренції. Недоліком Linpack є те, що він, головним чином, зосереджується на продуктивності процесорів та їх кількості. Він не досліджує локальну пропускну здатність підсистеми пам’яті та мережі, та немає єдиної достовірної цифри, яка б відображала продуктивність HPC системи в цілому. Очевидно, що вже недостатньо покладатись лише на Linpack. Потрібні інші тести для відстежування HPC систем з новими архітектурами.

Табор: Чи не могли б ви більш докладно описати існуючі альтернативні тести?

Моєр: Давайте обговоримо три альтернативні тести.

Тест HPC Challenge Benchmark (HPC CB) Джека Донгари складається з семи різних тестів, кожен з яких зосереджується на окремій частині системи. Звичайно, Linpack є одним з них і відповідає за продуктивність процесорів. Проте замість однієї цифри є сім, які відображаються значно складнішим чином, за допомогою пелюсткових діаграм.

Вони занадто складні для розуміння, особливо для журналістів, які пишуть про нові високопродуктивні системи. Однак, для системних спеціалістів вони є досить зрозумілими, через що HPC CB став певним стандартом при виборі HPC системи для організації.

Список Green500, заснований Ву-чун Фенгом та Кірком Камероном з Virginia Tech, є одним з тих підходів до рейтингування суперкомп’ютерів, які можна лише вітати. Він був анонсований на конференції SC’08 як доповнення до Top500. Метою рейтингу є порівняння суперкомп'ютерів за енергоефективністю, тобто продуктивністю на одиницю спожитої енергії.

На конференції SC’11 список Green500 містив 500 записів. Перша позиція з Top500 2011 року, K Computer виробництва Fujitsu, посів досить високе 32 місце у Green500, хоча він був найбільшим споживачем електроенергії серед машин з Top500 (12,5 МВт).

Проект Graph500 Річарда Мерфі з Національної лабораторії Сандіа є надзвичайно важливим проектом, орієнтованим на головні застосування суперкомп’ютерів для масивної обробки даних. Оскільки існуючі тести не дають достатньо повної інформації про придатність суперкомп’ютера для обробки великих масивів даних, необхідні нові тести, які допоможуть проектувати обладнання та ПЗ для таких задач.

В той час як Top500 орієнтується на швидкість арифметичних операцій з числами, Graph500 показує швидкість роботи з даними. Алгоритми обходу графів є основою багатьох задач аналізу даних. У проекті бере участь 50 експертів з різних країн. Заплановано випуск набору потужних тестів для цих застосувань.

В основі тесту Graph500 є три алгоритми роботи з графами. Вони найчастіше зустрічаються в наступних областях: комп’ютерна безпека, медична інформатика, соціальні та символічні мережі. Проект було анонсовано на конференції ISC’10, а перший список з дев’яти записів з’явився на SC’10. Наступні списки було опубліковано на ISC’11 (29 систем) та SC’11 (49 систем). Випуск чергового списку планується на конференції ISC’12.

Табор: Гансе, як на вашу думку, ми використовуємо Top500 з історичних причин чи через те, що він показує справжню швидкість комп’ютера?

Моєр: Я маю визнати, що Top500 на основі Linpack не є ідеальним інструментом для порівняння суперкомп’ютерів, але на сьогодні він єдиний з доступних. Linpack не каже, наскільки швидким є комп’ютер у реальних застосуваннях. Він лише показує здатність швидко розв’язувати системи лінійних рівнянь виду Ax=b, де матриця A є випадковою та досить щільною. І нічого більше. Невірна інтерпретація результатів тесту призвела до поганого ставлення до нього. Наприклад, деякі політики розглядають рейтинг Top500 як загальний рейтинг, придатний для всіх застосувань суперкомп’ютерів, що, звичайно, не вірно.

Табор: Як ви вважаєте, чи потрібно у рейтингу Top500 замінити продуктивність на відношення продуктивності та спожитої енергії?

Моєр: Ні.

Табор: Що ви думаєте про додавання до списку інформації про вартість суперкомп’ютера, що дозволило б відслідковувати продуктивність за одиницю вартості?

Моєр: Слушне питання. Ми думали про це на самому початку проекту, але вирішили відмовитись від включення ціни. Що таке вартість суперкомп’ютера? Це стандартна чи індивідуальна ціна? Ця інформація часто є недоступною і ми не хотіли гаяти час на безплідні пошуки.

Табор: Чи буде Top500 вимірювати продуктивність хмарних комп’ютерів?

Моєр: Ми над цим ще серйозно не думали. Коли ми глибше зрозуміємо хмарні технології, можливо, ми розглянемо це питання.

Табор: Чи є у вас плани написати книгу на основі рейтингів?

Моєр: Так, ми це неодноразово обговорювали, починаючи з 15-ї річниці Top500. Всі ми, в тій чи іншій мірі, є зайнятими людьми, але ви нагадали і я підніму це питання знову в зв’язку з 20-ю річницею нашого проекту.

Табор: Гансе, чи вірите ви, що у наступні 20 років Top500 залишиться настільки ж корисним рейтингом суперкомп’ютерів?

Моєр: Так, але я не можу вам сказати, яку міру ми будемо використовувати через 20 років.

Табор: Гансе, дякую за змістовну розмову та цікаві спогади.

Моєр: Із задоволенням, Томе. Побачимось у Гамбурзі.

За матеріалами The Top500 Report (June 2012).

Теги: Graph500, Green500, HPC, ISC, K Computer, Linpack, Top500, суперкомп'ютер

Матеріали за темою:

Коментарі