Конференція Високопродуктивні обчислення, Київ, 13-15 жовтня 2014

Ерік Стромаєр про Топ500: список, який живе власним життям

Ерік Стромаєр

Пропонуємо увазі читачів інтерв'ю з одним з авторів списку Top500 Еріком Стромаєром (Erich Strohmaier). Інтерв'ю опубліковано у The Top500 Report за червень 2012 року.

Після захисту кандидатської дисертації з фізики в Університеті Хейдельберга у Еріка Стромаєра не було багато часу на роздуми про майбутню кар’єру: у нього був рівно один вільний день перед початком роботи в Університеті Мангейма. Він використав його для купівлі костюму. Наступного дня він відвідав невелику університетську конференцію з суперкомп’ютерів, яку проводив професор Ганс Моєр та Ганс-Мартін Вакер.

Однією з задач Стромаєра під керівництвом професора Моєра був збір інформації про суперкомп’ютери у світі та підготовка щорічної доповіді на конференції. У 1993 році до них прийшло розуміння про необхідність змінити усталене уявлення про те, що таке «суперкомп’ютер», а замість цього використовувати результати певних експериментів.

Вони знали, що у світі існує від кількох сотень до тисячі векторних суперкомп’ютерів, тому вирішили зупинитись на 500 системах, відсортованих за результатами реального тесту з метою виключення непрацюючих систем. Вважаючи свій аналіз одноразовим, Стромаєр створив базу даних на своєму комп’ютері для цієї задачі.

Потім Моєр та Стромаєр вирішили дізнатись, як їх список змінився за п’ять місяців, та презентували його на суперкомп’ютерній конференції, яка проводилась у листопаді 1993 року в Портланді, штат Орегон (США). Цього разу Стромаєр вирішив створити нову базу даних з можливістю відстеження змін у часі, на випадок, якщо цей список буде існувати у майбутньому.

Так почалась історія списку Top500 найпотужніших суперкомп’ютерів світу, а в кар’єрі Стромаєра відбувся новий поворот. У червні 2012 він буде презентувати нову 39-ту редакцію списку на відкритті міжнародної суперкомп’ютерної конференції ISC’12 у Гамбурзі, з більш ніж двома тисячами відвідувачі, в яку перетворився той самий семінар у Мангеймі.

«Коли ми починали, я мав зібрати дані для невеликої конференції. Ми ніколи не очікували такого масштабу та популярності нашого проекту, – каже Стромаєр, який зараз є головою Future Technologies Group у Національній лабораторії Лоуренса Берклі, Каліфорнія (США). – Ми ніколи не могли собі уявити, що наша робота буде корисною для суперкомп’ютерної спільноти».

Набираючи оберти

Стомаєр каже, що два-три роки пішло на налагодження необхідних каналів інформації. Спочатку далеко не всі виробники суперкомп’ютерів погоджувались надати необхідні дані. «Спочатку дані надавали лише ті, хто був впевнений у тому, що їх результат є хорошим досягненням», – каже Стромаєр.

Коли список став більш відомим, з’явилась інша задача. «Деякі виробники почали казати: ми хочемо бути у вашому списку. Якого розміру система необхідна, щоб цього досягти?», – згадує Стромаєр. «Як раз тоді справи і почали поступово виходити з-під контролю».

З кожним новим випуском багато виробників та покупців високопродуктивних систем почали робити хвалькуваті заяви про майбутні позиції у списку. Але Стромаєр визнає, що його список ніколи не був всеосяжним. На початку багато центрів взагалі не хотіли розголошувати інформацію про володіння потужними системами, побоюючись втрати фінансування на майбутні машини.

«Деякі компанії не хотіли з’являтись у списку, оскільки вважали, що їх системи дають конкурентну перевагу, тому вони не хотіли давати конкурентам інформацію ні про розмір, ні про тип своїх машин», – каже Стромаєр. – «А деякі центри проводять секретні дослідження і забороняють нам публікувати дані про їх системи».

З ростом розміру машин, деякі центри неохоче надають весь суперкомп’ютер для запуску тесту Linpack, яким вимірюються всі суперкомп’ютери списку. Однією з причин для критики тесту, розробленого Джеком Донгарою з університету Тенесі, є невідповідність справжньому навантаженню кластера та викривлення рівня продуктивності. Але саме завдяки використанню єдиного тесту для порівняння тисяч систем протягом тривалого часу архів Top500 забезпечує можливість відстеження розвитку продуктивності та архітектур високопродуктивних систем з 1993 року.

Дійсно, гортаючи списки за минулі роки, можна побачити кілька цікавих феноменів, каже Стромаєр. «Найбільшим сюрпризом для мене стало стабільне зростання та розвиток, дуже стійка тенденція», – каже він. – «Спочатку ми очікували зміни набагато менших масштабів, але вони виявились значно більшими, ніж ми могли передбачити. Зростання рівня продуктивності було надзвичайно стабільним».

Іншим сюрпризом стала кількість систем, які посідали найвищі місця. У 38 списках 14 систем посідали вищу сходинку, деякі з них залишались першими завдяки оновленням та надбудовам. П’ять суперкомп’ютерів були на першому місці лише по одному разу, а дві системи були лідерами цілих сім разів поспіль.

З Хейдельберга до Тенесі, потім до Каліфорнії

Стромаєр отримав диплом кандидата наук з теоретичної фізики у 1990 році, але знайти роботу за спеціальністю було вкрай важко, тому він навіть не шукав можливості продовжувати навчання у докторантурі. Його дисертація була присвячена чисельним методам у фізиці елементарних частинок, які він втілював на найпотужніших комп’ютерах того часу. Тож, дізнавшись про вакансію у новому проекті Університету Мангейма, присвяченому порівнянню продуктивності кількох прикладних пакетів з фізики на суперкомп’ютері Fujitsu VP2600, він вирішив влаштуватись туди.

У 1995 році, коли фінансування проекту закінчилось, Стромаєр вирішив знайти посаду в США, та, зрештою, почав працювати з автором LINPACK та редактором Top500 Джеком Донгарою в Університеті Тенесі. Після 15 років у Хейдельберзі йому хотілось отримати два-три роки «американського досвіду». У 1998 р. Ерік вирішив залишитись у США ще трохи, скріпивши це рішення придбанням персонального номеру «Top500» для свого автомобіля.

Стромаєру хотілось ще далі на захід, особливо до Каліфорнії. Він вже був знайомий з Хорстом Сімоном під час роботи над Top500 та кілька разів відвідував лабораторію Берклі. Під час одного з візитів Стромаєр отримав вакансію у Національній лабораторії Лоуренса Берклі у 2001 р. На додачу до посади голови Future Technologies Group, він став провідним науковим співробітником інституту CACHE.

Але двічі на рік Стромаєр досі повертається до списку Top500, розсилаючи запрошення до участі за вісім тижнів до дати публікації. Дані для списку беруться з двох джерел: їх надсилають користувачі та виробники суперкомп’ютерів. У випадку розбіжностей у результатах тестів проводиться додаткове дослідження.

Найбільш серйозний етап роботи Стромаєра та його колеги Анаса Нашіфа починається приблизно за місяць, коли список наповнюється. В останні два тижні проходять два етапи рецензій списку людьми, які подавали дані, та групою співробітників, які проводять остаточну перевірку. Зрештою, на сервер завантажуються нові дані, друкуються сертифікати, пишуться прес-релізи та готуються презентації.

Щойно список офіційно публікується, багато організацій роблять власні повідомлення. Навіть маленькі університети, які мають системи десь у кінці списку, стверджують, що у них «один з найкращих суперкомп’ютерів світу».

«Це в дусі цієї гри: у нас є певна кількість великих гравців, а також багато маленьких, які дуже пишаються, що показує надзвичайну важливість суперкомп’ютерів для наукової спільноти», – каже Стромаєр. – «Шкода, якщо невелика організація прикладає багато зусиль, але не потрапляє до рейтингу. Але це – частина гри».

Теги: ISC, Linpack, Top500, суперкомп'ютер

Матеріали за темою:

Коментарі

Коментарі до "Ерік Стромаєр про Топ500: список, який живе власним життям":

Іван09.07.2012

А в Україні хіба 50 набереться? Це треба буде й адмінські ноути подавати

Андрій07.07.2012

Цікава замітка.
До речі, ідея, а можливо започаткуйте вітчизняний ТОП, хай ТОП-50 (не СНД, а наш). Ви (ІК НАНу) й методологію знаєте і фахівці з достатнім стажем. Було б цікаво. :-)