Конференція Високопродуктивні обчислення, Київ, 13-15 жовтня 2014

Китайські доморощені суперкомп’ютери

В кінці жовтня 2011 року компанія Sunway BlueLight MPP вперше створила високопродуктивний кластер ShenWei SW1600, створений на основі китайських процесорів. Новий суперкомп’ютер Dawning 6000, запуск якого було заплановано на грудень 2011 року, обладнано іншим процесором китайської розробки Godson-3B. Це суперкомп’ютери, які Китай може називати повністю власними.

На момент публікації розробники продовжували оптимізацію Dawning 6000 та проводили тести Linpack для порівняння з іншими суперкомп’ютерами списку Top500. Кластер петафлопсного рівня Sunway BlueLight вже пройшов цей тест та посів 14-те місце у списку Top500 за листопад. Обидві машини не будуть конкурувати з першими місцями списку, це швидше перший крок Китаю до технічної незалежності.

«У Dawning 6000 розробники намагаються освоїти всі технологічні моменти, які присутні у кластерах такого рівня. Китай зумів розробити свої власні процесори, власні ІТ з нуля»,— каже член IEEE професор електротехніки та комп’ютерної техніки Тарек Ель-Газаві з Університету Джорджа Вашингтона, директор Центру високопродуктивних обчислень. За умови, що сьогоднішні екзотичні компоненти суперкомп’ютера — це завтрашні банальні комплектуючі домашніх систем, Тарек Ель-Газаві передбачає, що подібні дослідні проекти дадуть поштовх китайським комерційним процесорам, які, як він очікує, будуть популярними на китайському ринку років через 10, а пізніше — й у інших країнах.

Зміна ролей

Кластер серії Dawning 5000 зроблений у 2008 році на основі американських процесорів AMD Opteron. Найпотужніший китайський суперкомп’ютер Tianhe-1A, який лідирував у Top500 протягом кількох місяців, завдячує своєю продуктивністю чіпам з Заходу: в ньому встановлено 7168 графічних прискорювачів NVidia Tesla та 14 386 процесорів Intel Xeon.

«Для створення Tianhe розглядались та застосовувались найпотужніші процесори,— каже Тарек Ель-Газаві.— Dawning, створений з нуля, було ретельно спроектовано на кожному рівні: процесори, вузли, система в цілому, а також з огляду на програмне забезпечення, яке буде запускатись».

Tianhe-1A також не пасе задніх в плані технічних новинок. Суперкомп’ютер обладнано незвичайною системою інтерконекта Arch, розробленою Китайським Національним університетом оборонних технологій. З пропускною здатністю 160 гігабіт на секунду Arch з великим відривом перемагає комерційні альтернативи типу InfiniBand.

«Якщо ви будуєте власний суперкомп’ютер, вам необхідно розробити власні процесори та інтерконект, щоб їх з’єднати»,— каже Джек Донгарра, професор електротехніки та комп’ютерних наук з Університету Теннессі, який допомагає ранжувати суперкомп’ютери.— «Я думаю, що китайці намагатимуться перейти на системи власної розробки. Вони хочуть зайняти місце розробників цієї галузі, які можуть створювати комп’ютери для Китаю та решти країн, замість того, щоб сподіватись на компоненти з Заходу».

Різні суперкомп’ютери відображають різні стратегії, стверджує Девід Каанер, засновник Азійської програми інформаційних технологій зі штаб-квартирою у Альбукерке. Наприклад, Tianhe-1A до сих пір найшвидший комп’ютер у Китаї, Sunway BlueLight вийшов з військових лабораторій, а Dawning 6000 — до сих пір може розглядатись як суперкомп’ютер для науковців. «Китай — велика країна з величезною кількістю талановитих людей, і вона має можливість спробувати свої сили в різних напрямках»,— каже Каанер.— «Змагання покращує усіх. Я бачу, що BlueLight — найбільш місцевий, завдяки використанню власних китайських чіпів та унікальної водяної системи охолодження».

Поки що жодна з цих машин не позбавилась впливу Заходу. Наприклад, виявляється, що процесори Godson-3B з суперкомп’ютера Dawning 6000, створені Китайською академією наук, використовують набір інструкцій з процесорів Заходу, всюдисущих у сенсі програмування. Набір інструкцій MIPS у процесорі Godson можна знайти у мікропроцесорах, встановлених у телевізорах.

Марк Піттман, віце-президент відділу продажів MIPS Technologies в Азії та Океанії, каже, що Китайська академія наук стала одним з перших клієнтів. Спочатку розробники Godson використовували набір інструкцій без ліцензії, але, за словами Піттмана, цей інцидент було залагоджено, і компанія видала ліцензію на MIPS академічному інституту обчислювальних технологій.

«Провідні китайські розробники вважають, що краще впроваджувати нові мікропроцесори з існуючими наборами команд, ніж втрачати час на їх розробку, а потім вже розробляти процесор на основі нового набору»,— каже Піттман. Розробка нових інструкцій вимагатиме переписування існуючих операційних систем, програм та драйверів. «Усі речі, які працюють на MIPS, необхідно переробити. Це дуже складно навіть для Китаю».

За чутками, комп’ютер ShenWei SW1600 зробив ще один крок до технічної незалежності. Якщо раніше ShenWei використовувала змінений набір інструкцій Alpha, розробники заявили, що тепер процесор має власний. Обидві системи й досі можуть використовувати західний інтерконект.

Каанер підтверджує, що у BlueLight стоїть модифікований InifiniBand. Ель-Газаві каже, що прототип вузла Dawning 6000 також використовує модифікований InfiniBand, об’єднаний з спеціалізованою мережею, яка дозволяє більш ефективно виконувати часті задачі. «Зрештою, ми зможемо побачити якийсь новий, ефективний тип китайського інтерконекта, який вписується в стандарти InfiniBand»,— каже він, додаючи, що дуже очікує появи інтерконекта суперкомп’ютера Dawning.

Продуктивність vs. Споживання енергії

Розробники процесорів також завбачливо приділяють велику увагу енергозбереженню. «Екзафлопсні перегони будуть перегонами з енергоефективності»,— каже Стів Скотт, генеральний директор відділу NVidia Tesla, раніше — старший віце-президент Cray.

За розрахунками процесор Godson-3B з продуктивністю 128 ГФлопс споживає лише 40 Ват, що майже вдвічі перевищує енергетичну ефективність у порівнянні з американськими аналогами. На момент написання статті, однак, енергетична ефективність цього процесора ще не вимірювалась стандартним методом типу Linpack. З іншого боку, Донгарра зазначає, що процесор — лише один з споживачів енергії, серед яких є інтерконект та пам’ять. Система BlueLight також привертає увагу. Вона виконує 741 МФлопс за 1 Ват енергії у порівнянні з 636 МФлопс/Ват у Tianhe-1A, каже Донгарра.

Розробники Китайської академії наук вже проводять дослідження зі збільшення ефективності нового покоління процесорів Godson-3C. За інформацією одного з творців чіпа, Юнжі Чена, 3С матиме ще більше відношення продуктивність/споживання, оскільки він буде створений на основі 32 нанометрового техпроцесу, на відміну від 65-нанометрового 3B, та завдяки використанню покращеної трирівневої кеш-пам’яті.

Ще більше енергії можна заощадити за рахунок переходу з CPU на GPU, як вже зробили кілька суперкомп’ютерів найвищого рівня. Графічні процесори можуть виконувати прості операції з паралельної обробки даних великих розмірів. Такий паралелізм економить енергію. За даними NVidia, CPU Intel Westmere споживає близько 1,7 наноджоуля на операцію при піковій продуктивності, в той час як GPU NVidia Fermi споживає у сім разів менше. Хоча Китай випустив власні GPU середнього рівня, схоже, що Китайська академія наук зосередила свої зусилля на лінійці звичайних процесорів Godson.

Надання уваги звичайним процесорам може бути одна з частин стратегії Китаю, каже Ель-Газаві. Він помітив, що не так то й просто програмувати під GPU, а китайські суперкомп’ютери роблять ставку не стільки на рекорди швидкості, скільки на захоплення ринку. «Хоча Китай спізнився, він наздоганяє семимильними кроками»,— каже він.

Теги: AMD, Cray, Godson, GPU, Infiniband, Intel, Linpack, NVidia, Top500, високопродуктивні обчислення, інтерконект, мережа, охолодження, прискорювачі, процесори, суперкомп'ютер, технології

Матеріали за темою:

Коментарі