Конференція Високопродуктивні обчислення, Київ, 13-15 жовтня 2014

Китайська «темна конячка»: процесор FeiTeng

Розробка власних китайських мікропроцесорів для високопродуктивних обчислень, схоже, нарощується. Процесори Godson-3B та ShenWei SW1600 були першими з тих, які потрапили у найпотужніший китайський суперкомп’ютер. Процесор FeiTeng чекає своєї черги у битві за екзафлопс.

Хоча офіційна інформація про останні розробки FeiTeng доволі обмежена, у той же час він згадується як «перший у світі 64-бітний потоковий процесор, призначений для високопродуктивних наукових обчислень». Архітектура, відома під назвами FeiTeng, YinHe та FT64, розробляється Національним університетом оборонних технологій (NUDT) у провінції Хайнань. Першим результатом робіт стала реалізація у 2007 році процесора під назвою FT64.

Відповідно до доповіді на Міжнародному симпозіумі комп’ютерних архітектур у 2007 році, архітектура та набір інструкцій FT64 були спеціально орієнтовані на високопродуктивні обчислення. Перше покоління FeiTeng було втілене на 130-нм процесі, мало частоту 500 MHz та пікову продуктивність 16 GFlops.

На сьогоднішній день такими цифрами нікого не здивуєш, але не будемо забувати, що це було майже п’ять років тому. Ще більш вражаючим було споживання енергії: лише 8,6 Вт, даючи ефективність у 1,8 GFlops/Вт. Флагманська версія NVidia Tesla M2090, випущена у 2011 році із застосуванням 40-нм технологій, має ефективність приблизно 2,9 GFlops/Вт.

Як родич GPGPU, FT64 повинен був мати со-процесор, який би керувався основним CPU. У статті вказувалось, що відповідна материнська плата мала 8 гнізд для FT64 і обмінювалась повідомленнями з кожним со-процесором через вбудований інтерфейс. Як і сучасні CPU-GPU системи, пам’ять FT64 та основного CPU розділені.

FT64

Автори FT64 також розробили потокову мову програмування, названу SF95, яка є розширенням Fortran 95 десятьма директивами компілятора для використання нової архітектури. Компілятор використовувався для порівняльного аналізу FT64 та Itanium 2 у популярних наукових додатках (FFT, EP, MG, Swim, CG, Laplace, Jacobi, GEMM та NLAG-5). Крім випадку CG, де FT64 зумів показати лише десяту частину від продуктивності Itanium, потоковий процесор мав перевагу у 1,1-2,5 разів у порівнянні у інших додатках, і у 8 разів більшу на FFT.

Однак, трохи інша картина описується на семінарі, проведеному в Університеті у кінці 2011 року. На семінарі наголошувалось, що FeiTeng — високопродуктивний процесор загального призначення. Перше покоління процесорів FeiTeng створено на архітектурі EPIC (явне паралельне виконання інструкцій). Його набір інструкцій повністю сумісний з набором інструкцій Itanium 2.

Наступне покоління основане на архітектурі SoC (система в мікросхемі). Він складається з процесора загального призначення та потокового процесора, який є першим у світі 64-бітним потоковим процесором для високопродуктивних обчислень. Процесор успішно використовується у якості прискорювача у суперкомп’ютерному комплексі YinHe.

Третє покоління FeiTeng — багатоядерний процесор з набором інструкцій SPARC. Він підтримує SIMD, обміни даними між багатьма ядрами для покращення паралельної обробки та утворює SMP систему. Перша версія використовувалась у кластері TH-1A, наступна оновлена версія, запланована на наступний рік, буде стояти у новому поколінні суперкомп’ютерів серії TH.

Відповідно до цих даних, FT64 був другим поколінням архітектури, яку випробували на одному з суперкомп’ютерів YinHe (Галактика) у Китаї, хоча теоретично вони можуть використовуватись у інших системах подібної архітектури.

Третє покоління архітектури FeiTeng виглядає більш схожим на звичайні автономні процесори, а не на потокові прискорювачі. Інформація про те, що остання мікросхема у цій серії використовується у суперкомп’ютері TianHe-1A, а його оновлена версія з’явиться у наступних машинах типу TH, викликає особливий інтерес. На даний момент TianHe-1A є найпотужнішим китайським суперкомп’ютером з продуктивністю 4,7 PFlops, але він створений з процесорів Intel Xeon та GPU NVidia Tesla.

Поки що неясно, наскільки велику роль гратимуть процесори FeiTen у виробництві суперкомп’ютерів сімейства TH, але NUDT вже збирається позбутись залежності від американських виробників мікросхем. У 2010 університет використовував процесори Intel Xeon та AMD Radeon для своєї першої петафлопсної машини TianHe-1. Наступного року при виробництві TianHe-1A вони переключились на NVidia Tesla.

Враховуючи бажання Китаю розробити власні мікропроцесори для галузі високопродуктивних обчислень, не буде великим сюрпризом побачити процесори FeiTeng у якості заміни продукції Intel та NVidia у майбутньому суперкомп’ютері для NUDT.

Очевидно, що суперкомп’ютерні центри країни проводять експерименти з мікропроцесорами, але на даний час просто шукають способи збільшення продуктивності. У той же час, можна сказати майже напевно, що Китай хоче побудувати свій перший екзафлопсний комп’ютер на власних технологіях, включаючи, звичайно, і процесори.

Теги: AMD, Godson, GPU, Intel, NVidia, високопродуктивні обчислення, екзафлопс, прискорювачі, процесори, суперкомп'ютер

Матеріали за темою:

Коментарі