Noderīgi padomi

Tīkli superdatoriem

Pin
Send
Share
Send
Send


Izkliedētā skaitļošana ir viens no veidiem, kā dot ieguldījumu dažos interesantos projektos. Kad dators atrodas dīkstāvē, dalieties tajā ar SETI projektu, kurš meklē ārpuszemes civilizācijas. Šajā gadījumā jūsu dators analizēs satelīta datus un informāciju, kas saņemta no teleskopiem.

Šis raksts palīdzēs jums pievienoties projektiem (piemēram, SETI), kas saistīti ar izkliedēto skaitļošanu. Rakstā jūs arī iepazīstina ar izplatīto skaitļošanas programmatūru BOINC.

Jums nepieciešams dators. Ja jums tāds jau ir, dodieties uz sadaļu Avoti un saites un instalējiet BOINC programmatūru. Ja jūs neinteresē SETI projekts, zemāk atradīsit citu projektu sarakstu.

Ja daudz naudas

Atsevišķi mēs atzīmējam ārkārtīgi dārgo, bet produktīvo procesoru līniju Intel Xeon LGA1567 ligzdā.
Šīs sērijas augstākais procesors ir E7-8870 ar desmit 2,4 GHz kodoliem. Tās cena ir 4616 USD. Šādiem CPU tiek izlaisti HP un Supermicro! astoņu procesoru! servera šasija. Astoņi 10 kodolu Xeon E7-8870 2,4 GHz procesori ar HyperThreading atbalsta 8 * 10 * 2 = 160 pavedienus, kas Windows Task Manager tiek parādīti kā simt sešdesmit procesora ielādes grafiki, matrica 10x16.

Lai astoņi procesori ietilptu korpusā, tie netiek uzreiz novietoti uz mātesplates, bet gan uz atsevišķiem dēļiem, kas pielīp mātesplatē. Fotoattēlā redzamas četras mātesplates ar procesoriem, kas uzstādīti mātesplatē (pa diviem katrā). Šis ir supermikro risinājums. HP risinājumā katram procesoram ir sava plate. HP risinājuma izmaksas ir divi līdz trīs miljoni, atkarībā no procesoru skaita, atmiņas un daudz ko citu. Supermicro šasija maksā 10 000 USD, kas ir pievilcīgāk. Turklāt Supermicro var ievietot četras kopētāja procesora paplašināšanas kartes PCI-Express x16 portos (starp citu, Infiniband adapterim joprojām būs vieta, lai saliktu šo kopu), bet tikai divas - HP. Tādējādi, lai izveidotu superdatoru, astoņu procesoru platforma no Supermicro ir pievilcīgāka. Tālāk redzamajā izstādes fotoattēlā ir parādīts viss superdators ar četrām GPU plāksnēm.

Tomēr tas ir ļoti dārgi.

Sakaru tīkli

Superdatora efektivitāti daudzās lietojumprogrammās lielā mērā nosaka profils darbam ar atmiņu un tīklu. Darbības ar atmiņu profilu parasti raksturo ar zvanu lokalizāciju ar telpisko laiku - pēc sarunu lieluma un to adreses izkliedes, un darba ar tīklu profilu raksturo mezglu sadalījums, ar kuriem tiek apmainītas ziņas, maiņas kurss un ziņojumu lielumi.

Superdatora veiktspēju uzdevumos ar intensīvu datu apmaiņu starp mezgliem (modelēšanas problēmas, problēmas uz grafikiem un neregulāriem režģiem, aprēķini, izmantojot mazas matricas) galvenokārt nosaka tīkla veiktspēja, tāpēc parasto komerciālo risinājumu (piemēram, Gigabit Ethernet) izmantošana ir ārkārtīgi neefektīva. Tomēr reāls tīkls vienmēr ir kompromisa risinājums, kura izstrādē tiek noteiktas prioritātes starp cenu, veiktspēju, enerģijas patēriņu un citām prasībām, kas lielā mērā ir pretrunīgas: mēģinājumi uzlabot vienu īpašību var izraisīt otras kvalitātes pasliktināšanos.

Sakaru tīkls sastāv no mezgliem, no kuriem katram ir tīkla adapteris, kas savienots ar vienu vai vairākiem maršrutētājiem, kurus savukārt savieno ātrgaitas sakaru kanāli (saites).

Att. 1. 4-toru topoloģija (3x3x3x3)

Tīkla struktūru, kas nosaka, cik precīzi sistēmas mezgli ir savstarpēji savienoti, nosaka tīkla topoloģija (parasti režģis, toruss vai biezs koks) un strukturālo parametru komplekts: mērījumu skaits, koku skaits, torusa malu izmēri, slēdžu skaits koku līmenī, tīkla mezglu skaits. maršrutētāju ostas utt. 1. attēlā parādīts četrdimensiju toru 3x3x3x3 topoloģijas piemērs.

Maršrutētāja arhitektūra nosaka to bloku struktūru un funkcionalitāti, kas ir atbildīgi par datu pārsūtīšanu starp tīkla mezgliem, kā arī kanāla, tīkla un transporta slāņu protokolu nepieciešamās īpašības, ieskaitot maršrutēšanas, arbitrāžas un datu plūsmas vadības algoritmus. Tīkla adaptera arhitektūra nosaka to bloku struktūru un funkcionalitāti, kas ir atbildīgi par procesora, atmiņas un tīkla mijiedarbību, jo īpaši šajā līmenī tiek atbalstītas MPI operācijas, RDMA (Remote Direct Memory Access - tieša pieeja cita mezgla atmiņai bez tā procesora līdzdalības). apstiprinājumi par saņemšanu no cita paketes mezgla, rīcība ārkārtas situācijās, pakešu apkopošana.

Lai novērtētu sakaru tīkla veiktspēju, visbiežāk tiek izmantoti trīs raksturlielumi: joslas platums (pārsūtīto datu daudzums par laika vienību), komunikācijas kavēšanās (datu pārsūtīšanas laiks tīklā), ziņas temps (parasti, nosūtot, saņemot un pārsūtot paketes starp maršrutētāja iekšējām vienībām, tās atsevišķi ņem vērā piegādes ātrumu).

Pilnības labad šie raksturlielumi tiek mērīti dažāda veida satiksmē, piemēram, kad viens mezgls sūta datus visiem pārējiem vai, tieši otrādi, visi mezgli sūta datus vienam vai arī visi mezgli sūta datus uz nejaušiem galamērķiem. Mūsdienu tīkliem tiek izvirzītas funkcionalitātes prasības:

  • efektīva Shmem bibliotēkas ieviešana kā iespēja atbalstīt vienvirziena komunikācijas modeli un GASNet, uz kuras balstās daudzu PGAS valodu ieviešana,
  • efektīva MPI ieviešana (parasti tas prasa efektīvu gredzenveida buferu un saņemto pakešu apstiprinājumu atbalsta mehānismu),
  • efektīvs kolektīvo operāciju atbalsts: apraide (to pašu datu vienlaicīga nosūtīšana daudziem mezgliem), samazināšana (bināras operācijas piemērošana, piemēram, vērtību kopai, kas saņemta no dažādiem mezgliem), masīva elementu sadalīšana pa mezglu kopām (izkliedi), elementu masīva salikšana, atrodas dažādos mezglos (pulcējas),
  • efektīvs starpmezglu sinhronizācijas operāciju atbalsts (vismaz barjeru sinhronizācija), efektīva mijiedarbība ar daudzu procesu mezglā procesu un drošas pakešu piegādes nodrošināšana.

Ir svarīgi arī efektīvi atbalstīt adaptera darbu ar resursdatora atmiņu tieši bez procesora iesaistes.

Ārvalstu ātrgaitas tīkli

Visus sakaru tīklus var iedalīt divās klasēs: komerciālos un pielāgotos, kas izstrādāti kā datorsistēmu daļa un ir pieejami tikai kopā ar tiem. Starp komerciālajiem tīkliem tirgus ir sadalīts starp InfiniBand un Ethernet - Top500 sarakstā (2011. gada jūnijs) 42% sistēmu izmanto InfiniBand un 45% - Gigabit Ethernet. Tajā pašā laikā, ja InfiniBand ir koncentrējies uz augstas veiktspējas sistēmu segmentu, kas paredzēts sarežģītiem skaitļošanas uzdevumiem ar lielu skaitu sakaru, tad Ethernet tradicionāli aizņem nišu, kurā datu apmaiņa starp mezgliem nav kritiska. Superdatoros Ethernet tīkls zemo izmaksu un pieejamības dēļ bieži tiek izmantots kā papildpakalpojumu tīkls, lai samazinātu vadības trafika un uzdevumu trafika traucējumus.

Inifiniband tīkls sākotnēji bija vērsts uz konfigurācijām ar tauku koku topoloģiju, bet komutatoru un maršrutētāju jaunākās versijas (kuras galvenokārt ražo QLogic) atbalsta daudzdimensionālo toru topoloģiju (izmantojot Torus-2QoS Routing Engine), kā arī hibrīda topoloģiju no 3D torus. un tauku koks. Superdators Sandia RedSky, kas tika samontēts 2010. gada sākumā un tagad ir Top500 16. vietā, ir viens no pirmajiem liela mēroga projektiem ar InfiniBand tīklu un topoloģijas 3D torusu (6x6x8). Tagad liela uzmanība tiek pievērsta arī efektīvam RDMA operāciju un Shmem bibliotēkas atbalstam (īpaši Qlogic Shmem).

InfiniBand popularitāte ir saistīta ar salīdzinoši lētajām izmaksām, izstrādāto programmatūras ekosistēmu un efektīvo MPI atbalstu. Tomēr InfiniBand ir savi trūkumi: zems ziņojumu piegādes ātrums (40 miljoni ziņojumu sekundē jaunākajos Mellanox risinājumos), zema īso pakešu pārraides efektivitāte, salīdzinoši liela kavēšanās (vairāk nekā 1,5 μs pārraidei no mezgla uz mezglu un papildu 0,1- 0,5 μs uz tranzīta mezglu), vājš atbalsts toroidālajai topoloģijai. Kopumā var apgalvot, ka InfiniBand ir produkts masu lietotājam, un tā izstrādes laikā tika panākts kompromiss starp efektivitāti un daudzpusību.

Varam arī atzīmēt tīklu Extoll, kas tiek gatavots laišanai tirgū - Heidelbergas universitātes attīstību profesora Ulriha Brūinginga vadībā. Galvenais uzsvars šī tīkla attīstībā ir samazināt kavējumus un palielināt piegādes ātrumu vienvirziena komunikācijās. Plānots, ka Extoll būs 3D toru topoloģija un izmantos optiskās saites ar joslas platumu 10 Gb / s uz joslu (seriālā datu pārraides kanāls saites ietvaros) un platumu 12 joslas uz saiti. Tagad FPGA ir pieejami Extoll tīkla prototipi: R1 - balstās uz Virtex4, R2 Ventoux - divu mezglu izkārtojums, kura pamatā ir Virtex6. Vienvirziena joslas platums vienai saitei ir 600 MB / s (R1). Tiks atbalstītas arī divas saskarnes (HyperTransport 3.0 un PCI Express gen3) ar procesoru, kas ļaus šo tīklu integrēt Intel un AMD platformās. Extoll atbalsta vairākus veidus, kā organizēt vienvirziena ierakstus, savu MMU (atmiņas pārvaldības vienību, virtuālo adrešu tulkošanas bloku fiziskajās adresēs) un atomu operācijas.

Atšķirībā no komerciālajiem tīkliem, pielāgoti tīkli aizņem daudz mazāku tirgus daļu, tomēr tie tiek izmantoti jaudīgākajos superdatoros no Cray, IBM, SGI, Fujitsu, NEC un Bull. Izstrādājot pielāgotus tīklus, izstrādātājiem ir lielāka brīvība un viņi cenšas izmantot progresīvākas pieejas, jo galaprodukta tirgus pievilcība ir mazāka, galvenokārt risinot problēmu, kas saistīta ar maksimālu veiktspējas sasniegšanu noteiktā uzdevumu klasē.

K Computer superdators izmanto patentētu Tofu (TOrus FUsion) sakaru tīklu, kas ir mērogojams 3D toruss, kura mezglos ir 12 mezglu grupas (mezglu grupas ir savienotas 12 tīklos ar 3D torusu, un katram šīs grupas mezglam ir sava izeja). 3D toru tīkls). Katrā grupā esošie mezgli ir savstarpēji savienoti ar 3D torusu ar sāniem 2x3x4 bez atkārtotām saitēm, kas ir līdzvērtīgs 2D torusam ar malām 3x4 (tātad mēs iegūstam 5D torusu ar fiksētām divām dimensijām). Tādējādi Tofu tīkla mezglā ir 10 saites ar vienvirziena caurlaides ātrumu 40 Gb / s katrā. Aparatūrā tiek atbalstīta mezglu barjeru sinhronizācija un samazināšana (vesels skaitlis un peldošais komats).

Tianhe-1A superdatora attīstības galvenie mērķi bija sasniegt augstu energoefektivitāti, attīstīt savu procesoru un tīklu, kas ir labāks par InfiniBand QDR. Superdators sastāv no 7168 skaitļošanas mezgliem, kas savienoti ar paša dizaina Arka tīklu ar biezu koku topoloģiju. Tīkls ir veidots no 16 portu maršrutētājiem, vienvirziena saites joslas platums - 8 GB / s, kavēšanās - 1,57 μs. Atbalstītas RDMA operācijas un optimizētas kolektīvās operācijas.

Sistēmu klasiskie pārstāvji, kas izmanto toroidālo topoloģiju, lai apvienotu skaitļošanas mezglus, ir IBM Blue Gene sērijas sistēmas, kuru pirmajās divās paaudzēs - Blue Gene / L (2004) un Blue Gene / P (2007) - tika izmantota 3D torus topoloģija. Blue Gene / P tīklam ir relatīvi vājas saites ar vienpusēju joslas platumu 0,425 GB / s, kas ir par mazāku pakāpi nekā tā mūsdienu InfiniBand QDR saites joslas platums, tomēr aparatūras balstīts barjeru sinhronizācijas un kolektīvo darbību atbalsts (atsevišķos kokam līdzīgos tīklos) nodrošina labu mērogojamību. reālas programmas. Turklāt visas saskarnes un maršrutēšanas vienības ir integrētas BPC mikroprocesorā (Blue Gene / P Chip), kas ievērojami samazina ziņojumu pārraides kavēšanos. Nākamās paaudzes sakaru tīklam Blue Gene / Q ir 5D toru topoloģija, un atšķirībā no tā priekšgājējiem tam nav atsevišķu tīklu barjeru sinhronizēšanai un kolektīvām darbībām. Blue Gene / Q mikroshēma pirmo reizi kļuva par daudzkodolu-vairāku pavedienu - četriem aparatūras pavedieniem vienā kodolā ar 16 kodoliem, kas ļauj vājināt tīkla prasības un nodrošināt kavējuma toleranci. Saites caurlaidspēja ir palielināta līdz 2 GB / s, taču tā joprojām ir maza salīdzinājumā ar Cray Gemini vai Extoll. Šajās sistēmās zemo caurlaides spēju izlīdzina lielais toru izmērs (liels saišu skaits) un rezultātā mazais tīkla diametrs (ievērojami mazāks nekā tīkliem ar 3D toru topoloģiju ar tādu pašu mezglu skaitu). Pieejamie avoti ziņo par divu Blue Gene / Q transpetaflops superdatoru izveidi: Sequoia ar 20 PFLOPS un Mira - 10 PFLOPS veiktspēju. Mēs varam secināt, ka Blue Gene / Q ir koncentrēts uz uzdevumiem, kas izmantos desmitiem un simtiem tūkstošu skaitļošanas mezglu ar tīkla trafiku no “visiem visiem” tipa.

Vēl viens pieejas piekritējs komunikāciju tīklu veidošanai ar toroidālo topoloģiju ir Cray, kas turpina izmantot 3D tor topoloģiju, vienlaikus palielinot caurlaides spēju un blakus esošo mezglu savienojošo saišu skaitu. Cray toroidālā tīkla pašreizējā paaudze ir Cray Gemini tīkls. Viens Gemini maršrutētājs atbilst diviem iepriekšējās SeaStar2 + paaudzes maršrutētājiem, tas ir, faktiski diviem tīkla mezgliem, tāpēc Gemini vietā 6 saites 10 izmanto, lai izveidotu savienojumu ar kaimiņu mezgliem (2 kalpo, lai savienotu divus adapterus savā starpā).

Superdatora tīkla komponenti (tīkla adapteri, slēdži, maršrutētāji) atšķirībā no procesoriem bieži ir dārgāki, un piekļuve tiem ir ierobežotāka. Piemēram, tagad slēdžus tīklam InfiniBand, kas ir galvenais superdatoru komerciālais tīkls, ražo tikai divi uzņēmumi, kurus abus kontrolē Amerikas Savienotās Valstis. Tas nozīmē, ka, ja viņiem nav notikumu ātrdarbīgu tīklu jomā, modernu superdatoru izveidi jebkurā valstī, izņemot ASV, Ķīnu vai Japānu, var viegli kontrolēt.

Vietējie tīkli

Komunikāciju tīklu izstrādi lietošanai superdatoros veic vairākas vietējās organizācijas: RFNC VNIIEF (par šīm norisēm ir ļoti maz informācijas atklātajos avotos), Krievijas Zinātņu akadēmijas un RSK SKIF programmatūras sistēmu institūts un RSM SKAS, IPM RAS un Pētniecības institūts Kvant (MVS-Express tīkls). ").

3D-tor sakaru tīkls krievu-itāļu superdatoram SKIF-Aurora ir pilnībā izveidots, izmantojot Altera Stratix IV FPGA, kas izskaidro diezgan mazo joslas platumu uz saiti - 1,25 GB / s (FPGA resursi ir ļoti ierobežoti).

MVS-Express tīklā PCI Express 2.0 tiek izmantots skaitļošanas mezglu integrēšanai, un mezgli ir savienoti caur 24-portu slēdžiem. Tīklam ir topoloģija tuvu tauku kokam. Tīkla adapterim skaitļošanas mezglā ir viens ports ar 4 joslu platumu, kā rezultātā vienvirziena maksimālā caurlaidspēja uz vienu saiti ir 20 Gbit / s, neņemot vērā kodēšanas pieskaitāmās izmaksas. PCI Express izmantošanas priekšrocība MVS-Express ir efektīvs koplietojamās atmiņas atbalsts ar vienvirziena komunikāciju iespēju. Tā rezultātā tīkls ir ērts Shmem bibliotēkas un PGAS valodu (UPC, CAF) ieviešanai.

Ar Krievijas Federācijas Rūpniecības un tirdzniecības ministrijas atbalstu NICEVT OJSC strādā pie Angara sakaru tīkla attīstības ar 4D-toru topoloģiju, kas var kļūt par pamatu vietēju tehnoloģiju radīšanai superdatoru attīstībai.

Tīkls "Angara"

Angaras tīkla attīstības galvenie mērķi:

  • efektīvs atbalsts vienvirziena komunikācijām (ievietot / saņemt) un PGAS valodām (kā galvenajiem līdzekļiem paralēlai programmēšanai),
  • Efektīvs MPI atbalsts
  • pašu kristālu izlaišana (lai sasniegtu lielu datu pārsūtīšanas ātrumu un nelielu kavēšanos),
  • adaptīva bezatteices pakešu pārraide,
  • efektīvs darbs ar moderniem procesoriem un mikroshēmojumiem.

Pirmajā šī tīkla attīstības posmā (2006) tika veikta dažādu tīkla iespēju modelēšana un tika pieņemti galvenie lēmumi par topoloģiju, maršrutētāja arhitektūru, maršrutēšanas algoritmiem un arbitrāžu. Papildus toroidālajai topoloģijai tika ņemti vērā Kailijas tīkli un “biezais koks”. Četru dimensiju torus tika izvēlēts vienkāršākas maršrutēšanas, labas mērogojamības un lielās savienojamības dēļ, salīdzinot ar mazākiem tori. Tīkla modelēšana ļāva detalizēti izpētīt dažādu tīkla arhitektūras parametru ietekmi uz galvenajiem veiktspējas raksturlielumiem, izprast uzdevumu trafika modeļus ar intensīvu, neregulāru piekļuvi atmiņai. Rezultātā tika izvēlēti optimālie bufera izmēri, virtuālo kanālu skaits un analizēti iespējamie sašaurinājumi.

2008. gadā parādījās pirmais FPGA maršrutētāja prototips - sešu mezglu tīkla izkārtojums uz Virtex4, kas savienots ar 2x3 torusu, kurā tika atkļūdīta maršrutētāja pamata funkcionalitāte, izstrādāta kļūmēm toleranta datu pārraide, uzrakstīts un atkļūdots draiveris un zema līmeņa bibliotēka, pārvietotas Shmem bibliotēkas un MPI Tagad ir palaists trešās paaudzes izkārtojums, kas sastāv no deviņiem mezgliem, kas savienoti divdimensiju torā 3x3. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. Īpaša uzmanība tika pievērsta kolektīvo operāciju (apraide un samazināšana) atbalstam, kas tika īstenotas, izmantojot virtuālu apakštīklu, kura koku topoloģija tika uzlikta uz daudzdimensionālu toru. Tīkls aparatūras līmenī atbalsta divu veidu attālas rakstīšanas, lasīšanas un atomu darbības (papildinošās un ekskluzīvās VAI). Attālinātās lasīšanas izpildes shēma (pieprasījuma nosūtīšana un atbildes saņemšana) ir parādīta 4. attēlā. 2 (attālās ierakstīšanas un atomu operācijas tiek veiktas līdzīgi). Atsevišķā blokā loģika tiek īstenota, lai apkopotu ziņojumus, kas saņemti no tīkla, lai palielinātu noderīgo datu īpatsvaru vienā darījumā, pārsūtot caur interfeisu ar resursdatoru (resursdators ir procesora-atmiņas tilta tilts).

Att. 2. Attālinātās lasīšanas shēma Angaras tīklā

Datu savienojuma slānī tiek atbalstīta bezatteices pakešu pārraide. Ir arī mehānisms, kā apiet neveiksmīgus sakaru kanālus un mezglus, atjaunojot maršrutēšanas tabulas. Lai veiktu dažādas pakalpojumu operācijas (jo īpaši, lai konfigurētu / atjaunotu maršrutēšanas tabulas) un veiktu dažus aprēķinus, tiek izmantots pakalpojumu procesors. Resursdatora interfeiss izmanto PCI Express.

Att. 3. Skaitļošanas mezgla struktūra ar tīkla adapteri / maršrutētāju "Angara"

Galvenie maršrutētāja bloki:

  • saskarne ar resursdatora sistēmu, kas atbild par pakešu saņemšanu un nosūtīšanu resursdatora interfeisā,
  • iesmidzināšanas un izmešanas vienība, kas veido paketes, kuras nosūtāmas tīklam un parsē no tīkla ienākošo pakešu galvenes,
  • pieprasījuma apstrādes vienība, kas apstrādā paketes, kurām nepieciešama informācija no resursdatora sistēmas atmiņas (piemēram, lasīšana vai atomu operācijas),
  • kolektīvo operāciju tīkla vienība, kas apstrādā paketes, kas saistītas ar kolektīvām operācijām, jo ​​īpaši, veicot samazināšanas operācijas, ģenerējot apraides pieprasījuma paketes,
  • pakalpojumu operāciju vienība, kas apstrādā paketes, kas tiek aizvestas uz pakalpojumu kopprocesoru un no tā,
  • slēdzis, kas savieno ieejas no dažādiem virtuāliem kanāliem un ieejas no inžektoriem ar izejām uz dažādiem virzieniem un ežektoriem,
  • sakaru kanāli datu pārraidei un saņemšanai noteiktā virzienā,
  • datu pārraides vienību pakešu nosūtīšanai noteiktā virzienā, kā arī uztveršanas un maršrutēšanas vienību pakešu saņemšanai un turpmākā likteņa izlemšanai.

Resursdatora mijiedarbība (kods, kas izpildīts uz centrālā procesora) ar maršrutētāju tiek veikta, rakstot uz atmiņas adresēm, kas saderētas ar maršrutētāja resursu reģionu adresēm (atmiņā kartēta ieeja / izvade). Tas ļauj lietojumprogrammai mijiedarboties ar maršrutētāju bez kodola dalības, kas samazina pakešu nosūtīšanas pieskaitāmās izmaksas, jo pārslēgšanās uz kodola kontekstu un atpakaļ prasa vairāk nekā simts pulksteņa ciklu. Lai nosūtītu paketes, tiek izmantots viens no atmiņas reģioniem, ko uzskata par zvana buferi. Ir arī atsevišķs reģions operāciju veikšanai, nekopējot atmiņas atmiņu (dati tiek lasīti no atmiņas un ar DMA operāciju palīdzību tiek rakstīti ar sakaru tīkla adapteri) un reģions ar vadības reģistriem. Piekļuvi noteiktiem maršrutētāja resursiem kontrolē kodolmodulis.

Lai panāktu lielāku efektivitāti, tika nolemts, ka vienam mezglā jāveic tikai viens skaitļošanas uzdevums, tādējādi novēršot pieskaitāmās izmaksas, kas saistītas ar virtuālās atmiņas izmantošanu, izvairījās no uzdevuma traucējumiem, vienkāršoja maršrutētāja arhitektūru pilna MMU trūkuma dēļ un izvairījās no visa viņa komunikācijas darbs kavējas, kā arī vienkāršo tīkla drošības modeli, no tā novēršot dažādu uzdevumu procesu drošību vienā mezglā. Šis risinājums neietekmēja tīkla funkcionalitāti, kas paredzēta galvenokārt liela izmēra uzdevumiem (pretstatā InfiniBand, universāls tīkls dažāda lieluma uzdevumiem). Līdzīgs lēmums tika pieņemts IBM Blue Gene, kur sadaļai ir ieviests uzdevuma unikalitātes ierobežojums.

Aparatūras līmenī tiek atbalstīts vienlaicīgs darbs ar daudzu viena uzdevuma pavedienu / procesu maršrutētāju - tas tiek realizēts vairāku iesmidzināšanas kanālu veidā, kas ir pieejami procesiem, izmantojot vairākus gredzenveida buferus pakešu ierakstīšanai. Šo buferu skaits un lielums var dinamiski mainīties.

Galvenais Angara tīkla programmēšanas režīms ir MPI, OpenMP un Shmem, kā arī GASNet un UPC kopīga izmantošana.

Pēc tīkla verifikācijas un prototipēšanas pabeigšanas plānots atbrīvot VLSI mikroshēmu. VLSI sērijas prototips tiks izveidots, lai atkļūdotu tehnoloģiskos risinājumus, tehnoloģisko procesu un simulācijas rezultātu eksperimentālu pārbaudi. Prototips saturēs visas pamatfunkcijas, darbosies ar PCI Express gen2 x16 saskarni un saitēm ar caurlaidību 75 Gb / s.

Angaras tīklu tirgū plānots reklamēt divās versijās: kā atsevišķu tirdzniecības tīklu PCI Express karšu veidā klasteru sistēmām ar standarta procesoriem un mikroshēmojumiem, kā arī kā daļu no četru kontaktligzdu lāpstiņu sistēmas, kuras pamatā ir AMD procesori, kas tiek izstrādāti NICEVT.

Noskatieties video: Akcija Spoku tīkli Kuldīgas novadā (Decembris 2022).

Pin
Send
Share
Send
Send