Cyfrifiadura Ymchwil Uwch yn estyn ffabrig rhwydwaith Hawk
24 Awst 2020
Ymgymerir â’r gwaith o estyn system uwchgyfrifiadura “Hawk” ym Mhrifysgol Caerdydd ym mis Medi.
Cyflawnir hyn drwy estyn ffabrig y rhwydwaith cysylltiedig a alluogir gan bensaernïaeth y system seilwaith y gellir ei phlygio.
Mae model seilwaith “y gellir ei blygio” yn nodweddu systemau uwchgyfrifiadura Caerdydd ers 2014 a dyddiau cynnar Raven, gyda’r systemau’n cael eu dylunio fel gall ymchwilwyr Caerdydd ychwanegu at y seilwaith ymchwil creiddiol drwy ddefnyddio cyllid Grant i gaffael nodau ychwanegol at ddefnydd eu prosiectau ymchwil eu hunain. Mae’r fath ddull yn dibynnu ar y ffaith bod modd estyn ffabrig rhyng-gysylltu’r system – y “glud” sy’n integreiddio’r nodau i mewn i’r system gyffredinol – gyda’r gallu i fanteisio ar y cenedlaethau diwethaf o ffabrigau rhyng-gysylltu mewn modd cost-effeithiol a chyflym.
Dyluniwyd system gychwynnol Hawk yn 2018 er mwyn gallu cael estyniad ar sail cysylltedd trwybwn uchel Mellanox, cuddni isel EDR (100Gb/s) InfiniBand, ac mae wedi bod wrth galon estyniad Hawk, o system graidd 8,040 ym mis Gorffennaf 2018 i’r system bresennol sy’n cynnwys 19,416 o greiddiau.
Gyda’r ffabrig presennol sy’n seiliedig ar EDR wedi’i ddirlenwi i bob pwrpas, a gyda rhyddhad Ffabrig HDR wedi’i uwchraddio gan Mellanox (200 Gb/s), cododd yr her o sut i integreiddio rhwydweithiau EDR a HDR heb ynysu’r rhwydwaith EDR presennol.
Ar ôl trafodaethau â’n partneriaid technoleg allanol, Mellanox, Dell ac Atos, mae datrysiad y dyluniad pensaernïol yn cynnwys cyflwyno dwy bont o’r enw Haen Rwydweithio Lustre (LNET). Mae’r rhain yn weinyddion sy’n gallu gweithio ar draws rhwydweithiau EDR a HDR, drwy ddefnyddio sawl rheolydd ConnectX6 IB, cyn creu pont rhwng y ddau rwydwaith. Ymhellach, caiff Storfa Ffeiliau’r Rhwydwaith (NFS) ei huwchraddio drwy ychwanegu addasydd ConnectX6 ac iddo ddau borth, fel y gall weithio ar draws y ddau rwydwaith IB hefyd.
Mae’r estyniad i alluogi holl osodiadau system Hawk yn y dyfodol er mwyn defnyddio HDR (200 Gb/s) i fod i’w gwblhau yn ystod mis Medi a bydd yn cael 60 o nodau ychwanegol. Bydd y cam nesaf hwn yn esblygiad y dull seilwaith y gellir ei blygio yn cyflwyno estyniad cyflym a llwyddiannus i Hawk, gan adlewyrchu cynnydd a gyflawnwyd ar ddechrau’r gwasanaeth ym mis Gorffennaf 2018.