ARCCA yn cefnogi AI ac ymchwil sy'n cael ei yrru gan Ddata
26 Hydref 2020
Er mwyn sbarduno datblygiad gwasanaethau sy'n diwallu anghenion esblygol ac amrywiol cymuned ymchwil Prifysgol Caerdydd, mae ARCCA wedi bod yn gweithio gyda StackHPC. Mae'r cwmni hwn yn arbenigo mewn datblygu galluoedd OpenStack ar gyfer ymchwil i achosion defnydd cyfrifiadurol, i ddarparu uwchraddiad pwysig i'r system dadansoddi data perfformiad uchel (HPDA), “Sparrow”.
Mae Sparrow yn ddatrysiad OpenStack integredig i storio, rheoli a dadansoddi data cymhleth sy'n berthnasol i ystod o ddisgyblaethau. Bydd yr uwchraddiad hwn yn darparu gwasanaeth newydd gyda phwyslais ar hyblygrwydd a rhwyddineb defnydd.
Cynhaliwyd cyfres o chwe gweithdy rhwng ARCCA a StackHPC yn ystod mis Gorffennaf ac Awst gan arwain at bensaernïaeth gyfeirio OpenStack fanwl ar gyfer lleoliad newydd Sparrow. Yn seiliedig ar achosion a gasglwyd o'r blaen ar gyfer y platfform, gwahoddwyd ymchwilwyr sy'n cynrychioli ystod o ddisgyblaethau ymchwil i gymryd rhan mewn sesiwn bwrpasol gyda StackHPC ac ARCCA i drafod eu gofynion ar gyfer y gwasanaeth newydd.
Bydd system Sparrow yn darparu gwasanaethau HPDA sy'n cefnogi deallusrwydd artiffisial (AI) a chyfleoedd ymchwil ar sail data, i ategu'r gwasanaeth HPC ciw-swp a ddarperir gan Hawk. Bydd y bensaernïaeth newydd hon yn cyflawni gwelliannau gwasanaeth i gefnogi llwythi gwaith rhithwir gan gynnwys cefnogaeth ar gyfer defnyddio adnoddau â chynwysyddion awtomataidd. Yn ogystal, bydd cyfres o uwchraddiadau caledwedd yn cael eu darparu, yn enwedig cefnogaeth i lif gwaith cyflymu GPU ynghyd â chefnogaeth ar gyfer trin data mynediad wedi'i reoli i fodloni gofynion diogelwch gwell.
Ymhlith y llwyfannau targed i'w cynnal gan Sparrow mae Apache Spark, system brosesu gwasgaredig a ddefnyddir ar gyfer llwythi gwaith data mawr, a weithredir gan ddefnyddio system offeryniaeth Kubernetes ar gyfer cyflwyno cymwysiadau mewn cynwysyddion. Darperir storfeydd o blatfform storio hyblyg a mesuradwy Ceph, yn ogystal ag amrywiaeth o gymwysiadau. Wedi'i gyflenwi fel llwyth gwaith yn Kubernetes, bydd yr olaf yn cynnwys:
NextFlow - Fframwaith llif gwaith adweithiol sy'n hwyluso ysgrifennu piblinellau cyfrifiadurol data-ddwys;
Hail - Cymhwysiad dadansoddi data genomig sy'n darparu offer gwyddor data pwerus, hawdd eu defnyddio;
Jupyter - Amgylchedd datblygu rhyngweithiol ar y we sy'n cefnogi ystod eang o lifoedd gwaith mewn gwyddor data, cyfrifiadura gwyddonol, a dysgu peiriannol.
Gyda’r uwchraddiad ar waith, disgwylir lansio gwasanaeth peilot erbyn diwedd y flwyddyn ar ôl cwblhau'r profion derbyn cysylltiedig yn llwyddiannus. Ein bwriad yw darparu gwasanaeth cynhyrchu llawn ar ddechrau 2021.