Offer iaith gydag effaith yn y byd go iawn
18 Hydref 2022
Mae Prifysgol Caerdydd yn arwain ar ddau adnodd newydd i grynhoi testunau Cymraeg yn awtomatig ac i ddatblygu thesawrws ar-lein Cymraeg.
Mae Ysgol y Gymraeg ac Ysgol Saesneg, Cyfathrebu ac Athroniaeth ym Mhrifysgol Caerdydd, mewn partneriaeth gydag Ysgol Cyfrifiaduraeth a Chyfathrebu ym Mhrifysgol Caerhirfryn, wedi bod yn cydweithio ar dechnoleg arloesol er mwyn hyrwyddo’r defnydd o’r Gymraeg, a ariennir gan Lywodraeth Cymru.
Gyda’i fersiwn beta wedi ei gyhoeddi ym mis Gorffennaf, mae’r Adnodd Creu Crynodebau (ACC) yn rhaglen crynhoi testun iaith Gymraeg yn awtomatig sydd ar gael i’r cyhoedd.
Nod y rhaglen newydd yw galluogi gweithwyr proffesiynol, addysgwyr a'r cyhoedd yn gyffredinol, i grynhoi dogfennau hir yn gyflym at ddefnydd personol a phroffesiynol.
Dywedodd Dr Dawn Knight, arweinydd y prosiect a Chyfarwyddwr Cyllid Ymchwil yn yr Ysgol Saesneg, Cyfathrebu ac Athroniaeth:
‘Mae gan ACC y potensial i ddarparu crynodebau cryno a chydlynol o destunau i ddefnyddwyr. Gan fod hyn yn aml yn cymryd llawer o amser ac yn anodd ei gynnal, mae gan ACC y potensial i arbed llawer o amser i ddefnyddwyr ac i helpu, er enghraifft, y rhai sy’n cael trafferth darllen dogfennau hir a chymhleth yn y Gymraeg’.
Nawr, mae’r tîm sy’n arwain ar brosiect Thesawrws yn anelu at ddatblygu thesawrws ar-lein mynediad agored, fydd ar gael am ddim, ar gyfer siaradwyr a dysgwyr Cymraeg. Bydd defnyddwyr yn gallu defnyddio rhyngwyneb y wefan i chwilio am gyfystyron. Er enghraifft, gallai chwilio am y gair ‘chwilio’ ddangos cyfystyron fel ‘edrych am’, ac ‘archwilio’.
Fel y dywed Dr Jonathan Morris, arweinydd prosiect adnodd Thesawrws a Chyfarwyddwr Ymchwil Ysgol y Gymraeg Prifysgol Caerdydd: ‘Mae’n bleser cael parhau â’r gwaith ar y prosiect rhyngddisgyblaethol hwn gyda chydweithwyr o Gaerdydd a Chaerhirfryn. Ein nod yw cynhyrchu thesawrws ffynhonnell agored y gellir adeiladu arno yn y dyfodol a’i ymgorffori mewn technolegau presennol’.
Yn y bôn, nod prosiect ThACC (Thesawrws Ar-lein Cymraeg Cyfoes) yw awtomeiddio datblygiad y thesawrws Cymraeg hwn. Mae tîm y prosiect yn bwriadu tynnu ar y defnydd o fewnosodiadau geiriau sydd eisoes yn bodoli ar gyfer y Gymraeg i ddod o hyd i eiriau cysylltiedig heb ddibynnu ar eiriadurwyr dynol, a'r defnydd o'r Tagger Semanteg Cymraeg a gwerthusiadau dynol i fireinio'r rhaglen. Rhagwelir y bydd yr adnodd newydd hwn yn cael ei lansio yn ystod haf 2023.
Mae’r rhaglen Crynhoi Testun Awtomatig Cymraeg a phrosiect ThACC yn rhan o’r Corpws Cenedlaethol Cymraeg Cyfoes (CorCenCC), a lansiwyd yn 2020 gyda Dr Dawn Knight yn arwain y prosiect.