Archwilio

CorCenCC

Mae CorCenCC yn gasgliad digidol hygyrch o samplau o Gymraeg, wedi’u casglu o gyfathrebu bywyd go iawn (‘corpws’). Gallwch archwilio CorCenCC i ddarganfod mwy am sut mae pobl wir yn defnyddio’r Gymraeg, er enghraifft, pa mor aml y defnyddir gair penodol, neu beth yw’r geiriau mwyaf aml eu defnydd mewn mathau penodol o gyfathrebu. Mae CorCenCC yn cynnwys 11 miliwn o eiriau o ffynonellau Cymraeg ysgrifenedig, llafar ac electronig, wedi'u codi o amrywiaeth o genres, amrywiadau iaith (rhanbarthol a chymdeithasol) a chyd-destunau. Mae pob gair mewn corpws wedi ei dagio gyda gwybodaeth ramadegol a semantig (yn ymwneud â themâu a phynciau) a rhoddir gwybodaeth am darddiad pob darn o iaith (e.e. math o destun, lleoliad siaradwyr).

Cymraeg