Cloddio data yw'r broses o ganfod patrymau mewn setiau enfawr o ddata, gan ddefnyddio dysgu peirianyddol, ystadegau a systemau cronfeydd data.[1] Mae'n is-faes rhyngddisgyblaethol o fewn gwyddoniaeth gyfrifiadurol ac ystadegaeth. Y nod cyffredinol yw echdynnu gwybodaeth, drwy ddefnyddio dulliau deallus, o setiau data, gan drawsffurfio'r wybodaeth yn strwythur hawdd ei ddeall, er mwyn ei defnyddio'n ddiweddarach.[1][2]
Y cam o ddadansoddi yw 'cloddio data' yn y broses o "ganfod gwybodaeth mewn cronfeydd data", sef KDD (the "knowledge discovery in databases").[3] Ar wahân i'r cam o ddadansoddi crai (raw analysis), mae cloddio data hefyd yn cynnwys cronfeydd data ac agweddau o reoli data, rhag-brosesu data, modelu a chasgliadol, ôl-brosesu, darlunio'r canlyniadau e.e. drwy graff a diweddaru arlein.[1]
Y gwahaniaeth rhwng dadansoddi data a chloddio data yw fod dadansoddi data'n crynhoi'r hanes e.e. dadansoddi effeithiolrwydd ymgyrch farchnata; mewn cyferbyniad, mae cloddio data yn canolbwyntio ar ddefnyddio dysgu peirianyddol a modelu ystadegol i ragfynegi'r dyfodol a chanfod patrymau o fewn y data.[4]