Testu-meatzaritza

Testu-meatzaritza, testutik kalitate handiko informazioa lortzeko prozesua da. Kalitate handiko informazioa, oro har, patroiak eta joerak egitean lortzen da, esate baterako, eredu estatistikoko ikasketen bidez. Testu-meatzaritzak, oro har, idazketa-testua egituratzeko prozesua dakar (normalean azterketa, ezaugarri linguistiko eratorri batzuk gehituta eta besteen ezabapena eta ondorengo datu-base batean sartzea), datu egituratuak eta, azkenik, irteeraren ebaluazioa eta interpretazioa. Testu-meatzaritzan "kalitate handia" garrantziaren, berrikuntzaren eta interesaren konbinazioari dagokio. Testu-meatzaritzako eginkizun tipikoen artean, testuen sailkapena, testu-taldekatzea, kontzeptu/entitate erauzketa, taxonomia granularrak, sentimenduen analisia, dokumentuaren laburpena eta entitate-ereduen modelizazioa.

Testuen analisiak honako hauek dakartza: informazioaren berreskurapena, azterketa lexikoa, hitzaren maiztasunen banaketa, ereduen ezagutza, etiketatzea/anotazioa, informazioaren erauzketa, datuen meatzaritza teknikak, bisualizazioa eta aurresateko analisia. Helburu nagusia testua aztertzeko datuak bihurtzea da, hizkuntzaren tratamendu naturalaren aplikazioaren bidez eta metodo analitikoen bidez.


Developed by StudentB