Dáta pre data-mining
Streda, Február 2nd, 2011Objavovanie znalostí s využitím techník data-miningu je vhodným nástrojom podporujúcim riešenia celej rady zložitých problémov.
Fundamentálny otázka pri každom projekte využívajúcom data-mining je dostupnosť a kvalita dát. Dnešné algoritmy sú dostatočne vyvinuté, aby dokázali vytvárať nad dátami spoľahlivé modely, ktoré následne slúžia pre predikciu alebo klasifikáciu ďalších prípadov. Pre algoritmy je to jednoduchá úloha, takmer nad akýmikoľvek dátami vytvoria optimálny model. Optimálny z pohľadu štatistiky. Otázkou však ostáva, či je vhodný aj pre riešenie pôvodnej úlohy a či výsledky naozaj poslúžia tak, ako očakávame. Rozhodujúcim faktorom sú dáta.
