Archive for the ‘Tech’ Category
Ohrozuje data-mining súkromie?
Štvrtok, Jún 23rd, 2011Dáta pre data-mining
Streda, Február 2nd, 2011Objavovanie znalostí s využitím techník data-miningu je vhodným nástrojom podporujúcim riešenia celej rady zložitých problémov.
Fundamentálny otázka pri každom projekte využívajúcom data-mining je dostupnosť a kvalita dát. Dnešné algoritmy sú dostatočne vyvinuté, aby dokázali vytvárať nad dátami spoľahlivé modely, ktoré následne slúžia pre predikciu alebo klasifikáciu ďalších prípadov. Pre algoritmy je to jednoduchá úloha, takmer nad akýmikoľvek dátami vytvoria optimálny model. Optimálny z pohľadu štatistiky. Otázkou však ostáva, či je vhodný aj pre riešenie pôvodnej úlohy a či výsledky naozaj poslúžia tak, ako očakávame. Rozhodujúcim faktorom sú dáta.
Ako vyriešiť KDD CUP 2009
Streda, Október 7th, 2009
KDD Cup 2009 prišiel s typickou úlohou kladenou na dnešných analytikov – tvorby viacerých modelov, nad množstvom neznámych dát, v krátkom čase. Tento článok predstavuje samotnú súťaž a postup riešenia založený na postupnej redukcii objemu dát s ohľadom na výpočtovú náročnosť metód využitú v jednotlivých krokoch.



