Adattudomány

Foster Provost és Tom Fawcett tekintélyes New York-i tudósok. Nemrég könyvet publikáltak a „data science”-ről, vagyis az adatok tudományáról (adattudomány?). Véleményük szerint a „data mining”, vagyis az adatbányászat a „data science” része, vagyis az utóbbi a tágabb kategória, és ez így rendben is van.

Provost és Fawcett szerint a „data science” alapvető rendeltetése a döntések jobbá tétele, üzleti szempontból legalábbis. Megítélésük szerint jobbítási céllal kétféle döntés jöhet szóba.

Az első csoportba azok a döntések tartoznak, amelyekhez valamilyen mélyreható felismerésre (vagy több ilyenre) van szükség a rendelkezésre álló, illetve megszerezhető adatokból. Ha például egy szupermarket-hálózat arra kíváncsi, hogy várhatóan miként fog változni a kereslet egy közelgő hurrikán hatására, vagyis mit kell megváltoztatni a készletekben, akkor ez egy ilyen döntés. (A konkrét példához konkrét felismerések tartoznak, így például: ha hurrikán közeleg, az emberek bizonyos sörökből jóval többet vesznek a megszokottnál.) Vagyis: nagy probléma, nagy felismerés agyafúrt adatbányászattal Big Data alapon, egyszeri nagy haszon.

A másik csoportba gyakran ismétlődő, rutinjellegű döntések tartoznak: ha az eredményességük csak egy kicsit is javítható a „data science” segítségével, a haszon idővel szépen felhalmozódhat. Vagyis: sok kis döntés megjavítva sok kis hasznot hoz, amiből aztán idővel nagy nyereség lehet. Ilyen például a rutinjellegű hitelkérelem-értékelés (újmagyarul: credit scoring) a bankoknál. Ha minden döntés egy picit jobb lesz, kevesebb hitel zápul meg, sok kicsi pedig sokra megy.

Hozzászólás írása

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*