A teljesség felé

Egy hosszabb tanulmányt olvasok a big data jelenségről (később majd részletesebben is írok róla). Szerzője szint a „big” jelzőt tulajdonképen nem „nagy”-nak kell értelmezni, hanem „teljes”-nek. Az elemzéseknél nem kell mintavétellel, a gondosan kiválasztott minták adatainak gondos pucolgatásával foglalkozni. A teljes adatállománnyal lehet dolgozni, legyen az bármekkora. A teljes állományban persze sok hiba is akadhat, ezért viszont kárpótol minket az állomány nagysága és teljessége.
A tanulmány a Google fordítóját hozza fel példaként, amibe gyakorlatilag minden fordítást beletápláltak, amit találtak a világhálón. Vannak közöttük jók is, rosszak is. Az eredmény jobbnak bizonyult, mint a válogatott, „hivatalos” fordításokkal operáló rendszereké. A teljesség, állítja a tanulmány, minőségi változást hoz, mondhatnánk a mennyiség átcsap minőségbe. A teljesség győzelmet arat a pontatlanságok felett.

Cimkék:

Tóth Attila Zoltán 2013. október 28.

  • Kedves Gyuri!
    Köszönöm, hogy nem elégedtél meg, mint ahogy eddig is tetted, a szolgai fordításból adódó szóhasználattal. Szerintem is itt többről van szó. A Big Data-val jegyzet új technológia jellemzése nem merül ki a feldolgozandó adatok mennyiségének nagyságával. Várom az említett tanulmány részleteit.

Hozzászólás írása

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*