Egy részlet a nagy egészből

Egy adatokról szóló könyv kéziratán dolgozom. Az elején lesz néhány példa a Big Data jelenségre. Íme a vonatkozó rész nyers változata:

——

Az adatrobbanás, a Big Data első megközelítésben nagyságrendi kérdés. Az emberiség a modern digitális technológiáknak köszönhetően óriási kapacitásokkal rendelkezik információk feldolgozásához és tárolásához. Ezekre szükség is van, hiszen a világban ugyanilyen óriási tömegű adat keletkezik szinte folyamatosan. Egyre több olyan forrás van, amely „Big Data” jelenséget produkál. Az adattömegek méretének, a jelenség kiterjedtségének érzékeltetése érdekében álljon itt néhány, egyszerűen a napihírekből vett példa a legkülönbözőbb területekről:

 

  • Korunk egyik leglátványosabban fejlődő tudományága a genetika. Az emberi genom bájtokban kifejezett méretéről különböző forrásokban eltérő számokat lehet találni, de ha abból indulunk ki, hogy benne minden bázispár (base pair) két bittel kódolható, akkor körülbelül 725 megabájt adatról van szó.
  • A CERN Nagy Hadronütköztetőjének használatánál évente 10-15 petabájt (1015 bájt) adat biztonságos tárolására van szükség.
  • Az internetes vállalati világ egyik szereplője, a Groupon 2011-ig, tehát a tőzsdei megjelenése évéig 43 országban vetette meg a lábát, és ezekben összesen 83 millió felhasználót gyűjtött magának. Ebből a 83 millióból 16 millió tekinthető aktívnak, vagyis ennyien vannak azok, akik tényleg vettek valamilyen kupont a Groupontól.
  • Kenyában a mobiltelefonok penetrációja 74%-os, ami jóval magasabb az afrikai átlagnál. Az országban az internet-előfizetések 99%-a mobiltelefonokhoz kötődik, a vezetékes telefonrendszer jelentősége jóval kisebb. Az egyik helyi mobilszolgáltató, a Safaricom öt évvel ezelőtt indította el M-PESA elnevezésű mobiltelefonos pénzküldő szolgáltatását. A szolgáltatásnak már több mint 15 millió felhasználója van, ami azt jelenti, hogy a felnőtt lakosság 70%-a csatlakozott a rendszerhez. Kenya GNP-jének 25%-a az M-PESÁ-n fut keresztül. A mobiltelefonok használata, rendszeren bonyolított pénzügyi tranzakciók hatalmas tömegű digitális adatot produkálnak.
  • A foglalkoztatási adatok alapján a világ legnagyobb részvénytársasága a Wal-Mart. Az áruházláncnak mintegy kétmillió alkalmazottja van, utána a McDonald’s következik 1,7 millióval. Az Indian Railways csak 1,4 millióval büszkélkedhet. Sok olyan cég van, amelyek létszáma közepes méretű városok lakosainak számával vetekedhet. Az óriásvállalatok nyilvántartásaiban rengeteg személyzeti adat halmozódik fel.
  • A kereskedelmi láncok a legnagyobb „adattermelők” közé tartoznak. Az amerikai Wal-Martnak hazájában 4.100, egyenként is óriási boltja van, ezekkel a lakosság kétharmadát érik el ötmérföldes távolságon belül.
  • A research2guidance tanácsadó cég szerint jelenleg az okostelefonok gazdáinak 5%-a használt mobil egészségügyi alkalmazásokat, és azt jövendölték, hogy ez az arány 2015-re el fogja érni a 30%-ot.
  • Állítsunk ide egy történelmi példát is a közelmúltból! Az egykori NDK-s titkosrendőrség, a Stasi fénykorában körülbelül százezer teljes munkaidős alkalmazottal dolgozott. Magánleveleket olvastak el, bankszámlákban kutakodtak, lakásokat poloskáztak be, egyszóval élték az ilyen szervezetek mindennapos életét. Munkájuk során 39 millió információs kartont halmoztak fel, az összegyűjtött dokumentumok hossza a polcokon több mint száz kilométer volt.
  • William Binney, az amerikai National Security Agency egykori alkalmazottjának becslése szerint az ügynökség 20 trillió „tranzakciót” halmozott fel telefonhívási, számítógépes levelezési, banki átutalási adatok formájában.
  • Oroszországban becslések szerint egymillió autóból filmezik menet közben folyamatosan az utat.
  • Az eBay nevű internetes piactér petabájtos nagyságrendben tárol tranzakciós adatokat
  • A Carolinas HealthCare systems nevű, egészségügyi centrumokat működtető szervezet 2014-ben kétmillió emberről kezdett fogyasztási adatokat gyűjteni egészségügyi prognózisok készítése céljából.
  • Egy amerikai kutatócsoport nemrég 73 online egyetemi kurzus adatait vizsgálta meg. Összesen 115.000 hallgató viselkedését tanulmányozták, akik együttesen több mint 800.000 hozzászólást írtak 170.000 különböző témában. Úgynevezett MOOC kurzusokról volt szó (Massive Open Online Courses) a Coursera nevű online oktatási cég kínálatából.
  • Az internetes boltok vásárlói rengeteg digitális nyomot hagynak maguk után. 2012-ben az Amerikai Egyesült Államokban az ottani statisztikai hivatal becslése szerint 225 milliárd dollár volt az elektronikus kiskereskedelem forgalma, ami 2011. óta mintegy 16%-os növekedést jelent. Az online vásárlások aránya ma 5,2%-ot ad a kiskereskedelem bevételéből.
  • A vállalati szoftverekkel foglalkozó német SAP-nak 2013-ban több mint 200.000 ügyfele volt, vagyis ügyfél-adatbázisa ennyi tételt tartalmazott.
  • A modern orvosi diagnosztika fontos elemei a digitális képalkotó eszközök, így például az MRI (Magnetic Resonance Imaging). A nagyságrendet ne képpontokkal, hanem költségekkel érzékeltessük: a képalkotás az Amerikai Egyesült Államokban az éves egészségügyi kiadások 7,5%-át teszi ki, ez nagyjából 200 milliárd dollárnak felel meg, ami Írország nemzeti jövedelmével vetekszik, a növekedési rátája pedig évi 14%.
  • A Decide.com cég automatizált rendszere 2012-ben 4 millió termék 25 milliárd árazási adatát gyűjtötte össze.
  • Doug Laney, a Gartner Group egyik vezető elemzője felmérte, hogy a Facebook még a tőzsdei megjelenése előtt, vagyis 2009 és 2011 között 2,1 trillió „tartalomdarabot” (“pieces of content”) gyűjtött össze lájkok, posztok kommentek stb. formájában. (A tőzsdei induló árfolyamból kiszámolta, hogy minden ilyen darab körülbelül öt centet ért.)
  • Az Amerikai Egyesült Államokban az orvosok 3,7 milliárd receptet írnak évente, egyre többet elektronikus formában.

 

Hozzászólás írása

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*