SMAC, avagy az infokommunikáció jövője – 5/7

Ez a cikksorozat bemutatja, hogy milyen trendek fogják jellemezni az infokommunikáció következő egy-két évtizedét. Pontosabban, amit ma látunk ezekből. Talán emlékeznek még, hogy az elején abból indultunk ki, hogy miért túl leegyszerűsítő azt mondani, hogy a Big Data a jövő. Remélem ma kiderül, hogy hogyan áll össze ez az egész, és hogy hol van ebben a Big Data szerepe. A negyedik hajtóérő ugyanis – ahogy Önök már nyilván sejtik – az…

Analitika

Az Analitika az a terület, ahol a másik három összeér. A mobileszközök által termelt, a közösségi megoldásokban megosztott, és a felhőben tárolt óriási volumenű adattömeg elemzése, majd az eredmények rendszerbe történő „visszaáramoltatása” teszi fel a koronát az együttműködésre. Az adatokból olyan információ aknázható ki, amely segítségével az eddigieknél lényegesen nagyobb rálátás nyerhető arra, hogy „hogyan is működik a világ”, így sokkal relevánsabb döntések hozhatóak. A megnövekedett felhasználószám és aktivitás azonban nem csak az adatvolumen (volume) növekedését hozta magával. A harmadik platform adatai jellegükben, szerkezetükben (variety) is különböznek a hagyományos vállalati rendszerek relációs adatbázisokba (táblákba) kényszeríthető adataitól. Ráadásul keletkezésük és felhasználásuk sebessége (velocity) is nagyobb. Mindez azt jelenti, hogy az analitika, az adatelemzés hagyományos eszközkészlete (pl. az adattárházak) csak korlátozottan alkalmazhatóak. Az új igények kezelését célozzák meg az ún. Big Data technológiák, amelyekről manapság olyan sokszor lehet hallani. A műszaki szempontok mellett egyre hangosabban jelenik meg egy másik aspektus is: ezek az új technológiák más, az eddigiek eltérő jellegű szakértelmet kívánnak a megoldás-stack minden szintjén. Az infrastruktúra szintjén a lineárisan skálázható és gazdaságilag fenntartható szoftver és hardver-infrastruktúra tervezéséhez, installálásához és működtetéséhez megfelelő műszaki kompetenciákra van szükség. A vállalatok ezt a szakértelmet szerencsére bérelhetik a felhőszolgáltatás részeként. A megoldás-stack erre ráépülő szintjein azonban már nem ilyen egyszerű a helyzet. Az adatszervezés és kezelés szintjén az elemzésekhez szükséges adathalmazok létrehozásához újszerű modellező és adatmenedzsment képességek kellenek, az elemzések, az információk kiaknázása szintjén az adatok közötti kapcsolatok, minták felfedezéséhez másfajta elemzői, döntés-modellezői készségekre van szükség, végül az üzleti területek döntéshozóival való együttműködés érdekében az üzleti fogalmak és összefüggések pontos ismerete is elengedhetetlen. Annak a szakértőnek, aki ezen képességek együttesével rendelkezik az áll a névjegykártyáján, hogy „data scientist”. Azt mondják, hogy jelenleg ők a munkaerőpiac legkeresettebb szakértői.

Az első cikkel kapcsolatban egy kommentelő azt kérdezte, hogy mit jelent a cikksorozat címében szereplő SMAC. Akkor azt ígértem, hogy ez az augusztus 5-i részben fog kiderülni. Vagyis a jövő héten.

Cimkék: , ,

Kincses László 2014. július 31.

  • Én voltam, itt vagyok, elolvastam eddig és várom a megoldást.

    Valahogy van egy olyan homályos érzésem, hogy ami nincs relációs modellbe szervezve, az nem lehet pontos (folyamatosan veszít az integritásából), és ami nem pontos (azaz nem tudjuk garantálni, hogy az, amire gondolunk), az nem alkalmas ellenőrzése (valaminek nem elég kb. +-1000 forintra stimmelnie, még ha ez nem jelentős összeg is, mert az az ember érzése, hogy ha nem egyezik, esetleg milliárdos hiba is lehet mögötte), és ha nem alkalmas ellenőrzésre, akkor elvesztettük a kontrollt. Ugyanakkor lehet, hogy nincs is szükség arra a kontrollra, és fontosabb előre jelezni a jövőt, mint a múltat kézben tartani.

    Már most is az az érzésem, hogy a szolgáltatók egyre kevésbé tudnak lépést tartani a folyamatosan növekvő igényekkel és a felmerülő változásokkal, és a havonta kapott (elvileg szigorú tranzakciós rendszerekből származó) számlák olyanok, mint a kalózbecsület (inkább csak amolyan útmutatófélék), amik körülbelül tükrözik a tényeket és rendszeresen korrekcióra szorulnak (egy lakcímváltozás, csomagváltás, stb. esetén hónapokig kell küzdeni a túlszámlázás, lemondás, javító számlák és hasonlók tömegével).

    Lehet, hogy csak egy közmegegyezés kellene arról, hogy nagyméretű adathalmazok elemzésén alapuló valószínűségekre alapozzuk az életünket, és ne ragaszkodjunk a pontos elszámoláshoz. Cserébe kitalálják a gondolatainkat és kielégítik az igényeinket kérés nélkül is.

Papp Attila 2014. augusztus 1.

  • Önmagában nem azzal van gond, hogy a modell nem relációs, hanem hogy az adatkezelő milyen beépített szolgáltatásokat nyújt az integritás védelmére. A kiforrott adatbázis kezelőknek szerencsére megvan a maguk eszközkészlete, azonban vannak feladatok, ahol erre nincs szükség. Itt írtam erről.

    Megoldás a jövő kedden! :)

Hozzászólás írása

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*