Na még egy kis big data

Íme még egy részlet a “big data” tanulmányból. Több itt már nem lesz belőle, majd jelzem, ha a cikk megjelenik valahol a Gutenberg galaxisban. Mindenesetre ha valakit érdekel a téma, és ír nekem egy e-mailt erre a címre: bogelgy@ceubusiness.org , szívesen elküldöm neki a teljes kéziratot, építő kritikáért és ötletekért cserébe.

————————————

 

A „big data” jelenség a gazdaságban és a gazdaságtudományban

 

        

A Financial Times a közelmúltban „digitális aranybányá”-nak nevezte a hatalmas adattömegek előállításában, feldolgozásában és felhasználásában rejlő lehetőséget (Waters [2011]). A cikk számos példát mutat be üzleti célú hasznosításra. Ez már elég ahhoz, hogy a „big data” jelenség gazdasági, illetve üzleti elemzés tárgya is legyen, a gazdasági vonatkozások tárgyalását azonban kezdjük a gazdaságtudományi vonatkozásokkal.

    A közgazdaságtudomány a társadalomtudományok körébe tartozik. Számos jele van annak, hogy a hatalmas méretű digitalizált adatbázisok előállításának, rendezésének és feldolgozásának technikai lehetősége a társadalomtudományi kutatásokra is jelentős hatást gyakorol. Ahogy Gary King, a Harvard Egyetem professzora írja (King [2011] 719. o.): a társadalomtudományok művelői felismerik, hogy olyan kérdések vizsgálatára nyílik lehetőség, amelyeket eddig nem, vagy csak alacsony hatékonysággal lehetett kezelni, miközben azok rendkívül fontosak lehetnek a társadalom szempontjából. Ha például valaki a tömegek véleményére, attitűdjeire, viselkedésére kíváncsi bizonyos kérdésekkel vagy jelenségekkel kapcsolatban, az internetes közösségi hálókon bejegyzések millióit analizálhatja automatizált szövegelemzési technikával.

    Az emberi viselkedés a közgazdaságtan viselkedési irányzatának (behavioural economics) is tárgya. Akerlof és Shiller például a jelenlegi válságot viselkedési, illetve „lelki” tényezőkkel magyarázza (Akerlof-Shiller [2011]). Az előző szakaszban említett digitális nyomoknak köszönhetően az emberi viselkedés ma hatalmas tömegű valós idejű adat segítségével elemezhető. Példaként lehet felhozni az Albert-László Barabási által leírt hálózatkutatási projekteket (Barabási [2010]). Ezek legfontosabb eszköze az emberek által önkéntesen magukkal hordott „szenzor”: a mobiltelefon. 2010-ben több mint 4 milliárd ember, a föld lakosságának 60%-a használt mobiltelefont, minden ötödik készülék sokféle tevékenységre használható okostelefon volt, amelyek piaci penetrációja évi 20%-os növekedést mutat (Manyika [2011] 2. o.).

    A technológia fejlődése új lehetőségeket nyit gazdaságtudományi vizsgálatokhoz, a tudományos célú kísérletezéshez, régi és új törvények igazolásához vagy éppenséggel megcáfolásához. Tudjuk például, hogy a közelmúltban – a gazdasági válság ellenére – gyors fejlődésnek indult az elektronikus (internetes) kereskedelem. A hazai netes boltok forgalma 2010-ben meghaladta a 133 milliárd forintot, ami a teljes kiskereskedelmi forgalom 1,8%-át jelentette[1]. Vannak olyan országok, ahol ez az arány lényegesen nagyobb. Magyarországon is létezik olyan nyitott, többféle árképzési rendszerrel dolgozó elektronikus piactér, ahol egy átlagos napon 15 ezer tranzakció (adásvételi esemény) zajlik, amelyek rengeteg digitális adatot „termelnek”. Az elektronikus kereskedelem kiváló terep adatigényes közgazdasági vizsgálatok számára. Hogy mást ne mondjuk: az elektronikus piacok egyes szegmensei közel állnak ahhoz, amit a közgazdaságtudomány „tökéletes piacnak” (perfect market) nevez – nyilván nem véletlen az irántuk mutatkozó kutatói érdeklődés (lásd pl. Bynjolsson-Dick-Smith [2009]).

    A vállalatok és a gazdaság más intézményei a kilencvenes évektől kezdődően rengeteg pénzt fektettek informatikai fejlesztésekbe. Számtalan vállalat használ fejlett számítógépes rendszereket folyamatai irányítására, ügyfélkapcsolatai kezelésére, ellátási láncának menedzselésére, logisztikai rendszerének automatizálására stb. Ezek a rendszerek folyamatosan öntik magukból a valós idejű az állapot- és  műveleti adatokat. Sokat fejlődött az adattisztítás, -tárolás és -lekérdezés üzleti szervezetekben is használt technológiája (adattárházak, dokumentum-menedzsment rendszerek stb.) Digitalizált adatok állnak rendelkezésre a bakkártyás műveletekről, az ingatlanpiaci forgalomról, a tőzsdei tranzakciókról, a nyitott társaságok pénzügyi és egyéb mutatóiról, különböző készletekről, a vonalkódokat felváltó rádiófrenkvenciás azonosítók (RFID) terjedésének köszönhetően sokféle árucikk és jármű fizikai mozgásáról. A McKinsey Global Institute becslése szerint 2010-ben már több mint 30 millió hálózatba kapcsolt szenzor (sensor node) működött a közlekedésben, az iparban, a közműveknél és a kiskereskedelemben (Manyika [2011] 2. o.).

     Mivel egyre több a számítógépes munkahely, az alkalmazottak munkahelyi viselkedése is elemezhető digitalizált adatbázisok segítségével. A szervezeten belüli elektronikus levél- és telefonos forgalom például hasznos képet adhat az informális hálózatokról, a hatalmi viszonyokról, a részlegek és szakemberek közötti együttműködésről.

    Mindezekből az következik, hogy a természettudományokhoz és más társadalomtudományokhoz hasonlóan a közgazdaságtudománynak is „adatgazdag” jövőre kell felkészülnie, a „big data” jelenség a közgazdaságtudományt is mindent bizonnyal megváltoztatja. A gazdaság szereplői viselkedésének megértéséhez is részben saját adatbázisaikhoz való viszonyuk, adatkezelési és -felhasználási módjaik feltárásán keresztül vezet az út.

    Térjünk vissza a „big data” jelenség szempontjából nyilvánvalóan fontos vállalati informatikai beruházásokhoz. A velük kapcsolatos számos trend közül kettőt mindenképpen ki kell emelnünk. Az első: a vállalati informatikai beruházások éves nagysága manapság több trillió dollárra rúg[2] és az elmúlt években jelentős emelkedést mutatott. Eközben az információk keletkeztetésének, menedzselésének és tárolásának fajlagos költsége az elmúlt öt évben a hatodára zsugorodott[3]. Az egyik oldalon tehát hatalmas befektetések állnak – a kérdés az, hogy mi van a másik oldalon, ezek a befektetések miként térülnek meg, milyen üzleti eredményt hoznak.

    A Financial Times említett cikke a „big data” jelenséget üzleti aranybányának nevezi. Ha e hasonlatnál maradunk, kijelenthetjük, hogy a bánya működtetéséhez beruházások kellenek. Mint láttuk, az üzleti célú informatikai beruházások óriási összegekre rúgnak. Mérési bizonytalanságok ellenére ezekről elég pontos képünk van. Nehezebb feladat azt megválaszolni, hogy ezek a beruházások (köztük a kifejezetten adatkezelési jellegűek, például adattárház-projektek) hogyan, milyen áttételeken keresztül térülnek meg. Üzleti kifejezéssel élve úgy is feltehetjük a kérdést, hol és milyen értékteremtő szerepe lehet a nagy digitalizált adatbázisok keletkeztetésének és felhasználásának.

    A vállalatok és más intézmények most kísérleteznek ezekkel a szerepekkel, most kezdik „kiaknázni a bányát”. Néhány értékteremtő módozat már elég jól kirajzolódik. Soroljuk fel a fontosabbakat!

    A vezetés és a döntéshozatal szempontjából a legfontosabb változás az intuitív, múltbeli tapasztalatokra, ösztönre, megérzésekre, kétes információk alapján kialakított véleményekre alapozott döntések visszaszorulása. Számos kutatási program bizonyítja, hogy a felsoroltaknak fontos szerepe van egy olyan világban, ahol a döntésekhez szükséges információk hiányosan és megkésve állnak rendelkezésre (lásd pl. Finkelstein [2003]). A fontos döntési tényezőkről rendelkezésre álló nagy tömegű, valós idejű adat csökkenti a döntések kockázatát, ráadásul a valós idejűség több preventív döntést tesz lehetővé, az utólagos, megkésett reakció helyett a megelőzésre téve át a hangsúlyt. (Aligha kell részletezni, hogy ennek mekkora jelentősége van például az egészségügy területén.)

    Az adatokra alapozott döntések könnyebben algoritmizálhatók és automatizálhatók. Az automatizálásnak többféle pozitív hatása lehet: kisebb költségek, rövidebb döntési ciklusidők, kisebb esély emberi hibákra, több lehetőség a döntések decentralizálására.

    Az adatbányászat (data mining) elnevezés mintegy két évtizede jelent meg a tudományos és az üzleti világban. Mai művelői kifinomult matematikai statisztikai eszközökkel elemeznek hatalmas adatbázisokat.  Az üzleti célú adatbányászat fontos célja olyan összefüggések, mintázatok feltárása, amelyek közvetlen hatással vannak a gazdasági eredményre (lásd pl. Hand-Mannila-Smyth [2001]; Fajszi-Cser-Fehér [2010]). A vállalatokat – érthetően – elsősorban azok a felismerések érdeklik, amelyek birtokában javítani tudnak ügyfélkapcsolati és értékesítési tevékenységükön, amelyek tehát vevőik viselkedéséről, a kereslet változásáról szolgáltatnak információt. Az eredmények hasznosításának többféle módjával találkozhatunk: az adatbányászat eredményei megjelennek például az ügyfélcsoportok azonosításában (a demográfiai alapú piacszegmentálást tömeges adatelemzéssel alátámasztott, viselkedésalapú tagolás váltja fel), a bankok kockázatértékelési (credit scoring) eljárásaiban, az internetes boltok ajánló algoritmusaiban (recommendation engines), a távközlési cégek lemorzsolódás-előrejelző rendszereiben.

    A vállalatok példáját a gazdasági élet más intézményei is követik: az adóhivatalok például adatbányászati vizsgálatok segítségével dönthetik el, kiket érdemes alaposabb (ezért szükségképpen drágább) ellenőrzésnek alávetni, vagyis növelni tudják ellenőrzési és behajtási munkájuk találati valószínűségét.

    Gazdasági célú statisztikai elemzések persze régen is készültek, a „big data” jelenség azonban megváltoztatta a nagyságrendeket. Hogy mennyire, azt érzékeltessük egyetlen példával: egy 2008-as kutatás megállapította, hogy egyedül a Yahoo cég havonta 110 milliárd (!) adatot gyűjt össze az ügyfeleiről (Baker [2008]). A hatalmas adattömegek statisztikai elemzése a természettudományos kutatás mellett egyre nagyobb szerepet kap a gazdaságban, de más területeken is, így például a bűnüldözésben, a politikában vagy éppenséggel a szexuális viselkedés feltárásában.

 

    Az adatok előállításához, tárolásához, feldolgozásához szükséges informatikai beruházások természetesen nem hoznak automatikusan üzleti eredményeket. Kutatási eredmények bizonyítják, hogy hasznosításuknak fontos feltételei vannak, és az sem kizárt, hogy több évet kell várni a pozitív következményekre (Bőgel [2009/b] 12. fejezet). A vállalati teljesítmény és a fenti értelemben vett (hatalmas adatbázisok, kifinomult statisztikai módszerek) üzleti analitika közötti összefüggés feltárását célzó kutatások egyelőre szórványosak, de az eredményeik biztatóak. Az MIT-n dolgozó Eric Brynjolfsson és munkatársai például ökonometriai eljárással határozott pozitív kapcsolatot mutattak ki az adatalapú döntéshozatal (data-driven decisonmaking) és a vállalati termelékenység között, ügyelve a fordított oksági kapcsolat kiszűrésére is (Brynjolfsson-Hitt-Kim [2011]).  

    Mindezekből arra következtethetünk, hogy a gazdaságban a „big data” jelenség új színt hoz a piaci versenybe. „Competing on analytics”, azaz versengés adatelemzéssel – így nevezi ezt Davenport és Harris [2007]. Az adatbázisok a vállalati vagyon fontos részét képezik, amit menedzselni, hasznosítani és értékelni kell. Ma már sok olyan vállalat van, amelyek petabájtos nagyságrendben tárolnak adatokat, a száz terabájtos nagyságrend pedig már szinte általánosnak tekinthető a nagyobb cégek körében. Az adatbázisokkal kapcsolatos tudás, az adatbázisok tartalma, feldolgozásuk technikája növekvő fontosságú versenyképességi tényező. Minden jel arra vall, hogy ez nemcsak vállalatokra vonatkozik, hanem régiókra, sőt országokra is. A lehetőségek szempontjából különös figyelmet igényelnek az olyan adatintenzív területek, mint például az egészségügy vagy a pénzügyi szolgáltatások; az előbbin a McKinsey cég kutatóközpontja az Amerikai Egyesült Államokban évi 300 milliárd dolláros „értékteremtési potenciált” jelez (Manyika et al. [2011] 8. o.). Jól látható, hogy informatikai tekintetben lemaradó, elhanyagolt szektorokban és régiókban nehéz lesz a lehetőségek kihasználása.

    A verseny munkaerő-piaci változásokat is hoz. A nagy digitális adatbázisok kezelése és elemzése különleges szakértelmet kíván, ami nem áll mindenütt korlátlan mennyiségben rendelkezésre. A keresleti előrejelzések egyes országokban tíz-, sőt százezres nagyságrendű munkaerőhiányt jósolnak. Ne feledjük, nem csak informatikusokról és matematikusokról van szó, hanem olyan üzleti, államigazgatási, egészségügyi és más vezetőkről, akik megértik az adatokban rejlő lehetőségeket és ki is tudják azokat használni. Az utóbbiakból jóval többre van szükség, mint az előbbiekből. Kérdés, hogyan reagálnak ezekre az igényre az oktatási rendszerek.




[1] A hazai internetes kereskedelemről a GKIeNET közöl rendszeresen adatokat, lád pl. (Népszabadság [2011])

[2] Az IDC adatai szerint 4 trillió dollárról van szó, ennyit költenek a vállalatok hardverre, szoftverre, informatikai szolgáltatásokra, saját informatikai személyzetükre, rendszereik működtetésére és menedzsmentjére (http://www.emc.com/digital_universe, 2. o.)

[3] U. o.

 

Post a Comment

You must be logged in to post a comment.