Erő, jog, etika

Pár napja találkoztam egy könyvben (majd még írok róla) az alábbi tanulságos történettel.

Az időpont 2011, a helyszín a Hewlett-Packard, vagyis korunk egyik legnagyobb technológiai cége, legendás alapítókkal, sok évtizedes tapasztalattal, izgalmas fejlődési fázisokkal, üzleti iskolák tananyagába illő igazgatótanácsi csatározásokkal, felvásárlásokkal, vezetőcserékkel, stratégiai fordulatokkal. A két főszereplő Gitali Halder és Anindya Dey, a vállalat tudósai. A jelzett évben adatbányászati eszközökkel vizsgálták meg az alkalmazottak távozása előrejelezhetőségének kérdését.

Módszertani szempontból klasszikus eljárásról van szó. A HP-nek természetesen rengeteg adata van minden alkalmazottjáról: mikor lépett be, hány éves, mi a végzettsége, mennyi a fizetése és a jutalma, hányszor kapott emelést, előléptetést, továbbképzést stb. Nyilván azt is feljegyzik, hogy ki és mikor hagyta el a céget valamilyen okból. Ezek az adatok tehát ott rejtőzködnek a számítógépek tárolóin.

A távozás, a rotáció nyilván kényes kérdés egy ilyen szervezetnél. Ha egy jól felkészült, fontos munkát végző, értékes tudással, hasznos információkkal bíró ember elmegy, az akár komoly anyagi veszteségekkel is járhat.

Kérdés tehát, hogy mit lehet tenni az ilyen távozások megelőzése érdekében. 2011-ben a HP-nek több mint 330.000 alkalmazottja volt – nyilván nem lehet mindegyik mellé egy közlekedési rendőrt állítani. Elsősorban azokkal kellene foglalkozni, akiknél a távozás valószínűsége nagy.

De kik ezek?

Nos, a két tudós pont erre kereste a választ a maguk statisztikai modelljével. Összeszedték az alkalmazottakkal kapcsolatos fenti adatokat, az így összeállított adatbázisra ráuszították a statisztikai elemző programjaikat, majd az érintettek nevéhez „távozási indexet” (flight risk) csatoltak, vagyis egy mutatót, ami a távozás valószínűségét jelzi. A programok a korábbi tapasztalatokból tanultak: feltárták, hogy a személyes információk adatok, események) és a távozás között milyen összefüggések mutatkoznak, majd az így kialakított (intelligens gépi tanulásra épülő) modellt előrejelzésre használták, mert az index tulajdonképpen nem más, mint egy előrejelzés, jövendölés: figyelem, ennél az alkalmazottnál nagy a távozás valószínűsége, annál a másiknál pedig kicsi.

Az elemzés nyomán érdekes dolgok derültek ki: a modell például jelezte, hogy azoknál, akik arányos fizetésemelés nélkül kaptak előléptetést, nő a távozás valószínűsége. Fontos tanulság. Tehát: nagy és összetett adatbázis, adatbányászat (predictive analytics), gépi tanulás, előrejelzési modell, indexek, végül akció, beavatkozás a jövendölések alapján – ez az események logikája.

Ne feledjük azt se, hogy a HP az adatelemzés egyik zászlóshajója, csak Bangalore-ban több mint másfélezer emberük dolgozik ezen a területen; logikus, hogy saját magukon is kipróbálják, amit tudnak. A vállalat egyes részlegeinél a rotáció a 20%-ot is elérte. Amikor a modell elkészült, kiválasztották az egyik ilyet, a számítógép kiszámolta az indexeket, majd megkezdődtek a megtartó akciók. Az eredmény pozitív: a távozások aránya csökkent, és az ebből származó haszon  némi utánajárással akár számszerűsíthető is.

A példa tehát jól mutatja a „predictive analytics” erejét és potenciális hasznát. A történet azonban nem csak ebből a szempontból tanulságos. A HP-nél a modellt és az indexeket nagyon óvatosan és bizalmasan kezelték, nyilván nem véletlenül. A gazdasági haszon mellett ugyanis akad itt egy sor más kérdés is. Mit szólna hozzá e bejegyzés nyájas olvasója, ha megtudná: a neve mellett a személyzeti nyilvántartásokban egy „távozási index” is szerepel? Szeretné-e megtudni, hogy mennyi az, és mi a mögötte álló modell logikája? Ki férhet hozzá ehhez az indexhez? Mire lehet azt felhasználni? Milyen indexeket lehet még készíteni? …És így tovább.

Azt szeretném jelezni, hogy a példa rávilágít az adatbányászat, az előrejelző analitika súlyos és izgalmas etikai problémáira is. Lapos közhely: mindenütt rengeteg adat gyűlik rólunk. A gyarapodó adatbázisok modern technológiával, kifinomult eljárásokkal, öntanuló modellekkel kombinálva kiváló lehetőséget adnak mindenféle előrejelzésekre, valószínűségi számításokra vásárlási szokásainkról, viselkedésünkről, egészségünkről, szándékainkról, politikai nézeteinkről stb. Ki, mikor, mit fog vásárolni? Melyik alkalmazottunk fog legközelebb távozni? Mit nézünk meg legközelebb a moziban? A potenciális bűnözők közé tartozunk-e? Összetörjük-e a kocsinkat a biztosítónk bánatára? Visszafizetjük a felvett hitelt? Elmegyünk nyaralni augusztusban? Ki fog a közeli jövőben családot alapítani? Kire fogunk szavazni a választásokon?

Az előrejelző modellek felhasználására nagyon erős a késztetés: számtalan, az előbbihez hasonló példa bizonyítja az erejüket. Még egy halovány előrejelzés is jobb lehet a puszta találgatásnál. Pszichológusok és szociológusok szerint életünket szokások, beégett minták irányítják; sokszor magunk sem vagyunk ennek tudatában, agyafúrt elemzők azonban megtalálhatják ezeket a velünk kapcsolatos adatbázisokban, digitális nyomainkban. A módszertan, a technika rohamléptekkel fejlődik – de mi a helyzet a joggal és az etikával?   

Hozzászólás írása

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*