Bió

Orvosbiológiai példa a technológiával foglalkozó fejezet elejére.

_______________________

Az USA rákkutatási programjainak központi intézménye, a National Cancer Institute (NCI) 2011 tavaszán, egy négy hónapig tartó vizsgálat lezárásaként megállapította, hogy a Biomedical Informatics Grid (rövidítve: caBIG) elnevezésű kormányzati projekt túlságosan komplex, az üzleti modellje pedig nem fenntartható. A jelentés[1] megkérdőjelezte a 350 millió dollárt felemésztő, a Center for Biomedical Informatics and Information Technology (CBIIT) által fenntartott program hatékonyságát, irányításának és felügyeletének minőségét. A döntéshozók a caBIG feladatkörét és költségvetését számottevően megnyirbálták, majd az ügynökség 2012-ben National Cancer Informatics Program (NCIP) néven új projekt indítását jelentette be.

A caBIG program kormányzati kezdeményezésre indult el 2004-ben azzal a céllal, hogy az ország rákkutatással foglalkozó központjait (összesen 65 ilyen intézményről, összesen 145 hálózati kapcsolódási pontról volt szó) modern informatikai rendszerrel kösse össze, és a kutatás mellett a tudásmegosztást, tapasztalatcserét és oktatást is támogassa. A kísérleti fázis 2007-ben fejeződött be, ami után a rendszer éles próbája következett.

A projekt nevében szereplő „grid” szó a „grid computing”-ra, vagyis az egymással összekötött, adott esetekben egyetlen nagy gépként dolgozó számítógépek hálózatára utal – az elképzelések szerint ennek kellett biztosítania a résztvevő intézmények közötti információáramláshoz szükséges alap-infrastuktúrát. A caBIG e mellett szoftverekkel és szoftverfejlesztési eszközökkel is foglalkozott, politikákat, szabványokat, fogalomtárakat dolgozott ki az információcsere megkönnyítése érdekében. A fejlesztett szoftvereknek az adatgyűjtést és -elemzést, a kutatási adatok menedzsmentjét, a klinikai tesztek megtervezését és követését, a tesztekben közreműködő páciensek toborzását és felügyeletét, a diagnózisok során készített képfelvételek gyűjtését és katalogizálását, a biológiai minták kezelését (szövetminta-bank) és hasonló tevékenységeket kellett szolgálniuk. A szoftverfejlesztés tekintetében a projekt a nyitottság politikája szerint járt el, az elkészített szoftvereket egy „open source” licencfajta alapján hozzáférhetővé és szabadon felhasználhatóvá tették, azok továbbfejlesztését, testre szabását, sőt, a továbbfejlesztett szoftverek kereskedelmi forgalomba hozását is engedélyezték.

Az ambiciózus elképzelések közé tartozott egy „tanuló egészségügyi rendszer” megépítése, az új ismeretek és eljárások alkalmazói közötti kommunikáció megkönnyítése és felgyorsítása annak érdekében, hogy a hasznosítás minél szakszerűbb és gyorsabb legyen. Fontos cél volt a személyre szabott gyógyászat (personalized medicine) feltételeinek megteremtése is, így például olyan „biomarkerek” keresése, amelyek megmutatják, hogy egy konkrét személynél melyik kezelésfajta lehet hatásos.

A projekt az orvosi diagnózisok elektronizálását (electronic health records), egységes szabványok szerinti tárolását is szorgalmazta. Mivel kényes és értékes adatokról volt szó, természetesen a biztonságra is ügyelni kellett. A számok és a dimenziók impozánsak. A caBig egy egészségügyi alapítvánnyal karöltve  2009-ben elhatározta, hogy egymillió páciens tesztadatait gyűjti össze; a munka elindult, 2010-re elérték a harmincezres létszámot. Egy másik tervben több mint tízezer daganat karakterizálása szerepelt.

Ezekből a példákból jól látható, hogy a caBIG tipikus Big Data projekt volt, az említett 2011-es jelentésből pedig arra következtethetünk, hogy a megtervezése és végrehajtása nagyon nehéz és kockázatos feladat volt. A vizsgálat azt is megállapította, hogy a projekt keretében megépített adatmenedzsment eszközöket és felhőalapú hálózatot kevesebb mint egy tucat kutatóközpont használja. A szakértők kifogásolták, hogy a pozitív szándékok és elismerésre méltó eredmények ellenére a projekt eltért az eredetileg kijelölt iránytól, a létre jött intézmény egy túlkomplikált szofverbirodalomhoz kezdett hasonlítani. Nem voltak világos prioritások, a gazdaságosság szempontja háttérbe szorult. Egyes szoftverek fejlesztése dollármilliókba került, a programokat túlfejlesztették, nehézkes volt a használatuk, nem volt támogatás, hiányos volt a dokumentáció.

A feltárt problémák ellenére az NCI keretében működő Center for Biomedical Informatics and Information Technology (CBIIT) vezetői nyilatkozatban megerősítették, hogy a gyógyászati célú biológiai kutatások területén határozott és egyre növekvő igény mutatkozik informatikai innovációra. A rákkutatás területén az NCIP program küldetési nyilatkozata[2] kutatókból, informatikusokból és fejlesztőkből álló multidiszciplináris közösség kialakítását és támogatását tűzi ki célul a kutatás és a hasznosítás hatékonyságának erősítése érdekében.

Igény tehát van, annak létét nem vitatja senki: minden érintett tisztában van azzal, hogy a biológiai és orvostudományi kutatásokhoz és fejlesztésekhez, okos rendszerek építéséhez egyre nagyobb szükség van korszerű informatikai alkalmazásokra. A megoldásoknak erre az igényre kell reagálniuk, miközben illeszkedniük kell az adott terület elvárásaihoz és adottságaihoz.

Sokféle igényről és adottságról beszélhetünk. Az egyik leglátványosabb trend a „Big Data” trend erősödése a biológiában és az orvostudományban. „A modern biológiában minden hét Big Data hét”[3] – írja John Boyle, a Cambridge közelében működő, orvosbiológiai kutatásokkal foglalkozó Kymab cég[4] vezető munkatársa, egy bioinformatikai tárgyú szakmai rendezvényre utalva.

Kétségtelen tény, hogy a kutatási programok óriási tömegű adatot produkálnak. A genetikai kutatások különösen sok adatot termelnek és fogyasztanak, ami nem csoda, hiszen például az emberi genom három milliárd bázispárból áll. Hozhatunk más példát is: az orvostudomány egyik leglátványosabb területe a diagnosztikai képalkotás (medical imaging), felbecsülni is nehéz, hogy szerte a világban, vagy akár csak egyetlen országban hány felvétel készül különböző digitális eszközökkel, hányat tárolnak különböző helyeken.

Az adatok sokfélék és változatosak: számok, szövegek, képek, filmek, hangok, akár kézírásos feljegyzések stb. érkeznek sokféle formátumban[5].

A kutatásnak és az alkalmazásnak rengeteg szereplője, intézménye van. Bevezető példánkban láthattuk, hogy csak az amerikai NCI több tucat vezető kutatóhelyet fog össze. A szereplők egyszerre versenyeznek és kooperálnak egymással. Az együttműködés, az adatok, tapasztalatok, eredmények közzététele, megosztása természetesen jó hatással van a fejlődésre, de a piaci verseny szerepéről sem szabad megfeledkezni.

A különböző helyeken felhalmozódó adatbázisok új kutatási-fejlesztési lehetőségeket nyitnak meg, lehetővé teszik például fontos szakmai problémák statisztikai-analitikai alapú (adatbányászati jellegű) megközelítését is. Alan Moody, a Torontói Egyetem orvosi képalkotással foglalkozó részlegének vezetője a közelmúltban megjelent cikkében[6] például arra hívja fel a figyelmet, hogy a diagnosztikai céllal készült röntgen, CT, MRI stb. felvételeket többnyire csak egyszer (a diagnózisnál) használják, utána „adattemetőkbe” kerülnek, vagyis további hasznosítás nélkül pihennek valamilyen számítógépes tárolóban. Ez a hatalmas tömegű kép valóságos kutatási kincsesbánya, amiben megfelelő analitikai eszközökkel korrelációkat, trendeket lehetne megvilágítani, például fel lehetne hívni a figyelmet a valamilyen kór kibontakozására utaló korai jelekre. A nagy adattömeg elemzése, visszatérő minták keresése „felerősítené” az egyes képeken mutatkozó apró jeleket. A hasznosításhoz új adatkezelési filozófiára és persze korszerű eszközökre, megoldásokra van szükség a tudományban, és persze felkészült szakemberekre (image-data scientist) – vonja le a következtetést Alan Moody, aki példaként a demenciát említi: ha a problémát sikerülne időben felismerni, többet lehetne tenni a folyamat megállítása vagy lassítása érdekében.

A kutatással és fejlesztéssel foglalkozó intézmények természetesen kiépítették már a saját informatikai rendszereiket, a számukra megfelelőnek tartott gépekkel, operációs rendszerekkel és alkalmazásokkal. A kép ebből a szempontból nagyon tarka: sok informatikai „sziget” létezik és fejlődik egymás mellett. A felhasználók, bár feladataik méretei egyre inkább meghaladják a rendelkezésükre álló saját kapacitásokét, nehezen mondanak le a megszokott eszközeikről, nehézkesen alkalmazkodnak központi fejlesztésű rendszerekhez, inkább azt várják el, hogy azok alkalmazkodjanak hozzájuk[7]. Így állt elő az a helyzet, hogy miközben határozott igény van valamilyen szintű központosításra és egységesítésre, az ilyen célú nagy állami projektek nehezen haladnak előre[8], és a nagy informatikai cégek (pl. IBM, Microsoft) megoldásait sem használják elegen.

A leírtakból látható, hogy az adatrobbanás jelensége jól megfigyelhető a biológiában és az orvostudományban, de példaként használhattunk volna más tudomány- vagy szakterületeket is, például a közgazdaságtudományt[9] vagy a szociológiát[10]. Az előbbieket használtuk annak leírására, hogy milyen igényekre és feltételekre kell felkészülni, milyen feltételekhez kell alkalmazkodni Big Data jellegű, illetve okos rendszerek építését célzó projekteknél: adat- és tudásmegosztás egymással együttműködő és versengő intézmények és személyek között, nagy tömegű, változatos összetételű, sokféle forrásból sokféle formátumban folyamatosan érkező adat keletkeztetésére, fogadása, tárolása, feldolgozása, hozzáférhetővé tétele, döntések támogatása adott helyen és időben, erősen hullámzó kapacitásigény, tarka „informatikai szigetek”, örökölt, egyedi rendszerek mindenfelé, emberi és intézményi alkalmazkodási nehézségek, költségvetési korlátok és gazdaságossági elvárások, jogi és biztonsági követelmények stb.

Lássuk most, hogy milyen megoldásokat kínál a technológiai fejlődés!


[1] Assessment of the Impact of the NCI CaBig. NCI’s Board of Scientific Advisors, 2011. március

[2] http://cbiit.nci.nih.gov/ncip/about-ncip/mission (letöltve: 2014. szeptember 2.)

[3] Boyle 2013, 7. o.

[4] A vállalat egyik befektetője a The Bill and Melinda Gates Foundation.

[5] A biológiában sokkal heterogénebb adatbázisokat használnak, mint a fizikában – állapítja meg Vivien Marx, a Nature folyóirat technológiai szerkesztője. Marx 2013, 257. o.

[6] Moody 2013

[7] Lásd erről a már idézett John Boyle véleményét: Boyle 2013

[8] Lásd például az Egyesült Királyság állami egészségügyi projektjének történetét: Bőgel 2013. 107-116. o.

[9] Lásd pl. Taylor-Schroeder-Meyer 2014

[10] Lásd pl. Tinati 2014

Post a Comment

Hiba az űrlap kitöltése során!

* A csillaggal jelölt mezők kitöltése kötelező

*
*
*
*