Egy kutatás visszhangja és tanulságai, amely megingatta az egyesült államokbeli médiában az amerikai álom képét

Timár András
2015. május 26.

 

A közgazdasági elemzések jövője; Big Data a társadalom- és gazdaságkutatás, valamint a kormányzati gazdaságpolitika együttes szolgálatában

Az adatgyűjtő és/vagy elemző kormányhivatalok, valamint közszolgálati szervezetek – és az általuk biztosított forrásadatok révén közvetve a gazdasági és társadalmi folyamatokat vizsgáló szakemberek, elemzők, befektetők és közgazdászok széles köre – mindinkább a versenyszférában felmerülő kihívásokhoz hasonló kérdésekkel szembesülnek, ugyanakkor a terület specialitásaiból fakadóan gyakran születnek olyan egyedi kezdeményezések és gyakorlati kutatási példák, amelyeket mintaként használhat fel a vállalati világ is. A neves és többszörös díjnyertes amerikai elemzőblog, a FiveThirtyEight vezető közgazdasági cikkírójának, Ben Casselmannek gondolatai nyomán érdemes alaposabban körüljárni a blogbejegyzést inspiráló – Magyarországon alig ismert, míg az Egyesült Államokban mind szakmai berkekben, mind a médiában nagy visszhangot kiváltó -, a társadalmi egyenlőtlenség és jövedelmi mobilitás jelenségét újszerű módon megközelítő vizsgálatot, amely egyrészt a kutatás módszertanában és eredményében, másrészt a hivatalos statisztikai szolgálatot  támogató szervezetek jövőjét illetően a laikus olvasó számára is rendkívül érdekes tanulságokkal szolgálhat.

A legtöbb országhoz hasonlóan az Egyesült Államokban is fontos döntésformáló szerepet töltenek be a különböző gazdasági statisztikai mutatók, amelyekről elmondható, hogy jól megalapozott elemzési módszertanuk jelentős múltra tekint vissza, vonatkozzanak ezek a statisztikák például a fogyasztói árak, a foglalkoztatás vagy a vásárlóerő alakulására. Legyenek azonban bármennyire is beváltak és megalapozzatok ezek a statisztikai módszertanok, egy nagyon jelentős gyengeségüket nem tudták eddig meghaladni: legtöbbször különböző formájú megkérdezéseken, önbevallás alapú kérdőíveken, illetve adatgyűjtéseken alapulnak, amelyek ugyan legtöbbször reprezentatív mintát jelentenek, azonban jellegüknél fogva magukban hordozzák az adatok részlegességében rejlő kockázatokat is. Mindehhez hozzátéve a megkérdezettek folyamatosan romló válaszadósági hajlandóságát, már az amerikai kormányzati elemzők számára sem marad más lehetőség, mint hogy az adatok minőségének és megbízhatóságának megőrzése érdekében egyre inkább újszerű megoldásokat keressenek. Sokszor az az ellentmondásos helyzet áll elő, hogy bár nagy mennyiségű és részletezettségű adat áll rendelkezésre különböző amerikai kormányzati és közszolgálati szervek nyilvántartásaiban, a legtöbb, az amerikai kormányzati döntéshozók által  is kiemelten kezelt gazdasági mutató továbbra is relatív kis elemszámú mintát használó kérdőíves felmérések eredményeként áll elő, a különféle jogi és bürokratikus korlátozás következtében, valamint az adatbázisok széttagoltsága és az eltérő adatstruktúra okozta gyakorlati nehézségek következményeként.

A közelmúlt egyik úttörő és eredményeivel nagy vihart kavaró kutatása jól példázza az újszerű megközelítésekben rejlő lehetőségeket. Sokakat foglalkoztató kényes kérdés a társadalmi egyenlőtlenség és mobilitás témája, amelyre az Egyesült Államokban például minden évben nagy merítésű, szám szerint 75.000 fős megkérdezéses statisztika irányul.

Két közgazdász, Raj Chetty és Emanuel Saez lehetőséget kapott arra, hogy az amerikai adóhivatal (US IRS – Internal Revenue Service) részletes adatait felhasználva milliónyi adóbevalláshoz hozzáférve vizsgálja meg a gazdasági egyenlőtlenségre vonatkozó hipotéziseit. Mindez egy nagyon egyedi helyzetet jelentett, mivel legtöbb esetben kutatók közvetlenül nem dolgozhatnak „éles” adatokkal, így a két közgazdásznak lényegében az IRS alkalmazottjaként kellett dolgoznia az elemzés ideje során. A közvetlen hozzáférés lehetővé tette, hogy összekapcsolják a szülők és gyerekeik adatait, a kutatás középpontjába helyezve a generációk közötti jövedelmi mobilitás jelenségét. A kutatás módszertana leegyszerűsítve a következő volt: a vizsgált minta alapját 10 millió, 1980 és 1982 között született gyerek képezte, akiket az elmúlt évtizedekben végigkövetve hasonlították össze a családok jövedelmének nagyságát és alakulását. A jövedelem alapján kvintiliseket alakítottak ki (a jövedelmi ötödök alapján történő elemzés egyébként elterjedt eszköze az életszínvonal vizsgálatának), illetve beépítették a földrajzi dimenziót is, 731 darab területi egységre bontva az Egyesült Államok területét. Az eredmények egyszerűsítése és könnyebb értelmezhetősége érdekében kiszámították, hogy egy, az 1990-es években a legalsó kvintilisbe, tehát lényegében jövedelmi helyzetét tekintve a népesség legrosszabb 20%-ába tartozó családban felnövő gyerek milyen valószínűséggel fog 30 éves korára a legfelső jövedelmi ötödbe kerülni.

A kutatás két nagyon jelentős következtetést hozott:

A jövedelmi mobilitás, vagyis gyakorlatilag a családok gazdasági kitörésének esélye nagy mértékben függ a földrajzi elhelyezkedéstől. A fent leírt felfelé megvalósuló társadalmi mozgás amerikai országos átlaga 7,5% volt, azonban mindez földrajzilag erősen kiegyenlítetlenül valósult csak meg: például San Joséban (California) 12,9% az esélye a jövedelmi ugrásnak, míg Charlotte-ban (North Carolina) mindössze 4,4% valószínűséggel tud valaki felfelé lépni a társadalmi ranglétrán. A részletek iránt érdeklődő olvasók a The New York Times interaktív infografikáján találhatnak további szemléletes adatokat.

A második, az előzetes várakozásoknak talán még inkább ellentmondó eredmény a társadalmi-gazdasági mobilitás időbeli alakulására vonatkozott. Az adatok elemzése során a kutatók arra a következtetésre jutottak, hogy a társadalmi mobilitás mértéke az elmúlt néhány évtizedben az Egyesült Államokban relatív állandó maradt, szemben azzal az eddigi elterjedt feltételezéssel, amely csökkenő trendet tulajdonított a jelenségnek. Az alsó jövedelmi ötödből a legfelsőbe történő ugrás például egy 1971-ben született gyerek számára 8,4% valószínűséggel, míg ugyanez egy 1986-ban született gyerek számára 9,0% valószínűséggel volt megvalósítható. Annak ellenére, hogy az adatok csak a korrelációk azonosítását segítik és nem teszik lehetővé az oksági viszonyok felismerését, társadalomkutatók véleménye szerint számos további elemzéseket lehet a meglévő adatokra alapozni.

Már említésre került, hogy jelenleg még nagyon ritkán kaphatnak kutatók hasonlóan széleskörű lehetőséget a részletes adatok elemzésére. A legfontosabb érv az adóhatóság számára a hozzáférés megadása mellett az volt, hogy ezáltal valós képet kaphatnak arról, hogy az adózási elvek, a helyi adók mértéke és típusa, valamint a kapcsolódó irányelvek hogyan befolyásolják a társadalmi mobilitást, a hivatal gyakorlatban is visszamérheti ezáltal a korábbi eltérő lokális gyakorlatok hatásait. Az elemzések minőségének javulása nem egyedül az adatmennyiség növekedésének tudható be. A közigazgatási adminisztrációban meglévő adatbázisok összekapcsolása egy rendkívül jól használható eszközt jelent az eddig nehezen megragadható, hosszú távú kormányzati intézkedések hatásának értékelésére. Az ilyenfajta eredményalapú döntéshozatal, úgy tűnik, hogy egyre elfogadottabb és
vonzóbb megközelítést jelent az USA-ban, akár az eltérő politikai oldalon állókat is közös platformra hozva a kérdésben.

Chetty és Saez kutatási módszertana és eredményei kapcsán érdemes elgondolkodni azon, hogyan használhatóak fel a nagy mennyiségű, nagy változatosságú, gyorsan változó és új feldolgozási formákat igénylő megoldások, tehát – a Gartner definíciója alapján – a Big Data „módszertana” a gazdaság-  és társadalomkutatásban