10 kérdés a nemzet első fő adatkutatójához

10 kérdés a nemzet első fő adatkutatójához

Mindössze nyolc év telt el azóta, hogy DJ Patil – akkoriban a LinkedIn adat- és elemzője – megalkotta az „adattudós” kifejezést, de ez a szakma máris az egyik legnépszerűbb az országban .

Patil régóta foglalkozik az adatiparral. A Marylandi Egyetem doktoranduszaként és későbbi oktatójaként a NOAA nyílt adatkészleteit használta a numerikus időjárás-előrejelzés javítására. Majdnem két évig az eBay, Inc. stratégiai, elemzési és termékekért felelős igazgatója volt; közel három évet töltött a LinkedInnél; és meg van írva könyveket az adatkultúráról és az épületadat-termékekről. Tavaly a Fehér Ház kinyilvánította, hogy támogatja az adattudományt kinevezése Patil az Egyesült Államok első adattudományi főkutatója és a Tudományos és Technológiai Politikai Hivatal adatpolitikai technológiai vezérigazgató-helyettese.



Miért döntött úgy a kormány, hogy egy vezető adattudósra van szüksége, és mit jelent ez a pozíció? A Science Friday arról beszélgetett Patil-lal, hogy mi keltette fel az érdeklődést az adatok iránt, mit jelent „adattudósnak” lenni, és hogyan látja az iparág fejlődését.

DJ Patil. © 2012 Eric Millette, Minden jog fenntartva

Hogyan kezdett el először dolgozni az adatokkal?
Általában véve szívom a matekot. Alig mentem át a matematika óráimat a középiskolában, és nagyon szerencsés voltam, hogy egy De Anza College nevű főiskolára jártam közvetlenül [Kaliforniában]. A legjobb döntésem az volt, hogy ugyanabba az órába járok, mint a barátnőmmel [nevet], és ő kalkulált, ezért elmentem és elvégeztem ezt a kalkulusórát. Én pedig azt mondtam: „Szent szar, nem tudok semmit; ez rendkívül kínos.” Valóban volt ez a pillanat, amikor elhatároztam, hogy valóban megtanulom, és lenyűgözöm a barátnőmet. Nagyon gyorsan felkaptam, és beleszerettem a matematikába.

Innen átkerültem az UCSD-re, ahol elkezdtem dolgozni a káoszelmélet sok adattal kapcsolatos vonatkozásán. Innen a Marylandi Egyetemre mentem, a káoszelmélet otthonára, és az egyik tanácsadóm Jim [James] Yorke volt, aki megalkotta a „kifejezést” káoszelmélet .’

Elkezdtünk dolgozni az időjárás előrejelzésen . Valóban rádöbbentünk, hogy az időjárás nem volt olyan kaotikus, mint azt az emberek korábban hitték. Ezt úgy csináltuk, hogy minden este 21 óra körül bementem, titokban átvettem a matek tanszék minden számítógépét, majd letöltöttem az Országos Meteorológiai Szolgálattól ezeket az adatokat, szétszedtem, összeraktam. különböző módokon – majd reggel 8 óra előtt indulni, amikor bárki bejött. És ez lehetővé tette számunkra, hogy megtaláljuk ezeket az igazán érdekes mintákat. Ez egy „a-ha!” pillanat volt számomra: Ó, hú, igazán hihetetlen dolgokat tudsz csinálni, ha képes vagy adatgyűjtésre. Miután ezt megtettük, ez lett az időjárás-előrejelzés egyik fő technikája.

Aztán segítettél közösen megalkotni a „kifejezést” adattudós (Jeff Hammerbacherrel, a Facebook akkori adatkezelőjével), igaz?
Igen. Ez jó és rossz. Azt hiszem, itt van ez az érdekes kérdés: Nos, mi az az adattudós? Ez nem csak egy tudós? A tudósok nem csak adatokat használnak? Tehát mit is jelent ez a kifejezés?

Az egyik szerzőtársam, Hilary Mason szerepelt a műsorban, és amivel viccelődünk, és amiről együtt írtunk, az az, hogy az adatkutatók munkaköri leírásában az első számú dolog az, hogy amorf. Nincs konkrét dolog, amit csinálsz; a munka mintegy megtestesíti ezeket a különféle dolgokat. Bármit megtesz egy probléma megoldásához.

Ha önvezető autót épít, kik azok, akik önvezető autót építenek? Adattudósok – legyenek azok termékmenedzserek, tervezők, bármik is legyenek. Ők azok az emberek, akik ezeket a technikákat és ötleteket használják a közgazdaságtanból, a statisztikából, a gépi tanulásból, a mesterséges intelligenciából, az összes ilyen tudományágból, hogy konkrétan működőképessé tegyék, hogy az autót úgy vezesse, hogy Ön biztonságban legyen és mások is biztonságban vannak.

A legjobb adattudósokban egy dolog közös: a hihetetlen kíváncsiság.

Hogyan változott az adatipar, és szerinted miért lett népszerű adattudósnak lenni?
Úgy gondolom, hogy az adattudományi szempont most igazán felvirágzott az egyik, hogy az emberek sokkal könnyebben tudnak adatokat gyűjteni, mint korábban; nem sok erőfeszítés megcsinálni. A második az, hogy most, hogy az emberek elegendő mennyiségű adatot tudnak gyűjteni, felmerül a kérdés: oké, akkor mit tegyünk vele? És WHO tényleg ezt fogja csinálni?

Mit gondol, hogyan jött rá a Fehér Ház, hogy szüksége van egy vezető adattudósra?
Nos, az egyik dolog, amit az emberek nem mindig vettek igazán figyelembe, az az, hogy ez az elnök az első naptól kezdve mennyire összpontosít az adatokra. Még ha vissza is lép a kampányában, ő nagyon arra koncentrál, hogy az adatokat újszerű módon használja fel a nyilvánosság bevonására. Amikor bekerült az adminisztrációba, mindenre összpontosított, kezdve attól, hogy a betegek hogyan férhessenek hozzá jobban az adatokhoz, egészen addig, hogy miként biztosítsuk, hogy az adatokat az átláthatóság érdekében használjuk fel – [azaz] a rendelkezésre álló adatok mennyiségének növelésére. létrehoztunk data.gov , ahol csaknem 200 000 olyan adatkészlet található, amelyek mindenki számára elérhetőek. Hogyan használjuk fel az adatokat a szolgáltatások javítására mindenki számára? Valójában [Obama elnök] igen végrehajtási utasítás hogy alapértelmezés szerint minden kormányzati adat nyílt és géppel olvasható, és hogy a szövetségi kutatási dollár felhasználásával közzétett adatok ingyenesek legyenek, mert ki fizette? Az adófizetők. (Van egy időablak, amikor azt akarjuk, hogy az [egészségügyi] folyóiratok kizárólagos hozzáférést kapjanak, de hosszú távon a nyilvánosságnak nem kellene ezért fizetnie.)

Csakúgy, mint ő volt az első elnök, akinek technológiai igazgatója volt, felismerte, hogy szükség van egy olyan csapatra, amely arra összpontosít, hogyan szabadítsuk fel az adatok erejét, hogy minden egyes amerikai hasznára váljon.

Most több mint egy éve tölti be ezt a pozíciót. Mi az eddigi legbüszkébb eredményed?
Az az eredmény, amelyre eddig a legbüszkébb vagyok, az az, hogy az adattudósok ma már erősen, erősen foglalkoznak ezekkel a problémákkal, és így sok szövetségi ügynökségnek van adatcsapata, vezető adattudósa vagy adatkezelője. Vegyük például a közlekedést. Van egy adatkezelőjük, aki arra összpontosít, hogy a Közlekedési Minisztérium hogyan gondolkodik erről újszerű módon? Az Országos Egészségügyi Intézetben van egy személy, aki az adatokkal kapcsolatos új gondolkodásmódokra összpontosít. Így tesz az Egyesült Államok Mezőgazdasági Minisztériuma is. Még az USAID is. Tehát mindenki az adatokra, mint erőtöbbszörözőkre gondol.

'A legjobb adattudósokban egy dolog közös: a hihetetlen kíváncsiság.'

Hol látja az adatipar jövőjét?
Számomra az a legizgalmasabb a jövővel kapcsolatban, hogy az adatok hogyan lesznek minden egyes beszélgetés része, és ennek eredményeként gyorsabban, minőségibb döntéseket hozunk. Ami fog történni, az az, hogy nem csak 10 évente egyszer nézzük meg az adatokat, hogy értékeljünk valamit, hanem nagyon rendszeresen, és sokkal valósabb időben korrigáljuk az adatokat. Ez pedig lehetővé teszi számunkra, hogy a kormányzat jobb szolgáltatásokat nyújtson, és mozgékonyabbak legyünk.

Mit tanácsolsz annak, aki adattudós szeretne lenni?
Soha nincs jobb időpont a kezdéshez. Csak menj oda data.gov . Közel 200 000 adatkészlet létezik, ahol ha csak elkezdi letölteni őket, játsszon velük. Az egyik legmenőbb dolog, amit most tehet, az az adatokkal való munka a helyi város szintjén. Van egy A Polgári Hackelés Nemzeti Napja [2016. június 4-én], és ami ezen a napon fog történni az egész országban, az emberek hackathont tartanak a helyi városukban, és helyi szinten dolgoznak majd az adatokon. Ezeket az adatokat helyi közösségeik fejlesztésére használhatják fel.

Ön szerint melyek az adatipar előtt álló legnagyobb kihívások?
Valami, amit nagyon fontosnak tartok, amit kértem, az az, hogy minden egyes képzési programnak – legyen az egyetemi, posztgraduális vagy online kurzusok az adattudományban – az adatetikának nem szabadon választható tantárgyként kell szerepelnie, hanem a működésünk központi tételeként. dolgokat. Amikor adatokkal dolgozunk, hihetetlen lehetőségei vannak arra, hogy nagyszerű dolgokat vigyen véghez velük, és megvan a képessége olyasmire is, ami nagyon problémás lehet. Látjuk, hogy az emberek hol használták fel az adatokat olyan módon, amiről azt gondoljuk, hogy alapvetően nem megfelelő. Az emberek elkezdtek beszélni erről, és arról, hogy mit kellene tennünk ellene. Azt hiszem, sokkal erősebb beszélgetést kell folytatnunk. Az adatvédelmi összetevők ugyanolyan fontosak.

Azt is gondolom, hogy sokkal több embert kell megtanítanunk az adatok használatára. Az „adatok használata” azt jelenti, hogyan kell egy grafikont az alapszinten olvasni, egészen a nagyon kifinomult dolgokig. Ha az embereket a mindennapi életük során adatokkal látják el, az emberek jobban kézben tudják tartani sorsukat. Ez olyan egyszerű is lehetne, mint: Hogyan válassz főiskolát? Ezért dolgozunk olyan keményen az Oktatási Minisztériummal, hogy megépítsük a College Scorecard , amely újszerű módon átláthatóságot ad az embereknek.

Kap valaha visszajelzést a szerepében?
A legnagyobb visszahatás szerintem az, hogy hogyan kezeljük ennek az adatvédelmi vonatkozását, és hogyan gondoljunk egyszerre a kiberbiztonságra? Az ok, amiért nem hiszem, hogy a visszhang a helyes szó, az az, hogy mindenki felismeri az értéket itt, tehát ez nem egy „de” hanem egy „és”. Hogyan használjuk fel az adatokat és őrizzük meg a magánéletet és biztosítják a kiberbiztonságot? Senkit sem kaptam, aki dühös lenne a problémák miatt, amelyeken dolgozunk; Szerintem az a probléma, hogy miért nem dolgozol? hogy ? Talán ez a legnagyobb visszhang.

Tehát hogyan kezeli az adatvédelemmel és a kiberbiztonsággal kapcsolatos aggályokat?
nagyon rájuk koncentrálok. Valójában mindenbe bele vannak építve, amit tettünk. Például a Precíziós Orvostudományi Kezdeményezés , kiadtuk magánélet és bizalom elveit Úgy gondoljuk, hogy ez lesz az alkalmazás a jövőben bárki számára, aki ilyen jellegű orvosbiológiai kutatást végez. Aztán közzétettük a biztonsági keretvázlat tervezetét az ilyen típusú kutatásokhoz, és hamarosan véglegesítjük. Tehát gyakoroljuk, amit prédikálunk, mivel az adatetika minden egyes tevékenységünk hihetetlen összetevője.

Ezt a cikket a hely és az egyértelműség kedvéért szerkesztettük.