Algoritmus minden fa azonosítására

Algoritmus minden fa azonosítására

Faágak egy utcán Dél-Kaliforniában. Hitel: Shutterstock

Állj meg egy pillanatra, és nézz ki az ablakon. Valószínűleg látni fog egy fát valahol kint. Ismered a fajtáját? Milyen gyakran kell öntözni? Egészséges?

Pietro Perona olyan világot képzel el, ahol ránézhet egy fára – vagy számtalan más tárgyra –, és egy okostelefon segítségével azonnali szakértelmet szerezhet róla. Míg Ön Lehet, hogy nem tud semmit az elemről, „valaki tudni fogja, mi az” – mondja Perona, az Allen E. Puckett elektromérnöki professzor, a Kaliforniai Műszaki Egyetemen (Caltech). 'És ha valaki tudja, [az Ön] iPhone-jának is tudnia kell.'



Nem azt jelenti, hogy csak megkérdezi a Google-t vagy a Sirit. Inkább lefényképezné az objektumot – például a fát –, és egy alkalmazásban vagy webhelyen használt algoritmus képes lenne felismerni, ha összehasonlítja a képét a különféle fafajokról gyűjtött adatokkal. Perona azt képzeli, hogy ez a fajta algoritmus milliónyi más megfigyelhető dolognál működik, a növényektől és állatoktól kezdve a geológiai képződményekig – akár különféle egészséggel kapcsolatos tüneteken is, mint például a bőrkiütések.

Perona a számítógépes látást kutatja, és azt kutatja, hogyan lehet „reprodukálni az emberi vizuális rendszer képességét egy gépben” – mondja. Az elmúlt néhány évben különösen érdekelte a számítógépek képzése a finom szemcsés vizuális kategorizálás elvégzésére, ami az objektumok nagyon specifikus azonosításának képessége, például egy fa a fajukig, vagy egy épület építészeti stílusa alapján. Egyes cégek már használnak erre alkalmas technológiákat – a Facebook szoftvere például képes felismerni a barátaid arcát a fényképeken.

2009-ben a Perona elkezdte vizsgálni a gépi tanulás alkalmazásának ötletét, hogy igény szerinti szakértelmet biztosítson a madárfajokról. Ez volt az első projekt a Cornell Egyetem számítástechnika professzorával, Serge Belongie-val folytatott folyamatos együttműködésben Visipedia , amely lényegében egy vizuális enciklopédia, amely humán szakértőktől tanulja meg a tárgyak osztályozását. Laboratóriumaik madárszakértőkkel együttműködve több ezer internetes képet címkéztek fel madarakról az ország minden tájáról, megkülönböztetve a csőrüket, szemüket és egyéb morfológiájukat. Ezután ezeket az adatokat betáplálták az algoritmusukba, ezáltal „megtanították”, hogyan lehet azonosítani a madarakat a megfigyelhető tulajdonságaik alapján.

A számítógépes vizuális algoritmusok „erős tanulási összetevőkkel rendelkeznek, így egy nagyon általános szoftvert készíthet, amely képes tanulni a példából” – mondja Perona.

Az eredményül kapott madáralgoritmus eddig több mint 550 madárfajt képes azonosítani Észak-Amerikában, mondja Perona, és nemrégiben alkalmazták az ún. Kis sólyom , amely lehetővé teszi a felhasználók számára, hogy feltöltsenek egy madarat, vagy készítsenek róla fényképet, hogy megismerjék annak faját.

Következő Visipedia projektjében Perona az algoritmust a fákra alkalmazza, miután a Caltech környéki körülményei ihlették. „Néhányszor aggódtam a pasadenai fák jövője miatt, mert Kalifornia korlátozta az öntözést, és láttam, hogy sok fa elpusztul” – mondja Perona. Úgy gondolta, hogy az algoritmus jobb utcai fák leltárt biztosíthat, amelyre a köztisztviselők támaszkodhatnának a városi erdők gondozására vonatkozó stratégiáik fejlesztésére.

Szerencsére a műholdas képszolgáltatások, mint például a Google Maps, rendszeresen frissített és nyilvánosan elérhető képeket biztosítanak az utcai fákról olyan városi területeken, mint Pasadena. Perona önkénteseket toborzott, hogy a Pasadena környékén készült képeken címkézzék fel a fákat nem fa objektumokból, majd a város által végzett korábbi faleltárból származó fajinformációkat használta fel az algoritmus azonosítási készségeinek képzésére.

Az algoritmus eredményeit a pasadenai fák városi felmérésével összehasonlító koncepcióteszt során az algoritmus a fák körülbelül 80 százalékát helyesen észlelte, és ezek közül az esetek 80 százalékában a megfelelő fajt azonosította, mondja Perona.

A Perona előrejelzése szerint ezt az algoritmust elsősorban a várostervezők használják országszerte. Perona becslése szerint azáltal, hogy nincs szükség emberi földmérőkre, a technológia több tízezer órát, sőt akár több millió dollárt is megtakaríthat. Ezen túlmenően az algoritmus segítségével rendszeresebben is végezhetnénk fás felméréseket, így frissebb információhoz juthatunk az adott területen lévő fák állapotáról.

„A legtöbb város 20-30 évente fog felmérést végezni, de lehetséges, hogy félévente is készíthetünk felmérést” – mondja Perona. „Sokkal pontosabban láthattuk, hogyan fejlődnek az Egyesült Államok városi erdői az idő múlásával, hogyan reagálnak a klímaváltozásra, hogyan reagálnak az egyik megyéből a másikba terjedő vírusra. Inkább olyan lesz, mintha látnánk a tőzsdét, vagy valami olyasmit, ami folyamatosan változik, és inkább frissül, mintsem [megtartja] ezt a nagyon statikus nézőpontot.”