A Qualcomm ma reggel bejelentette, hogy megépíti első mélytanuló szoftverfejlesztő készletét (SDK) a Snapdragon 820 processzorok számára. Az új SDK (a Snapdragon Neural Processing Engine) a Qualcomm Zeroth Machine Intelligence Platformjának tetején fut, és a Snapdragon 820 heterogén számítási képességeinek kihasználására készült.
Mielőtt részletesebben belemerülnénk ebbe a témába, tisztázzuk meg a zavarodottság egy pontját. Mi először jelentették több mint egy éve a Zerothon, amikor a Qualcomm megvitatta a Zeroth felvételét fizikai hardver magként, NPU néven, vagy Neural Processing Unit néven. Úgy hírlik, hogy ezt a magot alapfelszereltségként az összes Snapdragon 820 eszköz tartalmazza. Most már tudjuk, hogy a Qualcomm úgy döntött, hogy nem szállít NPU-t a Snapdragon 820-mal, és a Zeroth márkanév inkább egy szoftveres gépi tanulási platformra utal, mintsem a SoC speciális feldolgozási blokkjára.
A mély tanulás a gépi tanulás részhalmaza, amely, ahogy a neve is mutatja, a számítógép tanításának egyik módszere hogyan valamit tenni, nem pedig programozni nak nek csinálj valamit. A korai ideghálózatok meglehetősen sekélyek voltak, bemeneti réteggel, néhány rejtett réteggel, majd kimeneti réteggel. A mély tanulási hálózat, amint a neve is mutatja, sokkal több réteget használ a változók közötti kapcsolat kiszámításához.
A neurális hálózatokat széles körben használják a számítógépes látásban és több évtizede alkalmazzák ezen a területen, de az olyan területeken végzett kutatások nagy részét, mint az önvezető autók, a mély tanulás fejlődése tette lehetővé. A hagyományos ideghálózatnak egyetlen rejtett rétege lehet, ahol a „súlyokat” az arcfelismerés, a beszédértelmezés vagy a kézírás elemzése céljából számítják ki:
Egy ilyen példában az adatok betáplálásra kerülnek, a hálózat súlyozza (az edzések során megtanult paramétereknek megfelelően), majd megjeleníti a kimenetet. A mély tanulási hálózat ezzel szemben inkább így néz ki:
A mély tanulási hálózatok rejtettebb rétegekkel rendelkeznek, mint a hagyományos idegi hálózatok
A Qualcomm például jelenleg két technológiára használja a Zeroth-ot: a Snapdragon Scene Detect, amely objektumokat, elemeket és embereket osztályoz egy vizuális jelenetben, és a Snapdragon Smart Protect, amely gépi tanulással gyanús viselkedést keres, amely annak a jele lehet, hogy okostelefon sérült.
Snapdragon Smart Protect
Ha nehezen tudja felfogni, mennyire hasznos a mély tanulás, vegye figyelembe a következő példát. Képzelje el, hogy az utcán jár, és látja, hogy egy ház nyitva áll a bejárati ajtóval. Hogy ezt hogyan értelmezi, nagyon sok további adatponttól függ: Van-e nyilvánvalóan be- vagy kirakott jármű? Vannak-e emberek a bejáratnál vagy annak közelében? Kiabálást, nevetést vagy zenét hallasz? Lámpák világítanak a ház belsejében, és ha vannak, láthatsz valamit? 5 óra, 12 óra vagy 23:30 van?
Ezekre a kérdésekre adott válaszok határozzák meg, hogyan reagálsz a helyzetre. Ha vannak emberek, akik be-és kiköltöznek a házból, és hangos zene szól, ez valószínűleg egy buli. Ha senki sem látható, és a ház sötét, akkor lehet, hogy betörésnek van tanúja - vagy valaki egyszerűen elfelejtette megfelelően kinyitni az ajtót. 'Súlyokat' rendelünk ezekhez a valószínűségekhez, és ennek megfelelően értékeljük a helyzetet - és ezt öntudatlanul és rendkívüli sebességgel tesszük egy hagyományos számítógéphez képest. A hagyományos ideghálózatok megpróbálják lemásolni ezt a folyamatot. A mély tanulási hálózatok kibővítik a neurális hálózatok alapelveit, de rejtettebb rétegeket adnak hozzá, és ennek eredményeként képesek bonyolultabb forgatókönyvek értékelésére és kifinomultabb meghatározásokra.
A Qualcomm szerint a Snapdragon Neural Processing Engine a következő tulajdonságokat tartalmazza:
A Qualcommot egyértelműen érdekli az olyan feltörekvő piacok, mint az önvezető járművek, ahogy az Nvidia is. A mély tanulás „intelligenciájának” azonban mély következményei vannak a technológiával való interakciónkra nézve, és forradalomhoz vezethet az ember és a számítógép interakciójában.
Az egyik különbség a számítógépek között a Star Trek: A következő generáció és a saját technológiánk az Star Trek (és rengeteg más sci-fi) egy számítógépet ábrázol, amely beszélgetés közben egyaránt folyékony és képes kevésbé tökéletesen világos állítások értelmezésére. A sokszorosító tudja, hogy amikor Picard kapitány azt mondja: „Tea, Earl Gray, forró”, azt akarja, hogy a teáját meghatározott hőmérsékleten tálalják, és nem kéri, hogy magyarázza el, mit jelent a „forró”. (Van egy érdekes StackExchange cérna a szintaxison és a beszéden Star Trek, az igazán idétlen.)
A mély tanulási hálózatok segíthetnek olyan számítógépes programok felépítésében, amelyek sokkal jobban képesek elemezni az emberi beszédet, mint a jelenlegi szoftverek. Gyanítom, hogy ez annak a munkának is az alapja, hogy a vállalatok, mint például a Facebook és a Microsoft botkutatással foglalkoznak Tay múlt hónapi merénylete az ilyen kutatások veszélyeit is mutatja.
A Zeroth Machine Platform és a Snapdragon Neural Processing Engine segítségével a Qualcomm kalapba dobja a gyűrűt, és a fogadási fejlesztők a Snapdragon 820 processzorának, DSP-jének és GPU-jának képességeit felhasználva heterogén hálózatokat építenek, amelyek kihasználják mindhárom feldolgozási blokk képességeit . Az SDK várhatóan az idei év utolsó felében lesz elérhető.