Legfontosabb Innováció A Google AI lehetővé teszi a felhasználók számára, hogy a telefonkamerákkal azonnal fordítsanak szöveget 27 nyelven

A Google AI lehetővé teszi a felhasználók számára, hogy a telefonkamerákkal azonnal fordítsanak szöveget 27 nyelven

Milyen Filmet Kell Látni?
 
(Gif: Google)

(Gif: Google)



A mesterséges intelligenciának köszönhetően a külföldre utazás soha nem volt ilyen egyszerű.

A Google Fordító alkalmazás segítségével a felhasználók azonnal lefordíthatják a szöveget. Az alkalmazásban csak irányítsa a fényképezőgépet a lefordítandó szövegre, és látni fogja, hogy élőben válik a kívánt nyelvre, közvetlenül a szeme láttára - nincs szükség internetkapcsolatra vagy mobiltelefon-adatokra. Ez a praktikus szolgáltatás már egy ideje elérhető, de csak hét nyelvvel volt kompatibilis. Most , a gépi tanulásnak köszönhetően a Google frissítette az alkalmazást 27 nyelv azonnali lefordítására.

Tehát legközelebb, amikor Prágában tartózkodik, és nem tud menüt olvasni, visszakaptuk a dolgát - írta Otavio Good, a Google szoftvermérnöke a vállalat kutatásáról Blog .

A Google az AI-t is csak arra használta, hogy felére csökkentse a beszédfelismerési hibáikat.

Mától kezdve az angol, francia, német, olasz, portugál, orosz és spanyol közötti fordítás mellett a következő 20 nyelv is valós időben fordítható: bolgár, katalán, horvát, cseh, dán, holland, filippínó, Finn, magyar, indonéz, litván, norvég, lengyel, román, szlovák, svéd, török ​​és ukrán. És ha úgy dönt, hogy képet készít, ahelyett, hogy a szöveget élőben fordítaná, akkor összesen 37 nyelv támogatott.

Tehát hogyan tudta a Google növelni az elérhető nyelvek számát? Először megszerezték a Word Lens-et, amely korábban egy kibővített valóság fordító alkalmazás volt, és gépi tanulást és konvolúciós neurális hálózatokat használtak az alkalmazás képességeinek javítására. A képfelismerés fejlődése kulcsfontosságú volt.

Öt évvel ezelőtt, ha egy számítógépnek képet adott egy macskáról vagy kutyáról, akkor gondot okozott megmondani, melyik melyik. A konvolúciós ideghálózatoknak köszönhetően a számítógépek nemcsak a macskák és a kutyák között képesek különbséget tenni, hanem akár a különféle kutyafajtákat is képesek felismerni - mondta Mr. Good. Igen, nem csak arra jóak tripsz művészet —Ha idegen menüt fordít vagy aláírja a Google Fordító alkalmazás legújabb verzióját, akkor most mély neurális hálót használ.

Lépésről lépésre

Első , A Fordításnak ki kell gyűrnie a háttér rendetlenségét és meg kell találnia a szöveget. Amikor azonos színű képpontok foltjait találja meg, akkor megállapítja, hogy betűk. És amikor ezek a foltok közel vannak egymáshoz, akkor megérti, hogy folyamatos sort kell olvasni.

Következő, az alkalmazásnak fel kell ismernie, mi az egyes betűk. Itt jön be a mély tanulás.

Konvolúciós ideghálózatot használunk, betűkön és nem betűkön oktatva, hogy megtanulhassa, hogyan néznek ki a különböző betűk - olvasható a blogbejegyzésben.

A kutatóknak nemcsak tiszta megjelenésű, hanem piszkos betűkkel is ki kellett képezniük a szoftvert. A való világban levő leveleket visszatükröződések, kosz, foltok és mindenféle furcsaság rontja - írta Mr. Good. Tehát a levélgenerátorunkat úgy építettük, hogy mindenféle hamis szennyeződést hozzon létre, hogy meggyőzően utánozza a valós világ zaját - hamis tükröződések, hamis foltok, hamis furcsaságok. Néhány

Néhány edzéshez használt piszkos levél. (Fotó: Google)








A harmadik lépés a felismert betűk megkeresése egy szótárban a fordítások megszerzéséhez. A pontosság megkísérléséhez a szótár-keresések hozzávetőlegesek abban az esetben, ha egy S-t rosszul olvassák 5-nek.

Végül, a lefordított szöveg az eredeti tetején jelenik meg, ugyanabban a stílusban.

Megtehetjük, mert már megtaláltuk és elolvastuk a képen látható betűket, így pontosan tudjuk, hol vannak. Megnézhetjük a betűket körülvevő színeket, és ezzel törölhetjük az eredeti betűket. És akkor az eredeti előtérszín használatával a tetejére rajzolhatjuk a fordítást - olvasható a blogbejegyzésben.

Annak érdekében, hogy a lehető leghatékonyabb legyen, és lehetővé tegye ezeknek a lépéseknek az elvégzését valós időben, internet vagy adatkapcsolat nélkül, a Google csapata kifejlesztett egy nagyon kicsi neurális hálót, amelynek felső korlátja volt az általa kezelhető információk sűrűségének. Mivel saját képzési adataikat generálták, fontos volt a megfelelő adatok felvétele, de semmi extra, így az ideghálózat nem használja túl sok információsűrűségét nem fontos dolgokra. Példa lehet arra, hogy miként kell felismernie egy betűt kissé elforgatva, de nem túl sokat.

Végül a felhasználóknak még 20 nyelv marad, de ugyanaz a gyors sebesség.

LÁSD MÉG: A Google AI csapata a gépi tanulás terén elért alacsonyabb szintet adott nekünk

Cikkek, Amelyek Tetszenek :