Čo je Deep Learning AF: ako funguje automatické zaostrovanie spoločnosti Canon na AI?

Spoločnosť Canon urobila veľa hluku zo svojho nového systému Deep Learning AF, ktorý je jadrom najnovšej vlajkovej lode profesionálneho fotoaparátu výrobcu. Znie to neuveriteľne šikovne, ale existuje veľa otázok - čo je to Deep Learning? Kto robí výučbu? Učí sa systém pri streľbe? Je to naozaj umelá inteligencia vo fotoaparáte? Vylepšuje to vlastne automatické zaostrovanie?

Ak ste si prečítali našu recenziu Canon EOS-1D X Mark III, budete vedieť, že odpoveď na poslednú otázku je jednoznačne áno. Pokiaľ ide o odpovede na ďalšie otázky týkajúce sa programu Deep Learning AF, dajte si drink a občerstvenie a čítajte ďalej …

Mechanika automatického zaostrovania fotoaparátu Canon EOS-1D X Mark III je neuveriteľne šikovná a podporuje dva jednotlivé systémy AF. Prvým je optický systém, ktorý sníma 16 snímok za sekundu cez hľadáčik pomocou snímača merania 400 000 pixelov v spojení s dedikovaným procesorom Digic 8 pre 191-bodové automatické zaostrovanie schopné sledovať tvár.

Potom je tu systém Live View, ktorý dokáže snímať 20 snímok za sekundu a zamestnáva všetkých 20,1 milióna pixelov obrazového snímača v kombinácii s novým procesorom Digic X, pre 3 869 bodov Dual Pixel CMOS, ktoré dokážu vykonávať automatické zaostrenie s detekciou celého oka.

Pohon oboch týchto systémov predstavuje hlavnú technológiu Canon EOS iTR AFX - najnovšiu iteráciu jej inteligentného sledovania a rozpoznávania automatického zaostrovania, ktorá debutovala v pôvodnom fotoaparáte EOS-1D X (a následne sa dostal do rodiny 7D Mark II a 5D). V jeho obvodoch je pochovaný algoritmus Deep Learning.

Deep Learning NIE je to isté ako AI

Najskôr je potrebné objasniť, že Deep Learning si nemožno zamieňať s umelou inteligenciou (AI). Systém AI je niečo, čo je v neustálom stave vývoja. Hlboké učenie alebo strojové učenie je podmnožinou umelej inteligencie.

Na rozdiel od skutočnej AI je Deep Learning uzavretý proces. Jedná sa o algoritmus predbežnej montáže, ktorý umožňuje architektúre fotoaparátu v podstate sa učiť, a to oveľa rýchlejšie, ako by ho mohli manuálne naprogramovať ľudskí technici. Po dokončení tohto učenia sa uzamkne a načíta do fotoaparátu.

Od tohto bodu už nie je možné ďalšie učenie; napriek názvu - a Deep Learning je názov technológie, nie popis procesu - kamera sa neučí neustále a nebude sa zlepšovať, čím viac budete snímať (skutočný systém AI by sa skutočne naučil toľko zo svojich zlých návykov, aké by mali vaše dobré návyky!).

„Bolo to naučené,“ vysvetľuje Mike Burnhill, manažér technickej podpory pre Canon Europe. „Dáte to do počítača, vytvorí sa algoritmus, ktorý sa potom načíta do kamery. Takže sa líši od AI - AI je neustále sa učenie; hlboké učenie je v zásade samoúčelné a poskytuje vám konečný výsledok, ktorý sa potom načíta. do kamery. “

Čo si kladie otázku: je toľko fotoaparátov, ktoré kričia o funkciách založených na umelej inteligencii, je kamera skutočne schopná podporovať umelú inteligenciu?

„Výkon fotoaparátu na realizáciu skutočnej AI nie je vo fotoaparáte uskutočniteľný,“ hovorí Burnhill. "Ak to chcete urobiť, existujú telefóny - ale dáta nie sú vo vašom telefóne, ale v Silicon Valley. Tam sa nachádza systém AI. Je to len tak, že sa k nemu pripája vaše telefónne pripojenie - nie je tu, je tam (v oblak), pretože potrebujete server. Mohli by sme urobiť kameru, ale vy by ste so sebou neustále vláčili obrovské lietadlo. “

Ako sa Deep Learning učí?

Algoritmus Deep Learning sa teda učí sám - ale odkiaľ sa vlastne poučí? Zjednodušene povedané, odpoveď je „od najlepšej“.

„Spoločnosť Canon spolupracovala s našimi agentúrami,“ hovorí nám Burnhill. „Získali sme v podstate prístup k celej ich obrazovej databáze športovej fotografie od všetkých hlavných agentúr, spolupracovali sme s našimi veľvyslancami, ktorí sa venujú športu, a tí nám poskytli fotografie rôznych predmetov, čo nám umožnilo naučiť tento systém AF rozpoznávať ľudia v športe. “

Šport je samozrejme cieľovou vyučovacou metódou, pretože Canon EOS-1D X Mark III je predovšetkým športový fotoaparát. Problém je v tom, že či už ide o basketbalistu otočeného smerom od kamery, lyžiar, ktorý nosí ochranné okuliare, alebo jazdca formuly 1 s prilbou, ľuďom v športe sa často zakrývajú tváre - čo znamená, že tradičné automatické zaostrovanie na tvár alebo dokonca na oči nie je k dispozícii “ Nefunguje to a fotoaparát sa namiesto toho zafixuje na čísla ako na hráčskej uniforme.

Vďaka tomu, že algoritmus Deep Learning poskytuje prístup k obrovskej knižnici obrázkov, od všetkého od gymnastov naruby, až po hokejistov, ktorí nosia chrániče a prilby, je schopný naučiť sa a odlíšiť ľudskú podobu v nekonečných rozmanitých situáciách - a je v konečnom dôsledku schopný vykonať túto „detekciu hlavy“, takže aj keď tvár osoby nie je viditeľná, hlava je vždy hlavným zameraním.

„Hlboké učenie je v podstate obrazom, vytvoríte preň sadu pravidiel, pomocou ktorých sa dá učiť, a potom to pôjde a vytvorí si vlastný algoritmus,“ pokračuje Burnhill. „Takže nastavíte parametre toho, ako by ten človek vyzeral, idete„ Tu je človek “, potom analyzuje všetky obrazy ľudí a hovorí:„ Toto je osoba “,„ To je osoba “. prechádza určitým časom milióny obrázkov a vytvorí túto databázu, ktorá sa naučí sama. “

Algoritmus v skutočnosti vytvára dve databázy - jednu na obsluhu systému optického hľadáčika a meranie pomocou Digic 8 a jednu na obsluhu systému AF so živým náhľadom, ktorý používa Digic X. Pretože je to Digic X, ktorý vykonáva všetky výpočty pre sledovanie hlavy, akonáhle algoritmus AF detekuje osobu v zábere, všetko sa presunie do nového procesora.

„Keď už máte niekoho v sebe, máte skutočne spustené duálne spracovanie,“ hovorí Burnhill. „Sú tu dve databázy, pretože vstup z oboch senzorov sa bude mierne líšiť, takže to, ako sa rozpozná, sa bude mierne líšiť, takže ide o podmnožiny toho istého algoritmu. Základné údaje o oboch z nich sú rovnaké, sú to len ako sa to rozpozná a použijú sa na ňu správne údaje. ““

Ak sa nemôže naučiť nové veci … čo zviera AF?

Fotoaparát Canon EOS-1D X Mark III samozrejme nie je len športovým fotoaparátom - jeho ďalším kľúčovým publikom sú divoké zvieratá. Fotoaparát zatiaľ nemá schopnosť automatického zaostrovania na zvieratá a my sme zistili, že program Deep Learning sa v skutočnosti nemôže naučiť žiadne nové triky, akonáhle sa do fotoaparátu zapečie. Je to tak? Nebude sa kamera pri všetkej tejto vymyslenej novej technológii zameriavať ani na rodinného psa?

Je pravda, že fotoaparát momentálne nemá AF (zvieracie oko). „V zásade sa sústreďujeme na to, aby ľudia začali, aby tento druh algoritmu fungoval ako prvý,“ reaguje Burnhill. „Preto sme sa trochu zamerali na šport, pretože to je stanovený parameter a môžeme ho učiť v určitom časovom období,“

Odpoveď teda spočíva vo firmvéri. Burnhill potvrdil, že existuje potenciál, aby kamera podstúpila viac hlbokého učenia, napríklad pre vtáky a divokú zver, a aby sa tento aktualizovaný algoritmus používateľom šíril prostredníctvom aktualizácií firmvéru, aj keď zatiaľ neexistujú nijaké konkrétne plány.

"Budeme to vyvíjať stále, takže v tejto chvíli stále nie je rozhodnuté, ako a kam pôjdeme. Vývojový tím však ide a pozerá sa na ďalšie fotografie zvierat - uvedomujeme si, že existuje celá rada polí, ale zjavne veľká Táto kamera sa zameriava na šport a potom na divokú zver. Je zrejmé, že v Tokiu 2022-2023 to bola priorita. “

Je to spravodlivý bod; ak by Canon čakal, kým sa Deep Learning všetko naučí, vydanie fotoaparátu by trvalo dlhšie. A hoci sa výrobcovia ako Sony vo svojich fotoaparátoch môžu pochváliť selektívnym zvieracím AF, Burnhill poznamenáva, že Canon by radšej vydal skôr kompletné riešenie AF pre zvieratá ako selektívne kusové riešenie. A práve tu sa stane Deep Learning neoceniteľným.

„Problémy sú s divočinou, existuje veľa rôznych zvierat - zjavne máte predátorov s očami vpredu, a potom máte zboku králiky (oči), hady, vtáky … neexistuje systém, ktorý by rozpoznáva tváre všetkých zvierat. A práve tam sa dostanete k celému tomuto hlbokému učeniu, ktoré učí systém rozpoznávať tieto zložité veci. “

Hoci vaše Sony dokáže sledovať vášho psa alebo mačku, ale nie salamandru alebo plameniaka, spoločnosť Canon chce vyrobiť fotoaparát, ktorý dokáže všetko alebo nič. „Ak by sme to robili, chceli by sme to urobiť pre čo najširšie spektrum - nechceme robiť fotoaparát vhodný pre psov a fotoaparát vhodný pre mačky, chceme vyrábať fotoaparát vhodný pre zvieratá to funguje pre širokú škálu zvierat, ktoré by (profesionáli) zastrelili. ““

Recenzia Canon EOS-1D X Mark III
Ako spoločnosť Canon vyrobila najrýchlejšiu digitálnu zrkadlovku vôbec? Prepracovaním zrkadlového boxu
102 aktualizácií fotoaparátu Canon EOS-1D X Mark III

Zaujímavé články...