Kai žmogus pažvelgia į sceną ar vaizdą, jis jį supranta - kokie objektai joje yra ir kas vyksta, jei vyksta veiksmas. Kita vertus, kompiuteris apdoroja tik skaitmeninius duomenis, apibūdinančius kiekvieno taško spalvų vertę. Žmogui atpažinti picą ant netvarkingo stalo yra be vargo. Tačiau dar neseniai kompiuteriai negalėjo atlikti tos pačios užduoties.
Kompiuterinė vizija arba CV leidžia kompiuteriui sugebėti išsirinkti svarbią informaciją iš vaizdinių įvesties ir remiantis ta informacija tiksliai prognozuoti ir rekomenduoti.
Kaip veikia kompiuterio matymas?
Prieš matydamas kompiuterį, norėdamas sukurti programą, atpažįstančią konkretų vaizdą, žmogus turėtų valandų valandas atlikti rankinį kojų darbą. Visų pirma, reikėtų sutelkti panašių vaizdų duomenų bazę.
Tada šiuos vaizdus reikės rankiniu būdu išanalizuoti, išmatuoti ir anotuoti atitinkamais duomenimis kad tyrinėtojas manė galintis nustatyti aptariamą objektą (pvz., spalvą, matavimus ir figūra). Tik tada programinė įranga galėjo būti naudojama numatyti.
Kita vertus, kompiuterinis matymas automatizuoja visą šį procesą, naudodamas mašininio mokymosi metodą, žinomą kaip gilusis mokymasis. Giliai mokantis naudojamas daugiasluoksnis neuroninis tinklas su šimtais potencialių sluoksnių. Vaizdų atveju tai paprastai yra konvoliacinis neuronų tinklas (CNN).
Išsamiai paaiškinti, kaip veikia giluminis mokymasis ir neuroniniai tinklai, toli už šio straipsnio ribų. Iš esmės į neuronų tinklą tiekiama daug duomenų. Neuroninis tinklas analizuoja duomenis pakartotinai, kol gali suformuoti tikslius jų prognozes.
Jei CNN naudojamas kompiuterio regėjimo užduočiai, neuroninis tinklas duomenis perima keliais žingsniais. Pirma, jis sutraukia vaizdą į kelias dalis (atskirus taškus arba iš anksto pažymėtas pikselių grupes).
Tada jis numato, kas yra skirtinguose vaizdo gabaluose (pvz., Kietieji kraštai ar konkretūs objektai). Jis pakartotinai tikrina šių prognozių tikslumą ir kiekvieną kartą šiek tiek keičia algoritmo dalis, kol jis tampa labai tikslus.
Kompiuteriai yra tokie galingi, kad vaizdą gali analizuoti daug greičiau nei žmogaus smegenys, ypač išmokę atpažinti tam tikrus modelius. Tokiu būdu nesunku suprasti, kaip gilus mokymosi algoritmas galėtų aplenkti žmogaus galimybes.
Kokie yra kompiuterio matymo tipai?
Kompiuterinė vizija apima vaizdų analizę ir supratimą bei atitinkamų prognozių ar sprendimų dėl vaizdų rezultatus. Yra daugybė užduočių, kurias kompiuterio vizija panaudos šiems tikslams pasiekti. Kai kurie iš jų apima:
- Vaizdų klasifikacija: Atpažįstamas vaizdo tipas. Pavyzdžiui, ar tai žmogaus veidas, peizažas ar objektas. Tokią užduotį galima naudoti norint greitai identifikuoti ir klasifikuoti vaizdus. Vienas iš būdų tai yra automatiškai atpažinti ir blokuoti netinkamą turinį socialiniuose tinkluose.
- Objekto atpažinimas: Panašiai kaip vaizdų klasifikavimas, objektų atpažinimas gali atpažinti konkretų scenos objektą, pavyzdžiui, picą ant netvarkingo stalo.
- Krašto aptikimas: Dažnas kompiuterio matymo naudojimas ir dažniausiai pirmasis objektų aptikimo žingsnis yra kietųjų atvaizdo kraštų nustatymas.
- Objekto identifikavimas: Tai yra atskirų objekto ar vaizdo pavyzdžių atpažinimas, pvz., Konkretaus asmens, pirštų atspaudų ar transporto priemonės identifikavimas.
- Objekto aptikimas: Aptikimas yra tam tikro atvaizdo bruožo nustatymas, pavyzdžiui, kaulo lūžis rentgeno nuotraukoje.
- Objekto segmentavimas: Tai identifikuoja, kurie vaizdo pikseliai priklauso nagrinėjamam objektui.
- Objekto sekimas: Vaizdo sekoje, atpažinus objektą, jį galima lengvai stebėti visame vaizdo įraše.
- Vaizdo atkūrimas: Neryškumą, triukšmą ir kitus vaizdo artefaktus galima pašalinti tiksliai identifikuojant objekto ir fono vaizdą.
Kompiuterinio matymo pavyzdžiai
Dirbtinis intelektas yra jau naudojamas keliose pramonės šakose turintis stulbinantį efektą, kuris galioja kompiuterio matymui. Keletas šiandien jau naudojamų CV pavyzdžių.
Veido atpažinimas
Veido atpažinimas yra vienas iš pagrindinių būdų, kaip šiandien naudojama kompiuterinė vizija. Palyginus su žinomų veidų duomenų bazėmis, kompiuterio regėjimo algoritmai gali labai tiksliai identifikuoti atskirus žmones.
- Socialinė žiniasklaida analizuoja vaizdus ir automatiškai žymi vartotojus, kad turi gerą vaizdų pasirinkimą.
- Nešiojamieji kompiuteriai, telefonai ir saugos prietaisai gali identifikuoti žmones, kad būtų galima pasiekti.
- Teisėsauga naudoja veido atpažinimą vaizdo stebėjimo sistemose įtariamiesiems nustatyti.
Vaistas
Kompiuterinis matymas šiuo metu naudojamas sveikatos priežiūros įstaigose, siekiant greičiau ir tiksliau diagnozuoti, nei ekspertai gali nustatyti. Daugelis programų apima rentgeno, KT ar MRT vaizdų analizę tam tikroms sąlygoms, įskaitant neurologines ligas, navikus ir lūžusius ar lūžusius kaulus.
Savaeigiai automobiliai
Autonominės transporto priemonės turi suprasti aplinką saugiai važiuoti. Tai reiškia kelių, juostų, eismo signalų, kitų transporto priemonių, pėsčiųjų ir kt. Atpažinimą. Visų šių užduočių metu realiuoju laiku naudojamos kompiuterinės regėjimo sistemos, kad būtų išvengta susidūrimų ir saugiai vairuojama.
Kompiuterio vizija yra iššūkis
Dabartinės kompiuterinės vizijos programos jau pradeda keisti mūsų darbo būdus įvairiose pramonės šakose. Nuo galimybės aptikti sugedusią ar sugedusią įrangą ir tiksliai diagnozuoti vėžį, kompiuterio regėjimas gali pagerinti sistemas ir išgelbėti gyvybes.
Bet tai nėra be iššūkių. Kompiuterinis matymas vis dar toli nuo žmogaus regėjimo. Tūkstančius metų evoliucija leido mums atpažinti ir suprasti beveik viską, kas vyksta aplink mus realiuoju laiku. Bet mes neįsivaizduojame, kaip žmogaus smegenys atlieka šias užduotis.
Gilus mokymasis yra didžiulis žingsnis teisinga linkme, tačiau vis tiek reikia įdėti nuostabų darbą sukurti sistemą, galinčią atlikti užduotį, kurią žmonės gali atlikti labai lengvai, pavyzdžiui, identifikuoti automobilį keliu. Taip yra dėl to, kad kompiuteriai labai efektyviai atlieka suvaržytas užduotis. Sukurti kompiuterį, kuris galėtų suprasti bendrą vizualinio pasaulio sudėtingumą, yra visiškai kitoks kamuolio žaidimas.
Atliekant daugiau mokslinių tyrimų tiek dirbtinio intelekto, tiek žmogaus biologijos srityje, artimiausiu metu greičiausiai pastebėsime galimą kompiuterinio matymo panaudojimo sprogimą.
Mašininio mokymosi algoritmai yra skirti palengvinti gyvenimą ir patobulinti sistemas, tačiau jie gali suklysti su blogomis pasekmėmis.
Skaitykite toliau
- Paaiškinta technologija
- Programavimas
- Dirbtinis intelektas
- Neuroniniai tinklai
Jake'as Harfieldas yra laisvas rašytojas, įsikūręs Pertyje, Australijoje. Kai nerašo, jis dažniausiai lauke fotografuoja vietinę laukinę gamtą. Galite jį aplankyti www.jakeharfield.com
Prenumeruokite mūsų naujienlaiškį
Prisijunkite prie mūsų naujienlaiškio, kuriame rasite techninių patarimų, apžvalgų, nemokamų el. Knygų ir išskirtinių pasiūlymų!
Dar vienas žingsnis…!
Prašome patvirtinti savo el. Pašto adresą el. Laiške, kurį jums ką tik išsiuntėme.