Ko človek pogleda sceno ali sliko, jo razume - kateri predmeti so v njej in kaj se dogaja, če se dogaja. Po drugi strani računalnik obdeluje samo digitalne podatke, ki opisujejo barvno vrednost posamezne slikovne pike. Za človeka je prepoznavanje pice na razmetani mizi enostavno. Toda do nedavnega računalniki ne bi mogli opravljati iste naloge.

Računalniški vid ali življenjepis omogoča računalniku, da lahko iz vizualnih vhodov izbere pomembne informacije in na podlagi teh informacij da natančne napovedi in priporočila.

Kako deluje računalniški vid?

Da bi človek pred računalniškim vidom ustvaril program, ki prepozna določeno sliko, bi moral opraviti ure ročnega dela nog. Prvič, zbirko podatkov podobnih slik bi bilo treba zbrati.

Nato bi bilo treba te slike ročno analizirati, izmeriti in označiti z ustreznimi podatki da je raziskovalec mislil, da bi lahko identificiral zadevni predmet (kot so barva, mere in oblika). Šele nato je bilo mogoče uporabiti programsko opremo za napovedovanje.

Po drugi strani računalniški vid avtomatizira celoten postopek z uporabo pristopa strojnega učenja, imenovanega globoko učenje. Poglobljeno učenje uporablja večplastno nevronsko mrežo s stotinami potencialnih plasti. V primeru slik je to običajno konvolucijska nevronska mreža (CNN).

Podrobna razlaga, kako delujejo globoko učenje in nevronske mreže, daleč presega obseg tega članka. V bistvu se velike količine podatkov dovajajo v nevronsko mrežo. Nevronska mreža podatke analizira ponavljajoče se, dokler ne oblikuje natančnih napovedi o njih.

V primeru CNN, ki se uporablja za nalogo računalniškega vida, nevronska mreža podatke popelje v več korakih. Prvič, strne sliko na več kosov (posamezne piksle ali skupine pikslov, ki so predhodno označene).

Nato poda napovedi o tem, kaj je na različnih delih slike (na primer trdi robovi ali določeni predmeti). Večkrat preveri natančnost teh napovedi in vsakič nekoliko spremeni dele algoritma, dokler ne postane zelo natančen.

Računalniki so zdaj tako zmogljivi, da lahko sliko analizirajo veliko hitreje kot človeški možgani, še posebej, ko se naučijo prepoznavati določene vzorce. Na ta način je enostavno videti, kako bi algoritem globokega učenja lahko presegel človeške zmožnosti.

Katere so vrste računalniškega vida?

Računalniški vid vključuje analizo in razumevanje slik ter izpis ustreznih napovedi ali odločitev o slikah. Obstajajo različne naloge, ki jih bo računalniški vid uporabil za dosego teh ciljev. Nekateri med njimi vključujejo:

  • Klasifikacija slik: Vrsta slike je prepoznana. Na primer, ali gre za obraz, pokrajino ali predmet osebe. S to vrsto naloge lahko hitro prepoznamo in razvrstimo slike. Za to se uporablja samodejno prepoznavanje in blokiranje neprimerne vsebine v družabnih omrežjih.
  • Prepoznavanje predmeta: Podobno kot klasifikacija slik lahko prepoznavanje predmetov prepozna določen predmet znotraj scene - na primer pico na neredni mizi.
  • Zaznavanje robov: Običajna uporaba računalniškega vida in običajno prvi korak pri zaznavanju predmetov je prepoznavanje trdih robov slike.
  • Identifikacija predmeta: To je prepoznavanje posameznih primerov predmeta ali slike, na primer identifikacija določene osebe, prstnih odtisov ali vozila.
  • Zaznavanje predmeta: Zaznavanje je identifikacija določene lastnosti na sliki, kot je zlomljena kost na rentgenskem slikanju.
  • Segmentacija predmeta: To je identifikacija pikslov na sliki, ki pripadajo zadevnemu predmetu.
  • Sledenje predmetom: Ko je predmet prepoznan, ga lahko po videoposnetku zlahka zasledite v celotnem videoposnetku.
  • Obnovitev slike: Zameglitev, šum in druge slikovne artefakte lahko odstranite z natančnim ugotavljanjem, kje je na sliki predmet v primerjavi z ozadjem.

Primeri računalniškega vida

Umetna inteligenca je že uporabljajo v več panogah z osupljivim učinkom, kar velja za računalniški vid. Tu je nekaj primerov življenjepisa, ki se danes že uporablja.

Prepoznavanje obraza

Prepoznavanje obraza je danes eden glavnih načinov uporabe računalniškega vida. V primerjavi z bazami znanih obrazov lahko algoritmi računalniškega vida zelo natančno prepoznajo posamezne ljudi.

  • Socialni mediji analizirajo slike in samodejno označijo uporabnike, za katere imajo dober izbor slik.
  • Prenosniki, telefoni in varnostne naprave lahko prepoznajo ljudi, ki jim omogočajo dostop.
  • Organi pregona uporabljajo prepoznavanje obrazov v sistemih CCTV za prepoznavanje osumljencev.

Zdravilo

Računalniški vid se trenutno uporablja v zdravstvu za hitrejše in natančnejše diagnoze, kot jih lahko postavijo strokovnjaki. Številne aplikacije vključujejo analizo rentgenskih, CT ali MRI slik za določena stanja, vključno z nevrološkimi boleznimi, tumorji in zlomljenimi ali zlomljenimi kostmi.

Samovozeči avtomobili

Avtonomna vozila morajo razumeti okolico za varno vožnjo. To pomeni prepoznavanje cest, pasov, prometne signalizacije, drugih vozil, pešcev in še več. Pri vseh teh nalogah se v realnem času uporabljajo sistemi računalniškega vida, da se preprečijo trki in varna vožnja.

Računalniški vid je izziv

Trenutne aplikacije računalniškega vida že začenjajo spreminjati način dela v različnih panogah. Od zmožnosti odkrivanja okvarjene ali pokvarjene opreme do natančnega diagnosticiranja raka je računalniški vid zmožen izboljšati sisteme in rešiti življenja.

Vendar ni brez izzivov. Računalniški vid je še daleč od tistega, kar je človeški vid. Imamo tisoče let evolucije, ki nam omogoča, da v realnem času prepoznamo in razumemo skoraj vse, kar se dogaja okoli nas. Vendar nimamo pojma, kako človeški možgani opravljajo te naloge.

Poglobljeno učenje je velik korak v pravo smer, vendar vseeno zahteva neverjetno veliko dela ustvariti sistem, ki lahko opravi nalogo, ki jo lahko ljudje opravijo zelo enostavno, na primer prepoznavanje avtomobila na cesta. To je zato, ker računalniki izvajajo omejena opravila zelo učinkovito. Razvoj računalnika, ki lahko razume celotno zapletenost vizualnega sveta, je povsem drugačna igra z žogo.

Ko bomo več raziskovali tako aplikacije umetne inteligence kot človeško biologijo, bomo v bližnji prihodnosti verjetno videli eksplozijo možnih načinov uporabe računalniškega vida.

E-naslov
Kaj so algoritmi strojnega učenja? Evo, kako delujejo

Algoritmi strojnega učenja so zasnovani tako, da olajšajo življenje in izboljšajo sisteme, vendar se lahko s slabimi posledicami zmotijo.

Preberite Naprej

Sorodne teme
  • Pojasnjena tehnologija
  • Programiranje
  • Umetna inteligenca
  • Nevronske mreže
O avtorju
Jake Harfield (16 objavljenih člankov)

Jake Harfield je samostojni pisatelj s sedežem v Perthu v Avstraliji. Kadar ne piše, je običajno v grmovju in fotografira lokalne prostoživeče živali. Obiščete ga lahko na www.jakeharfield.com

Več od Jakea Harfielda

Naročite se na naše novice

Pridružite se našemu glasilu za tehnične nasvete, preglede, brezplačne e-knjige in ekskluzivne ponudbe!

Še en korak…!

Potrdite svoj e-poštni naslov v e-poštnem sporočilu, ki smo vam ga pravkar poslali.

.