Tehnologija prepoznavanja glasu ima bogato zgodovino razvoja, ki jo je pripeljala do tega, kar je danes. Je jedro sodobnega življenja in nam daje možnost opravljanja nalog samo s pogovorom z napravo. Torej, kako se je ta osupljiva tehnologija skozi leta razvijala? Poglejmo.

1952: Audreyjev sistem

Prvi korak pri prepoznavanju glasu je bil storjen v zgodnjih petdesetih letih. Bell Laboratories je leta 1952 razvil prvi stroj, ki je lahko razumel človeški glas, in se je imenoval Audrey System. Ime Audrey je bilo nekakšno krčenje fraze Automatic Digit Recognition. Čeprav je bila to velika inovacija, je imela nekaj velikih omejitev.

Najpomembnejše je, da je Audrey prepoznala samo številke 0-9, brez besed. Audrey je podala povratne informacije, ko je govornik izrekel številko, tako da je prižgal 1 od 10 žarnic, od katerih vsaka ustreza številki.

Zasluga za sliko: metamorworks/Shutterstock.com

Čeprav je lahko razumela številke z 90 -odstotno natančnostjo, je bila Audrey omejena na določeno vrsto glasu. Zato je bil edini, ki bi ga resnično uporabil, HK Davis, eden od razvijalcev. Ko je bila izgovorjena številka, bi moral govorec počakati vsaj 300 milisekund, preden izgovori naslednjo.

instagram viewer

Ne samo, da je bil omejen v funkcionalnosti, ampak tudi v uporabnosti. Stroju, ki bi razumel samo številke, ni bilo veliko koristi. Ena od možnih uporab je bilo klicanje telefonskih številk, vendar je bilo ročno klicanje številk veliko hitrejše in lažje. Čeprav Audrey ni imela milostnega obstoja, je še vedno velik mejnik v človeških dosežkih.

Povezano: Kako uporabljati glasovno tipkanje v programu Microsoft Word

1962: IBM -ova škatla za čevlje

Desetletje po Audreyju se je IBM preizkusil v razvoju sistema za prepoznavanje glasu. Na svetovnem sejmu leta 1962 je IBM predstavil sistem za prepoznavanje glasu po imenu Showbox. Tako kot Audrey je tudi njeno glavno delo razumelo števke 0-9, lahko pa je razumelo tudi šest besed: plus, minus, false, total, subtotal in off.

Shoebox je bil matematični stroj, ki je lahko reševal preproste aritmetične težave. Kar zadeva povratne informacije, je Shoebox namesto luči lahko natisnil rezultate na papir. Zaradi tega je bil uporaben kot kalkulator, čeprav bi moral zvočnik še vedno prekiniti med vsako številko/besedo.

1971: IBM -ova samodejna identifikacija klicev

Po Audrey in Shoeboxu so drugi laboratoriji po vsem svetu razvili tehnologijo prepoznavanja glasu. Vendar pa je vzletelo šele v sedemdesetih letih, ko je leta 1971 IBM na trg prinesel prvi tovrstni izum. Imenuje se sistem za samodejno identifikacijo klicev. To je bil prvi sistem za prepoznavanje glasu, ki je bil uporabljen preko telefonskega sistema.

Inženirji bi poklicali in bili povezani z računalnikom v Raleighu v Severni Karolini. Klicatelj bi nato izgovoril eno od 5000 besed v svojem besednjaku in kot odgovor dobil "govorjen" odgovor.

Povezano: Kako uporabljati glasovno narekovanje v računalnikih Mac

1976: Harpija

V začetku sedemdesetih let se je obrambno ministrstvo ZDA zanimalo za prepoznavanje glasu. DARPA (Agencija za napredne obrambne raziskovalne projekte) je leta 1971 razvila program Razumevanje govora (SUR). Ta program je financiral več podjetij in univerz za pomoč pri raziskavah in razvoju za prepoznavanje glasu.

Leta 1976 je univerza Carnegie Mellon zaradi SUR razvila sistem Harpy. To je bil velik preskok v tehnologiji prepoznavanja glasu. Sistemi do takrat so lahko razumeli besede in številke, vendar je bila Harpy edinstvena, saj je lahko razumela celotne stavke.

Imela je besednjak le približno 1011 besed, kar je po objavi avtorja B. Lowerre in R. Reddy, enakovredno več kot bilijonu različnih možnih stavkov. Objava nato navaja, da je Harpy lahko razumel besede z 93,77% natančnostjo.

Osemdeseta leta so bila ključni čas za tehnologijo prepoznavanja glasu, saj je to desetletje, ko je glas tehnologijo prepoznavanja, saj smo bili v tem desetletju, ko smo se seznanili s skrito metodo Markova (HMM). Glavna gonilna sila HMM je verjetnost.

Kadar koli sistem registrira fonem (najmanjši element govora), obstaja določena verjetnost, kaj bo naslednji. HMM na podlagi teh verjetnosti ugotovi, kateri fonem bo najverjetneje sledil, in oblikuje najverjetnejše besede. Večina današnjih sistemov za prepoznavanje glasu še vedno uporablja HMM za razumevanje govora.

Devetdeseta: prepoznavanje glasu doseže potrošniški trg

Od zasnove tehnologije za prepoznavanje glasu je bil na poti, da bi našel prostor na potrošniškem trgu. V osemdesetih letih je IBM predstavil prototipni računalnik, ki bi lahko narekoval govor v besedilo. Toda šele v zgodnjih devetdesetih letih so ljudje takšne aplikacije začeli opazovati v svojih domovih.

Leta 1990 je Dragon Systems predstavil prvo programsko opremo za narekovanje govora v besedilo. Imenovala se je Dragon Dictate in je bila prvotno izdana za Windows. Ta program v višini 9.000 dolarjev je bil revolucionaren za predstavitev tehnologije prepoznavanja glasu množicam, vendar je bila ena pomanjkljivost. Uporabljena programska oprema diskretni narek, kar pomeni, da se mora uporabnik med vsako besedo ustaviti, da jih program pobere.

Leta 1996 je IBM znova prispeval k industriji z Medspeakom. To je bil tudi program za narekovanje govora v besedilo, vendar ni trpel diskretne dikcije, kot je to storil Dragon Dictate. Namesto tega bi lahko ta program narekoval neprekinjen govor, zaradi česar je bil bolj prepričljiv izdelek.

Povezano: Kako uporabljati Google Assistant s slušalkami

2010: Dekle po imenu Siri

Tehnologija prepoznavanja glasu je v 2000 -ih letih postala zelo priljubljena. Uveljavljen je bil v več programske in strojne opreme kot kdaj koli prej, eden ključnih korakov v razvoju prepoznavanja glasu pa je bil Siri, digitalni pomočnik. Leta 2010 je podjetje z imenom Siri predstavilo virtualnega pomočnika kot aplikacijo za iOS.

Takrat je bil Siri impresiven kos programske opreme, ki je lahko narekovala govornikovo govorico in dala izobražen in duhovit odgovor. Ta program je bil tako impresiven, da je Apple istega leta prevzel podjetje in Siri nekoliko prenovil ter ga potisnil proti digitalnemu asistentu, ki ga poznamo danes.

Preko Appla je Siri dobila svoj ikonični glas (glas Susan Benett) in številne nove funkcije. Uporablja obdelava naravnega jezika za nadzor večine sistemskih funkcij.

2010: Veliki 4 digitalni pomočniki

Sedanji štirje veliki digitalni pomočniki prevladujejo pri prepoznavanju glasu in dodatni programski opremi.

  • Siri je prisoten v skoraj vseh Applovih izdelkih: iPhone, iPod, iPad in družini računalnikov Mac.
  • Pomočnik Google je prisoten v večini od 3 milijard naprav Android na trgu. Poleg tega lahko uporabniki uporabljajo ukaze v številnih Googlovih storitvahkot Google Home.
  • Amazon Alexa nima veliko namenske platforme, kjer živi, ​​vendar je še vedno pomemben pomočnik. Na voljo je za prenos in uporabo v napravah Android, napravah Apple. in celo izberite prenosnike Lenovo
  • Bixby je najnovejši vnos na seznam digitalnih pomočnikov. To je Samsungov domači digitalni pomočnik in je prisoten med telefoni in tabličnimi računalniki podjetja.

Govorjena zgodovina

Glasovno prepoznavanje je od Audreyjevih dni prišlo daleč. Na številnih področjih je zelo pridobil; na primer po Clear Bridge Mobile, je bilo med pandemijo leta 2020 na medicinskem področju korist od glasovnih klepetov. Od tega, da lahko le razumemo številke do razumevanja različnih variacij polnih stavkov, se je prepoznavanje glasu izkazalo za eno najbolj uporabnih tehnologij našega sodobnega časa.

DelitiCvrkutatiE-naslov
Kako deluje prepoznavanje glasu?

Ves čas uporabljamo prepoznavanje glasu, a kako to deluje?

Preberite Naprej

Sorodne teme
  • Pojasnjena tehnologija
  • Siri
  • Pomočnik Google
  • Alexa
  • Bixby
  • Glasovni ukazi
O avtorju
Arthur Brown (31 objavljenih člankov)

Arthur je tehnološki novinar in glasbenik, ki živi v Ameriki. V industriji je že skoraj desetletje in je pisal za spletne publikacije, kot je Android Headlines. Odlično pozna Android in ChromeOS. Poleg pisanja informativnih člankov je spreten tudi pri poročanju tehnoloških novic.

Več od Arthurja Browna

Naročite se na naše novice

Pridružite se našemu glasilu za tehnične nasvete, ocene, brezplačne e -knjige in ekskluzivne ponudbe!

Kliknite tukaj, če se želite naročiti