Microsoftov sustav za prepoznavanje govora na razini onog ljudskog?

Fotografija članka: Microsoftov sustav za prepoznavanje govora na razini onog ljudskog?

Microsoft je objavio da je njegov sustav za prepoznavanje govora jednak ili čak bolji nego onaj kod profesionalaca koji se bave transkripcijom

Oglas

Svi mi s vremena na vrijeme koristimo sustav prepoznavanja govora na razne načine. Većinom su za to zaduženi naši virtualni pomoćnici na smartfonima koji se na više ili manje uspješan načine trude razumjeti što im mi govorimo.

Svake godine sve velike tvrtke rade na ovome području i usavršavaju svoje virtualne asistente. U posljednje vrijeme na tržištu se pojavljuju uređaji kao i koji prepoznaju vaše glasovne naredbe i tako upravljaju vašim domom što je razina više od one na kojoj su naši smartfoni. Sve te tehnologije su zanimljive i korisne, ali nas sve izbaci iz takta kada nešto moramo ponoviti nekoliko puta da sustav prepozna našu želju, tako da većina ljudi ( barem na našem govornom području ) to koristi samo povremeno.

Srećom je napravio veliki napredak u poboljšavanju preciznosti u sustavu prepoznavanja govora. Proteklog mjeseca odjel koji se bavi istraživanjem i razvojem ovih sustava iznio je rezultate testiranja koji kažu da ovaj sustav pogriješi u samo 6.3% izdiktiranih riječi. Kako se redovito ostvaruje napredak na ovome području, posljednja testiranja kažu da je brojka pogreški još i manja samo 5.9% i da je pala na najmanju razinu ikada od kada se ovo mjeri. Brojke baš i neznanče puno, ali kada to stavimo u kontekst da profesionalci koji se bave transkripcijom u većini slučajeva pogriješe više nego ovaj sustav, onda su te brojke vrijedne naše pažnje.

Na ovome području još uvijek ima puno posla, ova testiranja su provedena u skoro idealnim uvjetima, pa na red dolaze i svi drugi uvjeti u kojima se možemo naći. Treba posebno raditi na prepoznavanju naglasaka, na izolaciji glasa govornika u prepunoj sali i ono što je možda najvažnije za prosječnog korisnika – izolacija buke dok smo na ulici.

Dugoročni plan ovih istraživanja treba biti da sustav prepozna jezik kao što ga čovjek prepoznaje, znači razina više nego što to danas jest. Danas sustavi rade tako da prepoznaju glas i da naprave njegov transkript pa tek onda drugi sustav pokušava razumjeti tekst i dati odgovor na naš upit ili naredbu.

Uvijek treba razlikovati razumijevanje od prepoznavanja, a Microsoft će sigurno ovaj sustav iskoristiti kako bi poboljšao funkcioniranje svoje virtualne pomoćnice , svojih programa za transkripciju i naravno nezaobilazne , kojom se može gotovo u potpunosti upravljati glasom.

Budućnost se čini jako zanimljiva po pitanju napretka naših virtualnih pomoćnika, ostaje nam jedino za vidjeti kako će Microsoftova konkurencija , Alexa i odgovoriti na ovaj napredak i kako će sve to učiniti dostupnim i funkcionalnim širim masama.

Oglas
Pretplatite se na BESPLATNE
Tjedni pregled najzanimljivijih tehnoloških informacija
Poveznica se otvara u novom prozoru
Sigurnosna provjera: Upišite rezultat  2+3=

KOMENTARI


Neprimjerene komentare, poveznice, reklamiranje/promoviranje i komentare koji tematski nisu vezani uz vijest odmah ćemo ukloniti.