Sve je češća upotreba glasa za upravljanje našim domovima i računalima. Gdje se prije samo deset godina tražilo od Alexa ili Google Homea da kontroliraju svjetla ili naruče proizvod s Interneta možda se činilo neobičnim, ali to je sada norma.
Jedna od tvrtki koja je najviše uložila u ovu vrstu tehnologije je Google, koji svojim Google Home uređajima i Android sustavima omogućuje prihvaćanje verbalnih naredbi, pa čak i prepoznavanje zvučnika.
Danas ćemo pogledati kako su povezali ovu tehnologiju sa svojom platformom Google Docs i razmotriti je li ovo održiva alternativa ostalim komercijalnim rješenjima za pretvaranje glasa u tekst.
Cijene
Softver je uključen u Google dokumente i samim time je besplatan. Sve što vam treba za to je Google račun i mobilni uređaj ili računalo s mikrofonom. To je još jedan izvor podataka za Google za žetvu, ali to je dio cijene 'besplatnog' ovih dana.
Oblikovati
Glas je moguće koristiti za unos na Google dokumentima, značajka se naziva ‘Glasovno tipkanje’, a može se naći na izborniku Alati na Google dokumentu ili unutar Google prezentacija. Također se može aktivirati na bilo kojem mjestu pomoću internetske tipke Ctrl-Shift-S.
Kad ste ga aktivirali prvi put, morat ćete sankcionirati pristup mikrofonu za docs.google.com.
Nakon što prihvatite da se pojavljuje mali okvir s logotipom mikrofona koji možete kliknuti za aktiviranje glasovnog unosa. Zatim se zamjenjuje crvenim simbolom mikrofona uz dokument koji označava da je sustav u načinu slušanja.
Prije nego što aktivirate glasovno tipkanje na upravljačkoj ploči, na izborniku možete odabrati jezik, a kako je ovo Google, postoji mnogo izbora. Možete i kliknuti na upitnik i dobiti pomoć o tome kako koristiti sustav.
Kako ovi sustavi idu, ovo je jako zgusnuto rješenje.
Google će ono što kažete obraditi najbolje što može, a ako sustav nije siguran točno oko riječi, podvući će ga sivom bojom. Zatim se na te "sumnjive" riječi može kliknuti i sustav pružiti neke alternative.
No, možete se brzo kretati po dokumentu i rješavati probleme ručno ili postaviti pokazivač i zadati mu još jedan udarac glasom.
Ako tijekom rada trebate razgovarati s drugom osobom, možete zatražiti od Googlea da prestane slušati, a zatim nakon toga nastaviti.
Ali da biste dobili pune mogućnosti ovog rješenja, postoji dugačak popis naredbi koje je potrebno zapamtiti koje mogu kopirati, zalijepiti, kretati se po dokumentu, umetati tablice i bezbroj drugih funkcija.
Možete umetnuti interpunkciju, oblikovati dokument, pa čak i umetnuti hiperveze.
Ako izvučete maksimum iz toga, pretpostavljate da se možete sjetiti naredbi ili da vam se otvori pomoć za pokretanje memorije.
Popis je brzo dostupan dostupnim izgovaranjem "Popis glasovnih naredbi".
Jezici
Tamo gdje mnoga rješenja za pretvaranje glasa u tekst pokrivaju samo mali broj jezika, Google ih ima znatnu količinu. Trenutni konačni popis je:
Afrikaans, amharski, arapski, arapski (Alžir), arapski (Bahrein), arapski (Egipat), arapski (Izrael), arapski (Jordan), arapski (Kuvajt), arapski (Libanon), arapski (Maroko), arapski (Oman) , Arapski (Palestina), arapski (Katar), arapski (Saudijska Arabija), arapski (Tunis), arapski (Ujedinjeni Arapski Emirati), armenski, azerbejdžanski, bahasa Indonezija, baskijski, bengalski (Bangladeš), bengalski (Indija), bugarski, Katalonski, kineski (pojednostavljeni), kineski (tradicionalni), kineski (Hong Kong), hrvatski, češki, danski, nizozemski, engleski (Australija), engleski (Kanada), engleski (Gana), engleski (Indija), engleski (Irska) , Engleski (Kenija), engleski (Novi Zeland), engleski (Nigerija), engleski (Filipini), engleski (Južna Afrika), engleski (Tanzanija), engleski (UK), engleski (SAD), farsi, filipinski, finski, francuski , Galicijski, gruzijski, njemački, grčki, gudžarati, hebrejski, hindski, mađarski, islandski, talijanski, talijanski (Italija), talijanski (Švicarska), japanski, javanski, kannada, kmerski, korejski, laoški, latvijski, litvanski, malajalamski, malezijski n, marati, nepalski, norveški, poljski, portugalski (Brazil), portugalski (Portugal), rumunjski, ruski, slovački, slovenski, srpski, sinhalski, španjolski, španjolski (Argentina), španjolski (Bolivija), španjolski (Čile), španjolski (Kolumbija), španjolski (Kostarika), španjolski (Ekvador), španjolski (El Salvador), španjolski (Španjolska), španjolski (SAD), španjolski (Gvatemala), španjolski (Honduras), španjolski (Latinska Amerika), španjolski (Meksiko) ), Španjolski (Nikaragva), španjolski (Panama), španjolski (Paragvaj), španjolski (Peru), španjolski (Portoriko), španjolski (Urugvaj), španjolski (Venezuela), sudanski, svahili (Kenija), svahili (Tanzanija), Švedski, tamilski (Indija), tamilski (Malezija), tamilski (Singapur), tamilski (Šri Lanka), tajlandski, turski, ukrajinski, urdu (Indija), urdu (Pakistan), vijetnamski i zulu.
To je 119 jezika, uključujući 13 arapskih oblika, 19 španjolskih varijacija, 13 engleskih dijalekata i čak četiri okusa tamilskog.
Uključeni su jezici koje softver za diktiranje rijetko podržava, poput zulujskog i islandskog, zbog relativno malog broja govornika.
Pokrivenost jezika vjerojatno je najveća snaga Google Voice Typinga.
Snimke
Ako ovo rješenje ima slabosti, to je da ne može lako obraditi snimke.
Iako to nije nemoguće natjerati, ali potrebno je zakrpati audio sustav računala tako da uzima izlaz namijenjen zvučnicima i usmjerava ga kao da dolazi iz mikrofona. No, ovo vam ne omogućuje razlikovanje različitih ljudi na snimkama, a moglo bi ometati AI koji Google koristi za poboljšanje verbalne točnosti učeći kako govorite.
Ako želite prepisati podcastove ili snimljene intervjue, preporučujemo vam da upotrijebite nešto drugo jer ovaj alat nije napravljen u tu svrhu.
Točnost
Teško je procijeniti točnost sustava za obradu glasa kad mu ne možete poslati iste snimke koje su konvertirali drugi proizvodi. Svatko tko redovito koristi Alexa ili Google Home znat će da nas povremeno neće razumjeti, uglavnom zbog stranih zvukova ili nedosljednog govora.
Međutim, u aktivnom testiranju koje smo proveli ovaj je alat uglavnom ispravio većinu riječi ili je točna riječ brzo bila dostupna na izborniku sa sumnjivim riječima.
Da bi se postigli najbolji rezultati potrebna je kontrola koja će se pokazati u brzini, glasnoći i tonu govora, što nesumnjivo dolazi s praksom. Također, sposobnost pamćenja svih posebnih naredbi može kritično smanjiti količinu potrebnih izmjena nakon snimanja.
Ovisno o vašim očekivanjima, ovdje je točnost prihvatljiva. Postoji dosljednost njegovih interpretacija koje je održavao tijekom naših testova. Koliko dobro funkcionira za vas, ne možemo predvidjeti. Ali kako je besplatan, to neće koštati ništa drugo osim vašeg vremena da to utvrdite.
Sigurnost
Kako je ovo Google, sigurnosni je model isti koji kontrolira pristup svim Google računima. To se kreće od jednostavne zaštite lozinkom do razumnije do dvofaktorske metodologije provjere autentičnosti (TFA).
S obzirom na broj lopova identiteta, oni koji koriste Google bez TFA riskiraju značajan rizik da im računi budu ugroženi.
Čak i ova sigurnosna opcija ima svoja ograničenja, ali je bolja od puke lozinke.
Za one koji nisu dovoljno paranoični, toplo preporučujemo da prijeđu na https://myactivity.google.com/myactivity
Vidjet ćete što Google svakodnevno prikuplja na vama, a to bi moglo uključivati snimke vaših glasovnih naredbi.
Konačna presuda
Ovo bi mogao biti duži pregled ako ovaj softver nudi više funkcionalnosti, ali ne nudi.
Kako rješenja za pretvaranje glasa u tekst ovo nisu komplicirana, ali imaju dovoljno funkcionalnosti da budu istinski korisna.
Druga su rješenja izgrađena za rukovanje transkripcijom razgovora između više ljudi, pri čemu je ovo dizajnirano za obradu jedne osobe koja govori kontrolirano i precizno.
Ono što upotrebljava podrazumijeva da ste sretni što upotrebljavate Google i Google dokumente, čak i ako to nije krajnje odredište teksta koji ste unijeli.
Nije zadaća kopirati diktat zalijepljenja iz Google dokumenata u drugu aplikaciju, a imat ćete kopiju u oblaku za referencu ako vam na kraju zatreba.
Neki korisnici razumljivo imaju problema s hranjenjem Googleovog nezasitnog apetita za korisničkim podacima, a ovaj je mehanizam još jedan izvor podataka za grickanje.
Ako se tako osjećate, nećete upotrebljavati Google Voice Typing ili bilo što drugo od Googlea.
Za one koji su spremni prihvatiti koliko Google može znati o njima, tada je rješenje za glasovno diktiranje u Google dokumentima dovoljno za opću upotrebu, posebno ako vam je ova funkcija potrebna samo povremeno.