Pregled govora u tekst Watsona: Najbolja usluga prepisivanja velikog volumena?

Watson je IBM-ov računalni sustav za obradu prirodnog jezika. Omogućuje poznato superračunalo s odgovorima na pitanja, kao i niz poslovnih proizvoda temeljenih na AI, uključujući Watson Speech to Text. U našem pregledu govora u tekst Watson, pogledati ćemo jednu od najboljih aplikacija za pretvaranje govora u tekst, idealnu za sve koji žele pretvoriti audio u tekst u mjerilu.

Watson platforma za obradu govora dostupna je na IBM Cloudu. Svestrani je alat i može se koristiti u mnogim kontekstima, uključujući diktiranje i transkripciju konferencijskog poziva. Štoviše, za razliku od većine drugih aplikacija za pretvaranje govora u tekst, dostupan je kao API, što programerima, između ostalog, omogućuje ugradnju u sustave glasovne kontrole.

Watson Govor u tekst: planovi i cijene

Watson Govor u tekst možete koristiti za obradu do 500 minuta zvuka besplatno mjesečno. Ako želite pretvoriti više od toga, morat ćete platiti za svaku audio minutu i stopa se mijenja na temelju trajanja obrađenog zvuka. Troškovi se kreću od 0,01 do 0,02 USD po minuti, a dodatni trošak iznosi 0,03 USD po minuti ako vam je potreban IBM-ov prilagođeni jezik. Dostupni su i premium Watsonovi planovi koji nude samo cijene i oni omogućuju pristup poboljšanim značajkama privatnosti podataka i jamstvima za neprekidno korištenje.

Watsonova usluga govora u tekst određuje se na temelju količine sadržaja koji trebate prepisati.

Također možete pristupiti sustavu Watson Govor u tekst putem općenite pretplate na IBM Cloud. Obrada prirodnog jezika samo je jedna aplikacija u širokom rasponu usluga AI koje možete dobiti putem IBM Cloud-a, tako da je ovo dobra opcija za svaku organizaciju koja treba pristup brzom prijenosu podataka, chat-ovima ili alatima za pretvaranje teksta u govor.

Watson Govor u tekst: Značajke

Zahvaljujući fleksibilnoj integraciji API-ja i drugim IBM-ovim alatima prije izrade, usluga prepoznavanja govora Watson ide daleko dalje od osnovne transkripcije. Ako ga želite koristiti u kontekstu korisničke službe, na primjer, Watson Assistant može se postaviti za izravnu obradu pitanja na prirodnom jeziku ili telefonsko odgovaranje na upite.

U Watsonu je IBM sastavio platformu za obradu prirodnih jezika bogatu značajkama.

Watson radi sa zvukom uživo na 11 jezika i može uvesti zvukove u raznim unaprijed snimljenim formatima. Tijekom strujanja, dijagnostička podrška u stvarnom vremenu znači da Watson može zatražiti od korisnika da se približe mikrofonu ili promijene okruženje. Također je impresivna činjenica da Watson može razlikovati različite zvučnike u zajedničkom razgovoru zahvaljujući Speaker Diarization, značajci koja je još uvijek u fazi beta testiranja.

Watson Govor u tekst: Postavljanje

Da biste koristili Watsona, prvo što morate učiniti je stvoriti IBM Bluemix račun. Registracija je besplatna i bezbolna, potrebna je samo adresa e-pošte i lozinka. Nakon što se prijavite, na svoj račun morate dodati odredbu za uslugu Govor u tekst. U ovoj ćete fazi dobiti nekoliko vjerodajnica koje biste trebali spremiti u vlastitu evidenciju.

Registracija za IBM Bluemix račun potrebna je kako bi se dobio pristup Watsonovom cjelovitom skupu značajki.

Nakon što to učinite, stvari postaju znatno složenije. Da biste pristupili Watsonu, trebat ćete dodati te vjerodajnice seriji kôda klijentskog jedinstvenog lokatora resursa (cURL), a zatim ga pokrenuti na svojem računalu. Da biste točno saznali koju naredbu trebate nazvati, pogledajte ovaj priručnik. Ako želite samo vidjeti koliko dobro funkcionira Watson sustav, a da ne morate preskakati sve te obruče, možete ga umjesto toga isprobati na IBM-ovoj demo stranici.

Watson Govor u tekst: Sučelje

Za razliku od aplikacija za pretvaranje glasa u tekst usmjerene prema potrošačima, Watsonove usluge dizajnirane su za pristup putem API-ja i koda ugrađenih u druge sustave. Iz tog razloga ne postoji pravo Watsonovo "sučelje". Umjesto toga, Watsonu se može pristupiti kroz tri različita internetska protokola. To su WebSockets, REST API i Watson Developer Cloud.

Watson Govor u tekst može se upravljati putem Watson Developer Cloud sustava.

Da biste kontrolirali Watsona, morat ćete upotrijebiti alat naredbenog retka koji se povezuje s IBM-ovim oblakom putem jedne od te tri rute. Sučelje koje krajnji korisnik u interakciji s Watsonom vidi trebat će zasebno izgraditi netko iz vašeg razvojnog tima.

Watson Govor u tekst: izvedba

Sveukupno, impresionirao nas je način na koji se ova platforma za obradu prirodnog jezika bavila stvarnim govorom. Watsona smo koristili za prepisivanje isječaka koje smo snimali u nizu izazovnih okruženja, kao i zvučne zapise poznatih govora održanih u nekoliko od 11 podržanih Watsonovih jezika.

Otkrili smo da je Watson dobro izveo unaprijed snimljeni govor.

Iako su greške postajale češće za isječke s puno pozadinske buke, Watson je općenito dao nevjerojatno točne rezultate. Iz naših testova procijenili bismo da su se nepromovirane pogreške u prosjeku događale samo jednom u 150 riječi. Međutim, postalo je jasno zašto Watson-ova značajka za diarizaciju zvučnika ostaje u BETA testiranju, jer je nekoliko puta tijekom naše ocjene jedan glas pogrešno označen kao zasebni zvučnici.

Watson Govor u tekst: podrška

IBM-ov resursni centar nudi obilje dokumentacije za bolje razumijevanje načina primjene Watsona na vaš određeni slučaj korištenja. Također vrijedi iskoristiti API-integracije i SDK-ove stvorene od strane zajednice programera Watson i objavljene na GitHub-u.

Stranica Watson API GitHub dobar je izvor podrške za uslugu Watson Speech to Text.

Ako tamo ne pronađete rješenje za svoj problem, IBM možete izravno kontaktirati otvaranjem karte za podršku ili kontaktiranjem putem telefona. Sve dok ste se odlučili za jedan od premium Watsonovih paketa, vaša upotreba Watsona bit će zaštićena ugovorom o usluzi na neodređeno vrijeme.

Watson Govor u tekst: Konačna presuda

Ako vaša organizacija ima know-how i resurse za pravilnu integraciju platforme IBM Watson Speech to Text u vaš sustav, dobit ćete napredne funkcije poput dijagnostike zvučnog okruženja u stvarnom vremenu i privremenih rezultata transkripcije. Međutim, mala poduzeća i organizacije borit će se s tehničkim izazovom pravilnog postavljanja Watsona.

Natjecanje

Usluga IBM Watson za govor u tekst izravna je konkurencija uslugama masovne transkripcije Google Cloud Speech-to-Text i Amazon Transcribe. Obje su znatno jeftinije od Watsona, s Google Cloud transkripcijom, na primjer, počevši od 0,006 dolara po minuti. Sve tri usluge dijele slične funkcije, poput prilagođenog rječnika, ali jedna značajka koja IBM Watsonu jako nedostaje, ali je dostupna s oba konkurenta, je automatsko prepoznavanje interpunkcije.

Tražite li drugo rješenje za pretvaranje teksta u tekst? Pogledajte naš najbolji vodič za softver za pretvaranje govora u tekst.

Zanimljivi članci...