Pregled Microsoft Azure: vrhunska obrada glasa

Sadržaj:

Anonim

Microsoft Azure Govor u tekst jedna je od najnaprednijih platformi za prepoznavanje glasa. Kao dio Microsoftove palete proizvoda Cognitive Speech Services, koristi algoritme za duboko učenje kako bi prevladao lošu kvalitetu zvuka i može se prilagoditi različitim stilovima govora za precizne transkripcije zvuka. U ovom pregledu govora u tekst Microsoft Azure, pomno ćemo pogledati ovu uslugu.

Vrijedno je napomenuti da Microsoft Azure Govor u tekst nije tradicionalni dio softvera za diktiranje prilagođen korisniku. Umjesto toga, ovo je platforma usmjerena na programere dizajnirana da pomogne tvrtkama u stvaranju, testiranju i upravljanju vlastitim proizvodima. Ako samo želite prepisati hrpu audio datoteka, alternativne aplikacije za pretvaranje govora u tekst mogu biti bolja opcija. Pogledajte naš najbolji vodič za pretvaranje govora u tekst za najbolje alternative.

Govor u tekst Microsoft Azure: planovi i cijene

Koristeći Microsoft Azure Govor u tekst, možete besplatno prepisati do pet sati zvuka i stvoriti jedan prilagođeni glasovni model mjesečno. Međutim, s besplatnim paketom istodobno je dostupan samo jedan istodobni audio zahtjev, što znači da ova opcija nije održiva za većinu tvrtki.

Naplata usluge Azure za govor podijeljena je na korake od jedne sekunde.

Ako želite prepisati više govornih isječaka odjednom, morat ćete nadograditi na standardni sustav cijena Azure. To košta 1 USD po satu zvuka i podržava do 20 istodobnih zahtjeva. Dodatni troškovi uključuju se ako trebate koristiti prilagođeni audio model ili prepisati višekanalne zvučne datoteke. Te dodatne usluge koštaju 1,40 USD, odnosno 2,10 USD po audio satu.

Iako Microsoft navodi svoje cijene u formatu "po zvučnom satu", kao što je to industrijski standard, naplata je zapravo podijeljena na korake od jedne sekunde, tako da nećete platiti više vremena obrade nego što je potrebno.

Microsoft Azure Govor u tekst: Značajke

Ključna značajka Azure Govor u tekst je pristup koji pruža moćnom Microsoftovom sustavu za obradu prirodnog jezika. Tijekom posljednjih nekoliko godina, Microsoftov govorni inteligencija dosegla je nekoliko važnih prekretnica. To znači da sada može dovršiti zadatke koji su prije bili nemogući za uslugu prepoznavanja govora, poput preciznog prepisivanja unakrsnih razgovora tijekom razgovora u malim grupama.

Usluga Microsoft Azure za govor u tekst može se integrirati s Office 365 radi optimalne točnosti.

Azure radi s desecima jezika i dijalekata i može se obučiti - koristeći prilagođene modele prepoznavanja govora - kako bi se bolje prilagodio korisnikovom stilu govora, pozadinskoj buci okruženja i rječniku. Ako je vaša organizacija već predana Microsoftovom ekosustavu proizvoda, možete koristiti podatke sustava Office 365 da biste poboljšali preciznost prepoznavanja govora za pojmove koji se odnose na organizaciju. I, što je najvažnije, to se može učiniti bez ugrožavanja vaše sigurnosti podataka, jer se Govor u tekst može pokretati lokalno.

Microsoft Azure Govor u tekst: Postavljanje

Microsoft Azure dizajniran je za programere, a ne za potrošače. To znači da je njegovo postavljanje uključen i pomalo izazovan postupak koji se najbolje prepušta nekome s velikom količinom tehničke stručnosti.

Postavljanje Azurea nije baš jednostavno ako nemate iskustva s kodiranjem.

Najbrži način konfiguriranja Azurea je korištenje Azure Speech SDK-a u programskom jeziku poput Java ili C ++. Za to ćete se trebati registrirati za besplatni Azure račun i stvoriti prazan projekt u svom razvojnom okruženju. Tada ćete trebati koristiti Microsoft Visual Studio i napisati kratki program za inicijalizaciju Microsoftovog objekta SpeechRecognizer.

Microsoft Azure Govor u tekst: Sučelje

Poput ostalih platforma za skupnu transkripciju, Microsoft Azure Govor u tekst namijenjen je izvođenju kao sučelje za programiranje aplikacija (API), dodan u programe Office 365 ili integriran u nove platforme i usluge. Zbog toga ne postoji jedinstveno sučelje Azure Govor u tekst. Što će krajnji korisnik vidjeti ovisi o tome kako je integriran Azure Govor u tekst.

Internetski portal Azure intuitivan je i jednostavan za upotrebu.

U međuvremenu, programer koji upravlja Azureom to će učiniti putem Microsoftovog internetskog portala Azure, koji se osjeća moderno i lako se kreće. Potrebno je samo nekoliko minuta da locirate stranicu resursa govornih usluga i, nakon što se instanca doda na vaš račun, nadzor upozorenja i upotrebe mogu se pregledavati u jednom prozoru.

Govor u tekst Microsoft Azure: izvedba

Kao dio naše provjere govora u tekst Microsoft Azure, željeli smo vidjeti kako se ova platforma nosi s izazovom obrade sirovih glasovnih snimki, pa smo, nakon što je naš Azure račun bio spreman za rad, prenijeli niz isječaka s različitim razinama pozadinske buke . Uobičajeno, Azure je dobro obavio obradu naših uzoraka jer smo tijekom naše procjene vidjeli samo pregršt pogrešaka.

Omogućavanje Azureova prilagođenog modela govora poboljšalo je našu točnost transkripcije.

Azure se lagano borio pri obradi neobičnih ili posebnih fraza, kao što su imena sportskih timova i znanstveni izrazi u početku, ali to je brzo riješeno omogućavanjem mogućnosti izlaza prilagođenog modela. Nakon što smo aktivirali ovu opciju, Azure se uspio prilagoditi jedinstvenom rječniku i stilu govora koji smo koristili.

Microsoft Azure Govor u tekst: podrška

Da biste naučili kako komunicirati sa Azure Speech Services SDK putem različitih programskih jezika i integrirati funkcije Azure Speech to Text u vlastitu platformu, zasigurno će vam trebati pomoć. Srećom, Microsoft je stvorio sveobuhvatan katalog materijala za obuku za platformu Azure, u kojem ćete pronaći primjere koda i korisne savjete.

Odjeljak za obuku web mjesta Azure sadrži mnogo korisnih izvora.

Također, svi Azure korisnici dobivaju besplatnu podršku za naplatu i upravljanje pretplatama kojoj se može pristupiti putem sustava ulaznica. Na vaš račun može se dodati detaljnija podrška uz redovnu naknadu, počevši od 29 USD mjesečno.

Microsoft Azure govor u tekst: konačna presuda

Azure Govor u tekst platforma koristi se vrhunskom tehnologijom za pružanje gotovo savršene usluge transkripcije. Najprikladniji je za tvrtke koje su već investirale u ekosustav Microsoft Office 365 jer se prilagođeni modeli glasa i rječnika mogu sigurno generirati iz vaše postojeće arhive dokumenata. Neke male tvrtke mogu se boriti s Azureom jer pravilno postavljanje zahtijeva pažnju kvalificiranog Microsoftovog programera za oblak.

Natjecanje

Amazon Transcribe, Google Cloud Govor u tekst i Watson Govor u tekst izravna su konkurencija Microsoftu Azureu. Sve ove tri platforme također su sposobne za točno izvođenje skupnih transkripcija velikog broja. Google Cloud jedini je bliski konkurent koji može raditi s više jezika od Azurea, ali je skuplji, s početnom stopom od samo 0,006 USD za 15 sekundi, u usporedbi s Azureovim 0,017 USD po minuti (0,00425 USD za 15 sekundi).

Da biste pronašli druge alternative za Microsoft Azure Govor u tekst, pogledajte naš najbolji vodič za softver za govor u tekst.