Runas atpazīšanas Python: kā tulkošanu pārtulkot tekstā?



Šis emuārs aptver runas atpazīšanas jēdzienu pitonā ar programmas paraugu, kas runu pārvērš tekstā, izmantojot runas atpazīšanu.

Runa ir visizplatītākais saziņas līdzeklis visā pasaulē. Lielākā daļa pasaules iedzīvotāju paļaujas uz runu, lai sazinātos savā starpā. Pieņemsim, ka mēs veidojam modeli, un rakstiskas pieejas vietā mēs vēlamies, lai mūsu sistēma reaģētu uz runu, tas kļūst diezgan grūti un prasa daudz datu apstrādi. Runas atpazīšanas sistēma pārvar šo barjeru, pārtulkojot runu tekstā. Šajā emuārā mēs izskatīsim runas atpazīšanu modulis pitonā . Šeit ir to pašu saraksts:

Kā darbojas runas atpazīšana?

Runas atpazīšanas sistēma būtībā tulko izrunātos izteikumus tekstā. Ir dažādi reālās dzīves runas atpazīšanas sistēmas piemēri. Piemēram, siri, kas runu uztver kā ievadi un pārveido to tekstā.





Runas atpazīšanas sistēmas izmantošanas priekšrocība ir tā, ka tā pārvar lasītprasmes barjeru. Runas atpazīšanas modelis var kalpot gan lasītprasmei, gan analfabētam, jo ​​tas koncentrējas uz izrunātajiem izteikumiem.

Izmantojot runas atpazīšanas sistēmu, mēs varam veikt arī visu apdraudēto valodu uzskaiti visā pasaulē. Lai gan tas izskatās diezgan intriģējoši un nemaz nav sarežģīts, runas atpazīšanas sistēma top daudz problēmu priekšā.



Runas atpazīšanas problēmas Sistēma

Runas atpazīšanas sistēmu kļūst grūti izveidot, jo runas jomā mums ir tik daudz mainīguma avotu.

Runāšanas stils

Katram cilvēkam ir daudzveidīgs runas stils, ieskaitot akcentus. Kā mēs visi zinām, mums ir atšķirīgi akcenti arī runāšanai angliski. Runājot par visizplatītāko valodu pasaulē, ir amerikāņu angļu, britu angļu un tik daudz citu akcentu. Izruna arī apgrūtina runas atpazīšanas sistēmas pilnīgu tulkošanu.



Vide

Vide arī piešķir daudz fona trokšņa sistēmai. Izolētā telpā, salīdzinot ar auditoriju, būs daudz atšķirīgu fona trokšņu. Pat atbalss var radīt lielu troksni arī sistēmā.

Runātāja raksturojums

Veca cilvēka balss var nebūt tāda pati kā zīdainim. Personas runas īpašības ir atkarīgas no daudziem faktoriem, ieskaitot skarbumu un skaidrību.

Valodas ierobežojumi

Dažiem runātiem izteikumiem var nebūt tulkošanas nozīmes.

Pēc šo problēmu pārvarēšanas jebkurai runas atpazīšanas sistēmai ir diezgan iespējams tulkot runu tekstā. Tagad, kad mēs zinām, kā darbojas runas atpazīšana, ļaujiet to apskatīt citādi kas ir pieejami runas atpazīšanai pitonā.

Pieejamas paketes runas atpazīšanai pitonā

  • apiai

  • Runas atpazīšana

  • Google_speech_cloud

  • Assemblyai

  • Pocketphinx

  • Watson_developer_cloud

  • balts

Šajā emuārā mēs iepazīsimies ar SpeechRecognition pakotnes detaļām, ļaujot arī apskatīt atmiņas joslu, lai saprastu, kā runas atpazīšanas sistēmas gadu gaitā ir attīstījušās.

Pats pirmais runas atpazīšanas prototips faktiski bija rotaļlieta ar nosaukumu radio rex kas nāca ap 1920. gadu. Tai bija suns, kurš sēdēja suņu mājā, un tas parādīsies, tiklīdz kāds izrunās vārdu rex.

Vienīgā modeļa problēma bija tā, ka atspere tika piestiprināta pie elektromagnēta, kas bija jutīgs pret enerģiju, kas svārstās ap 500 Hz. Tā kā tas ir tikai frekvences detektors, to attālināti varētu nosaukt par runas atpazīšanas modeli.

1962. gadā IBM nāca klajā ar kurpju kaste modelis, kas spēja atpazīt atsevišķus vārdus un arī veikt dažas aritmētiskās darbības.

Tad nāca HARPIJA no CMU, kas spēja atpazīt savienoto runu no 1000 vārdu leksikas. Ap 80. gadiem cilvēki sāka izmantot statistikas modeļus, un viena no visbiežāk izmantotajām mašīnmācīšanās paradigmām bija slēptais markova modelis.

Pēc dziļu neironu tīklu ieviešanas lielākā daļa runas atpazīšanas modeļu darbojas neironu tīklos. Iespējas nav iedomājamas neironu tīklos, vārdu krājums var sasniegt 10k un vairāk vārdu.

Kā instalēt runas atpazīšanu Python?

Lai instalētu SpeechRecognition pakotni ir pitons, palaidiet šādu komandu terminālā, un tā tiks instalēta jūsu sistēmā.

instalācija-runas atpazīšana python-edureka

Vēl viena pieeja tam var būt paketes pievienošana no projekta tulka, ja izmantojat

Paketei ir atpazīšanas klase, kurā burvība notiek galvenokārt. Būtībā tā ir klase, kuru izmanto runas atpazīšanai. Tālāk ir norādītas septiņas metodes, ar kurām var lasīt dažādus audio avotus, izmantojot dažādas API.

  • atpazīt_bingu ()
  • atpazīt_google ()
  • atpazīt_google_cloud ()
  • atpazīt_houndify ()
  • atpazīt_ibm ()
  • atpazīt_apziņu ()
  • atpazīt_sfinksu ()

Tagad atpazīšanas_sfinxu var izmantot, lai runas atpazīšanas sistēmu palaistu arī bezsaistē. Tas prasa Pocketsphinx instalēšanu.

importēt runas atpazīšanu kā sr # atpazītājklases r = sr.Recognizer ()

Ieejas iegūšana no mikrofoniem

Lai izmantotu mikrofonus, mums būs jāinstalē arī pyaudio modulis. Lai iegūtu ievades runu no mikrofona, mēs izmantojam mikrofona klasi, nevis jebkuru citu ievades metodi, piemēram, audio failu.

Lielākajai daļai projektu mēs varam izmantot noklusējuma mikrofonus. Bet, ja nevēlaties izmantot noklusējuma mikrofonu,mikrofonu nosaukumu sarakstu var iegūt, izmantojot metodi list_microphone_names.

Lai ierakstītu mikrofona ievadi, mēs izmantojam klausīšanās metodi.

importēt runas atpazīšanu kā sr r = sr. Atpazītājs () ar sr. Mikrofons () kā avots: audio = sr. klausīties (avots)

Kā instalēt Pyaudio Python?

Lai instalētu Pyaudio python, palaidiet šādu komandu terminālā vai, ja izmantojat pycharm, iestatījumos pievienojiet paketi no projekta tulka.

informatikas apmācība iesācējiem pdf

Izmantot gadījumu

Mēs izveidosim programmu, izmantojot python runas atpazīšanas moduli, lai atpazītu runu un izpildītu sekojošo:

  1. pārvērst runu par tekstu
  2. atveriet URL, izmantojot tīmekļa pārlūkprogrammas moduli
  3. nododiet vaicājumu, izmantojot runas atpazīšanu, lai meklētu URL

Tālāk ir aprakstīta iepriekš minētā problēmas izklāsta programma:

importēt runas atpazīšanu kā sr importēt tīmekļa pārlūkprogrammu kā wb r1 = sr.Recognizer () r2 = sr.Recognizer () r3 = sr.Recognizer () ar sr.Microphone () kā avotu: print ('[meklēt edureka: meklēt youtube]') drukāt ('runājiet tagad') audio = r3.klausieties (avots), ja 'edureka' r2.recognize_google (audio): r2 = sr.Recognizer () url = 'https://www.edureka.co/' ar sr .Mikrofons () kā avots: drukāt ('meklēt vaicājumā') audio = r2.klausīties (avots) mēģināt: get = r2.atpazīt_google (audio) drukāt (iegūt) wb.get (). Open_new (url + get) izņemot sr.UnknownValueError: print ('kļūda'), izņemot sr.RequestError kā e: print ('neizdevās'. formāts (e)), ja 'video' ierakstā r1.recognize_google (audio): r1 = sr.Recognizer () url = ' https://www.youtube.com/results?search_query= 'ar sr.Microphone () kā avotu: print (' meklēt video ') audio = r2.klausieties (avots) try: get = r1.recognize_google (audio ) print (get) wb.get (). open_new (url + get), izņemot sr.UnknownValueError: print ('nevarēju saprast'), izņemot sr.RequestError kā e: print (neizdevās iegūt rezultātus. formāts (e) )

Jūs iegūsiet izvadi, kā tas parādīts attēlā. Ja jūs sakāt edureka, tas liks jums pateikt vaicājumu, kuru vēlaties meklēt edureka URL, kuru esam ierakstījuši url mainīgajā. Ja jūs sakāt python, pārlūkprogrammā tiks atvērta šāda tīmekļa lapa.

Šajā emuārā mēs esam apsprieduši, kā mēs varam izmantot runas atpazīšanu pitonā, lai tulkotu runu tekstā, izmantojot runas atpazīšanas paketi. ir kļuvis par stundas nepieciešamību tādiem jēdzieniem kā runas atpazīšana vai objektu noraidīšana ar kas runas atpazīšanas sistēmām sniedz neiedomājamas iespējas, kur mēs varam apmācīt un pārbaudīt milzīgus runas datus, lai izveidotu sistēmu. Jūs varat reģistrēties lai dziļi neironu tīkli apgūtu savas prasmes un sāktu mācīties.

ir kādi jautājumi? pieminiet tos komentāros, mēs sazināsimies ar jums.