Tutorial

Fejlfinding Common Speech Recognition Problemer

I de tidligere tutorials om Speech Recognition lærte du, hvordan du konfigurerer denne applikation og det grundlæggende ved at bruge det. Talegenkendelse virker overraskende godt "lige ud af boksen", og det er ret sofistikeret for en indbygget applikation. Dette er dog ikke at sige, at det er tåbeligt. Lad os tage et kig på nogle af de fælles problemer i talegenkendelse, og hvordan man retter dem.

Jeg taler, men absolut sker ingenting

Lad os se det, vi kender alle den mest sandsynlige årsag, og vi er alle blevet fanget af noget som dette på et eller andet tidspunkt. Heldigvis er det meget ligetil at fastsætte de mest sandsynlige problemer:

Er din mikrofon tilsluttet?
Hvis mikrofonen har en lydløs knap, er den blevet trykket?
Er mikrofonindgangen dæmpet i Kontrolpanel -> Hardware og lyd -> Juster systemstyrken eller i dit lydkorts egen software?

Tilslut mikrofonen eller sluk for den, og du skal være god til at gå. Microsoft har nogle andre forslag til forslag til mikrofonfejl her, for mindre almindelige problemer: Fejlfinding af talegenkendelsesproblemer.

Jeg taler, og den blå bjælke angiver input af en slags, men talegenkendelse svarer ikke.

Sørg for, at din mikrofon ikke er dæmpet. Skrivebordsmikrofoner har ofte en knap på bunden, der tændes, når mikrofonen er aktiv, så det er nemt at vide, om mikrofonen er tændt eller slukket. Headsets har normalt en knap i ledningen og har muligvis ingen bestemt indikation for, at mikrofonen er aktiv. Selvom du er sikker på at du har kontakten i den rigtige position, skal du prøve at trykke på den igen.
Husk, du skal sige "Start Listening" for at vække programmet op. Du kan også højreklikke på den runde knap med mikrofonen i den og vælge "Til: Lyt til alt, hvad jeg siger" . Du tror, at en sådan indstilling vil blive husket, og Talegenkendelse vil så altid starte i "Lytte" -tilstand, men desværre er det ikke sådan, det virker.

Vent ... hvis min mikrofon er dæmpet, hvorfor ser talegenkendelse input?

Dette er en "gotcha", der er overraskende almindeligt. Mikrofonen eller headsettet kan være lydløst, men der kan være en anden aktiv mikrofon, som du ikke har tænkt på som en i et webcam. Husk, hvordan vi opretter mikrofonen i den første vejledning (Arbejde med talegenkendelse: Opsætning og konfiguration)?

Efter opsætning af headsettet er det let at overse en anden inputkilde. Her, som du kan se, var mit webcam mikrofon aktivt.

Klik på den pågældende kilde, og klik derefter på Egenskaber . Derfra kan du vælge at deaktivere kilden.

Og her løber du ind i en anden "gotcha". Når du vælger at deaktivere en enhed, forsvinder den fra listen over tilgængelige enheder.

Enheden er faktisk ikke væk. Højreklik på et vilkårligt sted i kassen, og vælg "Vis deaktiverede enheder" .

Og nu ser du den mikrofon igen med notationen, at den er deaktiveret. Du kan til enhver tid genaktivere det. (Dit lydpanel viser dine egne enheder og vil sandsynligvis ikke se præcis sådan ud.)

Jeg taler langsomt og tydeligt, men talegenkendelse fortsætter med at indsætte gibberish i teksten.

Samme som ovenfor - det er næsten sikkert, at du har mere end en mikrofon aktiv. Dobbeltkryds og deaktiver den, du ikke bruger.

Jeg taler langsomt og tydeligt, men talegenkendelse holder mig misforståeligt. Ordene det vælger er ikke korrekte.

Talegenkendelse er god, men det er ikke perfekt. Hvis du stadig har problemer, ville det være en god idé at tage tid til at træne det for at genkende din stemme og din udtale. Husk hvordan vi hoppede over det pågældende emne i Kontrolpanel -> Talegenkendelse ? Du kan gå tilbage gennem kontrolpanelet og vælge det.

Eller du kan højreklikke på den blå mikrofon-knap og vælge Konfiguration -> Forbedre talegenkendelse .

På nogen måde åbner du Voice Training . Dette er selvforklarende, og du kan gå igennem det så mange gange som du vil. Herefter vil talegenkendelse forstå dig meget bedre.

Speech Recognition gadget blokerer noget, jeg skal se.

Gadgeten er som standard docket øverst på skærmen. Men du kan trække og slippe det overalt på skærmen. Som du kan se, vil det ændre form lidt. Og det vil forblive på toppen af noget andet på skærmen.

Uanset hvad jeg gør, kan jeg ikke få talegenkendelse til at arbejde med et program, jeg virkelig vil bruge.

Selvom talegenkendelse vil fungere med en bred vifte af ikke-Microsoft-software (jeg har prøvet det med Google Chrome og Eudora e-mail-klienten med fornuftig succes) for eksempel, vil det ikke fungere med alt. Dette er en af begrænsningerne i Speech Recognition, og der er ingen rettelse til det. Som jeg tidligere nævnte, synes Adobe-software at være mest modstandsdygtig. Hvis du virkelig vil bruge talegenkendelse med alle dine yndlingssoftware, ville du være meget lykkeligere med kommerciel talegenkendelse software som Dragon Naturally Speaking.

Så bliver du anerkendt?

Har du forsøgt talegenkendelse ? Hvad har din erfaring været? Har du haft problemer med det, der ikke er dækket her? Tag venligst tid til at forlade en besked og fortæl os. Også, for mere nyttige artikler om dette værktøj, tøv ikke med at kontrollere vores anbefalinger nedenfor.