Tutorial

Talegenkendelse: Eftertanke på dens styrker og svagheder

Jeg må indrømme, at jeg ikke havde brugt nogen form for talegennkendelse i lang tid, da jeg blev bedt om at gøre tutorials. Sidste gang jeg havde forsøgt talegenkendelse, var det med Dragon Dictate, som var nyt, da Windows 98 også var nyt. For meget lang tid siden i computer år!

Jeg var glad for at tackle dette emne, fordi jeg var meget interesseret i at se, hvordan talegenkendelse har forbedret sig. Og dreng, har det forbedret! Selv en grundlæggende, indbygget applikation som dette gjorde et fantastisk godt job "lige ud af boksen." I denne sidste artikel om Talegenkendelse vil jeg gerne snakke om det, jeg lærte, mens jeg reacquainted mig med talegjenkendelsens underværd, og hvor jeg kommer herfra.

Ikke klar til Star Trek endnu

Jeg er sikker på, at mange af os så på Starship Enterprise's besætning, der sagde "Computer!" og få et øjeblikkeligt svar. Vi har endnu ikke Starfleet-computere, men begynder med Windows Vista og fortsætter i Windows 7. Vi har computere, der vil lytte til os og svare på det, vi fortæller dem, og svar os, hvis "Hvad var det?" betragtes som et svar.

Jeg havde problemer, da jeg først forsøgte at bruge talegenkendelse, og fejlfinding var ikke særlig ligetil. Hjælpefilerne er ikke altid tilstrækkelige nok. Jeg kunne finde svarene på Microsofts hjemmeside og i et udvalg af online fora uden for meget arbejde. Sådan fandt jeg ud af, at jeg havde glemt, at mit webcam (sidder lige foran mig på toppen af ​​min skærm og direkte i tråd med den måde, jeg talte) også havde en aktiv mikrofon og tilføjede forvirringen. Når jeg fik det fast, var det smukt glat sejler fra da af.

Jeg forsøgte endda at tale med et udvalg af forskellige accenter (f.eks. BBC British og American Redneck) og kunne få en rimelig god anerkendelse og tillade forskelle i standard amerikansk udtale. Selvfølgelig siger "venner, romere, landsmænd, lån mig dine ører!" mens jeg gjorde mit allerbedste indtryk af Helen Mirren og Jeff Foxworthy fik jeg mig til at grine for meget for at få helt præcise resultater.

Sproggenkendelse

Speech Recognition kan bruges på forskellige sprog, og jeg troede jeg kunne prøve det med min begrænsede amerikanske accent, spansk, tysk og fransk, men desværre kan du ikke bruge andre sprog, medmindre dit operativsystem også findes på dette sprog. Du kan ændre dit operativsystems sprog ved at installere en anden sprogpakke fra Microsoft, men du kan kun gøre det, hvis du kører Windows 7 Ultimate eller Windows 7 Enterprise.

Talegenkendelse er tilgængelig for engelsk, engelsk, fransk, spansk, tysk, japansk, traditionel kinesisk og forenklet kinesisk og findes i disse sprogversioner af Windows 7 (alle versioner). Jeg var ked af at ikke kunne prøve det ud. Jeg har ingen idé om, hvad der vil ske med Windows 8, men jeg tror, ​​at muligheden for at installere andre sprogpakker ville være et godt supplement til Windows 8-ækvivalenterne af Windows 7 Professional og derover.

Hvad fungerer godt

Talegenkendelse er som nævnt designet til at fungere bedst med anden Microsoft-software. Så længe jeg eksperimenterede med Microsoft-produkter, var jeg meget succesfuld (selvom man kunne forvente at bruge Microsoft Office Excel var både begrænset og kompliceret). Med anden software blev det ramt eller savnet. Jeg kunne bruge Google Chrome- browseren temmelig godt (absolut ikke så godt som Internet Explorer ) og mit Eudora- e-mail-program, som nu er ret antikke software. Det er værd at eksperimentere med din egen yndlingssoftware for at se, hvad du kan gøre. Kommandoen "Vis nummer" var særlig nyttig i valg af varer og kommandoer.

Jeg fandt også, at det ikke tog meget lang tid for rigtigheden af ​​anerkendelsen at forbedre sig markant. Jeg gik gennem træningsøvelserne to gange, og derefter var anerkendelsen næsten 100% korrekt. Jeg kunne tale lidt hurtigere og lægge færre pauser for softwaren til at holde op. Jeg nød virkelig at se min stemme oversat til ord på skærmen. Mine tidlige erfaringer med talegenkendelse software var intetsteds nær dette behagelige.

Hvad virker ikke godt

Som nævnt er noget software bare uforeneligt med talegenkendelse . Jeg kunne ikke engang åbne Adobe Reader eller Adobe AIR- versionen af TweetDeck . Jeg fandt ud af, at jeg ikke kunne logge ind på min Google-konto med Internet Explorer for at afprøve Google Docs - det syntes at være nogen måde at tale eller stave min adgangskode til. Jeg formoder, at det her er et sikkerhedsproblem, der ikke tillader, at adgangskoder tales højt, hvor en anden måske hører, men det var irriterende.

Jeg kunne åbne iTunes og vælge en sang til at spille, men kunne faktisk ikke få det til at spille. Jeg kunne åbne Scrivener (min tekstbehandler valgfri), men "Vis tal" lagde ikke tal på noget, jeg ønskede at bruge. Jeg gjorde ikke noget virkelig omfattende forsøg med min yndlings software - det er bare nogle få, jeg forsøgte. Det ville være umagen værd for alle, der ønsker at bruge talegenkendelse til at teste de programmer, de vil bruge det med, for at være sikker på, at det bliver kompatibelt.

Flere links og ressourcer

Hvis du ikke allerede har set de foregående artikler, kan du finde dem her:

  • Arbejde med talegenkendelse: Opsætning og konfiguration
  • Arbejde med talegenkendelse: kommandoer, diktering af tekst og browsing af internettet
  • Fejlfinding Common Speech Recognition Problemer

Det er mærkeligt, at det er næsten umuligt at finde oplysninger om talegenkendelseMicrosoft Answers hjemmeside uden at klikke på et link fra en Google eller Bing-søgning. Jeg kunne slet ikke få svar ved at sætte "Speech Recognition" i søgefeltet, selv om der er et par spørgsmål om det i fora. Brug dette link for at få hjælp til talegenkendelse fra Windows-webstedet: Talegenkendelse søgeresultater.

Her er en kort Wikipedia-artikel, der fortæller om talegenkendelse hos Microsoft: Windows Speech Recognition.

Her er en blogindgang, der giver forfatterens tanker om at sammenligne talegenkendelse med Dragon Naturally Speaking: Dragon NaturallySpeaking Versus Windows 7 Voice Recognition.

Indpakning det

Jeg nød virkelig at arbejde med talegenkendelse og forundre over de forbedringer, der er sket over tid. Det ville helt sikkert være godt nok til afslappet daglig brug, især med Microsoft-produkter.

Vil jeg fortsætte med at bruge talegenkendelse ? Ja, når jeg kan. På dette tidspunkt behøver jeg ikke noget mere sofistikeret. Det var værd at den tid det tog at træne det og at træne mig selv til at bruge det rigtigt.