Jeg vil gerne som mit næste projekt i delphi lave et program som gør at man kan stemmestyre computeren. men jeg ved ikke hvordan at man får den til at se om lyden der kommer gemmen lydkortet fra mikrofonen, er næsten ligesom en lyden i en lydfil. sådan at hvis den næsten er ens, så kan den gøre et eller andet. kort sagt hvordan får man den til at tjekke om man prøver at sige det samme som er i en lydfil, og så hvis det cirka er ens, så gør den et eller andet.
jpvj -> Hvorfor har det ikke noget med binær sammenligning at gøre?
Hvis man vælger at bruge ting som micosoft SAPI gør man det også umuligt fx at lave så man ikke bare kan sige noget helt ulogisk og så forstår den det, det skal med andre ord være korrekt engelsk før den kan se hvad man prøver at sige.
Det rigtig udgangspunkt er da netop det som jonat selv siger, hvis man havde en funktion som havde hastigheden til at sammenligne input med flere lydfiler ville det være løst!
Enig i jpvjs kommentar. Det er ikke nok at sammenligne to lydfiler - det kommer ikke til at virke. Forskellige former for spektralanalyse kan komme det lidt nærmere, men jeg tvivler stadig (der er en grund til at stemmegenkendelse først nu er ved at blive brugbart)
det jeg siger er at hvis man forstår at læse en fx en wave fil som forskellige lyd frekvenser og sammenligne med input frekvenser tror jeg det er muligt. (spektralanalyse)
Siger ikke at man skal gemme alt lyd fra mic og tjekke det med crc :P ..
Nu er der jo nok en grund til, at der bruges millioner af dollars på at forske i dette emne - så regn ikke med, at man liiige skruer et eller andet sammen...
Det er håbløst at forsøge at sammenligne et input fra en mic med en wav fil - og så måske tage højde for om de ligner hinanden lidt..
Du skal tage hastigheden, hvor med ordet udtales med i betragtning - og iøvrigt også tonelejet (en smule forkølet???).
Det kræver en del FFT analyser og en del andet, før du overhovedet nærmer dig noget brugbart.
--> doc404. Hvad er FFT? Jeg Glemte at sige at jeg er nybegynder inden for delphi ;-) (2 år. hvor det har været en fritids interesse). Og så behøver den ikke at kunne gendkende lyden hvis man er forkølet, det skal bare være et supplerendene program til windows. Men hvordan laver man den FFT analyse. Jeg har hørt fra en jeg kender at det er meget svært at lave det hvis den skal genkende flere forskellige personer, men at det er lettere at lave hvis det kun er for en person. (Og det er det jeg skal lave.) Ellers ligger der ikke et component, et eller andet sted man kan bruge??
jeg kan ikke hente nogle af komponenterne nu.. jeg sidder inde på en skole. Kan nok kommentere det i aften men det ser ud til at der er noget jeg kan bruge der.
Det er muligt at lave stemmestyring i Delphi ved hjælp af SAPI. Glem alt om fil-analyse!! Det største problem er, at der ikke findes en dansk version af SAPI.
Jeg har kun d4 standard.. og så vidt jeg kan læse ud fra det er det kun hvis man har mindst delphi 5. Hvis det er ved i så hvor man kan skaffe en større version af delpi hvis man ikke skal bruge 40-50000 kr. på det?? jeg har læst at de skulle være på alt for data nogle gange, men hvordan skaffer man eldræ udgaver af det blad???
Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.