Microsoft Research Investerer bedre-end-Human Speech Recognition

$config[ads_kvadrat] not found

Derfor vil Tine give dig hjerneorgasme

Derfor vil Tine give dig hjerneorgasme
Anonim

Microsoft er blevet verdens første virksomhed til at udvikle talegenkendelse software, der er mere præcis end mennesker. I papiret "Opnåelse af menneskelig paritet i conversational speech recognition", der blev offentliggjort mandag, producerede softwaren udskrifter, der indeholdt halvdelen procent færre fejl end menneskelige anstrengelser, hvilket er utroligt at overveje, hvor godt folk er ved at forstå tale. Gennembrudet åbner døren for nye A.I. assistenter, der er mere præcise end nogensinde før.

Det er imponerende, hvor langt teknologien er kommet på så kort tid. Det var ikke for længe siden, at computer talegenkendelse var en mærkelig niche, der syntes håbløst fjernt. Se denne demonstration af Windows Vista talesoftware fra 2006:

Holdet anvendte National Institute of Standards and Technology (NIST) 2000 test, der blev brugt i hele branchen til at måle pålideligheden af ​​taletransskriptioner. En samtale foregår mellem to deltagere over telefonen, drej for tur, før det resulterende script sammenlignes og kontrolleres mod ordbogstavler.

I omstillingsdelen, hvor to fremmede taler for første gang, er den menneskelige fejlfrekvens omkring 5,9 procent, mens der på call home-delen, hvor to personer, der kender hinanden taler, er fejlfrekvensen omkring 11,3 procent. Microsofts software scorede omkring 0,4 procent lavere fejlfrekvens.

Gennembruddet hjælper med at skabe nye former for fordybende A.I.. I august tog student Joshua Browder omslaget fra sin DoNotPay chatbot, som kan hjælpe hjemløse med gratis juridisk rådgivning. Kombineret med anerkendelsesfremskridt er det nemt at se en fremtid, hvor folk spørger en virtuel assistent om hjælp til bolig ved at have en regelmæssig samtale med deres computer.

På nuværende tidspunkt overvejer forskere, hvordan A.I.-drevet talegenkendelse kan give klogere svar. Sensay, en vrede-detektion A.I. fra laboratoriet bag Siri bruger avancerede genkendelsesfunktioner til at opdage, om en bruger føler sig vred eller forvirret og ændrer sine svar, så de passer til situationen. Fjernelse af barrieren for fejlsynlig stemmegenkendelse skaber spændende nye muligheder for virtuel hjælp.

$config[ads_kvadrat] not found