Sprogmatik bruger AI til at udskrive sprog, og det slår Google

3 Responsibilities of Startup CEO

Speechmatics går efter Google. Den britiske opstart tog wraps off automatisk sprogkunstner i sidste måned, en kraftig kunstig intelligens, der kan lære noget sprog til tale-til-tekst transkription i løbet af få dage. Holdet ønsker at aktivere teknologien til alle de ca. 7.000 sprog i verden med potentiale til at omdanne liv.

Speechmatics har siden lanceringen af sprogværktøjet arbejdet på Omniglot, en udfordring at opbygge et sprog om dagen. I sidste uge ramte firmaet en stor milepæl: Det har officielt slået Google, med 72 unikke sprog i alt.

Systemet bruger maskine læring til at matche lyddata med en transkription modpart. Det bruger så sproglige mønstre fra andre sprog til at gøre processen så let som muligt, og identificere lighederne mellem lyde og grammatiske strukturer og anvende dem på nye sprog. Processen er meget effektiv: Som et eksempel tog Speechmatics 'arbejde på hindi kun to uger for at nå 80 procent nøjagtighed. Da det endelige produkt blev testet mod Googles indsats, gjorde det 23 procent færre fejl.

Inverse talte med Benedikt von Thüngen, CEO for Speechmatics, for at finde ud af mere.

Hvordan begyndte teamet først at arbejde på projektet?

Vi startede projektet Omniglot som en udfordring for os selv - for at se, hvor mange sprog vi kunne bygge i seks uger. Vi realiserede et stykke tid tilbage, at den traditionelle tilgang til at bygge hvert sprog individuelt ikke længere er levedygtig, når man ser på skalaen med en hurtig hastighed. Med det for øje måtte vi genoverveje, hvad et sprog er, hvordan det er struktureret og hvilke ligheder der er mellem forskellige sprog. Vi har fundet en måde at bruge disse fællesheder til at identificere mønstre og hjælpe vores AI-drevne ramme, Automatic Linguist (AL), at opbygge sprog hurtigere end nogensinde - 46 om seks uger for at være præcise eller om et sprog om dagen i seks uger !

Hvordan adskiller dette sig fra Googles indsats?

Vores tilgang til sprogbygning er et af hovedaspekterne, som adskiller os fra Google. Selvom vi antager, at de bygger deres sprog individuelt (eller ved det vi kalder "brute force"), bruger vi kraften til A.I. at strømline og fremskynde sprogopbygningsprocessen. Mens andre tjenester som Google fokuserer på at bygge dialekter frem for unikke sprog, er vi stolte af at sige, at vores indsats har været fokuseret på unikke sprog fra hele verden, herunder områder, der tidligere har været underbevist af de store teknologiselskaber.

Hvad er nogle af de virkelige applikationer til dette?

Vi har nu teknikken og viden til at gøre vores service mere vidtrækkende end nogensinde før og bringe automatisk talegjenkendelse (ASR) til alle. Dette er især relevant i lande med lavt literacy-forhold, hvor evnen til at bruge tidligere utilgængelig tale-til-tekst teknologi til at kommunikere kan gøre hele forskellen for mennesker. Andre egentlige tilfælde, hvor ASR-teknologi kan hjælpe med at gøre problemer med tilgængelighed - høre- og / eller synshandicappede mennesker fra hele verden kan nu bruge en enhed så simpelt som en telefon til at interagere med dem omkring dem.

Forbedrer dette nøjagtigheden af veldækkede sprog som engelsk?

Da vi fortsætter med at udvikle flere sprog, vores A.I. Rammerne bliver mere og mere dygtige til at identificere sproglige træk og mønstre. Vi vil bruge denne viden til fortsat at forbedre vores nuværende sprogbase, herunder engelsk.

Kan dette forbedre noget som Google Pixel Buds 'oversættelsesværktøjer i realtid?

Vi ser definitivt projekter som Omniglot, der hjælper med at forbedre real-time oversættelsesværktøjer fremadrettet. Da flere ressourcer er investeret i at udvide rækkevidden og nøjagtigheden af sprog, vil vi se løbende forbedringer i oversættelsessektoren.

Fungerer dette med ethvert sprog, endda konstruerede sprog som Klingon?

Vi har endnu ikke prøvet at bygge noget sammen, men vi kan ikke se nogen grunde til, at de ikke ville fungere. Da disse sprog stadig talt af mennesker, følger de også lignende strukturelle regler og begrænsninger som hverdags sprog (fx antal fonemer), hvilket ville give AL nok data til en bygning.

Åbner du indkøb af projektet?

Nej, vi har ikke planer for det på plads.

Hvordan vil licens arbejde?

De sprog, der tilbydes under projektet Omniglot, er gratis og kan ikke bruges til kommercielle formål. Som sådan vil der ikke være nogen licens i tilknytning til dem i overskuelig fremtid.

Hvad er de næste skridt herfra?

Projekt Omniglot er bare starten for os. Vi vil til sidst bygge hvert sprog i verden, så vi arbejder hårdt mod det mål!

Hvor lang tid vil det tage en kunstner at udskrive Wikipedia

Fra kl. 4:45 i eftermiddag indeholder engelsk Wikipedia 4,894,108 artikler. Siden "Wikipedia: Statistikker" anslås, at der oprettes 750 nye artikler om dagen, og Wikimedia-projektets redaktionstæller er mindboggling at se - mere end en redigeringsrulle i hvert sekund. New York Times vurderer, at hele ...

Nootropiske producenter bruger videnskabeligt sprog til at undgå sammenligningen af tilskud

Ingen kan lide suppleringsindustrien, som i tvivl er tvivlsom, kriminel i værste fald, og låst i en kamp med FDA, der formår at være på en gang kedelig og kedelig. Men nootropics, kosttilskud til at øge hukommelsen og læring, er elskede i Silicon Valley, på Wall Street, og i stærkt konkurrencedygtige gymnasier med Ritalin s ...

Rohingya Sprog: Drej en dialekt til et digitaliseret sprog

Mens Rohingya-folkene har oplevet en voldelig undertrykkelse i Myanmar, kunne de få et nyt redskab til at bevare deres kulturelle identitet: et digitalt sprog.

$config[ads_kvadrat] not found

Sprogmatik bruger AI til at udskrive sprog, og det slår Google

3 Responsibilities of Startup CEO

Hvor lang tid vil det tage en kunstner at udskrive Wikipedia

Nootropiske producenter bruger videnskabeligt sprog til at undgå sammenligningen af ​​tilskud

Rohingya Sprog: Drej en dialekt til et digitaliseret sprog

Nootropiske producenter bruger videnskabeligt sprog til at undgå sammenligningen af tilskud