Hvorfor A.I. Kan kæmpe for at forstå arabisk

$config[ads_kvadrat] not found

String Theory Explained – What is The True Nature of Reality?

String Theory Explained – What is The True Nature of Reality?
Anonim

I verden af ​​kunstig intelligens er data kong. Jo mere du har, desto bedre bliver dine værktøjer, da systemer kan "lære" mere om, hvad man kan forvente. Men afhængigt af platformen er A.I. er at tegne data fra, nogle sprog kan være bedre repræsenteret end andre, ifølge Miriam Redi, en forsker for Yahoo Labs.

"For eksempel som Flickr, hvor vi tager vores data fra, er nogle sprog meget lidt repræsenteret," sagde Redi, der talte på Londons Deep Learning Summit på torsdag. "Så vi har engelsk, millioner af billeder til engelsk, men vi har måske 100.000 for arabisk."

Redis team arbejder på et værktøj, der kan identificere ikke-synlige elementer til billeder, som kulturelle værdier og følelsesmæssige konnotationer. Værktøjet analyserer teksten knyttet til offentligt tilgængelige billeder på Flickr. Over tid vil A.I. begynder at forstå, hvorfor nogen kan mærke et billede "happy party" eller "akavet øjeblik", men disse ideer vil vokse mere præcist, da værktøjet analyserer flere billeder.

"Uheldigvis er nøjagtigheden for følelsesdetektion i billeder til arabiske sprog en tendens til at være lavere, fordi vi ikke har nok data," sagde Redi.

På de sprog, der havde større mængder data, så Redis hold et par interessante mønstre. Romance-sprog som fransk og spansk har tendens til at udtrykke sig på lignende måder, mens italienerne syntes at være det eneste sprog, hvor brugerne identificerede billeder med udtrykket "skatteunddragelse".

Sprogbarrierer forbliver stadig noget af et problem for A.I. forskere. Enhver, der har brugt Google Translate, vil vide, at skiftende sprog aldrig er lige så simpelt som det lyder. Men nye udviklinger ændrer ting, med Facebook, der annoncerer i sommer, at den var ved at komme tættere på sin drøm om et enkeltsprogligt socialt netværk, der automatisk oversætter tekster til brugere.

Udviklingen i fjernelse af sprogbarrierer kan bidrage til at fremme international kommunikation, men for projekter som Redi er der ingen reel erstatning for menneskeskabte følelsesdata.

$config[ads_kvadrat] not found