pointerMachine Learning sulle emoji

Quasi la metà dei commenti scambiati su Instagr.am sono emoji (in Finlandia la percentuale rispetto a messaggi testuali arriva al 60%); spesso adottate, come hanno scoperto quelli di Instagr.am, a discapito non di una prosa forbita ed elegante ma dello slang tipico di internet (xoxo, omg, lol, ahah o eheh). L’emoji, insomma, non rimpiazza una parola ricca di significato ma il lol tanto abusato — pazienza, quindi. Forse anche meglio.

Dato il loro uso pervasivo, Instagr.am ha cercato di analizzarle, provando a individuare lo spettro di significati che ogni emoji si porta dietro, come queste si associno fra loro. Già è difficile capire i significati che 👯 si porta dietro rispetto a 💃, ma in che modo un cuore 💚  si distingue da uno 💛?

Having learned a good representation for emoji, we can begin to ask questions about similarity. Namely, for a given emoji, what English words are semantically similar? For each emoji, we compute the “angle” (equivalently the cosine similarity) between it and other words. Words with a small angle are said to be similar and provide a natural, English-language translation for that emoji.

Continua a leggere sul blog di Instagr.am.