Accéder au contenu principal

How Google Converted Language Translation Into a Problem of Vector Space Mathematics


Technology Review (09/25/13) 

Google researchers have developed a technique that uses vector space mathematics for language conversion. Instead of using versions of the same document in different languages, the technique relies on data mining to model the structure of a single language and then compares this to another language's structure. Their method is based on the notion that all languages have to describe a similar set of ideas, requiring similar words to accomplish this. The researchers determined a way to represent a language using the relationship between its words. The set of all the relationships, or the language space, can be visualized as a set of vectors pointing from one word to another; linguists recently have found that these vectors can be approached mathematically. Converting one language into another becomes a mathematical task of determining the transformation that converts one vector space into the other. To map the vector spaces, the researchers use a small bilingual dictionary developed by humans that compares the same body of words in two languages, to lay the groundwork for the linear transformation. The mapping can then be applied to larger language spaces. The researchers note that although their method is simple, it achieves almost 90-percent precision for English and Spanish translation, and is equally effective with less closely-related languages, such as English and Vietnamese.

Commentaires

Posts les plus consultés de ce blog

le Conservatoire (Cnam) accueille le Forum science, recherche & société

Demain, le Conservatoire accueille le Forum science, recherche & société
Le jeudi 22 mai, le Conservatoire accueille la sixième édition du Forum science, recherche & société (SRS). Créé par le journal Le Monde et le magazine La Recherche en 2009, cet événement propose à un large public de venir à la rencontre du monde scientifique, pour découvrir, comprendre et échanger sur les recherches d’aujourd’hui, les découvertes de demain et toutes les technologies qui ont fait, peuplent ou détermineront notre quotidien.

À partir de 9 heures, et tout au long de la journée, des tables rondes, conférences, projections de documentaires, démonstrations de serious games... verront se succéder une cinquantaine d’intervenants chercheurs, philosophes, acteurs de la société civile et essayistes pour apporter l’éclairage des sciences et de la recherche sur des enjeux de société présents et à venir.

Des grilles de l’établissement à la salle des textiles, de la cour d’honneur à l’amphithéâtre Paul-Pai…

Expérience professionnelle Cnam Liban informatique

Au Cnam Liban 1/3 des crédits environs sont attribués à l'expérience professionnelle, voici les conditions de validation de cette expérience:

Source : département informatique Cnam Liban , Computer Science Lebanon for adult training and continuous training
Les titres du répertoire national des certifications professionnelles (RNCP)Les diplômes de niveau III (bac+2) :
2 ans d’expérience professionnelle dans le domaine ou 2 ans en dehors du domaine
+ 3 mois de stage dans la spécialitéLes diplômes de niveau II (bac+3/4) :
2 ans d’expérience professionnelle dans le domaine ou 3 ans en dehors du domaine
+ un stage de 3 à 6 mois selon la spécialitéLes licencesParcours complet L1, L2, L3
3 ans d’expérience professionnelle dont 1 an dans le domaine validé par un rapport
d’activité. Si l’expérience professionnelle est en dehors de la spécialité : 3 ans + 6 mois de
stage dans la spécialitéParcours L3
1 an d’expérience professionnelle dans le domaine validé par un rapport d’activité.
Si l’expérience…

Certificat de spécialisation Big Data à l'ISSAE Cnam Liban

Ce certificat offre la possibilité à des informaticiens, mathématiciens, statisticiens de suivre une formation professionnelle pluridisciplinaire pour acquérir les compétences propres à l'exercice du métier émergent de data scientist également appelé "analyste big data".
Alliant des compétences en mathématiques, statistique, informatique, visualisation de données ; il est capable de stocker, rechercher, capter, partager, interroger et donner du sens à d'énormes volumes d'informations: des données structurées et non structurées, produites en temps réel et provenant de sources diverses.
À l'ISSAE Cnam Liban un Certificat de spécialisation Analyste de données massives est proposé si vous êtes intéressé vous pouvez vous faire connaitre en remplissant ce formulaire : https://cnamliban.page.link/inscriptionDS

Ce certificat est disponible hors temps de travail, le soir ou le samedi.