Le crowdsourcing : un outil efficace pour améliorer nos programmes

Utilisé en entreprise ou pour développer des programmes, le crowdsourcing est aujourd’hui partout sur Internet. Vous y avez vous-même probablement contribué aujourd’hui, en effectuant une recherche sur Google, en demandant une traduction en ligne ou simplement en utilisant une application GPS sur votre smartphone.

Qu’est-ce que le crowdsourcing ?

Le « crowdsourcing », ou production participative, consiste à utiliser les connaissances, le savoir-faire ou les informations d’une multitude d’individus pour alimenter des bases de données et les traiter à travers des programmes, dans le but de faciliter le machine learning. Cette technique est employée par des dizaines d’entreprises qui exploitent les capacités de milliards d’utilisateurs dans le monde. Le crowdsourcing peut être rémunéré ou récompensé s’il s’agit de partager volontairement ou de contrôler les informations fournies à la machine, même si la plupart du temps il reste bénévole.

Le crowdsourcing
Source : http://www.erasmusplus.it

Bénévole dans la mesure où nous travaillons tous, parfois sans le savoir, à l’amélioration de ces systèmes, à travers nos recherches Google, nos trajets, nos consultations en ligne, nos « likes » sur les réseaux sociaux ou nos interactions avec les assistants vocaux. Toutes ces données peuvent être utiles à des entreprises comme Google, Facebook ou Amazon qui vont se les approprier pour en abreuver leurs programmes d’analyse du comportement humain et par la suite, nous proposer des résultats plus proches de notre recherche ou des publicités personnalisées pour nous faciliter l’utilisation d’Internet. Tout ceci, à des fins commerciales, bien sûr.

Pour vous donner un exemple, on peut utiliser celui cité par Antonio A. Casilli dans son ouvrage En attendant les robots. Il explique que derrière les reCAPTCHA (licence détenue par Google) se cache en réalité un ingénieux programme de machine learning. À la différence du CAPTCHA traditionnel qui utilise la reconnaissance visuelle d’un seul mot déformé, le reCAPTCHA reconnait 2 mots.  Un mot qu’il connaît déjà et un autre que vous déchiffrez à la place de l’ordinateur. Si vous réussissez à reconnaître le premier mot, le reCAPTCHA supposera que vous avez réussi à déchiffrer le second, et enregistra votre réponse dans sa base de données. On utilise cette réponse pour analyser informatiquement un livre numérisé grâce à un programme de reconnaissance de texte. Il est aussi commun d’en trouver sous la forme d’images, puisque la reconnaissance d’images reste peu développée pour le moment.

Donc nous travaillons tous au développement de ces grandes entreprises ?

Nos actions en ligne sont en effet exploitées par des algorithmes pour analyser nos connaissances et notre comportement, et permettre des résultats plus « humains » de la part des ordinateurs. Mais peut-on réellement considérer notre implication dans ce procédé comme du travail ? Oui, dans la mesure où celui-ci est défini comme la production d’un service ou d’un bien. Nous mettons à disposition de ses entreprises notre savoir-faire et notre capacité d’adaptation, c’est donc bien la production d’un service.

Se pose alors la question de la rémunération : « Tout travail mérite salaire ». Cette expression ne semble pas s’appliquer ici. Certains experts en sociologie du numérique estiment qu’un revenu universel du numérique, aussi minime soit-il, devrait être mis en place pour rémunérer chaque utilisateur. Cependant, il ne faut pas oublier que les groupes comme Google, Apple, Facebook ou Microsoft nous fournissent un certain nombre de services gratuits et que nous pouvons tous exploiter en échange de nos données.

Par exemple, grâce à la géolocalisation d’un utilisateur, Google pourra calculer un itinéraire plus rapide pour des dizaines d’autres. De la même manière, Facebook pourra proposer des résultats de recherche permettant de gagner du temps plutôt que d’exécuter toute la recherche manuellement depuis notre propre poste informatique. C’est donc un système d’échange de services gratuits entre nous et ces grands groupes.

Et la traduction dans tout ça ? 

Les traducteurs automatiques en ligne fonctionnent en partie sur le même principe. Lorsqu’un utilisateur entre une requête, on pourra l’enregistrée et utilisée pour de futures demandes. Les résultats proposés par le traducteur seront donc, eux aussi, le fruit d’un algorithme. Celui-ci aura analysé des milliers de demandes similaires pour calculer la probabilité qu’un terme apparaisse dans la traduction. C’est donc généralement un jeu de probabilités, calculées selon les recherches précédentes. 

Grâce à ses nombreux services, Google a ainsi pu accumuler une masse immense de textes rédigés par des auteurs (blogs et sites Internet, livres sur Google Books, journaux en ligne, etc.). Toutes ces données peuvent ainsi entrer en considération pour certains programmes de reconnaissance et de traduction proposés par la marque.

Ces programmes et algorithmes rendent les traducteurs en ligne de plus en plus performants. Toutefois, de nombreuses avancées restent à faire en termes de compréhension de textes plus littéraires, imagés, et donc plus complexes. Cet usage des probabilités est aussi valable pour les logiciels de TAO. Cependant, les résultats seront, en principe, contrôlés par une intelligence humaine. Cela assurera une meilleure traduction que celle proposée par un simple calcul informatique. L’intervention de l’Homme reste donc pour le moment indispensable pour parvenir à une traduction parfaite.

Article écrit par Justine ALVES, Master CAWEB

Laisser un commentaire

Bouton retour vers haut de page