Est-il possible de faire un bon moteur de recherche sans collecter de données personnelles ?

Le but du moteur de recherche est de renseigner l’internaute avec des réponses pertinentes (et uniquement des réponses pertinentes). Ainsi, un moteur de recherche peut être jugé en fonction de 2 facteurs :

  1. La capacité à renvoyer toutes les pages pertinentes
  2. La capacité à ne renvoyer que des pages pertinentes.

Un bon moteur de recherche excelle dans les 2 cas ci-dessus et peut être résumé en quelques mots : « Toute l’info mais juste l’info nécessaire« .

Pour le moteur de recherche, la tâche est parfois ardue : polysèmes, même mot dans plusieurs langues… Pour ces raisons, les outils de recherche tentent de saisir l’intention de celui qui exécute la recherche et pour cela, aller piocher dans les données personnelles est tentant…

surveillance-web

L’approche Google

Google accumule des centaines de données sur les habitudes, les recherches, les centre d’intérêts des internautes qui utilisent ses services. Google fait aussi des liens entre les personnes, les recherches dans le temps et utilise ses données pour personnaliser ses résultats.

Cette façon de faire doit permettre de mieux comprendre l’internaute et son besoin. En recoupant les données des requêtes récentes avec l’historique, les centre d’intérêts des « amis », le moteur pense pouvoir personnaliser les réponses et obtenir des réponses plus satisfaisantes.

À l’inverse, la somme de données collectées est gigantesque et pourrait (peut ?) être utilisé à mauvais escient. En ayant une connaissance particulièrement fine des internautes de façon individuelle, Google ne joue-t-il pas un jeu inégal ? Comment l’internaute lambda est-il capable de reconnaître si un résultat est un vrai résultat ou un produit publicitaire habilement positionné ?

Le deuxième risque à craindre pour l’internaute est le vol de ses données personnelles. Personnellement, je me sentirai particulièrement mal à l’aise si quelqu’un pouvait avoir accès à toutes mes données qui ont transité et sont stockées chez Google. Je sais que mes données sont plutôt en sécurité sur les serveurs du plus gros moteur de recherche au monde mais l’erreur est humaine et le risque zéro n’existe pas.

Enfin, le dernier aspect qui me pose souci (et c’est de loin le plus important à mes yeux) est le risque de se retrouver enfermé dans sa bulle d’idées. À force de personnaliser les résultats des requêtes, le moteur ne va-t-il pas sélectionner, filtrer et choisir de ne m’afficher que les résultats qui vont dans le sens de mes précédents choix ? Comment avoir accès à des idées contradictoires, des points de vue différents, des réflexions hors de mon périmètre intellectuel actuel ?

D’autres arguments sont disponibles ici.

À laisser la machine décider à ma place pour gagner un peu de facilité, est-ce que je me rends vraiment service au final ?

L’approche DuckDuckGo

Le petit moteur DuckDuckGo a fait le choix de ne pas tracer les utilisateurs. Cela signifie que les requêtes ne sont pas enregistrées et que l’outil de recherche ne peut pas reconstituer un historique de recherche et le relier à un individu.

L’idée du fondateur, Gabriel Weinberg, est la suivante : l’anonymat force les moteurs de recherche à se surpasser (de meilleurs résultats) et se focaliser sur leur tâche première (la recherche et pas la publicité par exemple). Les données ne sont pas anonymisées (elles le sont vraiment) et cela ne peut donc pas entraîner de risques à terme.

Ceci dit, DuckDuckGo personnalise quand même les résultats (en fonction de critères géographiques par exemple).

Les avantages pour l’internaute sont clairs : leurs données ne sont pas utilisées pour afficher de la publicité ni pour consolider d’énormes bases de profiling. Les risques par rapport aux données personnelles sont inexistants et les éventuels filtres sont choisis par l’utilisateur lui-même.

L’approche DuckDuckGo est-elle viable ?

Aujourd’hui DuckDuckGo vit grâce à la publicité (non personnalisée) sur ses pages de résultats. Face au mastodonte Google, les moteurs de recherche se basant sur l’anonymat ont certainement un marché de niche bien identifié mais cela suffira-t-il ? Et si l’outil devient vraiment grand public, le modèle économique permettra-t-il de continuer à proposer un service de qualité ?

L’approche Google est-elle viable ?

Combien de noms d’entreprises sont devenus des verbes ? Googler quelque chose, à défaut d’être très utilisé, montre une réalité bien actuelle : le moteur de recherche Google est aujourd’hui incontournable. L’internaute lambda n’a pas vraiment envie de s’embêter avec les données privées (même les siennes) et mis à part un énorme scandale ou une évolution réglementaire brutale, je ne crois pas que l’entreprise de Mountain View ait beaucoup de souci à se faire pour la suite…

Recherche + données personnelles = ?

Savoir si les données personnelles sont nécessaires ou utiles pour améliorer les recherches me semble une belle idée mais qui ne peut pas s’implémenter correctement sans :

  • Une prise de conscience collective des enjeux liés aux données personnelles et à la façon dont les entreprises du web utilise nos données pour leur profit ;
  • Une vraie volonté personnelle des internautes ;
  • Une évolution des outils de recherche avec la mise en place d’outils pour gérer ses données personnelles (au delà du sympathique mais trop léger Google Data Liberation Front).

Qu’en pensez-vous ?

Photo : Ludovic Bertron

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *