Qu'est-ce que la «confidentialité différentielle» et comment cela garde-t-il mes données anonymes?
Apple mise sur leur réputation pour s'assurer que les données qu'elles collectent restent confidentielles. Comment? En utilisant quelque chose appelé «Confidentialité différentielle».
Qu'est-ce que la confidentialité différentielle??
Apple l'explique en tant que tel:
Apple utilise la technologie de confidentialité différentielle pour aider à découvrir les habitudes d'utilisation d'un grand nombre d'utilisateurs sans compromettre la vie privée. Pour masquer l'identité d'un individu, Differential Privacy ajoute du bruit mathématique à un petit échantillon de son profil d'utilisation. Alors que de plus en plus de personnes partagent le même schéma, des schémas généraux commencent à émerger, ce qui peut informer et améliorer l'expérience utilisateur..
La philosophie de Differential Privacy est la suivante: aucun utilisateur dont le périphérique, qu’il s’agisse d’un iPhone, d’un iPad ou d’un Mac, ajoute un calcul à un plus grand ensemble de données agrégées (une grande image formée de différentes images plus petites) ne doit pas être révélé comme tel. la source, sans parler de quelles données ils ont contribué.
Apple n'est pas la seule entreprise à le faire, ni Google ni Microsoft l'utilisaient encore plus tôt. Mais Apple l'a popularisé en en parlant en détail lors de son discours au WWDC 2016.
Alors, en quoi est-ce différent des autres données anonymisées, demandez-vous? Eh bien, les données anonymisées peuvent toujours être utilisées pour déduire des informations personnelles si vous en savez suffisamment sur une personne.
Supposons qu'un pirate informatique puisse accéder à une base de données anonymisée révélant la masse salariale d'une entreprise. Disons qu'ils savent aussi que l'employé X déménage dans une autre région. Le pirate informatique peut alors simplement interroger la base de données avant et après le déménagement de l’employé X et en déduire facilement son revenu..
Afin de protéger les informations sensibles de l'employé X, la confidentialité différentielle modifie les données avec un «bruit» mathématique et d'autres techniques telles que, si vous interrogez la base de données, vous ne recevrez qu'un message. approximation de combien (ou quelqu'un d'autre) l'employé X a été payé.
Par conséquent, sa vie privée est préservée en raison de la «différence» entre les données fournies et le bruit qui y est ajouté. Il est donc suffisamment vague pour qu'il soit pratiquement impossible de savoir si les données que vous consultez sont effectivement celles d'un individu..
Comment fonctionne la confidentialité différentielle d'Apple?
La confidentialité différentielle est un concept relativement nouveau, mais l’idée est qu’elle peut donner à une entreprise de précieuses informations basées sur les données de ses utilisateurs, sans savoir quoi. exactement que les données disent ou de qui elles proviennent.
Apple, par exemple, s'appuie sur trois composants pour appliquer différemment la confidentialité différentielle sur votre appareil Mac ou iOS: le hachage, le sous-échantillonnage et l'injection de bruit..
Le hachage prend une chaîne de texte et la transforme en une valeur plus courte avec une longueur fixe et mélange ces clés en chaînes irréversiblement aléatoires de caractères uniques ou «hash». Cela masque vos données afin que l'appareil ne stocke aucune de celles-ci dans sa forme d'origine.
Le sous-échantillonnage signifie qu'au lieu de rassembler chaque mot d'une personne, Apple n'en utilisera qu'un échantillon plus petit. Par exemple, disons que vous avez une longue conversation avec un ami en utilisant emoji. Au lieu de collecter l'intégralité de la conversation, le sous-échantillonnage peut uniquement utiliser les parties qui intéressent Apple, telles que l'emoji..
Enfin, votre appareil injecte du bruit en ajoutant des données aléatoires à l'ensemble de données d'origine afin de le rendre plus vague. Cela signifie que Apple obtient un résultat qui a été légèrement masqué et qui n'est donc pas tout à fait exact.
Tout cela se passe sur votre appareil, il a donc déjà été raccourci, mélangé, échantillonné et flou avant même d'être envoyé au cloud pour être analysé par Apple.
Où est la confidentialité différentielle d'Apple utilisée?
Il existe une variété de cas où Apple pourrait vouloir collecter des données pour améliorer ses applications et ses services. Pour le moment, Apple utilise uniquement la confidentialité différentielle dans quatre domaines spécifiques..
- Quand suffisamment de personnes remplacent un mot par un emoji particulier, cela deviendra une suggestion pour tout le monde..
- Lorsque de nouveaux mots sont ajoutés à suffisamment de dictionnaires locaux pour être considérés comme banaux, Apple les ajoutera également au dictionnaire de tous les autres.
- Vous pouvez utiliser un terme de recherche dans Spotlight. Il fournira ensuite des suggestions d'application et ouvrira ce lien dans ladite application ou vous permettra de l'installer à partir de l'App Store. Par exemple, supposons que vous cherchiez «Star Trek», ce qui suggère l'application IMDB. Plus les gens ouvrent ou installent l'application IMDB, plus elle apparaîtra dans les résultats de recherche..
- Il fournira des résultats plus précis pour les astuces de recherche dans Notes. Par exemple, supposons que vous ayez une note contenant le mot «pomme». Vous effectuez une recherche et vous obtenez des résultats non seulement pour la définition du dictionnaire, mais également pour le site Web d'Apple, les emplacements des magasins Apple, etc. Vraisemblablement, plus les gens tapent sur certains résultats, plus ils apparaissent haut et souvent dans la Recherche pour tous les autres.
Utilisons les émoticônes comme exemple. Dans iOS 10, Apple a introduit une nouvelle fonctionnalité de remplacement d'emoji sur iMessage. Tapez le mot "amour" et vous pourrez le remplacer par un coeur emoji. tapez le mot «chien» et, vous l'avez deviné, vous pouvez le remplacer par un chien emoji.
De même, il est possible pour votre iPhone de prédire quel emoji vous voulez, de sorte que si vous tapez un message «Je vais promener le chien», votre iPhone suggérera gentiment au chien emoji..
Apple prend donc toutes ces petites données iMessage qu'elle collecte, les examine dans son ensemble et peut déduire des modèles de ce que les gens tapent et dans quel contexte. Cela signifie que votre iPhone peut vous proposer des choix plus judicieux, car il tire parti de toutes les conversations en mode texte que les autres créent et pense: «Il s'agit probablement de l'emoji que vous souhaitez."
Ça prend un village (d'Emoji)
L'inconvénient de Differential Privacy est qu'il ne fournit pas de résultats précis dans de petits échantillons. Son pouvoir consiste à rendre certaines données vagues, de sorte qu’elles ne puissent être attribuées à aucun utilisateur. Pour qu’il fonctionne correctement, de nombreux utilisateurs doivent y participer..
C'est un peu comme regarder une photo très près. Vous ne pourrez pas voir ce que c'est si vous ne regardez que quelques bits, mais à mesure que vous reculez et regardez le tout, la photo devient plus claire et plus précise, même si elle n'est pas très haute résolution.
Ainsi, afin d'améliorer le remplacement et la prédiction des emoji (entre autres), Apple doit collecter des données iPhone et Mac du monde entier pour lui donner une image de plus en plus claire de ce que les gens font et améliorer ainsi ses applications et ses services. Il se tourne vers toutes ces données aléatoires, bruyantes et crowdsourced, et les exploite pour trouver des schémas, tels que le nombre d'utilisateurs qui utilisent l'émoji à la pêche au lieu de "butt".
Ainsi, la puissance de la confidentialité différentielle repose sur le fait qu'Apple puisse examiner de grandes quantités de données agrégées, tout en veillant à ne pas savoir qui leur envoie ces données..
Comment désactiver la confidentialité différentielle sous iOS et macOS
Si vous n'êtes toujours pas convaincu que Differential Privacy vous convient, vous avez de la chance. Vous pouvez vous désinscrire directement des paramètres de votre appareil..
Sur votre appareil iOS, appuyez sur Ouvrir "Paramètres" puis "Confidentialité".
Sur l'écran Confidentialité, appuyez sur «Diagnostics et utilisation»..
Enfin, sur l'écran Diagnostics & Usage, appuyez sur «Ne pas envoyer»..
Sur macOS, ouvrez les Préférences Système et cliquez sur «Sécurité et confidentialité»..
Dans les préférences Sécurité et confidentialité, cliquez sur l'onglet «Confidentialité», puis assurez-vous que «Envoyer les données de diagnostic et d'utilisation à Apple» est désélectionné. Notez que vous devrez cliquer sur l'icône de cadenas dans le coin inférieur gauche et entrer votre mot de passe système avant de pouvoir effectuer cette modification..
De toute évidence, la confidentialité différentielle, en théorie et en application, va bien au-delà de cette explication simplifiée. Sa viande et ses pommes de terre reposent en grande partie sur des mathématiques sérieuses et, en tant que telles, elles peuvent devenir assez lourdes et compliquées..
J'espère cependant que cela vous donne une idée de la façon dont cela fonctionne et que vous vous sentez plus en confiance lorsque les entreprises collectent certaines données sans craindre d'être identifiées.