Protection des témoins : casser la voix et l’image
Rédigé par Martin Biéri & Alexis Léautier
–
04 janvier 2023
La question de la protection des témoins n’est pas récente : il existe dans le droit des dispositions permettant de protéger leur anonymat, notamment lorsque pèse sur eux un risque d’atteinte à leur intégrité (ou à celle de leurs proches). Pour autant, les mesures techniques censées garantir cet anonymat par la modification des informations audio et vidéo ont certaines limites, sans cesse repoussées par les progrès technologiques.
La protection de l’identité des témoins
Alors que la protection des lanceurs d’alertes a connu un renforcement avec la loi Waserman en 2022 et la transposition de la directive européenne datant de 2019, la question de la protection de l’anonymat dans les contextes juridiques ou journalistiques reste un enjeu, surtout au regard des progrès de la technologie.
Si des mesures permettant de protéger les témoins étaient présentes en France depuis plusieurs années – pour les protéger d’influence extérieure, comme la subordination de témoin ou d’autres moyens de pression, mais également dans l’usage, comme dans le fait de protéger l’identité des « indics » de la police dans les procès-verbaux –, elles ont été renforcées depuis 2001, permettant notamment d’organiser le cadre légal du témoignage anonyme, « une importante nouveauté inspirée par les procédures accusatoires des pays de common law » (Citoyens et délateurs, 2005). Ainsi, on y trouve de nouvelles dispositions permettant de cacher certaines informations qui présentent des risques pour les témoins. Ces derniers peuvent – par exemple – donner l’adresse du commissariat plutôt que la leur pour ne pas risquer de représailles de la personne qu’ils seraient en train d’incriminer.
Ce renforcement s’est poursuivi en 2016, faisant notamment apparaître quelques précisions techniques. En effet, dans le cadre d’une procédure judiciaire (dans le cadre d’un crime ou d’un délit puni d’au moins trois ans de prison), le témoin peut être amené à comparaître, avec des mesures qui permettent de le protéger d’une réidentification : « Dans certaines circonstances (par exemple si sa sécurité n’est plus assurée), le témoin peut être autorisé à utiliser un nom d’emprunt. S’il est confronté au suspect, cette confrontation se fera à distance. Le témoin ne sera pas visible et sa voix sera masquée. La révélation de l’identité ou de l’adresse est punie de 5 ans de prison et de 75 000 € d’amende » (service-public). Ces nouveaux ajouts sont à comprendre dans le contexte de la lutte contre le terrorisme, et notamment à la suite des attentats de l’année 2015, comme l’indique l’intitulé du texte.
Ainsi, outre le fait de garder secrète l’identité de l’individu (nom, prénom, adresse, etc.), c’est-à-dire de la conserver en dehors ou en parallèle de la procédure, il existe deux manières de le protéger : en « enlevant » son image (le fait d’être visible) et en « masquant » sa voix. Dans le premier cas, le fait de ne pas être présent (à distance) est une mesure assez simple et évidente : l’absence physique de l’individu de l’enceinte du tribunal (par exemple, dans la confrontation) le protège de manière évidente. Il existe ensuite d’autres mesures permettant de dégrader l’image afin qu’elle ne transmette aucune information directement identifiante (floutage ou pixellisation par exemple).
En ce qui concerne la voix, les mesures techniques utilisées sont également assez connues : il s’agit généralement d’opérer une modification de la voix, en la décalant vers les aigus ou vers les graves. Il ne s’agit donc pas spécialement ici d’une dégradation du son, mais bien d’une transposition, ce qu’on appelle le « pitch shifting » (voir également plus bas).
Ces techniques se retrouvent également dans le cadre de reportages télévisés, dans lequel des personnes témoignent en échange d’une protection de leur anonymat, sur des sujets plus ou moins sensibles. Plusieurs dispositifs existent : la personne peut être hors champ ou dans l’ombre, ce qui permet de n’avoir qu’une vague silhouette ; la personne peut être « floutée » (on ajoute un filtre par-dessus l’image ou au contraire, on dégrade plus ou moins la qualité de l’image dans l’optique de masquer ce qui est considéré comme le plus identifiant, à savoir le visage) ; la personne peut être anonymisée par un bandeau noir sur les yeux ; elle peut également être remplacé par un acteur ou un journaliste lisant ses propos – ou ses propos peuvent être simplement écrits sur un carton.
Des limites inhérentes à la technique
La voix
Ces mesures techniques sont-elles pour autant suffisamment efficaces ? D’abord, dans le cadre de la voix, il n’est pas compliqué techniquement de modifier dans le sens inverse pour se rapprocher rapidement de la voix réelle et ainsi pouvoir réidentifier la personne. Cette manœuvre est disponible dans la plupart des logiciels d’édition du son, d’enregistrement ou de création musicale, y compris gratuits. Le « pitch shifting», cette fameuse modulation linéaire du signal, semble donc une mesure de protection extrêmement faible dans le cadre de la protection d’un témoin ou dans celui de la protection des sources. Cette technique pouvait avoir de l’intérêt quand les coûts de rétroingénierie étaient importants et accessibles qu’à un nombre limité de personnes il y a quelques dizaines d’années, ce qui n’est plus le cas avec le passage au format numérique et l’accessibilité des logiciels.
Démonstration d’un pitch shifting : le premier enregistrement est l’original ; le second est l’enregistrement après « déplacement » de 7 demi-tons vers les graves, grâce à un logiciel accessible gratuitement en ligne. Pour autant, l’inversion n’est pas compliquée : en tâtonnant, il est assez simple de revenir à (ou de s’approcher de) l’enregistrement original.
Par ailleurs, la voix est une donnée à géométrie variable (voir le Livre blanc sur les assistants vocaux et nos articles Les droits de la voix) : en plus d’être une caractéristique propre à chaque individu, elle est le support du message transmis. La manière de parler, les tics de langage, l’accent… sont autant d’indices pour pouvoir réidentifier la personne. Et, par extension, nous retrouvons tous les enjeux classiques liés à l’anonymisation des données : enlever les attributs directement identifiants n’est pas forcément suffisant. Il est possible de réidentifier une personne (par inférence ou recoupement) grâce aux informations contextuelles fournies dans l’enregistrement.
L’illustration la plus célèbre de ces failles est la réidentification de Sonia (qui est nom d’emprunt). Cette personne qui avait fourni des informations sur un terroriste et permis d’éviter un attentat en 2015 avait vu son identité révélée. Suite à cela, elle avait été obligée de changer de nom, d’adresse, etc. Cet incident avait par ailleurs mené au projet de loi « Lutte contre le crime organisé, le terrorisme et leur financement, et améliorant l’efficacité et les garanties de la procédure pénale » en 2015, mentionné plus haut.
En parallèle, il est aussi à noter que les liens entre analyse vocale et justice se multiplient : il existe de nouveaux acteurs spécialisés pour épauler les enquêteurs, par exemple. Ainsi, l’entreprise Agnitio, dont le logiciel Batvox est utilisé dans plusieurs services de police en Europe, avait notamment permis d’authentifier la voix de Jérôme Cahuzac dans les enregistrements dévoilés par Mediapart en 2013 et réutilisés par la justice.
Par ailleurs, cet épisode avait suscité des réactions dans la communauté scientifique sur la fiabilité des recours à de tels dispositifs dans le cadre de procédure judiciaire : « Malgré les progrès permanents de la Science, les chercheurs du domaine considèrent quasi unanimement que les méthodes actuelles de comparaison vocale sont imprécises » selon J.-F. Bonastre, professeur au Laboratoire d’Informatique d’Avignon et spécialiste du traitement de la parole et de l’authentification vocale (dont vous pouvez trouver l’interview donnée au LINC en 2017 ici). Il rappelle également dans un article intitulé « 1990-2020 : retours sur 30 ans d’échanges autour de l’identification de voix en milieu judiciaire » que les fondements scientifiques des expertises vocales sont contestés par les chercheurs académiques, et qu’une position de la communauté scientifique francophone sur le sujet n’a pas changé depuis le vote d’une motion en 1990. Il est intéressant de noter que des chercheurs participants à des procès le font sous le label de témoins scientifiques et non d’experts judiciaires.
Lien de l’article :
https://linc.cnil.fr/protection-des-temoins-casser-la-voix-et-limage