Empreintes digitales : une découverte de l’IA remet en question une certitude vieille d’un siècle

Depuis plus de cent ans, l’unicité des empreintes digitales constitue un fondement de la criminalistique et des technologies biométriques. Une étude récente menée par des chercheurs américains vient toutefois nuancer cette certitude. En s’appuyant sur l’intelligence artificielle, ils ont mis en évidence des similitudes structurelles entre les différents doigts d’un même individu, des caractéristiques jusqu’ici indétectables par les méthodes traditionnelles.

Une IA capable de relier les doigts d’un même individu

L’étude, publiée en janvier 2024 dans la revue Science Advances, a été menée par des chercheurs de l’université Columbia et de l’université de Buffalo. Leur modèle d’intelligence artificielle repose sur l’apprentissage contrastif profond et a été entraîné sur plus de 60 000 images d’empreintes digitales issues de quatre grandes bases de données biométriques. Le système a atteint plus de 99,99 % de confiance pour déterminer si deux empreintes appartenaient à la même personne. Surtout, il a obtenu 77 % de précision pour identifier des empreintes provenant de doigts différents d’un même individu, un taux qui augmente significativement lorsque plusieurs empreintes sont combinées dans l’analyse. Cette découverte suggère que certaines caractéristiques structurelles se répètent d’un doigt à l’autre, même entre les deux mains.

Contrairement aux méthodes classiques utilisées en criminalistique, qui s’appuient sur les minuties (terminaisons et bifurcations des crêtes), le modèle a analysé des éléments plus larges comme l’orientation et la courbure des crêtes. Ces motifs structurels apparaissent de manière constante sur l’ensemble des doigts d’une personne. Les chercheurs ont utilisé des bases de données reconnues, dont les références NIST SD300 et SD302, ainsi que la base RidgeBase développée à Buffalo. Ils ont pris soin de contrôler les variables externes, comme le type de capteur utilisé ou les conditions de prélèvement, pour s’assurer que les similitudes détectées n’étaient pas liées à des facteurs environnementaux ou techniques.

Des enquêtes accélérées grâce à l’analyse croisée

Traditionnellement, l’identification d’une empreinte digitale suppose de comparer l’empreinte retrouvée à une base de données existante, doigt par doigt. Ce processus peut être long, surtout lorsque le nombre de suspects est élevé. La nouvelle méthode d’IA offre un gain d’efficacité notable. Lors d’un test simulé en contexte judiciaire, le modèle a réduit une liste de 1 000 suspects à moins de 40 candidats probables. En identifiant des traits structurels récurrents entre les doigts, l’IA peut relier des empreintes trouvées sur différentes scènes de crime, même si elles proviennent de doigts différents.

Cette capacité pourrait s’avérer particulièrement utile dans les affaires impliquant des empreintes partielles, floues ou de mauvaise qualité, fréquentes sur les scènes de crime. Les systèmes de correspondance traditionnels peinent souvent à traiter ces cas, notamment lorsque le doigt utilisé n’est pas connu. Toutefois, les chercheurs ont insisté sur le fait que l’IA n’est pas encore adaptée à une utilisation judiciaire. Les taux de précision, bien qu’en progression, restent en deçà des seuils de fiabilité exigés pour une identification légale. L’objectif actuel du modèle est de servir à la génération de pistes d’enquête, non à l’identification formelle devant un tribunal.

L’orientation des crêtes, plus révélatrice que les minuties

L’étude a montré que l’orientation des crêtes, notamment dans la zone centrale de l’empreinte, constitue le facteur le plus déterminant pour détecter les similitudes inter-doigts. En revanche, les minuties, longtemps considérées comme la référence absolue en matière de comparaison d’empreintes, ont apporté très peu d’informations dans ce contexte. Les images binarisées et les cartes d’orientation ont obtenu des résultats presque aussi bons que les scans originaux, ce qui laisse penser que les caractéristiques essentielles des empreintes sont plus simples et plus largement réparties qu’on ne le pensait.

Les chercheurs ont utilisé des cartes de saillance et des filtres convolutifs pour visualiser les processus internes du modèle. Ces outils ont révélé que l’IA se concentrait principalement sur les zones présentant de forts changements directionnels dans le flux des crêtes, comme les deltas des empreintes. La similitude est restée statistiquement significative pour toutes les combinaisons de paires de doigts, y compris entre les deux mains. Le modèle a également été testé sur la base NIST SD301, collectée selon d’autres protocoles expérimentaux, avec des résultats cohérents, ce qui confirme sa capacité de généralisation.

Des implications pour la sécurité biométrique

Au-delà de la criminalistique, cette découverte pourrait avoir des répercussions sur les systèmes de sécurité biométrique, notamment les smartphones, les contrôles d’accès et les vérifications d’identité aux frontières. Ces dispositifs reposent généralement sur l’hypothèse que chaque empreinte enregistrée représente un marqueur d’identité distinct. La possibilité de similitudes inter-doigts introduit à la fois des risques et des opportunités. D’un côté, des acteurs malveillants pourraient exploiter ces similitudes pour contourner l’authentification en utilisant un doigt différent de celui enregistré. De l’autre, les utilisateurs pourraient bénéficier d’une authentification plus flexible, notamment en cas de blessure ou d’illisibilité du doigt principal.

Pour améliorer l’entraînement, le modèle a d’abord été pré-entraîné sur la base de données synthétiques PrintsGAN, qui contient plus de 500 000 images d’empreintes générées artificiellement. Cette étape de pré-entraînement a amélioré la capacité de l’IA à reconnaître les caractéristiques des crêtes avant l’affinage sur des échantillons réels. Les performances du modèle ont également été évaluées selon le genre et les groupes raciaux. Elles sont restées globalement cohérentes, bien qu’une précision légèrement supérieure ait été enregistrée lorsque l’entraînement et les tests étaient réalisés au sein du même groupe démographique. Ces résultats soulignent l’importance de bases de données représentatives et posent la question d’un éventuel biais algorithmique dans les outils judiciaires. Les chercheurs ont utilisé un sous-ensemble démographique équilibré de la base SD302 pour cette phase de test et recommandent d’élargir les futurs modèles à des populations plus vastes et diversifiées.

En bref …

Cette recherche bouleverse plus d’un siècle de certitudes en criminalistique en révélant que les empreintes digitales ne sont pas aussi uniques qu’on le croyait. L’intelligence artificielle ouvre la voie à de nouvelles méthodes d’enquête, plus rapides et capables de relier des indices issus de doigts différents. Toutefois, la fiabilité du modèle reste insuffisante pour une utilisation judiciaire immédiate. Les implications touchent aussi la sécurité biométrique, qui devra intégrer ces nouvelles données dans ses protocoles. Si les résultats sont confirmés et affinés, cette avancée pourrait redéfinir en profondeur les standards de l’identification biométrique et soutenir des enquêtes plus efficaces, tout en appelant à une vigilance accrue sur les biais algorithmiques et la diversité des données utilisées.

Pour aller plus loin : The Daily Galaxy