Taux de faux positifs

Le taux de faux positifs (FPR) est une mesure de la précision d’un test : qu’il s’agisse d’un test de diagnostic médical, d’un modèle d’apprentissage automatique ou d’autre chose. En termes techniques, le taux de faux positifs est défini comme la probabilité de rejeter à tort l’hypothèse nulle.

Définition des faux positifs

Imaginez que vous ayez un test de détection d’anomalies d’une certaine variété. Peut-être s’agit-il d’un test médical qui vérifie la présence ou l’absence d’une maladie ; peut-être s’agit-il d’un algorithme d’apprentissage automatique basé sur la classification. Dans tous les cas, il existe deux vérités possibles dans la vie réelle : soit la chose testée est vraie, soit elle ne l’est pas. La personne est malade, ou elle ne l’est pas ; l’image est un chien, ou elle ne l’est pas. De ce fait, il existe également deux résultats possibles du test : un résultat positif (le test prédit que la personne est malade ou que l’image est un chien) et un résultat négatif (le test prédit que la personne n’est pas malade ou que l’image n’est pas un chien).

Parce qu’il y a deux vérités possibles et deux résultats de test possibles, nous pouvons créer ce qu’on appelle une matrice de confusion avec tous les résultats possibles.

Voici les possibilités :

  • Vérité positive : la vérité est positive, et le test prédit un positif. La personne est malade, et le test le signale avec précision.
  • Vrai négatif : la vérité est négative, et le test prédit un négatif. La personne n’est pas malade, et le test le rapporte avec précision.
  • Faux négatif : la vérité est positive, mais le test prédit un négatif. La personne est malade, mais le test rapporte de manière inexacte qu’elle ne l’est pas. Également appelée erreur de type II en statistique.
  • Faux positif : la vérité est négative, mais le test prédit un positif. La personne n’est pas malade, mais le test rapporte de manière inexacte qu’elle l’est. Également appelée erreur de type I en statistique.

Mesurer la précision d’un test

En calculant des ratios entre ces valeurs, nous pouvons mesurer quantitativement la précision de nos tests.

Le taux de faux positifs est calculé comme suit : FP/FP+TN, où FP est le nombre de faux positifs et TN le nombre de vrais négatifs (FP+TN étant le nombre total de négatifs). C’est la probabilité qu’une fausse alerte soit émise : qu’un résultat positif soit donné alors que la vraie valeur est négative.

Il existe de nombreuses autres mesures possibles de la précision des tests et du taux d’erreur. Voici un bref récapitulatif des plus courantes :

Le taux de faux négatifs – également appelé taux de ratés – est la probabilité qu’un vrai positif soit manqué par le test. Il est calculé comme suit : FN/FN+TP, où FN est le nombre de faux négatifs et TP est le nombre de vrais positifs (FN+TP étant le nombre total de positifs).

Le taux de vrais positifs (TPR, également appelé sensibilité) est calculé comme suit : TP/TP+FN. Le TPR est la probabilité qu’un vrai positif soit testé positif.

Le taux de vrais négatifs (également appelé spécificité), qui est la probabilité qu’un vrai négatif soit testé négatif. Il est calculé comme TN/TN+FP.

Si vous êtes du côté du patient d’un test médical analysé comme celui-ci, vous vous souciez peut-être un peu plus de deux métriques supplémentaires : la valeur prédictive positive et la valeur prédictive négative.

La valeur prédictive positive est la probabilité que, si vous avez obtenu un résultat positif au test, vous ayez réellement la maladie. Elle est calculée comme suit : TP/TP+FP. À l’inverse, la valeur prédictive négative est la probabilité que, si vous avez obtenu un résultat négatif, vous n’ayez en réalité pas la maladie.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *