
P-value et Khi2
Khi 2
La loi du χ2 (prononcé « khi carré » voire « khi-deux ») est une loi à densité de probabilité. Cette loi est caractérisée par un paramètre dit degrés de liberté à valeur dans l'ensemble des entiers naturels (non nuls).
Soient , k variables aléatoires indépendantes suivant des lois normales de moyennes respectives
et d'écart-type
; leurs variables centrées et réduites, alors par définition la variable
, telle que :
qui suit une loi du χ2 à k degrés de liberté.
Le KHI-deux est un test statistique qui permet de mesurer la dépendance ou non existante entre deux variables. Le logiciel Sphinx fait tous les calculs et en déduit si la dépendance est significative ou non. Pour savoir si le test est significatif, on prend le seuil de 5%, qui est celui que l’on attribue dans la quasi totalité des cas.
P-value
Dans un test statistique, la valeur p (en anglais p-value) est la probabilité d'obtenir la même valeur (ou une valeur encore plus extrême) du test si l'hypothèse nulle était vraie. Si cette valeur p est inférieure à la valeur du seuil préalablement défini (traditionnellement 5 % ou 1 %), on rejette l'hypothèse nulle et le « résultat du test est statistiquement significatif »1.
En d'autres termes, la valeur p est la probabilité de commettre une erreur de première espèce, c'est-à-dire de rejeter à tort l'hypothèse nulle et donc d'obtenir un faux positif. La valeur p se traduit par un seuil expérimental.
En général, on considère les seuils suivants2 :
: très forte présomption contre l'hypothèse nulle
: forte présomption contre l'hypothèse nulle
: faible présomption contre l'hypothèse nulle
Une nouvelle approche par inférence bayésienne met en évidence que ces valeurs de seuil sont trop optimistes et expliquent le manque de reproductibilité des études scientifiques, suggérant un p < 0,001 ou 0,0053.
La valeur p est la probabilité qu’un événement quelconque soit le simple fait du hasard. De façon purement arbitraire, on considère en général comme « statistiquement significatives » les valeurs de p inférieures à 1 chance sur 20 autrement dit que la probabilité (p) qu’une valeur soit due au hasard ne dépasse pas 5%
• p<0,05 => différence statistiquement significative
• p>0,05 => différence non statistiquement significative.