Quelques éléments de statistique ... |
| Créé le 09/05/2004 |
Auteur : A. Taytard |
(Mis à jour le 09/01/2007) |
| Révisé le 09/01/2007 |
C. Raherison |
|
| |
|
|
Quelques questions
lorsqu'on analyse un article
Quelle
question a été posée par les auteurs ?
Comment
les auteurs ont-ils répondu à la question posée ?
ont
ils vérifié que
leurs groupes étaient comparables et, si nécessaire,
ont ils fait des ajustements sur les différences
initiales ?
quels
types de données ont ils obtenu et ont ils utilisés les tests statistiques
appropriés
?
si les
auteurs ont utilisé un test statistique peu connu, pourquoi l'ont ils
fait et l'ont ils référencié ?
est ce
que les données ont été analysées selon le protocole d'origine ?
est que
des tests pairés ont été réalisés sur les données pairées ?
est ce
qu'un test bilatéral a été réalisé chaque fois que l'effet d'une intervention
pouvait raisonnablement être négatif
?
est ce
que les points extrêmes ont été analysés avec bon sens et des ajustements
statistiques appropriés
?
Quelle
est la signification des résultats?
Corrélation
Le coefficient de corrélation
de Pearson (r) permet
de savoir si deux variables quantitatives (aléatoires) sont indépendantes
ou liées
Il n'est valide que si
les données sont normalement distribuées
les 2 groupes
de données sont indépendants
une seule paire de mesures est faite sur chaque sujet (sinon il faut utiliser une analyse de variance)
Régression
Le
choix du qualificatif final utilisé, régression ou corrélation, n'est pas
fondamental.
La régression implique qu'une variable (contrôlée) peut être prédite
par une ou plusieurs autres
Causalité (Critères
de Bradford, Hill)
Elle implique :
une association statistique
une association forte (OR>2)
une association robuste d'une étude à l'autre
une relation
temporelle appropriée
un effet
dose-réponse
que ce
qu'on a trouvé a du sens en termes épidémiologiques, biologiques
une association
spécifique
une analogie
avec une association causale précédemment trouvée
Méta-analyses
Moyenne,
médiane
Moyenne
: moyenne arithmétique ; valide si la variable est distribuée selon une loi normale, sinon, utiliser la médiane.
Médiane : on classe les observations par ordre croissant ; médiane
=observation de rang (nombre d'observations + 1)/2
Dispersion de la distribution
Etendue
: différence entre la valeur maximale et la valeur minimale ; très sensible aux extrêmes
Quantiles
: on divise les données en parties égales ; le plus souvent, on utilise
des quartiles en divisant les données en 4 parties égales de 25% (percentile)
; écart interquartile = distance entre le 1er le le 3ème quartile.
Ecart-type
(standard deviation) : valable pour décrire une variable de distribution
normale ; 95% des observations se situent entre la moyenne ± 2 écart-types.
Ecart-type
de la moyenne (standard error of the mean) : si on s'intéresse à des groupes d'échantillons, on peut calculer la moyenne des moyennes obtenuesavec chaque échantillon. Cet indice décrit la précision de l'estimation de la moyenne dans un échantillon, il ne décrit pas la dispersion des observations autour de la moyenne (écart-type).
Hazard ratio
Basé sur la notion de risque instantané de décès dans un modèle de Cox par rapport à une variable donnée. Il s'agit de la modélisation de la probabilité de décès
que l'on a dans une courbe de Kaplan-Meier.
En dessous de 1 : diminution du risque de décès dans le groupe étudié.
Au dessus de 1 : augmentation du risque de décès.
L'intervalle de confiance ne doit pas contenir 1 pour la significativité statistique des résultats.
Intervalle de confiance (IC)
Intervalle dans lequel la vraie valeur a de bonnes chance de se trouver.
Il peut être calculé pour différents niveaux de confiance : 90%, 95%, 99%.Cela signifie que sur 100 intervalles de confiance, 95 contiendront la moyenne théorique et 5 ne la contiendront pas ; on est sûr à 95% que la moyenne est dans l'intervalle calculé.
Lorsque la taille de l'échantillon augmente, l'intervalle de confiance diminue car la précision de l'estimation augmente. Lorsque l'échantillon recouvre toute la population, l'intervalle de confiance est égal à 0.
Si IC est calculé pour une différence (de 2 moyennes ou de 2 proportions :différence de risque), les différences
sont significatives si l'intervalle necontient pas 0.
Si IC est calculé pour un rapport (de proportion : risque relatif ; ou de cotes : odds ratio), les différences
sont significatives si l'intervalle ne contient pas 1.
Puissance
Risque a (risque
de première espèce) :
risque de conclure à tort à une différence
lorsqu'il n'y en a pas.
Risque b (risque
de deuxième espèce) : risque de
ne pas voir une différence qui existe vraiment.
Puissance :
probabilité (généralement à 80%) de détecter une différence lorsqu'elle existe réellement.
Cela permet de déterminer le nombre de sujets nécessaires pour obtenir la puissance souhaitée.
Risque relatif
Rapport du risque dans le groupe A sur celui du groupe B.
Sensibilité
Proportion de patients qui ont la maladie recherchée et dont le test
est positif (vrais positifs).
Spécificité
Proportion de patients qui n'ont pas la maladie recherchée et dont le test est négatif (vrais négatifs).
Efficacité diagnostique
pourcentages de bien classés par le test : (vrais positifs + vrais
négatifs
/ malades + non malades)
Valeur
prédictive
positive :
probabilité d'avoir la maladie en cas de test positif (VPP)
négative :
probabilité de ne pas avoir la maladie en cas de testnégatif
(VPN)
Courbe
ROC (receiver operating characteristic)
Elle met en relation la sensibilité et la spécificité d'un test.
Si on emploie un test pour exclure un diagnostic, sa sécurité est déterminéepar la sensibilité (on admet le moins possible de faux négatifs).
Si on emploie un test pour porter un diagnostic, sa sécurité est déterminéepar sa spécificité (on
admet le moins possible de faux positifs)
Rapport
de vraisemblance (likelyhood ratio)
Quantifie la vraisemblance d'un diagnostic fourni par un test positif ;
rapport de la probabilité qu'un test positif corresponde réellement à la maladie par rapport à la probabilité qu'un test positif ne corresponde pas à la
maladie.
Rapport
de cote : Odds ratio (OR)
Odd : mesure d'effet relatif calculé comme un rapport de 2 probabilités
complémentaires : probabilité P qu'un évènement survienne / probabilité 1-P
que cet évènement
ne survienne pas.
Odds ratio : rapport des "odds" dans 2 populations différentes (exemple
: groupe exposé vs groupe non exposé).
L'odds ratio est une meilleure approximation du risque relatif lorsque
le risque, dans l'un des groupes, est faible (< 10 %)
Distribution
La plus connue est la distribution "normale" ou gaussienne (loi normale avec 2 paramètres : moyenne ; écart-type). Une distribution peut êtrenormale dans une population générale, et ne pas l'être dans la population considérée, surtout dans les petits échantillons.
Paramètres de position : médiane, moyenne, quartile...
Paramètres de dispersion : intervalles interquartiles, écart-type, variance...
Coefficient décrivant la forme d'une distribution : coefficient de symétrie
(skewness); coefficient d'aplatissement (kurtosis)
Tests permettant d'affirmer la normalité d'une distribution : méthodes
graphiques, Kolmogorov-Smirnov ; Shapiro-Wilk (le plus utilisé)
Analyse de variance
Classiquement, toute variable
quantitative se décrit par : une étendue, un intervalle inter-quartile,
et un écart-type.
L’étendue représente l’écart entre la plus grande et la plus petite mesure
L’intervalle inter-quartile est défini par deux bornes délimitant les quarts supérieurs et inférieurs des données.
L’écart-type correspond à la moyenne des valeurs absolues des écarts par rapport à la
moyenne.
La variance est le carré de son écart-type ; c’est donc une
mesure de dispersion des observations (moyenne
des carrés des écarts).
L’analyse de variance permet de comparer
- deux groupes : c’est l’utilisation du test T (analyse univariée).Sila
différence observée est plus du d oubleque son erreur d’estimation,
on conclura que la différence est significative,sinon on conclura que la différence est compatible avec le hasard. (conditionsde validité : si les observations ont indépendantes,
si la distributionsuit une loi normale)
- plusieurs groupes : c’est l’ANOVA. Elle consiste à comparer
deux sources de variance : variance entre les groupes et variance résiduelle
au sein des groupes. Si la variance entre les groupes n’est pas plus
grande que la variance des observations au sein des groupes, les différences
observées ne sont que le reflet des aléas liés à l’échantillonnage. Il
n’y a donc pas de différence réelle entre les moyennes des populations.
(conditions de validité : si les observations sont indépendantes,
si la distributionsuit une loi normale).
Test
paramétrique
Ils sont utilisables lorsqu'on peut faire une hypothèse sur la loi de distribution de la variable étudiée (le plus souvent, la loi normale) et doncutiliser les caractéristiques de cette loi (ex : moyenne, écart-type
pour laloi normale).
Exemples : comparaison de
2 pourcentages : variables indépendantes : Chi2 (et ses variantes) ; appariées: Chi2 de Mac Némar
2 moyennes : variables indépendantes : écart réduit, Student ; appariées
: écart réduit apparié,
Student apparié
plus de 2 moyennes : variables indépendantes : analyse de variance ; appariées
: variance à 2
facteurs
2 variables quantitatives : coefficient de corrélation
Test
non paramètrique
Utilisés dans de petits échantillons
lorsqu'on n'a pas d'hypothèse
sur la loi de distribution... ou lorsqu'on n'en fait pas.
On utilise le rang de chaque variable dans la distribution.
Moins puissant que les tests paramétriques.
Exemples : comparaison de :
2 séries : indépendantes : Mann et Whitney ; appariées : Wilcoxon apparié
plus de 2 séries : indépendantes : Kruskal et Wallis ; appariées : Friedman
2 variables quantitatives : coefficient de Spearman
Comparaison
de l'interprétation
d'un test par 2 observateurs : coefficient kappa
Concordance : proportion de sujets pour lesquels il y a accord entre les observateurs.
le coefficient kappa est d'autant plus proche de 1 que la concordance est
bonne mais la mesure doit être interprétée en fonction du contexte. On considère habituellement comme "bon" un coefficient kappa > 0,6.
Le coefficient kappa pondéré est utilisé lorsqu'on souhaite pondérer des discordances plus "graves" que
d'autres.
A noter :http://kappa.chez.tiscali.fr sur
le sens et l'utilisation de ce coefficient.
Au total, lorsqu'on compare 2 traitements
1/ on rejette l'hypothèse nulle il
y a une différence
2/ p permet de dire que, à n% près, le hasard seul ne permet pas d'expliquer
la différence observée
3/ cela ne veut pas dire forcément que c'est le traitement ; d'autres facteurs peuvent être pris en compte ; c'est ce que cherche à éviter
une bonne randomisation
4/ cela a t-il une significativité clinique ?
|
Réf:
Chatelier
G, Durieux P. Moyenne, médiane et leurs indices de dispersion :
quand les utiliser et comment les présenter dans un article scientifique
? Rev Mal Respir 2003;20:421-4
Dart
T, Chatelier G. Comment décrire la distribution d'une variable
? Tests de normalité et traitement des valeurs extrêmes. Rev
Mal Respir 2003;20:946-51
Dalmay
F, Preux PM, Druet-Cabanac M, Vergnenègre A. Qu'est ce qu'un test
non paramétrique ? Rev Mal Respir 2003;20:955-8
Fuhrman
C, Chouaïd C. Concordance de deux variables : les approches numériques
- Concordance entre observations qualitatives (coefficient kappa),
concordances entre méthodes quantitatives. Rev Mal Respir 2004;21:123-5
Greenhalgh
T. How to read a paper: Statistics for the non-statistician. I:
Different types of data need
different statistical tests. BMJ 1997;315:364-6
Greenhalgh
T. How to read a paper: Statistics for the non-statistician.
II: "Significant" relations and
their pitfalls. BMJ 1997;315:422-5
Mélot
C. Qu'est ce qu'un intervalle de confiance ? Rev Mal Respir 2003;20:599-601
Mélot
C. Que signifie puissance d'une étude ? Comment la calculer
? Comment calculer le nombre de sujets nécessaires ? Rev
Mal Respir2003;20:602-3
Morabia
A. Risque relatif et odds ratio. Rev Mal Respir 2003;20:757-9
Nendaz
MR, Perrier A. Sensibilité, spécificité, valeur prédictive
positive et valeur prédictive négative d'un test diagnostique. Rev
Mal Respir 2004;21:390-3
Perneger
T, Perrier A. Analyse d'un test diagnostic : courbe ROC ou "receiver
operating characteristic". Rev Mal Respir 2004;21:398-401
Preux
PM, Druet-Cabanac M, Dalmay F, Vergnenègre A. Qu'est ce qu'un
test paramétrique ? Rev Mal Respir 2003;20:953-4
Méthodes statistiques à l'usage des médecins et biologistes 4 ème édition D. Schwartz Collection Statistique en biologie et en médecine. Médecine-Science
Flammarion |
|