respir.com
respir.com
 

respir.com
respir.com
 
-- Infos --
  • La version PDF et HTML des enseignements de séméiologie du référentiel de pneumologie sont en ligne.
  • Des enseignements de pathologie du référentiel de pneumologie ont été mis à jour : Tuberculose (Q106), Allergies et hypersensibilités chez l'enfant et l'adulte (Q113), Sarcoïdose (Q124), Thrombose veineuse profonde et embolie pulmonaire (Q135), Pathologies pulmonaires iatrogènes (Q181), Détresse respiratoire aiguë du nourrisson de l'enfant et de l'adulte : Corps étranger des voies aériennes supérieures (Q193), Asthme de l'adulte (Q226), Insuffisance respiratoire chronique (Q254), Epanchement pleural (Q312), Hémoptysie (Q317), Toux chez l'enfant et chez l'adulte (avec le traitement) (Q336).

 INSCRIPTION GRATUITE

Elle permet d'accéder à la formation santé et à la bibliographie, de recevoir la revue de respir et d'être informé de l'actualité liée aux maladies respiratoires.

contact
collaborateurs
formation médicale initiale
référentiel de pneumologie (ECN)
cours Bordeaux2
formation médicale continue
cas cliniques
tabacologie
base documentaire
bibliographies

Quelques éléments de statistique ...

Créé le 09/05/2004 Auteur : A. Taytard (Mis à jour le 09/01/2007)
Révisé le 09/01/2007 C. Raherison  
     

Quelques questions lorsqu'on analyse un article
Quelle question a été posée par les auteurs ?
Comment les auteurs ont-ils répondu à la question posée ?
ont ils vérifié que leurs groupes étaient comparables et, si nécessaire, ont ils fait des ajustements sur les différences initiales ?
quels types de données ont ils obtenu et ont ils utilisés les tests statistiques appropriés ?
si les auteurs ont utilisé un test statistique peu connu, pourquoi l'ont ils fait et l'ont ils référencié ?
est ce que les données ont été analysées selon le protocole d'origine ?
est que des tests pairés ont été réalisés sur les données pairées ?
est ce qu'un test bilatéral a été réalisé chaque fois que l'effet d'une intervention pouvait raisonnablement être négatif ?
est ce que les points extrêmes ont été analysés avec bon sens et des ajustements statistiques appropriés ?
Quelle est la signification des résultats?

Corrélation
Le coefficient de corrélation de Pearson (r)
permet de savoir si deux variables quantitatives (aléatoires) sont indépendantes ou liées
Il n'est valide que si
les données sont normalement distribuées
les 2 groupes de données sont indépendants
une seule paire de mesures est faite sur chaque sujet (sinon il faut utiliser une analyse de variance)

Régression
Le choix du qualificatif final utilisé, régression ou corrélation, n'est pas fondamental.
La régression implique qu'une variable (contrôlée) peut être prédite par une ou plusieurs autres

Causalité (Critères de Bradford, Hill)
Elle implique :
une association statistique
une association forte (OR>2)
une association robuste d'une étude à l'autre
une relation temporelle appropriée
un effet dose-réponse
que ce qu'on a trouvé a du sens en termes épidémiologiques, biologiques
une association spécifique
une analogie avec une association causale précédemment trouvée

Méta-analyses

Moyenne, médiane
Moyenne : moyenne arithmétique ; valide si la variable est distribuée selon une loi normale, sinon, utiliser la médiane.
Médiane : on classe les observations par ordre croissant ; médiane =observation de rang (nombre d'observations + 1)/2

Dispersion de la distribution
Etendue : différence entre la valeur maximale et la valeur minimale ; très sensible aux extrêmes
Quantiles : on divise les données en parties égales ; le plus souvent, on utilise des quartiles en divisant les données en 4 parties égales de 25% (percentile) ; écart interquartile = distance entre le 1er le le 3ème quartile.
Ecart-type (standard deviation) : valable pour décrire une variable de distribution normale ; 95% des observations se situent entre la moyenne ± 2 écart-types.
Ecart-type de la moyenne (standard error of the mean) : si on s'intéresse à des groupes d'échantillons, on peut calculer la moyenne des moyennes obtenuesavec chaque échantillon. Cet indice décrit la précision de l'estimation de la moyenne dans un échantillon, il ne décrit pas la dispersion des observations autour de la moyenne (écart-type).

Hazard ratio
Basé sur la notion de risque instantané de décès dans un modèle de Cox par rapport à une variable donnée. Il s'agit de la modélisation de la probabilité de décès que l'on a dans une courbe de Kaplan-Meier.
En dessous de 1 : diminution du risque de décès dans le groupe étudié.
Au dessus de 1 : augmentation du risque de décès.
L'intervalle de confiance ne doit pas contenir 1 pour la significativité statistique des résultats.

Intervalle de confiance (IC)
Intervalle dans lequel la vraie valeur a de bonnes chance de se trouver.
Il peut être calculé pour différents niveaux de confiance : 90%, 95%, 99%.Cela signifie que sur 100 intervalles de confiance, 95 contiendront la moyenne théorique et 5 ne la contiendront pas ; on est sûr à 95% que la moyenne est dans l'intervalle calculé.
Lorsque la taille de l'échantillon augmente, l'intervalle de confiance diminue car la précision de l'estimation augmente. Lorsque l'échantillon recouvre toute la population, l'intervalle de confiance est égal à 0.
Si IC est calculé pour une différence (de 2 moyennes ou de 2 proportions :différence de risque), les différences sont significatives si l'intervalle necontient pas 0.
Si IC est calculé pour un rapport (de proportion : risque relatif ; ou de cotes : odds ratio), les différences sont significatives si l'intervalle ne contient pas 1.

Puissance
Risque a (risque de première espèce) : risque de conclure à tort à une différence lorsqu'il n'y en a pas.
Risque b (risque de deuxième espèce) : risque de ne pas voir une différence qui existe vraiment.
Puissance : probabilité (généralement à 80%) de détecter une différence lorsqu'elle existe réellement.
Cela permet de déterminer le nombre de sujets nécessaires pour obtenir la puissance souhaitée.

Risque relatif
Rapport du risque dans le groupe A sur celui du groupe B.

Sensibilité
Proportion de patients qui ont la maladie recherchée et dont le test est positif (vrais positifs).

Spécificité
Proportion de patients qui n'ont pas la maladie recherchée et dont le test est négatif (vrais négatifs).

Efficacité diagnostique
pourcentages de bien classés par le test : (vrais positifs + vrais négatifs / malades + non malades)

Valeur prédictive
positive : probabilité d'avoir la maladie en cas de test positif (VPP)
négative : probabilité de ne pas avoir la maladie en cas de testnégatif (VPN)

Courbe ROC (receiver operating characteristic)
Elle met en relation la sensibilité et la spécificité d'un test.
Si on emploie un test pour exclure un diagnostic, sa sécurité est déterminéepar la sensibilité (on admet le moins possible de faux négatifs).
Si on emploie un test pour porter un diagnostic, sa sécurité est déterminéepar sa spécificité (on admet le moins possible de faux positifs)

Rapport de vraisemblance (likelyhood ratio)
Quantifie la vraisemblance d'un diagnostic fourni par un test positif ; rapport de la probabilité qu'un test positif corresponde réellement à la maladie par rapport à la probabilité qu'un test positif ne corresponde pas à la maladie.

Rapport de cote : Odds ratio (OR)
Odd : mesure d'effet relatif calculé comme un rapport de 2 probabilités complémentaires : probabilité P qu'un évènement survienne / probabilité 1-P que cet évènement ne survienne pas.
Odds ratio : rapport des "odds" dans 2 populations différentes (exemple : groupe exposé vs groupe non exposé).
L'odds ratio est une meilleure approximation du risque relatif lorsque le risque, dans l'un des groupes, est faible (< 10 %)

Distribution
La plus connue est la distribution "normale" ou gaussienne (loi normale avec 2 paramètres : moyenne ; écart-type). Une distribution peut êtrenormale dans une population générale, et ne pas l'être dans la population considérée, surtout dans les petits échantillons.
Paramètres de position : médiane, moyenne, quartile...
Paramètres de dispersion : intervalles interquartiles, écart-type, variance...
Coefficient décrivant la forme d'une distribution : coefficient de symétrie (skewness); coefficient d'aplatissement (kurtosis)
Tests permettant d'affirmer la normalité d'une distribution : méthodes graphiques, Kolmogorov-Smirnov ; Shapiro-Wilk (le plus utilisé)

Analyse de variance
Classiquement, toute variable quantitative se décrit par : une étendue, un intervalle inter-quartile, et un écart-type.
L’étendue représente l’écart entre la plus grande et la plus petite mesure
L’intervalle inter-quartile est défini par deux bornes délimitant les quarts supérieurs et inférieurs des données.
L’écart-type correspond à la moyenne des valeurs absolues des écarts par rapport à la moyenne.
La variance est le carré de son écart-type ; c’est donc une mesure de dispersion des observations (moyenne des carrés des écarts).
L’analyse de variance permet de comparer
- deux groupes : c’est l’utilisation du test T (analyse univariée).Sila différence observée est plus du d oubleque son erreur d’estimation, on conclura que la différence est significative,sinon on conclura que la différence est compatible avec le hasard. (conditionsde validité : si les observations ont indépendantes, si la distributionsuit une loi normale)
- plusieurs groupes : c’est l’ANOVA. Elle consiste à comparer deux sources de variance : variance entre les groupes et variance résiduelle au sein des groupes. Si la variance entre les groupes n’est pas plus grande que la variance des observations au sein des groupes, les différences observées ne sont que le reflet des aléas liés à l’échantillonnage. Il n’y a donc pas de différence réelle entre les moyennes des populations. (conditions de validité : si les observations sont indépendantes, si la distributionsuit une loi normale).

Test paramétrique
Ils sont utilisables lorsqu'on peut faire une hypothèse sur la loi de distribution de la variable étudiée (le plus souvent, la loi normale) et doncutiliser les caractéristiques de cette loi (ex : moyenne, écart-type pour laloi normale).
Exemples : comparaison de
2 pourcentages : variables indépendantes : Chi2 (et ses variantes) ; appariées: Chi2 de Mac Némar
2 moyennes : variables indépendantes : écart réduit, Student ; appariées : écart réduit apparié, Student apparié
plus de 2 moyennes : variables indépendantes : analyse de variance ; appariées : variance à 2 facteurs
2 variables quantitatives : coefficient de corrélation

Test non paramètrique
Utilisés dans de petits échantillons lorsqu'on n'a pas d'hypothèse sur la loi de distribution... ou lorsqu'on n'en fait pas.
On utilise le rang de chaque variable dans la distribution.
Moins puissant que les tests paramétriques.
Exemples : comparaison de :
2 séries : indépendantes : Mann et Whitney ; appariées : Wilcoxon apparié
plus de 2 séries : indépendantes : Kruskal et Wallis ; appariées : Friedman
2 variables quantitatives : coefficient de Spearman

Comparaison de l'interprétation d'un test par 2 observateurs : coefficient kappa
Concordance : proportion de sujets pour lesquels il y a accord entre les observateurs.
le coefficient kappa est d'autant plus proche de 1 que la concordance est bonne mais la mesure doit être interprétée en fonction du contexte. On considère habituellement comme "bon" un coefficient kappa > 0,6.
Le coefficient kappa pondéré est utilisé lorsqu'on souhaite pondérer des discordances plus "graves" que d'autres.
A noter :http://kappa.chez.tiscali.fr sur le sens et l'utilisation de ce coefficient.

Au total, lorsqu'on compare 2 traitements
1/ on rejette l'hypothèse nulle il y a une différence
2/ p permet de dire que, à n% près, le hasard seul ne permet pas d'expliquer la différence observée
3/ cela ne veut pas dire forcément que c'est le traitement ; d'autres facteurs peuvent être pris en compte ; c'est ce que cherche à éviter une bonne randomisation
4/ cela a t-il une significativité clinique ?

Réf:
Chatelier G, Durieux P. Moyenne, médiane et leurs indices de dispersion : quand les utiliser et comment les présenter dans un article scientifique ? Rev Mal Respir 2003;20:421-4
Dart T, Chatelier G. Comment décrire la distribution d'une variable ? Tests de normalité et traitement des valeurs extrêmes. Rev Mal Respir 2003;20:946-51
Dalmay F, Preux PM, Druet-Cabanac M, Vergnenègre A. Qu'est ce qu'un test non paramétrique ? Rev Mal Respir 2003;20:955-8
Fuhrman C, Chouaïd C. Concordance de deux variables : les approches numériques - Concordance entre observations qualitatives (coefficient kappa), concordances entre méthodes quantitatives. Rev Mal Respir 2004;21:123-5
Greenhalgh T. How to read a paper: Statistics for the non-statistician. I: Different types of data need different statistical tests. BMJ 1997;315:364-6
Greenhalgh T. How to read a paper: Statistics for the non-statistician. II: "Significant" relations and their pitfalls. BMJ 1997;315:422-5
Mélot C. Qu'est ce qu'un intervalle de confiance ? Rev Mal Respir 2003;20:599-601
Mélot C. Que signifie puissance d'une étude ? Comment la calculer ? Comment calculer le nombre de sujets nécessaires ? Rev Mal Respir2003;20:602-3
Morabia A. Risque relatif et odds ratio. Rev Mal Respir 2003;20:757-9
Nendaz MR, Perrier A. Sensibilité, spécificité, valeur prédictive positive et valeur prédictive négative d'un test diagnostique. Rev Mal Respir 2004;21:390-3
Perneger T, Perrier A. Analyse d'un test diagnostic : courbe ROC ou "receiver operating characteristic". Rev Mal Respir 2004;21:398-401
Preux PM, Druet-Cabanac M, Dalmay F, Vergnenègre A. Qu'est ce qu'un test paramétrique ? Rev Mal Respir 2003;20:953-4
Méthodes statistiques à l'usage des médecins et biologistes 4 ème édition D. Schwartz Collection Statistique en biologie et en médecine. Médecine-Science Flammarion

Nous adhérons aux principes de la charte HONcode.
Vérifiez ici.
Tous droits réservés © Geri-Communication 2008
Usage strictement personnel. L'utilisateur du site reconnaît avoir pris connaissance de la licence de droits d'usage et mentions légales, en accepter et en respecter les dispositions.

Respir.com est enregistré à la C.N.I.L. sous le n°757727 VERSION 1