La théorie derrière les valeurs p et l'hypothèse nulle peuvent sembler compliquées au début, mais comprendre les concepts vous aidera à naviguer dans le monde des statistiques. Malheureusement, ces termes sont souvent mal utilisés dans la science populaire, il serait donc utile que tout le monde comprenne les bases.
Consultez également notre article Comment supprimer toutes les autres lignes dans Excel
Calculer la valeur p d'un modèle et prouver / infirmer l'hypothèse nulle est étonnamment simple avec MS Excel. Il y a deux façons de le faire et nous allons les couvrir tous les deux. Creusons dedans
Hypothèse nulle et valeur p
L'hypothèse nulle est une affirmation, également appelée position par défaut, qui affirme que la relation entre les phénomènes observés est inexistante. Il peut également être appliqué aux associations entre deux groupes observés. Au cours de la recherche, vous testez cette hypothèse et essayez de la réfuter.
Par exemple, supposons que vous souhaitiez savoir si un régime à la mode donné produit des résultats significatifs. L'hypothèse nulle, dans ce cas, est qu'il n'y a pas de différence significative dans le poids des sujets testés avant et après un régime. L’hypothèse alternative est que le régime fait une différence. C'est ce que les chercheurs tenteront de prouver.
La valeur p représente le risque que le résumé statistique soit égal ou supérieur à la valeur observée lorsque l'hypothèse nulle est vraie pour un certain modèle statistique. Bien qu'il soit souvent exprimé en nombre décimal, il est généralement préférable de l'exprimer en pourcentage. Par exemple, la valeur p de 0, 1 doit être représentée par 10%.
Une faible valeur p signifie que la preuve contre l'hypothèse nulle est forte. Cela signifie en outre que vos données sont significatives. D'un autre côté, une valeur p élevée signifie qu'il n'y a pas de preuve solide contre l'hypothèse. Pour prouver que le régime à la mode fonctionne, il faudrait que les chercheurs trouvent une valeur p faible.
Un résultat statistiquement significatif est celui qui est hautement improbable si l'hypothèse nulle est vraie. Le niveau de signification est indiqué par la lettre grecque alpha et doit être supérieur à la valeur p pour que le résultat soit statistiquement significatif.
De nombreux chercheurs dans un large éventail de domaines utilisent la valeur p pour obtenir un aperçu meilleur et plus approfondi des données avec lesquelles ils travaillent. La sociologie, la justice pénale, la psychologie, la finance et l’économie font partie des domaines de prédilection.
Trouver la valeur p dans Excel
Vous pouvez trouver la valeur p d'un ensemble de données dans MS Excel via la fonction T-Test ou à l'aide de l'outil d'analyse de données. Tout d'abord, nous allons examiner la fonction T-Test. Nous examinerons cinq étudiants ayant suivi un régime de 30 jours. Nous comparerons leur poids avant et après le régime.
REMARQUE: Pour les besoins de cet article, nous utiliserons MS Excel 2010. Bien que ce ne soit pas la plus récente, les étapes devraient également s'appliquer aux versions les plus récentes.
Fonction T-Test
Suivez ces étapes pour calculer la valeur p avec la fonction T-Test.
- Créez et remplissez la table. Notre table ressemble à ceci:
- Cliquez sur n'importe quelle cellule en dehors de votre table.
- Tapez: = T.Test (.
- Après le crochet ouvert, tapez le premier argument. Dans cet exemple, il s'agit de la colonne Avant le régime. La plage doit être B2: B6. Jusqu'ici, la fonction ressemble à ceci: T.Test (B2: B6.
- Ensuite, nous entrerons dans le deuxième argument. La colonne Après le régime et ses résultats sont notre deuxième argument et la plage dont nous avons besoin est C2: C6. Ajoutons-le à la formule: T.Test (B2: B6, C2: C6.
- Tapez une virgule après le deuxième argument et les options de distribution unilatérale et bilatérale apparaîtront automatiquement dans un menu déroulant. Choisissons la première - la distribution unilatérale. Double-cliquez dessus.
- Tapez une autre virgule.
- Double-cliquez sur l'option Jumelé dans le menu déroulant suivant.
- Maintenant que vous avez tous les éléments dont vous avez besoin, fermez le support. La formule de cet exemple ressemble à ceci: = T.Test (B2: B6, C2: C6, 1, 1)
- Appuyez sur Entrée. La cellule affichera la valeur p immédiatement. Dans notre cas, la valeur est 0, 133906 ou 13, 3906%.
Étant supérieur à 5%, cette p -valeur ne fournit pas une preuve solide contre l'hypothèse nulle. Dans notre exemple, la recherche n'a pas prouvé que les régimes amaigrissants aidaient les sujets testés à perdre beaucoup de poids. Cela ne signifie pas nécessairement que l'hypothèse nulle est correcte, mais seulement qu'elle n'a pas encore été réfutée.
Route d'analyse des données
L'outil d'analyse de données vous permet d'effectuer de nombreuses tâches intéressantes, notamment des calculs à valeurs p . Pour simplifier les choses, nous utiliserons le même tableau que dans la méthode précédente.
Voici comment c'est fait.
- Comme nous avons déjà les différences de poids dans la colonne D, nous ignorerons le calcul de la différence. Pour les prochains tableaux, utilisez cette formule: = "Cellule 1" - "Cellule 2".
- Ensuite, cliquez sur l'onglet Données du menu principal.
- Sélectionnez l'outil d'analyse de données.
- Faites défiler la liste et cliquez sur l’option T-Test: Deux échantillons associés pour moyen.
- Cliquez sur OK.
- Une fenêtre pop-up apparaîtra. Cela ressemble à ceci:
- Entrez le premier intervalle / argument. Dans notre exemple, il s’agit de B2: B6.
- Entrez la deuxième plage / argument. Dans ce cas, il s’agit de C2: C6.
- Laissez la valeur par défaut dans la zone de texte Alpha (c'est 0.05).
- Cliquez sur le bouton radio Plage de sortie et choisissez où vous voulez le résultat. S'il s'agit de la cellule A8, entrez: $ A 8 $.
- Cliquez sur OK.
- Excel calculera la valeur p et plusieurs autres paramètres. La table finale pourrait ressembler à ceci:
Comme vous pouvez le constater, la valeur p unilatérale est la même que dans le premier cas - 0.133905569. Comme il est supérieur à 0, 05, l'hypothèse nulle s'applique à ce tableau et les preuves à l'appui sont faibles.
Choses à savoir sur la p- valeur
Voici quelques conseils utiles concernant les calculs de valeurs p dans Excel.
- Si la valeur p est égale à 0, 05 (5%), les données de votre table sont significatives. S'il est inférieur à 0, 05 (5%), les données que vous avez sont hautement significatives.
- Si la valeur p est supérieure à 0, 1 (10%), les données de votre tableau sont non significatives. Si elle se situe dans la plage 0.05-0.10, vous avez des données marginalement significatives.
- Vous pouvez modifier la valeur alpha, bien que les options les plus courantes soient 0, 05 (5%) et 0, 10 (10%).
- Choisir votre test bilatéral peut être le meilleur choix, selon votre hypothèse. Dans l'exemple ci-dessus, le test unilatéral signifie que nous examinons si les sujets du test ont perdu du poids après un régime, et c'est exactement ce que nous devions découvrir. Mais un test bilatéral permettrait également de déterminer s’ils avaient pris un poids statistiquement significatif.
- La p -valeur ne peut pas identifier les variables. En d'autres termes, s'il identifie une corrélation, il ne peut pas en identifier les causes.
La p-valeur démystifiée
Chaque statisticien digne de ce nom doit connaître les tenants et les aboutissants des tests d'hypothèses vides et ce que signifie la p-valeur . Ces connaissances seront également utiles aux chercheurs de nombreux autres domaines.
Avez-vous déjà utilisé Excel pour calculer la valeur p d'un modèle statistique? Quelle méthode avez-vous utilisée? Préférez-vous une autre façon de le calculer? Faites le nous savoir dans la section "Commentaires".
