Anonim

La valeur p est l’un des concepts les plus importants de la statistique. Lorsque vous travaillez sur des projets de recherche, ce sont les données de sortie sur lesquelles les scientifiques se fient le plus souvent.

Consultez également notre article Comment lier des données à un autre onglet dans Google Sheets

Mais comment calculez-vous réellement la valeur p dans Google Spreadsheets?

Cet article va vous montrer tout ce que vous devez savoir sur le sujet. À la fin de l'article, vous serez en mesure de calculer facilement la valeur p et de vérifier vos résultats.

Quelle est la p- valeur?

La valeur p est utilisée pour déterminer si certaines hypothèses sont correctes ou non. Fondamentalement, les scientifiques choisiront une valeur ou une plage de valeurs qui expriment le résultat normal attendu lorsque les données ne sont pas corrélées. Après avoir calculé la valeur p de leurs ensembles de données, ils sauront à quel point ils sont proches de ces résultats.

La constante qui représente les résultats attendus est appelée le niveau de signification. Bien que vous puissiez choisir ce nombre en fonction de recherches antérieures, il est généralement défini sur 0, 05.

Si la valeur p calculée est bien inférieure au seuil de signification, le résultat attendu ne s'est pas matérialisé. Plus la valeur p est faible, plus il est probable que vos données expriment une sorte de corrélation.

Comment calculez-vous la valeur p manuellement?

Voici les étapes pour calculer la valeur p sur papier:

  1. Déterminez les résultats attendus de votre expérience.
  2. Calculez et déterminez les résultats observés pour votre expérience.
  3. Déterminez le degré de liberté - quel écart par rapport aux résultats respectés est considéré comme significatif?
  4. Comparez les premiers résultats attendus aux résultats de l'observateur avec un khi carré.
  5. Choisissez le niveau de signification.
  6. Approximez votre p- value en utilisant le tableau de distribution du Khi-deux.
  7. Rejetez ou conservez votre hypothèse nulle de départ.

Comme vous pouvez le constater, il y a beaucoup de choses à calculer et à prendre en compte lorsque vous utilisez une feuille de papier et un stylo. Vous devrez vérifier si vous avez suivi les formules correctes pour toutes les étapes et vérifier de nouveau si vous avez les bonnes valeurs.

Pour éviter le risque de résultats erronés dus à de mauvais calculs, il est préférable d'utiliser des outils tels que Google Sheets. Étant donné que la valeur p est si importante, les développeurs ont inclus une fonction qui la calculera directement. La section suivante va vous montrer comment faire.

Calcul de la valeur p dans Google Sheets

La meilleure façon de l'expliquer serait d'utiliser un exemple que vous pouvez suivre. Si vous avez déjà une table existante, appliquez simplement ce que vous avez appris dans le tutoriel suivant.

Nous allons commencer par créer deux ensembles de données. Après cela, nous comparerons les ensembles de données créés pour voir s’il existe une signification statistique entre eux.

Disons que nous devons examiner les données pour un entraîneur personnel. L'entraîneur personnel nous a fourni les numéros de ses clients concernant leur progression en push-up et en pull-up, et nous les avons entrés dans Google Spreadsheet.

Le tableau est très basique mais il servira aux fins de cet article.

Afin de comparer ces deux ensembles de données différents, nous devrons utiliser la fonction T-TEST de Google Spreadsheet.

La syntaxe de cette fonction ressemble à ceci: TTEST (array1, array2, tails, type) mais vous pouvez également utiliser la syntaxe T.TEST (array1, array2, tails, type) - les deux font référence à la même fonction.

Array1 est le premier ensemble de données. Dans notre cas, ce serait la colonne entière de Pushups (sauf le nom de la colonne, bien sûr).

Array2 est le deuxième ensemble de données, qui se trouve sous la colonne Pull-ups.

Les queues représentent le nombre de queues utilisées pour la distribution. Vous avez seulement deux options ici:

1 - distribution unilatérale

2 - distribution à deux queues

Le type représente une valeur entière pouvant être 1 (test T apparié), 2 (test T à variance égale échantillonné à deux échantillons) ou 3 (test T à variance inégale à deux échantillons).

Nous allons nommer une colonne de notre choix TTEST et afficher les résultats de cette fonction dans la colonne à côté.

Pour utiliser cette fonction, cliquez simplement sur la colonne vide dans laquelle vous souhaitez afficher les p- valeurs et entrez la formule dont vous avez besoin. Pour notre exemple, nous allons entrer la formule suivante: = TTEST (A2: A7, B2: B7, 1, 3). Comme vous pouvez le constater, A2: A7 représente les points de départ et d'arrivée de notre première colonne. Vous pouvez simplement maintenir votre curseur à la première position (A2) et le faire glisser au bas de votre colonne pour que Google Spreadsheets mette automatiquement à jour votre formule. Ajoutez une virgule à votre formule et faites la même chose pour la deuxième colonne.

Ensuite, remplissez simplement les queues et tapez les arguments (séparés par des virgules) et appuyez sur Entrée.

Votre résultat devrait apparaître dans la colonne où vous avez tapé la formule.

Messages d'erreur courants

Si vous avez commis une erreur en tapant votre formule TTEST, vous avez probablement déjà vu l'un de ces messages d'erreur:

  1. # N / A - affiché si vos deux ensembles de données ont des longueurs différentes.
  2. #NUM - affiché si l'argument tails entré n'est pas égal à 1 ou 2. Il peut également être affiché si l'argument type n'est pas égal à 1, 2 ou 3.
  3. #VALEUR! - affiché si vous avez entré des valeurs non numériques pour les queues ou les arguments de type.

Le calcul des données n'a jamais été aussi simple avec Google Spreadsheets

Espérons que vous avez maintenant ajouté une autre fonction Google Spreadsheets à votre arsenal. En savoir plus sur les possibilités et les fonctionnalités de cet outil en ligne, vous serez plus à même d'analyser les données, même si vous n'êtes pas statisticien.

Avez-vous une autre méthode que vous utilisez pour calculer la valeur p ? N'hésitez pas à nous en parler dans les commentaires ci-dessous.

Comment calculer la valeur p dans les feuilles de google