t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2024)

Der p-Wert gibt die Wahrscheinlichkeit an, dass das beobachtete Ergebnis oder ein noch extremeres Ergebnis eintritt, wenn die Nullhypothese wahr ist.

Mithilfe des p-Wertes wird entschieden, ob die Nullhypothese beibehalten oder abgelehnt wird. Ist der p-Wert kleiner als das festgelegte Signifikanzniveau (oft 5%) wird die Nullhypothese abgelehnt, sonst nicht.

Du möchtest eine Aussage über die Grundgesamtheit treffen und hast dafür eine Hypothese aufgestellt. Da es meistens nicht möglich ist, die gesamte Grundgesamtheit zu befragen, befragst du eine Stichprobe. Jetzt wird diese Stichprobe, aufgrund des Zufalls, sehr wahrscheinlich von der Grundgesamtheit abweichen.

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (1)

Sollte in deiner Grundgesamtheit die Nullhypothese gelten, z.B. das Gehalt von Männern und Frauen unterscheidet sich nicht in Deutschland, dann wird es in der Stichprobe sicherlich trotzdem einen Unterschied geben, z.B. einen Unterschied von 300 Euro pro Monat. Nun sagt dir der p-Wert wie wahrscheinlich es ist, dass in der Stichprobe zufällig ein Unterschied von 300 Euro oder mehr auftritt, wenn es in der Grundgesamtheit keinen Unterschied gibt.

Kommt eine sehr kleine Wahrscheinlichkeit raus, kann man sich natürlich fragen, ob die Annahme über die Grundgesamtheit überhaupt wahr ist.

Liegt der p-Wert z.B. bei 3%, dann ist es nur zu 3% wahrscheinlich, dass eine Stichprobe gezogen wird, in der das Gehalt von Männern und Frauen um mehr als 300 Euro auseinander liegt.

Wann wird der p-Wert verwendet?

Daher wird der p-Wert verwendet, um bei einem Hypothesentest die Nullhypothese entweder beizubehalten oder abzulehnen. Ist der berechnete p-Wert kleiner als ein vorher festgelegter Grenzwert (Signifikanzniveau), dann wird die Nullhypothese abgelehnt, ansonsten wird sie beibehalten.

Vereinfacht ausgedrückt: Egal welchen Hypothesentest man berechnet, der p-Wert ist das, was einem am Ende interessiert.

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2)

Beispiel:

  • Die Nullhypothese ist, dass es keinen Unterschied zwischen dem Gehalt von Männern und Frauen gibt.
  • Nun wird eine Stichprobe mit dem Gehalt von Männern und Frauen gezogen. Dies sind unsere beobachteten Ergebnisse.
  • Wir gehen davon aus, dass die Nullhypothese wahr ist, also dass es keinen Unterschied zwischen dem Gehalt von Männern und Frauen gibt.
  • Bei dem beobachteten Ergebnis (Stichprobe) ist nun herausgekommen, dass Männer 150 € mehr im Monat verdienen als Frauen.
  • Der p-Wert gibt nun an, wie wahrscheinlich es ist, eine Stichprobe zu ziehen, in der sich das Gehalt von Männern und Frauen um 150€ oder mehr unterscheiden, obwohl es in der Grundgesamtheit keinen Unterschied gibt.
  • Ist der p-Wert z.B. 0,04, ist es nur zu 4% wahrscheinlich, eine Stichprobe zu ziehen die 150€ oder mehr auseinanderliegt, wenn es in der Grundgesamtheit keinen Unterschied im Gehalt gibt.

Sagen wir, im oberen Fall kommt ein p-Wert von 0,04 bzw. 4% heraus, was bedeutet dieser p-Wert nun? Vereinfacht gesagt bedeutet das Ergebnis, dass es, wenn in der Grundgesamtheit kein Unterschied im Gehalt vorliegt, nur zu 4% wahrscheinlich ist eine Stichprobe zu ziehen, die 150€ oder mehr auseinanderliegt.

Die Wahrscheinlichkeit von 4% ist natürlich sehr gering, sodass man sich fragen kann, ob es überhaupt stimmt, dass Männer und Frauen in der Grundgesamtheit gleich viel verdienen, oder ob diese Hypothese nicht lieber verworfen werden sollte.

Die Frage, ab wann die Nullhypothese verworfen wird beantwortet das Signifikanzniveau.

Signifikanzniveau

Das Signifikanzniveau wird vor dem Test festgelegt. Liegt der berechnete p-Wert unter diesem Wert, wird die Nullhypothese abgelehnt, ansonsten wird sie beibehalten. In der Regel wird ein Signifikanzniveau von 5 % gewählt. Das Signifikanzniveau wird auch mit alpha abgekürzt:

  • alpha < 0,01 : hoch signifikant
  • alpha < 0,05 : signifikant
  • alpha ≥ 0,05 : nicht signifikant

Das Signifikanzniveau gibt damit die Wahrscheinlichkeit für einen Fehler 1. Art an. Was bedeutet das nun? Liegt ein p-Wert von 5% vor und die Nullhypothese wird damit abgelehnt, ist die Wahrscheinlichkeit, dass die Nullhypothese doch gilt, 5% also es ist zu 5% wahrscheinlich, dass man einen Fehler macht. Wird der kritische Wert auf 1% herabgesetzt, liegt die Fehlerwahrscheinlichkeit dementsprechend nur noch bei 1%, es ist damit aber auch "schwerer", die Alternativhypothese zu bestätigen.

Einseitiger p-Wert

Sagen wir, du betrachtest die Reaktionszeit von zwei Gruppen. Dann ist oft nicht von Interesse, ob es einen Unterschied zwischen den beiden Gruppen gibt, sondern ob eine Gruppe einen größeren bzw. kleineren Wert hat als die andere. In diesem Fall hätte man eine gerichtete Hypothese aufgestellt und würde dann einen sogenannten einseitigen p-Wert berechnen.

Ein einseitiger p-Wert umfasst Werte, die in einer Richtung extremer sind als das erhaltene Ergebnis, wobei diese Richtung im Voraus angegeben wurde.

Ein zweiseitiger p-Wert schließt Werte ein, die sowohl in positiver als auch in negativer Richtung extremer sind.

Der einseitige p-Wert ergibt sich dann, indem der zweiseitige p-Wert durch 2 geteilt wird. Hierbei muss natürlich aufgepasst werden, ob der betrachtete Unterschied bzw. Effekt überhaupt in die Richtung der Alternativhypothese geht.

Beispiel

Deine Alternativhypothese ist, dass Gruppe A größere Werte bei der Reaktionszeit hat als Gruppe B. Beim Auswerten deiner Daten erhältst du einen zweiseitiger p-Wert von 0,04.

Nun muss geprüft werden, ob in deinen Daten wirklich die Gruppe A größere Werte hat. Ist dies der Fall, wird der zweiseitiger p-Wert durch zwei geteilt, also erhälst du 0,02.

Ist dies nicht der Fall und der Effekt bzw. Unterschied geht genau in die andere Richtung als in der Alternativhypothese formuliert, ergibt sich dein p-Wert mit 1-0,02 also mit 0,98

Keine Angst, wenn du DATAtab verwendest, kannst du angeben, welche Art von Hypothese du hast, und DATAtab hilft dir bei der Auswertung.

p-Wert berechnen

Für die Berechnung des p-Wertes muss zunächst ein passender Hypothesentest gefunden werden. Ist der passende Hypothesentest gefunden kannst du den p-Wert im Statistik Rechner auf DATAtab ausrechnen. Die bekanntesten Hypothesentests sind:

  • t-Test
  • Korrelationsanalyse
  • Chi-Quadrat-Test
  • Varianzanalyse

Für die Berechnung des p-Wertes wird eine Verteilungsfunktion benötigt, welche die Realisierungen bzw. Ziehungen der Stichprobe beschreibt. Ist diese Verteilungsfunktion bekannt, kann bestimmt werden, wie wahrscheinlich es ist, dass eine gezogene Stichprobe kleiner oder gleich einem betrachteten Wert ist. Klassische Vertreter dieser Verteilungen sind die t-Verteilung und die Chi-Quadrat-Verteilung.

t-Verteilung

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (3)

Chi-Quadrat-Verteilung

t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (4)

Statistische Tests und der p-Wert

Damit man eine Hypothese verwerfen oder beibehalten kann benötigt man also den p-Wert. Der Ablauf wie der p-Wert für statistische Tests verwendet wird, ist nun folgender:

  • Festlegung des Signifikanzniveaus alpha z.B. 5 %
  • Festlegung eines statistischen Test-Verfahrens z.B. t-Test oder Korrelationsanalyse
  • Berechnung der Teststatistik von der Stichprobe z.B. den t Wert beim t-Test
  • Ermittlung des p-Wertes für die Teststatistik z.B. p-Wert für gegebenes t beim t-Test
  • Überprüfung ob, der p-Wert über oder unter dem festgelegten kritischem p-Wert liegt z.B. p-Wert 1% liegt unter dem kritischem Wert von 5%

Wie gebe ich den p-Wert an?

Wie der p-Werte aus einem Hypothesentest in Wissenschaftlichen Arbeiten dargestellt werden soll, ist nicht immer ganz klar. Unterschiedliche Statistikprogramme geben den p-Werte in unterschiedlichen Formaten aus, die teils für die Verschriftlichung nicht benötigt werden.

Rein theoretisch könnte der p-Wert auf eine nicht signifikant oder statistisch signifikant reduziert, was angemessen sein kann, wenn auch der Schätzwert und ein 95 %-Konfidenzintervall angegeben werden, aber im Allgemeinen liefert dies nicht genügend Informationen.

Wenn z.B. zwei p-Werte nahe der 0,05-Grenze liegen, einer knapp darüber und einer knapp darunter, sollte die Interpretation der beiden Werte nicht sehr unterschiedlich ausfallen. Wenn wir diese p-Werte auf eine binäre Antwort reduzieren und sagen, dass der eine signifikant ist und der andere nicht, ohne diese Aussage zu qualifizieren, riskieren wir, die von den Tests gelieferte Evidenz falsch darzustellen.

Daher ist es ratsam, den tatsächlichen p-Wert anzugeben, damit erhalten LeserInnen den größtmöglichen Einblick in die Ergebnisse.

Es ist üblich, die statistische Signifikanz in Form von Sternen anzugeben: * für p <0,05, ** für p <0,01, und *** für p <0,001. Im Allgemeinen wird für p-Werte Folgendes empfohlen:

  • Gib nach Möglichkeit den tatsächlichen P-Wert an.
  • Rundung: Zwei signifikante Stellen sind in der Regel ausreichend
t-Test, Chi-Quadrat, ANOVA, Regression, Korrelation... (2024)

FAQs

When to use t-test vs ANOVA vs correlation? ›

The Student's t test is used to compare the means between two groups, whereas ANOVA is used to compare the means among three or more groups. In ANOVA, first gets a common P value. A significant P value of the ANOVA test indicates for at least one pair, between which the mean difference was statistically significant.

When to use ANOVA t-test or chi-square? ›

While t-tests and ANOVA primarily deal with continuous dependent variables, Chi-Square tests come into play when there is a categorical dependent variable, often in the context of logistic regression.

What is the t-test for regression and correlation? ›

The regression t-test is applied to test if the slope, β, of the population regression line equals 0. Based on that test we may decide whether x is a useful (linear) predictor of y.

How do you interpret t-test results in regression analysis? ›

The t-test assesses whether the beta coefficient is significantly different from zero. If the beta coefficient is not statistically significant (i.e., the t-value is not significant), the variable does not significantly predict the outcome. If the beta coefficient is significant, examine the sign of the beta.

Should I use a t-test or regression? ›

Using linear regression instead of a t test or ANOVA allows us to directly obtain estimates (differences between treatment groups) along with their confidence intervals instead of only P values. Additionally, interaction terms can be included, and the interaction can be evaluated.

When should we use regression instead of ANOVA? ›

If you're interested in predicting an outcome or understanding the relationship between variables, regression is your go-to method. But if your focus is on comparing means and determining whether differences are significant, ANOVA is the tool of choice.

Does ANOVA measure correlation? ›

Both tests are quite different and answer different questions. Pearson correlation coefficient is used to measure the strength and direction of the linear relationship between two continuous variables, while ANOVA is used to test for differences in means among two or more groups.

When can you not use chi-square test? ›

Most recommend that chi-square not be used if the sample size is less than 50, or in this example, 50 F2 tomato plants.

Why not use t-test instead of ANOVA? ›

T-tests need to handle multiple comparisons better. Conducting multiple t-tests between different pairs of groups increases the likelihood of Type I errors (false positives). ANOVA incorporates post hoc tests (e.g., Tukey's test, Bonferroni correction) to handle multiple comparisons and control the overall error rate.

Do you need t-test for correlation? ›

The t-test is a statistical test for the correlation coefficient. It can be used when x and y are linearly related, the variables are random variables, and when the population of the variable y is normally distributed.

What is the difference between correlation and regression test? ›

The most commonly used techniques for investigating the relationship between two quantitative variables are correlation and linear regression. Correlation quantifies the strength of the linear relationship between a pair of variables, whereas regression expresses the relationship in the form of an equation.

What is a good p-value in regression? ›

A common threshold of the P-value is 0.05. Note: A P-value of 0.05 means that 5% of the times, we will falsely reject the null hypothesis. It means that we accept that 5% of the times, we might falsely have concluded a relationship.

What is the Anova in regression interpretation? ›

Analysis of Variance (ANOVA) consists of calculations that provide information about levels of variability within a regression model and form a basis for tests of significance. The basic regression line concept, DATA = FIT + RESIDUAL, is rewritten as follows: (yi - ) = ( i - ) + (yi - i).

What is a good T score in regression? ›

A good t-statistic is one that is statistically significant, meaning that the difference between the two sample means is unlikely to have occurred by chance. Generally, a t-statistic of 2 or higher is considered to be statistically significant.

How to know if a regression is significant? ›

In the intercept-only model, all of the fitted values equal the mean of the response variable. Therefore, if the P value of the overall F-test is significant, your regression model predicts the response variable better than the mean of the response.

What is the difference between correlation and t-test? ›

Correlation is a statistic that describes the association between two variables. The correlation statistic can be used for continuous variables or binary variables or a combination of continuous and binary variables. In contrast, t-tests examine whether there are significant differences between two group means.

What circ*mstances should you use ANOVA instead of t-tests to evaluate mean differences? ›

Answer and Explanation: We should use ANOVA instead of several t-tests to evaluate the differences in the mean of three or more groups because every time, we conduct a t-test (between two groups) there is some chance that a Type I error is being made while doing the test.

What is the major advantage to using ANOVA over t-test? ›

With a t-test, one would have to do multiple one-to-one comparisons. By contrast, with ANOVA, one can run a single test, with multiple different recipes in comparison to each other.

References

Top Articles
'It Could Be Any One of Us': Hundreds Mourn Slain Jersey City Officer
How to Watch With a Dog AND a Cat, Every Day Is Fun Online Free - Films/Movies & reviews news - NewsLocker
Proto Ultima Exoplating
How to Create a Batch File in Windows? - GeeksforGeeks
Nj Scratch Off Remaining Prizes
15:30 Est
Wjbd Weather Radar
Academic Calendar Biola
Jocko Joint Warfare Review
Butte County Court Oroville Ca
Uscis Fort Myers 3850 Colonial Blvd
Tinyzonetv.to Unblocked
Greyhound Bus Station Syracuse Ny
Dmv Leestown Rd
Smith And Wesson Nra Instructor Discount
Atl To London Google Flights
Mchoul Funeral Home Of Fishkill Inc. Services
Busted Newspaper Hampton County VA Mugshots
Buncensored Leak
Waitlistcheck Sign Up
Garagesalefinder Com
Watch Fifty Shades Darker Online Putlocker
SIM Cards, Phone Cards & SIM Cards, Cell Phones & Accessories
How To Level Up Intellect Tarkov
Fastest Lovakengj Favour
My Fico Forums
Nationsotc.com/Bcbsri
Currently Confined Coles County
Erfahrungen mit Rheumaklinik Bad Aibling, Reha-Klinik, Bayern
Current Time In Maryland
Storenet Walgreens At Home
Lkq Pull-A-Part
Closest Postal Service To My Location
The Listings Project New York
Dying Light Nexus
Rte Packaging Marugame
MyEyeDr. near Lind&lt;b&gt;ergh Center Metro Station
Aces Login Palo Alto
JPX Studios/item asylum
Omari Lateef Mccree
African American Thursday Blessings Gif
Kristy Althaus Kansas
A1.35.3 Spanish short story: Tending the Garden
Smoque Break Rochester Indiana
Cnas Breadth Requirements
Venti X Zhongli R34
Best Of Clinton Inc Used Cars
Duxa.io Reviews
Cargurus Button Girl
Lubbock Avalanche Journal Newspaper Obituaries
Dominos Nijmegen Daalseweg
Vox Machina Wiki
Latest Posts
Article information

Author: Zonia Mosciski DO

Last Updated:

Views: 6058

Rating: 4 / 5 (71 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Zonia Mosciski DO

Birthday: 1996-05-16

Address: Suite 228 919 Deana Ford, Lake Meridithberg, NE 60017-4257

Phone: +2613987384138

Job: Chief Retail Officer

Hobby: Tai chi, Dowsing, Poi, Letterboxing, Watching movies, Video gaming, Singing

Introduction: My name is Zonia Mosciski DO, I am a enchanting, joyous, lovely, successful, hilarious, tender, outstanding person who loves writing and wants to share my knowledge and understanding with you.