Welchen Test wähle ich

Allgemeine Fragen zu Statistik mit R.

Welchen Test wähle ich

Beitragvon Fledermaus » Do 15. Mär 2018, 16:03

Hallo,
ich arbeite gerade an der Statistik meiner Masterarbeit. In dieser wollte ich herausfinden, ob Fledermäuse durch die Begehung des Winterquartiers wach werden. Während des Winterschlafs befinden sich die Tiere im Torpor und haben eine sehr niedrige Körpertemperatur und wenn sie aktiv werden heizen sie hoch. Dafür habe ich Temperaturmessungen gemacht und die Temperatur der Fledermäuse am Anfang gemessen und nach 45 Minuten nochmal und wollte nun herausfinden ob die Tiere bei der zweiten Messung wärmer sind.

Ob sie nun aufwachen oder nicht würde ich entweder mit einem gepaarten Wilcox machen

wilcox.test(Te$Temp_A, Te$Temp_B, paired=TRUE, ra.rm=T)

# Wilcoxon signed rank test with continuity correction

#data: Te$Temp_A and Te$Temp_B
#V = 1963300, p-value = 3.53e-06
#alternative hypothesis: true location shift is not equal to 0

oder mit einem Binomial Test (Eines der 3000 gemessenen Tiere war am Anfang schon wach, also p=1/3000 und 14 waren (das eine Tier welches am Anfang wach war ausgenommen) bei der zweiten Messung wach)

> binom.test(14, 3000, p = 0.000333, alternative = c("two.sided"), conf.level = 0.95)

# Exact binomial test

#data: 14 and 3000
#number of successes = 14, number of trials = 3000, p-value = 4.346e-12
#alternative hypothesis: true probability of success is not equal to 0.000333
#95 percent confidence interval:
# 0.002553587 0.007817490
#sample estimates:
#probability of success
# 0.004666667

Welchen soll ich nehmen?
Und nun zur eigentlich Problematik

Ich möchte gerne ein Model machen um auch auf andere Effekte zu prüfen.
Dafür möchte ich gerne die Temperaturdifferenz gegen Temperatur draußen, die Temperatur im Bunker (alles metrische Werte), gegen unterschiede zwischen den verschiedenen Fledermausarten testen.

Die Differenzwerte der Temperaturmessungen sind nicht normal verteilt. Außerdem sind dort negativwerte dabei.
Ich habe die Differenzwerte auch schon logarythmiert, war das richtig? wenn ich ein lm nehme müssen sie ja normalverteilt sein oder soll ich ein glm nehmen und die Abhängige Variable (Differenz) nicht logarythmieren?
oder brauche ich gar ein glmm oder etwas ganz anderes? :shock:

Ich hoffe es kann mir jemand helfen. :cry: Vielen Dank
Fledermaus
 
Beiträge: 18
Registriert: Do 15. Mär 2018, 15:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welchen Test wähle ich

Beitragvon Hufeisen » Sa 17. Mär 2018, 13:10

Hallo,

wenn ich das richtig verstehe, hast du bei der Temperaturmessung der Fledermäuse zwei Größen. Einmal die Körpertemperatur zu t1 und t2 sowie die Feststellung, ob eine Fledermaus wach ist oder ruht zu t1 und t2. Ob sich die Körpertemperaturen zu t1 und t2 unterscheiden, kann mit dem gepaarten t-Test (falls die Temperaturen normalverteilt sind) oder dem Wilcoxontest (falls nicht normalverteilt) überprüft werden. Ich bin mir aber nicht sicher, ob der Binomialtest der richtige Test dafür ist, wie viele Fledermäuse wach sind. Der Binomialtest überprüft ja, ob ein beobachteter Anteilswert mit einem theoretisch erwarteten Anteilswert übereinstimmt, beispielsweise die Wahrscheinlichkeit eine 1 zu würfeln. Dein Vergleichswert ist aber nicht theoretisch sondern empirisch ermittelt. Aber ich bin mir, wie gesagt, da nicht ganz sicher. Auf jeden Fall ist aber der McNemar der richtige Test für Anteilswerte in verbundenen Stichproben. Da wäre ich mal gespannt, ob das gleiche wie beim Binomialtest rauskommt. Der wird hier kurz erklärt: https://www.medistat.de/glossar/analyse ... emar-test/ . Dort wird auch erwähnt, dass bei kleinen Häufigkeitsunterschieden durchaus der Binomialtest verwendet werden kann. Vielleicht kann hier jemand noch ergänzen.

Ich habe die Differenzwerte auch schon logarythmiert, war das richtig? wenn ich ein lm nehme müssen sie ja normalverteilt sein oder soll ich ein glm nehmen und die Abhängige Variable (Differenz) nicht logarythmieren?
oder brauche ich gar ein glmm oder etwas ganz anderes? :shock:

Nicht normalverteilte Werte sind für ein lineares Modell grundsätzlich unproblematisch. Wichtig ist, dass die Residuen normalverteilt sind. Du solltest eine erste lineare Testregression mit den rohen Daten rechnen und schauen, ob die Modellannahmen erfüllt sind (Linearität, Additivität, Homoskedastizität, Unabhängigkeit). Im Prinzip geht es nur darum, zu überprüfen, ob deine Daten sich linear beschreiben lassen. Im besten Fall zeigt sich die nicht normale Verteilung der Temperaturdifferenzen auch in den erklärenden Variablen, dann löst sich dieses 'Problem' von alleine auf. An der Verteilung der Residuen kannst du dann ablesen, ob eine Variablentransformation helfen würde, die Daten in einen linearen Zusammenhang zu bringen. Dabei ist das Logarithmieren nur eine der möglichen Transformationen. Schau mal hier: http://people.duke.edu/~rnau/testing.htm und hier: http://docs.statwing.com/interpreting-r ... egression/ .
Eine Logarithmierung erfordert übrigens, dass alle Werte positiv sind, das war also falsch.
Neu in R, versuche trotzdem zu helfen.
Hufeisen
 
Beiträge: 115
Registriert: Di 31. Jan 2017, 19:15
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post

Re: Welchen Test wähle ich

Beitragvon Fledermaus » Mo 19. Mär 2018, 09:27

Hallo,
vielen Dank für die hilfreiche Antwort. :D
Darf ich denn dann nur meine abhängige Variable logarithmieren oder sollte ich dann auch die unabhängigen Variablen logarithmieren? Dürfte ich dann einfach, um die negativen Werte zu eliminieren, vor dem logarithmieren meine Daten aus der Reihe der abhängigen Variable alle mit +4 ins positive rücken? Der niedrigste Wert ist -3,1.
Mit Additivität ist gemeint, dass die Variablen, die ich in meinem Model habe alle additiv sind (also mit + verbunden werden können) und keine Interaktion haben (wenn sie mit * verbunden werden), oder? Darf ich im Falle von einer Interaktion in den erklärenden Variablen kein lineares model mehr nehmen?

Vielen Dank,
LG
Bianca
Fledermaus
 
Beiträge: 18
Registriert: Do 15. Mär 2018, 15:44
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Welchen Test wähle ich

Beitragvon Hufeisen » Mo 19. Mär 2018, 13:22

Darf ich denn dann nur meine abhängige Variable logarithmieren oder sollte ich dann auch die unabhängigen Variablen logarithmieren?

Eine Logarithmierung ist nicht möglich, weil du negative Werte hast. Schau mal:
Code: Alles auswählen
> log(1)
[1] 0
> log(0)
[1] -Inf
> log(-1)
[1] NaN


Erstmal musst du aber überhaupt keine Variablen transformieren. Rechne eine Testregression und schau dir die Residuen an. Wenn du deine Temperaturdifferenzen mit +4 ins positive rückst, verfälscht du deine Daten. Manche Fledermäuse waren bei der ersten Begehung doch wärmer als bei der zweiten. Diesen Effekt würdest du kaschieren.
Wenn du Variablen logarithmierst (hypothestisch gesprochen, es trifft ja auf dich nicht zu), veränderst du den modellierten Zusammenhang. Normalerweise gilt ein additiver Zusammenhang. Ändert sich x um eins, ändert sich y um ß1:

Bei Logarithmierung nur der abhängigen Variable gilt, dass eine Veränderung der erklärenden Variablen um 1 die abhängige Variable um e^(1 * β1) ändert, also .
Bei Logarithmierung beider Seiten entsteht ein multiplikativer Zusammenhang.

Mit Additivität ist gemeint, dass die Variablen, die ich in meinem Model habe alle additiv sind (also mit + verbunden werden können)...

Ja.
und keine Interaktion haben (wenn sie mit * verbunden werden), oder?

Nein. Ein Interaktionsterm wird ja auch mit einem + an die Gleichung angehängt, das ist also kein Problem im linearen Modell.
Neu in R, versuche trotzdem zu helfen.
Hufeisen
 
Beiträge: 115
Registriert: Di 31. Jan 2017, 19:15
Danke gegeben: 0
Danke bekommen: 1 mal in 1 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste

cron