Ich möchte kontinuierliche Daten modellieren, die von 0 bis 0,96 reichen (die Daten spiegeln den Anteil an Blattschaden an einzelnen Blättern wider).
Ich dachte an die Verwendung einer Beta-Verteilung, da die Beta-Verteilung eine kontinuierliche Wahrscheinlichkeitsverteilung ist, die auf dem Intervall [0, 1] definiert ist. Siehe Histogamm (Bild, links) Datenverteilung:
Ich habe meine Daten mit der Funktion "glmmTMB" unter Verwendung der folgenden Modellstruktur modelliert (Chewin_propohn0= Blattschadenanteile)
nzmod3<-glmmTMB(Chewin_prop ~ Drought+Stratum+Year+Drought:Stratum+Drought:Year+Stratum:Year+(1|Tree.ID), data=ss,family=beta_family(link = "logit"), na.action = na.exclude)
Das Modell läuft einwandfrei, und ich erhalte keine Fehlermeldungen. Wenn ich jedoch mit der Funktion "testDispersion()" aus dem DHARMa-Paket auf Overdispersion prüfe, sehe ich, dass mein Modell overdispersed ist (siehe Bild rechts)
Meine Fragen sind:
1: Ist Überdispersion etwas, das mir Sorgen bereiten sollte, wenn ich ein Beta-Familienmodell auf kontinuierliche Daten anwende (ich konnte keine klaren Antworten auf diese Frage finden)
2: Wenn 1=JA, welche Alternativen habe ich? Wie kann ich mit dieser Überdispersion umgehen? Ich habe bereits einen Hurdle modelling Ansatz ausprobiert (Anpassung eines Bernoulli-Modells an die Null/Nicht-Null-Daten, dann ein bedingtes kontinuierliches Modell für die Nicht-Null-Werte), aber das hat mein Problem nicht gelöst. Vielen Dank, Michi