Lineare Regression zeigt Signifikanz-real aber nicht linear

Allgemeine Fragen zu Statistik mit R.

Lineare Regression zeigt Signifikanz-real aber nicht linear

Beitragvon Mona.71 » Mo 23. Jul 2018, 16:18

Hallo, Ihr Lieben,

ich bin blutiger Anfänger, muß eine Hausarbeit fertig schreiben und mein Prof. ist bis zum Abgabetermin in Urlaub. Ich habe folgendes Problem. Die Durchführung einer linearen Regression zeigt mir Signifikanz bei einem bestimmten Merkmal. Bei genauerer Betrachtung ist der Verlauf jedoch nicht linear. Wie kann das sein?

Zum Projekt: Ich untersuche den Zusammenhang zwischen Rücklaufquoten bei Online-Umfragen (UV) und den AVs Geschlecht (dichotom), Studiengang (dichotom) und Fachsemester (ordinal, ganzzahlig, 7 Semester, Daten integer).

Mir war bei der ersten Auswertung meiner Daten ein Fehler unterlaufen (eine Leerstelle mit ungeahnten Folgen) . Nun habe ich nach Korrektur der Daten nochmals die lineare Regression durchgeführt, um festzustellen, dass neben dem Geschlecht auch das Semester Auswirkungen auf die Rücklaufquote hat. Jetzt ist mir aber nicht ganz klar, wie ich das interpretieren kann.

Call:
lm(formula = QUOTE ~ FACH + SEM + SEX, data = daten)

Residuals:
Min 1Q Median 3Q Max
-6.7079 -1.8259 -0.0563 0.7285 9.2793

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.8357 1.4934 3.908 0.000665 ***
FACHBWP 1.1071 1.1289 0.981 0.336523
SEM -0.6204 0.2822 -2.198 0.037833 *
SEXw 3.4871 1.1289 3.089 0.005019 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.987 on 24 degrees of freedom
Multiple R-squared: 0.3898, Adjusted R-squared: 0.3136
F-statistic: 5.111 on 3 and 24 DF, p-value: 0.007082

Da es sich um insgesamt 7 Semester handelt und es sich um integere Daten handelt, steckt doch dahinter eine Art „je höher, desto mehr/weniger-Aussage“, oder?! Tatsächlich zeigt aber der Mittelwertvergleich via Boxplot, dass nur im 4. Semester ein deutlich höherer Mittelwert vorliegt. Wo ist jetzt mein Denkfehler? Oder kann die Regression bei U-förmigem Verlauf auch einfach fehlerhaft sein? Oder müsste ich ein ganz anderes Verfahren (mehrfaktorielle ANOVA?) anwenden? Wie interpretiere ich die dann richtig? Reicht überhaupt der Mittelwertvergleich mittels Boxplot bei mehr als zwei Werten, wenn laut Regressionsanalyse statistische Signifikanz vorliegt? Wie kann ich erkennen, welcher Wert überhaupt statistisch signifikant ist?

Ich habe einiges rumprobiert und wenn ich die Regression z.B. ohne das Geschlecht durchführe, ist auch das Semester nicht mehr signifikant.

Ich hoffe, irgendjemand versteht überhaupt mein Problem und antwortet mir möglichst unchinesisch....

Vielen Dank!!
Mona.71
 
Beiträge: 1
Registriert: Mo 23. Jul 2018, 16:08
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Lineare Regression zeigt Signifikanz-real aber nicht lin

Beitragvon jogo » Mi 25. Jul 2018, 08:52

Hallo Mona,

wenn ich das richtig sehe, funktioniert R einwandfrei beim Schätzen des linearen Modells.
Deshalb sehe ich momentan keine R-spezifische Frage. Deine Fragen betreffen eher die Modellierung allgemein - sie würden genauso lauten, wenn Du irgend eine andere Software für die Schätzung verwendet hättest.

Gruß, Jörg
jogo
 
Beiträge: 132
Registriert: Mo 26. Feb 2018, 09:56
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post


Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste