multiple imputation

Allgemeine Fragen zu Statistik mit R.

multiple imputation

Beitragvon lisa23 » Mi 4. Mai 2022, 11:20

Hallo zusammen

Für meine Masterarbeit mache ich eine Analyse gemäss dem intent-to-treat Prinzip. Das hat zur Folge, dass ich einige fehlende Werte habe in meinen Postfragebögen.
Die fehlenden Werte will ich nun über eine multiple imputation schätzen lassen. Nach dem ich nun eine Woche lang darum herum probiert habe, bin ich einmal auf die folgenden Schritte gekommen:
Ich habe das Package in R "mice" gebraucht und Imputationsmodelle ausgeben lassen (imp <- mice(solus_analyse).

R gibt mir nun jeweils für jedes NA in meinem Datensatz 5 Werte aus. Jetzt wollte ich wissen, welcher Wert bzw. welches Imputationsmodell denn nun das beste ist für mein NA's(?). Dafür habe ich einmal folgendes nach Anleitung im Internet gemacht:

Mit with() habe ich mir diese Regression erstellt:
fit <- with(imp, lm(sum_ucla_post ~ sex_pre + age_pre + relationship_pre + educat_pre + sum_ucla_pre + lonely_dir_pre + lonely_dir_post + sum_bvi + sum_phq_pre + sum_sias_sps_pre + social_isol + sum_pid_pre + sum_zuf))

und diese dann gepoolt mit:
pool.fit <- pool(fit)
pool(fit)
Class: mipo m = 5
term m estimate ubar b t dfcom df riv lambda fmi
1 (Intercept) 5 1.30137013 17.518784021 6.9980107978 25.916396978 66 20.27088 0.4793491 0.32402702 0.3821231
2 sex_pre2 5 -1.02233896 0.754293676 0.4036502025 1.238673919 66 15.66084 0.6421640 0.39104742 0.4563127
3 age_pre 5 0.05068003 0.000585483 0.0004611962 0.001138918 66 11.18748 0.9452631 0.48593071 0.5583987
4 relationship_pre1 5 0.14217863 0.652585236 0.2122632196 0.907301100 66 24.15575 0.3903182 0.28074017 0.3337131
5 educat_pre 5 0.42012343 0.040246231 0.0305713507 0.076931852 66 11.53726 0.9115293 0.47685867 0.5488311
6 sum_ucla_pre 5 0.68517847 0.017628769 0.0056448648 0.024402607 66 24.47194 0.3842491 0.27758665 0.3301795
7 lonely_dir_pre 5 -0.75098838 0.270628958 0.1125073756 0.405637808 66 19.57629 0.4988707 0.33283103 0.3919345
8 lonely_dir_post 5 2.08840730 0.273032879 0.1250910130 0.423142095 66 17.97132 0.5497844 0.35474895 0.4162855
9 sum_bvi 5 0.15892646 0.009369788 0.0049689779 0.015332561 66 15.78686 0.6363830 0.38889611 0.4539527
10 sum_phq_pre 5 -0.02602509 0.009979922 0.0028159740 0.013359090 66 27.11276 0.3385967 0.25294902 0.3025659
11 sum_sias_sps_pre 5 -0.05272338 0.004418416 0.0020502433 0.006878708 66 17.77021 0.5568267 0.35766774 0.4195190
12 social_isol 5 -0.26330368 0.004781751 0.0021913832 0.007411411 66 17.96692 0.5499366 0.35481230 0.4163557
13 sum_pid_pre 5 0.02230135 0.001063084 0.0005511159 0.001724423 66 16.10787 0.6220950 0.38351328 0.4480403
14 sum_zuf 5 -0.05996818 0.006607923 0.0005798594 0.007303754 66 51.23993 0.1053026 0.09527036 0.1286306

summary(pool.fit)
term estimate std.error statistic df p.value
1 (Intercept) 1.30137013 5.09081496 0.2556310 20.27088 0.8008117782
2 sex_pre2 -1.02233896 1.11295729 -0.9185788 15.66084 0.3722475088
3 age_pre 0.05068003 0.03374787 1.5017256 11.18748 0.1608558270
4 relationship_pre1 0.14217863 0.95252354 0.1492652 24.15575 0.8825835801
5 educat_pre 0.42012343 0.27736592 1.5146902 11.53726 0.1567566393
6 sum_ucla_pre 0.68517847 0.15621334 4.3861714 24.47194 0.0001905417
7 lonely_dir_pre -0.75098838 0.63689702 -1.1791363 19.57629 0.2524768044
8 lonely_dir_post 2.08840730 0.65049373 3.2104957 17.97132 0.0048567991
9 sum_bvi 0.15892646 0.12382472 1.2834793 15.78686 0.2178449682
10 sum_phq_pre -0.02602509 0.11558153 -0.2251665 27.11276 0.8235382577
11 sum_sias_sps_pre -0.05272338 0.08293798 -0.6356964 17.77021 0.5330763101
12 social_isol -0.26330368 0.08608955 -3.0584859 17.96692 0.0067766283
13 sum_pid_pre 0.02230135 0.04152617 0.5370431 16.10787 0.5985785163
14 sum_zuf -0.05996818 0.08546200 -0.7016941 51.23993 0.4860450124


Nun habe ich diese Regressionskoeffizienten erhalten. Aber jetzt weiss ich immer noch nicht, wie ich den besten Wert/das beste Impuationsmodell auswähle, um meine NA's im Datensatz zu ersetzen. Kann mir da jemand weiterhelfen?
Wie kann ich das herausfinden?

Merci schon im Voraus für die Hilfe. Ich bin wirklich sehr dankbar für jeden Hinweis!

Lg Lisa
lisa23
 
Beiträge: 1
Registriert: Fr 22. Apr 2022, 14:28
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast