Werte neuer Variable in Abhängigkeit anderer Spaltenwerte

Allgemeine Fragen zu Statistik mit R.

Werte neuer Variable in Abhängigkeit anderer Spaltenwerte

Beitragvon kosa » Mi 19. Okt 2022, 18:52

Liebe Community,

ich habe eine Frage zur Datensatzaufbereitung. In einer Umfrage wurden dieselben Personen zu zwei Messzeitpunkten zu einer Reihe verschiedener Variablen befragt. Dabei entstand ein Datensatz im Long-Format, d.h. Angaben jedes Teilnehmer/jeder Teilnehmerin werden in zwei Zeilen gespeichert. Jede Zeile repräsentiert die Angaben dieser Person zu dem jeweiligen Messzeitpunkt (siehe Beispiel). Personen haben dabei individuelle Teilnahmecodes. Derselbe Teilnahmecode zeigt somit an, dass es sich um Angaben der selben Person handelt.

Code: Alles auswählen
Teilnahmecode   Messzeitpunkt      Risikowahrnehmung   ....
DB6M                   1                           6
DB6M                   2                           4
TH4D                   1                           2
TH4D                   2                           3
...


Nun möchte ich eine neue Variable "Risikowahrnehmung.complete" erstellen, die mir anzeigt, ob die Angaben vollständig sind. Es könnte nämlich sein, dass eine Person zu beiden Messzeitpuntken oder zu einem der beiden Messzeitpunkte keine Angabe gemacht hat und somit Werte fehlen (NAs).In der neuen Variable möchte ich dies für jede Person prüfen lassen. Wenn Die Person ein oder mehr NAs hat, dann sollte da eine 0 kodiert werden. Wenn die Person keine NAs hat, dann soll dort eine 1 stehen (siehe Beispiel)

Code: Alles auswählen
Teilnahmecode   Messzeitpunkt      Risikowahrnehmung      Risikowahrnehmung.complete
DB6M                   1                           6                                    1
DB6M                   2                           4                                    1
TH4D                   1                           2                                    1
TH4D                   2                           3                                    1
SU6H                   1                          NA                                   0
SU6H                   2                           3                                    0
VG9S                   1                          NA                                   0
VG9S                   2                          NA                                   0
...



Kann mir jemand sagen, wie ich das am besten programmiere?

Hier noch ein reproduzierbares Beispiel:
Code: Alles auswählen
data <- data.frame(
  code = c("AH6M","AH6M","BD7M","BD7M","SH9L","SH9L"),
  time = c(1,2,1,2,1,2),
  risk = c(6,7,NA,3,NA,NA))


Vielen Dank vorab und liebe Grüße!
kosa
 
Beiträge: 2
Registriert: Mo 12. Aug 2013, 19:42
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Zurück zu Statistik allgemein

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron