Clusteranalyse

T-Test, U-Test, F-Test sowie weitere Tests und Gruppenvergleiche aller Art.

Clusteranalyse

Beitragvon Christian_Berlin » Do 27. Aug 2015, 14:27

Hallo zusammen,

ich versuche mich gerade an einer Clusteranalyse und scheitere an der Daisy-Funktion, mit der ich meine ordinären und binären Variablen miteinander verknüpfen möchte. Es erscheint die folgende Fehlermeldung:

Fehler in daisy(Rohdaten, metric = "gower", stand = FALSE, type = list(symm = 1)) :
mindestens eine binäre Variable hat mehr als 2 Stufen.

Folgendes habe ich schon probiert und hat leider nicht weiter geholfen:
- habe alle binären Variablen geprüft, ob sie wirklich binär sind
- Fehlende Daten ("n.a.") habe ich bereinigt
- Binäre Daten bestehen jetzt nur noch aus "0" und "1"

Kann mir jemand helfen? Falls nicht, bin ich auch über alternative Lösungswege dankbar.

VG Christian
Christian_Berlin
 
Beiträge: 2
Registriert: Do 27. Aug 2015, 14:03
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse

Beitragvon Christian_Berlin » Fr 28. Aug 2015, 09:57

Hat sich erledigt. Ich habe es durch Trial and Error selbst herausgefunden.

Man muss sicherstellen, dass die binären Variablen beim Einlesen links bzw. am Anfang stehen. Bei mir waren das 36. Der Code muss wie folgt angepasst werden:

daisy(Rohdaten, metric="gower",stand=FALSE, type=list(symm=1:36))

VG Christian
Christian_Berlin
 
Beiträge: 2
Registriert: Do 27. Aug 2015, 14:03
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse

Beitragvon MMN12 » Do 1. Nov 2018, 23:01

Hi Christian
Ich habe dasselbe Problem wie du damals.
Was waren bei dir 36? Zeilen die Du dann "links" eingeordnet hast?

Vg
Margot
MMN12
 
Beiträge: 5
Registriert: Mi 12. Sep 2018, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse

Beitragvon jogo » Fr 2. Nov 2018, 09:37

Hallo Margot,

bei einem Dataframe sind die Variablen die Spalten und jede Zeile enthält eine Beobachtung.
Ich habe Christian so verstanden, dass er 36 binäre/dichotome Variablen/Spalten hatte, die er links anordnen musste.

Gruß, Jörg
jogo
 
Beiträge: 118
Registriert: Mo 26. Feb 2018, 09:56
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse

Beitragvon MMN12 » Do 8. Nov 2018, 20:13

Danke. Ich habe es soweit verstanden.
Habe jetzt ein anderes Problem.....Zwar versuche ich ein Dendogram zu erstellen. Kommt aber die Fehlermeldung: "Fehler: Unsupported index type: NULL" Irgendein Hinweis?
VG
Margot
MMN12
 
Beiträge: 5
Registriert: Mi 12. Sep 2018, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse

Beitragvon jogo » Fr 9. Nov 2018, 10:35

Hallo Margot,

so ganz ohne Daten und Code: nein.
Deshalb hat StackOverflow auch so hohe Anforderungen an die Fragen: https://stackoverflow.com/questions/596 ... le-example
Auch in dem anderen Forum, in dem ich öfter unterwegs bin, haben wir etwas ähnliches:
http://forum.r-statistik.de/viewtopic.php?f=20&t=11

Gruß, Jörg
jogo
 
Beiträge: 118
Registriert: Mo 26. Feb 2018, 09:56
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Clusteranalyse

Beitragvon MMN12 » Sa 10. Nov 2018, 20:38

Danke Jörg.
Einiges habe ich geschafft.
Erstmals habe ich die einzige Spalte mit Text (als "character" eingestuft) gelöscht: x1 <- x[,-1]
Danach habe ich die Anzahl der Spalten angepasst (insg 21 Spalten): daisy(x1, metric = "gower", stand = TRUE, type = list(symm=21))
Da habe ich eine Warnmeldung gekriegt: Binärvariable 3, 4, 13, 14, 15, 18 als intervallskaliert behandelt.
Das stört mich noch. Allerdings hat es nicht verhindert eine Cluster-Analyse zu machen:
> hc_x1 <- hclust(d_x1, method = "average")
> plot(hc_x1)

Das Dendogram sieht bescheuert aus. Das liegt zum Teil daran, dass meine Daten wirklich verrückt sind, glaube ich.
Jetzt muss ich mein Dendogram verbessern.....
VG
Margot
MMN12
 
Beiträge: 5
Registriert: Mi 12. Sep 2018, 13:43
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Tests und Gruppenvergleiche

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste