Text Clustering

Faktorenanalyse, Clusteranalyse, Diskriminanzanalyse und weitere multivariate Verfahren mit R.

Text Clustering

Beitragvon alexw » Sa 28. Jul 2018, 11:38

Hallo zusammen!

Ich habe eine recht allgemeine Frage an euch.
Meine Aufgabe ist es aus einem Dokument mit Hotelbewertungen (Name des Hotels, negativer Kommentar, positiver Kommentar, Bewertung von 1-10) mit Hilfe von Text Clustern Erkenntnisse aus den Kommentaren zu erzielen.

Die Idee war zunächst die negativen Kommentare zu clustern. Daraufhin innerhalb der einzelnen Cluster eine Durchschnittsbewertung zu berechnen und eine Word-Cloud zu erstellen, um zu sehen, welche Wörter denn in den Kommentaren erwähnt werden und zu welchen Bewertungen diese führen.

Kleines Beispiel: Bewertungen, in denen "schlechtes Frühstück" vorkommt, bekommen im Durchschnitt eine Bewertung von 6 Punkten.

Leider bin ich recht neu in der R-Umgebung und tue mich schwer, die richtigen Funktionen und Pakete zu finden. Auf Youtube etc. gibt es schon viele Tutorials, aber die sind doch alle sehr verschieden.
Deshalb wollte ich hier einmal nachfragen, ob ihr mir Tipps geben könnt, wie ihr grundsätzlich bei so einer Aufgabe vorgehen würdet und mit welchen Funktionen.
Den Code möchte ich dann gerne selber schreiben, damit ich auch wirklich nachvollziehen kann, was denn passiert.

Vielen Dank schon einmal!

Grüße,
Alex
alexw
 
Beiträge: 2
Registriert: Sa 28. Jul 2018, 11:23
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Text Clustering

Beitragvon jogo » Di 31. Jul 2018, 08:46

Hallo Alex,

hast Du schon auf SO gesucht?
https://stackoverflow.com/search?q=%5Btm%5D+cluster o.ä.

Gruß, Jörg
jogo
 
Beiträge: 78
Registriert: Mo 26. Feb 2018, 09:56
Danke gegeben: 3
Danke bekommen: 0 mal in 0 Post

Re: Text Clustering

Beitragvon alexw » Do 2. Aug 2018, 08:58

Hallo Jörg,

dort tatsächlich noch nicht! Werd mir das heute nachmittag direkt mal ansehen.
Danke für den Tipp!
alexw
 
Beiträge: 2
Registriert: Sa 28. Jul 2018, 11:23
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Multivariate Verfahren

Wer ist online?

Mitglieder in diesem Forum: Google [Bot] und 0 Gäste

cron