Hallo zusammen!
Ich habe eine recht allgemeine Frage an euch.
Meine Aufgabe ist es aus einem Dokument mit Hotelbewertungen (Name des Hotels, negativer Kommentar, positiver Kommentar, Bewertung von 1-10) mit Hilfe von Text Clustern Erkenntnisse aus den Kommentaren zu erzielen.
Die Idee war zunächst die negativen Kommentare zu clustern. Daraufhin innerhalb der einzelnen Cluster eine Durchschnittsbewertung zu berechnen und eine Word-Cloud zu erstellen, um zu sehen, welche Wörter denn in den Kommentaren erwähnt werden und zu welchen Bewertungen diese führen.
Kleines Beispiel: Bewertungen, in denen "schlechtes Frühstück" vorkommt, bekommen im Durchschnitt eine Bewertung von 6 Punkten.
Leider bin ich recht neu in der R-Umgebung und tue mich schwer, die richtigen Funktionen und Pakete zu finden. Auf Youtube etc. gibt es schon viele Tutorials, aber die sind doch alle sehr verschieden.
Deshalb wollte ich hier einmal nachfragen, ob ihr mir Tipps geben könnt, wie ihr grundsätzlich bei so einer Aufgabe vorgehen würdet und mit welchen Funktionen.
Den Code möchte ich dann gerne selber schreiben, damit ich auch wirklich nachvollziehen kann, was denn passiert.
Vielen Dank schon einmal!
Grüße,
Alex