Schleife (loop) und deren Ergebnisse in eine csv-Datei

For(), If(), While() und Verwandte. Diskussion von programmiertechnischen Fragen.

Schleife (loop) und deren Ergebnisse in eine csv-Datei

Beitragvon daten_tim » Fr 13. Jan 2017, 16:06

Liebe R-Community,
ich tüftel nun schon eine Weile an einem Problem, habe im englischsprachigem Bereich auch ähnliche Dinge gefunden, aber keine passende Lösung für mich.
Ich habe eine Datei mit mehreren Millionen Zeilen (all_data). In dieser befinden sich ca. 25.000 Institutionen, die unterschiedich viele Zeilen beisteuern (von einer bis mehere Tausend). In jeder Zeile ist vermerkt, welche Institution diese geliefert hat. Ich möchte nun ersteinmal nur Wissen, wieviele Zeilen jede Institution in all_data beisteuert. Dafür habe ich folgenden Code geschrieben, der aber verbessert werden muss:

Code: Alles auswählen
for (i in all_data[,1][1:25000]) {
   
    institution_i=subset(all_data, all_data$institution == i)
   
    wert1=nrow(institution_i)
   
    print(wert1)
   
    write.csv(wert1, file= "results.csv", row.names = FALSE)
}


Die Schleife gibt mir durch print nacheinander alle Zeilenanzahlwerte (wert1) von jeder Institution. Z. B. für die ersten 4 Institutionen
Code: Alles auswählen
[1] 5295
[1] 6956
[1] 5748
[1] 6477

Die 25.000 Werte bringen mir aber nichts in der R-Studio-Console, deshalb will ich sie in eine csv-datei bekommen. In meiner Form beinhaltet die csv, aber immer nur die letzte Institution - sie wird also stets überschrieben, anstatt untereinander alle 25.000 Zeilenwerte jeder Institution zu nennen.
Danach will ich logischerweise auch noch jeweils eine csv-datei für jede Institution anlegen - also 25.000 csv-Dateien mit allen Zeilen der jeweiligen Institution. - Aber das wäre erst das nächste Problem! :)
Ich freue mich über Eure Meinung.
daten_tim
 
Beiträge: 23
Registriert: Do 18. Sep 2014, 17:46
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Schleife (loop) und deren Ergebnisse in eine csv-Datei

Beitragvon daten_tim » Fr 13. Jan 2017, 18:18

Danke.

so ganz funktioniert das bei mir noch nicht. was sagen die 5 mio. in der data.table aus? also warum brauchen wir die? das sollen doch irgendwie meine gänzlichen zeilen darstellen, oder?
das .N sorgt für das Zählen?

beste gruesse
daten_tim
 
Beiträge: 23
Registriert: Do 18. Sep 2014, 17:46
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Programmierkonzepte

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron