Gennemsnit efter kriterie
Jeg har et datasæt hvor hver enkelt virksomhed har 8 variable. Disse variable for hver virkomhed har jeg fra tre-fem år tilbage. Jeg skal nu bruge gennemsnittet for hver virksomhed på tværs af årene. Prøver lige at illustrereVirksomhed Var1 Var2 Var3 .....
id_1 0,7 0,8 0,5
id_1 0,3 0,2 0,3
id_1 0,5 0,9 0,9
id_2 ... .... ...
Det er så gennemsnittet for hver variable jeg ønsker i nogle nye kolonner. Altså beregne gennemsnittet efter virksomheds_id. For nogle virksomheder er der 3 år, andre 4 og andre igen 5 år efter hinanden.
Jeg er klar over jeg kunne lave en ny række for hver gang der kom en ny virksomhed og så beregne gennemsnittet i den ny række. Men har op til 100000 rækker så det vil tage alt for lang tid.
har siddet og grublet over dette uden at kunne finde en løsning, så smider 200 point i puljen i håb om eksperterne herinde kan hjælpe.