Central Trend Measurements for Grouped Data
den åtgärder av central tendens hos grupperade data De används i statistiken för att beskriva vissa beteenden av en grupp av levererade data, såsom vilket värde är nära, som är genomsnittet av data samlas in, bland andra.
När en stor mängd data tas är det användbart att gruppera dem för att få en bättre ordning på dem och därmed kunna beräkna vissa åtgärder med central tendens.
Bland de åtgärder av central tendens som används mest är det aritmetiska medelvärdet, medianen och läget. Dessa siffror berättar vissa egenskaper för de uppgifter som samlats in i ett visst experiment.
För att använda dessa åtgärder är det nödvändigt att först veta hur man grupperar en uppsättning data.
Grupperade data
För att gruppera data först måste du beräkna räckvidden för data som erhålls genom att subtrahera det högsta värdet minus det lägsta värdet av data.
Välj sedan ett tal "k", vilket är antalet klasser där du vill gruppera data.
Vi fortsätter att dividera intervallet mellan "k" för att få amplituden för de klasser som ska grupperas. Detta nummer är C = R / k.
Slutligen startas grupperingen, för vilken ett mindre antal än det minsta värdet av den erhållna data är vald..
Detta nummer kommer att vara den nedre gränsen för första klassen. Till detta läggs till C. Det erhållna värdet blir den övre gränsen för första klassen.
Därefter tillsätts C till detta värde och den övre gränsen för den andra klassen erhålls. På så sätt fortsätter du tills du får den övre gränsen för den sista klassen.
När uppgifterna är grupperade kan du fortsätta att beräkna medel, median och mode.
För att illustrera hur det aritmetiska medelvärdet, medianen och läget beräknas, fortsätter vi med ett exempel.
exempel
När du grupperar data kommer du därför att få en tabell som följande:
De tre viktigaste centrala tendensåtgärderna
Nu ska vi fortsätta att beräkna det aritmetiska medelvärdet, medianen och läget. Ovanstående exempel kommer att användas för att illustrera denna procedur.
1- Aritmetisk medelvärde
Det aritmetiska medelvärdet består i att multiplicera varje frekvens med medelvärdet av intervallet. Sedan läggs alla dessa resultat till och slutligen delas med de totala uppgifterna.
Med hjälp av föregående exempel skulle vi få fram att det aritmetiska medelvärdet är lika med:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Detta indikerar att medelvärdet av data i tabellen är 5,11111.
2- Medium
För att beräkna medianen i en dataset är först alla data beställda från minst till största. Två fall kan presenteras:
- Om datamängden är udda, är medianen den data som ligger rätt i mitten.
- Om datanumret är jämnt, är medianen genomsnittet av de två data som återstår i mitten.
När det gäller grupperade data görs beräkningen av medianen på följande sätt:
- N / 2 beräknas, där N är den totala data.
- Det första intervallet söks där den ackumulerade frekvensen (summan av frekvenserna) är större än N / 2, och den nedre gränsen för detta intervall, som heter Li, väljs..
Median ges med följande formel:
Me = Li + (Ls-Li) * (N / 2 - ackumulerad frekvens före Li) / Frekvens av [Li, Ls)
Ls är den övre gränsen för det intervall som nämns ovan.
Om ovanstående datatabellen används den har till N / 2 = 18/2 = 9. Kumulativa frekvenser är 4, 8, 14 och 18 (en för varje rad i tabellen).
Därför bör det tredje intervallet väljas, eftersom den ackumulerade frekvensen är större än N / 2 = 9.
Så Li = 5 och Ls = 7. Om du använder den ovan beskrivna formeln måste du:
I = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Mode
Mode är det värde som har mest frekvens bland alla grupperade data; det vill säga det är det värde som upprepas oftast i den ursprungliga datasatsen.
När du har en mycket stor mängd data används följande formel för att beräkna läget för den grupperade data:
Mo = Li + (Ls-Li) * (frekvens Li - Frekvens L (i-1)) / ((frekvens Li - Frekvens L (i-1)) + (frekvens Li - Frekvens L ( jag + 1)))
Intervallet [Li, Ls) är det intervall där den högsta frekvensen hittas. För exemplet i denna artikel har vi det sättet som ges av:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
En annan formel som används för att få ett ungefärligt värde för mode är följande:
Mo = Li + (Ls-Li) * (frekvens L (i + 1)) / (frekvens L (i-1) + frekvens L (i + 1)).
Med denna formel är kontona följande:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
referenser
- Bellhouse, D. R. (2011). Abraham De Moivre: Ställ in scenen för klassisk sannolikhet och dess tillämpningar. CRC Press.
- Cifuentes, J. F. (2002). Introduktion till sannolikhetsteori. Univ. National of Colombia.
- Daston, L. (1995). Klassisk sannolikhet i upplysningen. Princeton University Press.
- Larson, H.J. (1978). Introduktion till sannolikhetsteori och statistisk inferens. Editorial Limusa.
- Martel, P.J. & Vegas, F.J. (1996). Sannolikhet och matematisk statistik: tillämpningar i klinisk praxis och hälsostyrning. Ediciones Díaz de Santos.
- Vázquez, A. L., & Ortiz, F.J. (2005). Statistiska metoder för att mäta, beskriva och kontrollera variabilitet. Ed. Universitetet i Cantabria.
- Vázquez, S. G. (2009). Matematikmanual för tillgång till universitetet. Redaktionscentrum för studier Ramon Areces SA.