Sturges Rule Förklaring, applikationer och exempel



den Sturges regel är ett kriterium som används för att bestämma antalet klasser eller intervaller som är nödvändiga för att grafiskt representera en uppsättning statistiska data. Denna regel formulerades 1926 av den tyska matematikern Herbert Sturges.

Sturges föreslog en enkel metod, baserat på antalet prover x som möjliggjorde att hitta antalet klasser och deras intervallamplitud. Sturgesregeln används i stor utsträckning speciellt inom statistikområdet, speciellt för att bygga frekvenshistogram.

index

  • 1 Förklaring
  • 2 applikationer
  • 3 Exempel
  • 4 referenser

förklaring

Sturgesregeln är en empirisk metod som i stor utsträckning används i beskrivande statistik för att bestämma antalet klasser som måste existera i ett frekvenshistogram för att klassificera en uppsättning data som representerar ett prov eller en population.

I grund och botten bestämmer denna regel bredden på de grafiska behållarna, frekvenshistogrammen.

För att fastställa sin regel ansåg Herbert Sturges ett idealfrekvensdiagram, som består av K-intervaller, där ithintervallet innehåller ett visst antal prover (i = 0, ... k - 1), representerade som:

Det antal prover ges av antalet sätt på vilka en delmängd av en uppsättning kan extraheras; det vill säga med binomialkoefficienten uttryckt som följer:

För att förenkla uttrycket tillämpade han logaritmens egenskaper i båda delarna av ekvationen:

Sålunda fastställde Sturges att det optimala antalet intervaller k ges genom uttrycket:

Det kan också uttryckas som:

I detta uttryck:

- k är antalet klasser.

- N är det totala antalet observationer av provet.

- Log är den gemensamma logaritmen i bas 10.

Till exempel, för att skapa ett frekvenshistogram som uttrycker ett slumpmässigt prov på höjden av 142 barn, är antalet intervaller eller klasser som fördelningen kommer att ha:

k = 1 + 3,322 * log10 (N)

k = 1 + 3,322* logg (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Distributionen kommer således att ligga i 8 intervaller.

Antalet intervaller ska alltid representeras av heltal. I fall där värdet är decimalt måste en approximation till närmaste heltal göras.

tillämpningar

Sturgesregeln tillämpas huvudsakligen i statistik, eftersom det tillåter att en frekvensfördelning görs genom beräkningen av antalet klasser (k), liksom längden på var och en av dessa, även känd som amplitud.

Amplituden är skillnaden mellan klassens övre och nedre gränser dividerad med antalet klasser och uttrycks:

Det finns många empiriska regler som möjliggör en frekvensfördelning. Sturges-regeln används emellertid allmänt eftersom den approximerar antalet klasser, som i allmänhet varierar från 5 till 15.

På så sätt överväga ett värde som tillräckligt representerar ett prov eller en befolkning. det vill säga att approximationen inte representerar extrema grupperingar, och det fungerar inte med ett alltför stort antal klasser som inte tillåter att sammanfatta provet.

exempel

Det är nödvändigt att utföra ett frekvenshistogram enligt de givna uppgifterna, vilket motsvarar åldrar som erhållits i en undersökning av män som övar i ett lokalt gym.

För att bestämma intervallen måste du veta vad som är storleken på provet eller antalet observationer; i det här fallet har du 30.

Då gäller Sturges-regeln:

k = 1 + 3,322 * log10 (N)

k = 1 + 3,322* logg (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 intervaller.

Från antalet intervaller kan amplituden som dessa har, beräknas; det vill säga bredden på varje stapel representerad i frekvenshistogrammet:

Den nedre gränsen anses vara det lägsta värdet av data, och den övre gränsen är det högsta värdet. Skillnaden mellan den övre och nedre gränsen kallas variabelns räckvidd eller väg (R).

Från bordet har vi att den övre gränsen är 46 och den nedre gränsen 13; På så sätt blir amplituden för varje klass:

Intervallen kommer att bestå av en övre och nedre gräns. För att bestämma dessa intervall börjar du räkna från den nedre gränsen och lägger till den amplituden som bestäms enligt regel (6) enligt följande:

Då beräknas den absoluta frekvensen för att bestämma antalet män som motsvarar varje intervall; i det här fallet är det:

- Intervall 1: 13-18 = 9

- Intervall 2: 19 - 24 = 9

- Intervall 3: 25 - 30 = 5

- Intervall 4: 31 - 36 = 2

- Intervall 5: 37 - 42 = 2

- Intervall 6: 43 - 48 = 3

När man lägger till den absoluta frekvensen för varje klass måste detta vara lika med det totala antalet prov. i detta fall 30.

Därefter beräknas den relativa frekvensen för varje intervall, vilket delar den absoluta frekvensen av detta intervall med det totala antalet observationer:

- Intervall 1: fi = 9 ÷ 30 = 0,30

- Intervall 2: fi = 9 ÷ 30 = 0,30

- Intervall 3: fi = 5 ÷ 30 = 0,1666

- Intervall 4: fi = 2 ÷ 30 = 0,0666

- Intervall 5: fi = 2 ÷ 30 = 0,0666

- Intervall 4: fi = 3 ÷ 30 = 0,10

Då kan du skapa ett bord som speglar data, och även diagrammet från den relativa frekvensen i förhållande till de erhållna intervallen, vilket kan ses i följande bilder:

På så sätt tillåter Sturges-regeln att bestämma antalet klasser eller intervaller i vilka ett prov kan delas, för att sammanfatta ett urval av data genom förberedelse av tabeller och grafer.

referenser

  1. Alfonso Urquía, M.V. (2013). Modellering och simulering av diskreta händelser. UNED,.
  2. Altman Naomi, M. K. (2015). "Enkel linjär regression". Naturmetoder .
  3. Antúnez, R.J. (2014). Statistik i utbildningen. Digital UNID.
  4. Fox, J. (1997). Tillämpad regressionsanalys, linjära modeller och relaterade metoder. SAGE Publikationer.
  5. Humberto Llinás Solano, C.R. (2005). Beskrivande statistik och sannolikhetsfördelningar. University of the North.
  6. Panteleeva, O. V. (2005). Grundval av sannolikhet och statistik.
  7. O. Kuehl, M. O. (2001). Utformning av experiment: Statistiska principer för design och analysanalys. Thomson Redaktörer.