Ogrupperad data är information som inte är organiserad i specifika kategorier eller grupper. Den presenteras i sin råa form, utan någon föregående klassificering. I detta sammanhang kan exempel på ogrupperad data inkludera en lista över elevers testresultat, längden på individer i en given population eller reaktionstiden för en grupp människor.
I den här artikeln ska vi utforska några exempel på ogrupperad data och hur vi kan analysera dem genom lösta övningar. Vi kommer att gå igenom grundläggande statistiska tekniker, såsom att beräkna medelvärde, median, mod och standardavvikelse, bland annat, för att extrahera relevant information och tolka data effektivt. Genom dessa övningar kommer du att kunna finslipa dina färdigheter inom ogrupperad dataanalys och tillämpa denna kunskap i vardagliga situationer.
Hur hittar man medelvärdet av en ogrupperad datamängd?
För att hitta medelvärdet av en ogrupperad datamängd adderar man först alla värden i mängden och dividerar sedan resultatet med det totala antalet värden. Om vi till exempel har följande värden: 10, 15, 20, 25 och 30, skulle medelvärdet beräknas enligt följande:
Summa av värden: 10 + 15 + 20 + 25 + 30 = 100
Totalt antal värden: 5
Medelvärde = Summa av värden / Totalt antal värden
Genomsnitt = 100 / 5 = 20
Därför är medelvärdet av den ogrupperade datamängden 20.
För att göra det enklare att beräkna medelvärdet kan du använda en miniräknare eller ett kalkylblad. Det är viktigt att komma ihåg att medelvärdet är ett mått på central tendens som ger oss en uppfattning om datamängdens typiska värde.
Huvudsakliga mått på central tendens för ogrupperade data: läs mer om dem här!
När man arbetar med ogrupperade data – det vill säga data som inte är organiserad i klasser eller intervall – är det viktigt att förstå de viktigaste måtten på central tendens. Dessa mått hjälper oss att sammanfatta och tolka data mer effektivt.
De viktigaste måtten på central tendens för ogrupperade data är genomsnitt, median och fashionMedelvärdet beräknas genom att addera alla datavärden och dividera med det totala antalet observationer. Medianen är det värde som delar datan i två lika stora delar, vilket innebär att hälften av datan är större än medianen och hälften är mindre. Moden är det värde som förekommer oftast i datan.
För att beräkna medelvärdet av en ogrupperad datamängd, summera helt enkelt alla värden och dividera med det totala antalet observationer. Om vi till exempel har värdena 10, 15, 20, 25 och 30, skulle medelvärdet vara (10 + 15 + 20 + 25 + 30) / 5 = 20.
För att hitta medianen för en ogrupperad datamängd måste du sortera värdena i stigande ordning och hitta mittvärdet. Om det finns ett jämnt antal observationer är medianen medelvärdet av de två centrala värdena. Om vi till exempel har värdena 10, 15, 20, 25 och 30, skulle medianen vara 20.
Slutligen är läget helt enkelt det mest frekvent upprepade värdet i data. Om det inte finns några upprepade värden betraktas data som amodala. Om vi till exempel har värdena 10, 15, 20, 25 och 20, skulle läget vara 20.
Var och en av dessa ger viktig information om datafördelningen och kan hjälpa oss att bättre förstå uppsättningen observationer.
Hitta medianen av talen 6, 7, 9, 10, 10 och 12.
När man studerar ogrupperade data är det vanligt att man arbetar med isolerade talmängder utan någon specifik organisation. För att hitta medianen för en ogrupperad datamängd, organisera dem helt enkelt i stigande ordning och identifiera det centrala värdet.
När det gäller talen 6, 7, 9, 10, 10 och 12 skulle medianen vara det centrala talet, vilket är 9. Därför är medianen för denna uppsättning tal 9.
Detta är ett enkelt exempel på hur man hittar medianen av ogrupperade data. För större mängder, följ helt enkelt samma procedur: ordna talen och identifiera det centrala värdet.
Att öva medianövningar med ogrupperade data kan hjälpa till att förstärka konceptet och finslipa dataanalysfärdigheter. Bekantskap med denna typ av beräkning är avgörande för att hantera olika statistiska analyssituationer.
Betydelsen av grupperad data: förstå hur man organiserar information på ett kategoriserat sätt för analys.
Betydelsen av grupperade data: Förstå hur man organiserar information kategoriserad för analys. När man arbetar med stora datamängder är det ofta nödvändigt att gruppera dem i specifika kategorier för att underlätta analysen. Detta innebär att organisera data i grupper eller intervall, vilket gör att vi kan extrahera mer korrekt och relevant information.
Om vi till exempel har en lista över åldrar för ett urval av personer kan vi gruppera denna data i åldersintervall, till exempel 0–10 år, 11–20 år, 21–30 år och så vidare. Detta gör att vi kan visualisera åldersfördelningen tydligare och identifiera mönster eller trender.
Att gruppera data, är det nödvändigt att definiera de intervall eller kategorier som ska användas och sedan klassificera varje observation enligt dessa kriterier. Vi kan sedan beräkna statistiska mått, såsom medelvärde, median och mod, för varje grupp, vilket ger oss en mer detaljerad och korrekt bild av data.
Därför är det en grundläggande teknik för att analysera stora datamängder.
Ogrupperade data: exempel och lösta övningar

Ogrupperad uppgifter är de som erhållits från en studie, men är inte organiserade efter klass. När det finns ett hanterbart antal datapunkter, vanligtvis 20 eller färre, och det finns få distinkta datapunkter, kan de behandlas som ogrupperad och extraherad information.
Ogrupperade data kommer från den forskning eller studie som utförts för att erhålla dem och kräver därför bearbetning. Låt oss titta på några exempel:
Resultat av ett IQ-test som administrerades till 20 slumpmässigt slumpmässigt utvalda universitetsstudenter. De erhållna uppgifterna var följande:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106
-Ålder på 20 anställda på ett mycket populärt kafé:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
-Genomsnittet av slutbetygen för 10 elever i en matematikklass:
3,2; 3.1; 2.4; 4,0; 3,5; 3,0; 3,5; 3,8; 4.2; 4.9
Dataegenskaper
Det finns tre viktiga egenskaper som kännetecknar en uppsättning statistiska data, oavsett om de är grupperade eller inte, vilka är:
-Placera , vilket är datas tendens att klustra sig kring vissa värden.
– Dispersion , en indikation på hur spridda eller dispergerade data är runt ett givet värde.
-Form , hänvisar till hur data distribueras, vilket kan ses när en graf konstrueras. Det finns mycket symmetriska kurvor och även kurvor som lutar åt vänster eller höger om ett visst centralt värde.
För var och en av dessa egenskaper finns en serie mått som beskriver dem. När de väl har erhållits ger de oss en översikt över datas beteende:
-De vanligaste måtten på position är det aritmetiska medelvärdet eller helt enkelt medelvärdet, medianen och läget.
– Intervall, varians och standardavvikelse används ofta i dispersion, men de är inte de enda måtten på dispersion.
-Och för att bestämma formen jämförs medelvärdet och medianen genom bias, vilket kommer att ses strax.
Beräkning av medelvärde, median och mod
- Det aritmetiska medelvärdet , även känt som medelvärdet och betecknat som X, beräknas enligt följande:
X = (x 1 +x 2 +x 3 +… .. x n ) / n
Där x 1 , x 2 ...x n, är data och n är deras totala värde. I summeringsnotation har vi:
- Medianen är värdet som visas mitt i en ordnad datasekvens, så för att få det måste du sortera informationen innan något annat.
Om antalet observationer är udda är det inga problem att hitta mittpunkten i mängden, men om vi har ett jämnt antal data genomsöks de två centrala datavärdena och medelvärdet beräknas.
- Vägen är det vanligaste värdet som observeras i datamängden. Det existerar inte alltid, eftersom det är möjligt för ett värde att upprepas oftare än ett annat. Det kan också finnas två datapunkter med samma frekvens; i det här fallet talar vi om en bimodal fördelning.
Till skillnad från de två föregående måtten kan läget användas med kvalitativa data.
Låt oss se hur dessa positionsmått beräknas med ett exempel:
Löst exempel
Antag att vi vill bestämma det aritmetiska medelvärdet, medianen och läget i exemplet som föreslogs i början: åldrarna på 20 cafeterianställda:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20
A genomsnitt beräknas helt enkelt genom att addera alla värden och dividera med n = 20, vilket är det totala antalet data. På så sätt:
X = (24 + 20 + 22 + 19 + 18 + 27 + 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21 + 19 + 22 + 27 + 29 + 23 + 20) / 20 =
= 22,3 år.
att hitta median, du måste först begära datamängden:
18, 18, 19, 19, 19, 20, 20, 21, 21, 22 , 22 , 22, 23, 23, 24, 25, 27, 27, 27, 29
Eftersom detta är ett jämnt antal datapunkter, är medelvärdet av de två primära datapunkterna, markerade med fetstil. Eftersom båda är 22, är medianen 22 år.
Slutligen, fashion Det är den mest upprepade eller mest frekventa informationen, med 22 år.
Intervall, variation, standardavvikelse och bias
Intervallet är helt enkelt skillnaden mellan de största och minsta datapunkterna och låter dig snabbt bedöma datavariabiliteten. Andra spridningsmått ger dock mer insikt i datafördelningen.
Variation och standardavvikelse
Variationen betecknas som om den beräknas med uttrycket:
För att korrekt tolka resultaten definieras därför standardavvikelsen som kvadratroten ur variansen eller även kvasistandardavvikelsen, vilket är kvadratroten ur kvasivariansen:
Det är jämförelsen mellan medelvärdet X och medianvärdet Med:
-Om Med = medelvärde X: är data symmetriska.
-När X>Med: luta åt höger.
-Tänk om X
Löst övning
Hitta medelvärdet, medianen, läget, intervallet, variansen, standardavvikelsen och biasen för resultaten av ett IQ-test som gavs till 20 universitetsstudenter:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106
Lösning
Vi kommer att be om data, eftersom det kommer att vara nödvändigt att hitta medianen.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124
Och låt oss lägga dem i en tabell enligt följande, för att göra beräkningarna enklare. Den andra kolumnen, med titeln "Kumulativ", är summan av motsvarande data plus den föregående.
Den här kolumnen hjälper dig att enkelt hitta medelvärdet genom att dividera det sista kumulativa värdet med det totala antalet data, som syns i slutet av kolumnen "Kumulativt":
X = 112,9
Medianen är medelvärdet av de centrala data som är markerade med rött: siffran 10 och siffran 11. Eftersom de är desamma är medianen 112.
Slutligen är läget det mest upprepade värdet och är 112, med 7 repetitioner.
Beträffande måtten på spridning är intervallet:
124-106 = 18.
Variansen erhålls genom att dividera slutresultatet i den högra kolumnen med n:
s = 668,6 / 20 = 33,42
I detta fall är standardavvikelsen kvadratroten ur variansen: √33.42 = 5.8.
Å andra sidan är värdena för kvasivarians och kvasistandardavvikelse:
s c = 668,6 / 19 = 35,2
Kvasistandardavvikelse = √35,2 = 5,9
Slutligen är biasen något åt höger, eftersom medelvärdet 112,9 är större än medianen 112.
Referenser
- Berenson, M. 1985. Statistik för administration och ekonomi. Interamericana SA
- Canavos, G. 1988. Sannolikhet och statistik: Tillämpningar och metoder. McGraw Hill.
- Devore, J. 2012. Sannolikhet och statistik för teknik och naturvetenskap. 8:e upplagan. Cengage.
- Levin, R. 1988. Statistik för administratörer. 2:a upplagan. Prentice Hall.
- Walpole, R. 2007. Sannolikhet och statistik för teknik och naturvetenskap. Pearson.