Ugrupperede data: eksempler og løste øvelser

Sidste ændring: Marco 4, 2024
Forfatter: y7rik

Ugrupperede data er information, der ikke er organiseret i specifikke kategorier eller grupper. De præsenteres i sin rå form uden forudgående klassificering. I denne sammenhæng kan eksempler på ugrupperede data omfatte en liste over elevers testresultater, højden på individer i en given population eller reaktionstiden for en gruppe mennesker.

I denne artikel vil vi udforske nogle eksempler på ugrupperede data og hvordan vi kan analysere dem gennem løste øvelser. Vi vil dække grundlæggende statistiske teknikker, såsom beregning af middelværdi, median, modus og standardafvigelse, blandt andet, for at udtrække relevante oplysninger og fortolke dataene effektivt. Gennem disse øvelser vil du være i stand til at finpudse dine færdigheder inden for ugrupperet dataanalyse og anvende denne viden i hverdagssituationer.

Hvordan finder man middelværdien af ​​et ugrupperet datasæt?

For at finde middelværdien af ​​et ugrupperet datasæt, skal du først lægge alle værdierne i sættet sammen og derefter dividere dette resultat med det samlede antal værdier. Hvis vi for eksempel har følgende værdier: 10, 15, 20, 25 og 30, ville middelværdien være som følger:

Sum af værdier: 10 + 15 + 20 + 25 + 30 = 100

Samlet antal værdier: 5

Gennemsnit = Sum af værdier / Samlet antal værdier

Gennemsnit = 100 / 5 = 20

Derfor er middelværdien af ​​det ugrupperede datasæt 20.

For at gøre det nemmere at beregne middelværdien kan du bruge en lommeregner eller et regneark. Det er vigtigt at huske, at middelværdien er et mål for central tendens, der giver os en idé om den typiske værdi af datasættet.

Vigtigste mål for central tendens for ugrupperede data: lær om dem her!

Når man arbejder med ugrupperede data – det vil sige data, der ikke er organiseret i klasser eller intervaller – er det vigtigt at forstå de vigtigste mål for central tendens. Disse mål hjælper os med at opsummere og fortolke dataene mere effektivt.

De vigtigste mål for central tendens for ugrupperede data er gennemsnit, en median og modeMiddelværdien beregnes ved at lægge alle dataværdierne sammen og dividere med det samlede antal observationer. Medianen er den værdi, der deler dataene i to lige store dele, hvilket betyder, at halvdelen af ​​dataene er større end medianen, og den anden halvdel er mindre. Modusen er den værdi, der forekommer hyppigst i dataene.

For at beregne middelværdien af ​​et ugrupperet datasæt skal du blot lægge alle værdierne sammen og dividere med det samlede antal observationer. Hvis vi for eksempel har værdierne 10, 15, 20, 25 og 30, ville middelværdien være (10 + 15 + 20 + 25 + 30) / 5 = 20.

For at finde medianen af ​​et ugrupperet datasæt skal du sortere værdierne i stigende rækkefølge og finde den midterste værdi. Hvis der er et lige antal observationer, er medianen gennemsnittet af de to centrale værdier. Hvis vi for eksempel har værdierne 10, 15, 20, 25 og 30, ville medianen være 20.

Endelig er modusen simpelthen den hyppigst gentagne værdi i dataene. Hvis der ikke er nogen gentagne værdier, betragtes dataene som amodale. Hvis vi for eksempel har værdierne 10, 15, 20, 25 og 20, ville modusen være 20.

relateret:  Kvasivarians: formel og ligninger, eksempler, øvelse

Hver af disse giver vigtig information om datafordelingen og kan hjælpe os med bedre at forstå sættet af observationer.

Find medianen af ​​tallene 6, 7, 9, 10, 10 og 12.

Når man studerer ugrupperede data, er det almindeligt at arbejde med isolerede sæt af tal uden nogen specifik organisering. For at finde medianen af ​​et ugrupperet datasæt skal du blot organisere dem i stigende rækkefølge og identificere den centrale værdi.

I tilfælde af tallene 6, 7, 9, 10, 10 og 12 ville medianen være det centrale tal, som er 9. Derfor er medianen af ​​dette sæt af tal 9.

Dette er et simpelt eksempel på, hvordan man finder medianen af ​​ugrupperede data. For større sæt skal du blot følge den samme procedure: sætte tallene i rækkefølge, og identificere den centrale værdi.

At øve medianøvelser med ugrupperede data kan hjælpe med at styrke konceptet og finpudse dataanalysefærdigheder. Kendskab til denne type beregning er afgørende for at håndtere forskellige statistiske analysesituationer.

Betydningen af ​​grupperede data: forstå, hvordan man organiserer information på en kategoriseret måde til analyse.

Betydning af grupperede data: Forstå, hvordan man organiserer information kategoriseret til analyse. Når man arbejder med store datasæt, er det ofte nødvendigt at gruppere dem i specifikke kategorier for at lette analysen. Det betyder at organisere data i grupper eller intervaller, hvilket giver os mulighed for at udtrække mere præcise og relevante oplysninger.

Hvis vi for eksempel har en liste over aldre for en stikprøve af personer, kan vi gruppere disse data i aldersgrupper, såsom 0-10 år, 11-20 år, 21-30 år osv. Dette giver os mulighed for mere tydeligt at visualisere aldersfordelingen og identificere mønstre eller tendenser.

At gruppere dataene, er det nødvendigt at definere de intervaller eller kategorier, der skal anvendes, og derefter klassificere hver observation i henhold til disse kriterier. Vi kan derefter beregne statistiske mål, såsom middelværdi, median og modus, for hver gruppe, hvilket giver os et mere detaljeret og præcist billede af dataene.

Derfor er det en grundlæggende teknik til analyse af store datasæt.

Ugrupperede data: eksempler og løste øvelser

Ugrupperede data: eksempler og løste øvelser

Ugrupperet data er dem, der er opnået fra en undersøgelse, men som ikke er organiseret efter klasse. Når der er et håndterbart antal datapunkter, normalt 20 eller færre, og der er få forskellige datapunkter, kan de behandles som ugrupperet og udtrukket information.

Ugrupperede data stammer fra den forskning eller undersøgelse, der er udført for at indhente dem, og kræver derfor bearbejdning. Lad os se på nogle eksempler:

Resultater af en IQ-test udført på 20 tilfældige universitetsstuderende. De opnåede data var som følger:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106

-Alder på 20 ansatte i en meget populær café:

relateret:  Frihedsgrader: hvordan man beregner dem, typer, eksempler

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20, XNUMX, XNUMX

-Gennemsnittet af de endelige karakterer for 10 elever i en matematiktime:

3,2; 3.1; 2.4; 4,0; 3,5; 3,0; 3,5; 3,8; 4.2; 4.9

Dataegenskaber

Der er tre vigtige egenskaber, der karakteriserer et sæt statistiske data, uanset om de er grupperede eller ej, nemlig:

-Position , hvilket er datas tendens til at klynge sig omkring bestemte værdier.

– Dispersion , en indikation af, hvor spredte eller dispergerede dataene er omkring en given værdi.

-Form , refererer til den måde, data er fordelt på, hvilket kan ses, når en graf konstrueres. Der er meget symmetriske kurver og også kurver, der hælder til venstre eller højre for en bestemt central værdi.

For hver af disse egenskaber er der en række målinger, der beskriver dem. Når de er indsamlet, giver de os et overblik over dataenes adfærd:

-De mest almindeligt anvendte mål for position er det aritmetiske gennemsnit eller blot middelværdien, medianen og modusen.

– Interval, varians og standardafvigelse bruges ofte i spredning, men de er ikke de eneste mål for spredning.

- Og for at bestemme formen sammenlignes middelværdien og medianen gennem bias, som det vil fremgå snart.

Beregning af middelværdi, median og modus

- Det aritmetiske gennemsnit , også kendt som middelværdien og betegnet som X, beregnes som følger:

X = (x 1 +x 2 +x 3 +… .. x n ) / n

Hvor x 1 , x 2 ...x n, er dataene og n er deres total. I summationsnotation har vi:

- Medianen er den værdi, der vises midt i en ordnet datasekvens, så for at få den skal du sortere dataene før noget andet.

Hvis antallet af observationer er ulige, er der ikke noget problem med at finde midtpunktet i sættet, men hvis vi har et lige antal data, søges der efter de to centrale data, og gennemsnittet beregnes.

- Vejen er den mest almindelige værdi observeret i datasættet. Den findes ikke altid, da det er muligt for én værdi at gentage sig oftere end en anden. Der kan også være to datapunkter med samme frekvens; i dette tilfælde taler vi om en bimodal fordeling.

I modsætning til de to foregående målinger kan mode bruges med kvalitative data.

Lad os se, hvordan disse positionsmål beregnes med et eksempel:

Løst eksempel

Antag, at vi ønsker at bestemme det aritmetiske gennemsnit, medianen og modusen i eksemplet fra begyndelsen: alderen på 20 kantinemedarbejdere:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20, XNUMX, XNUMX

A gennemsnit beregnes simpelthen ved at lægge alle værdierne sammen og dividere med n = 20, hvilket er det samlede antal data. På denne måde:

X = (24 + 20 + 22 + 19 + 18 + 27 + 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21 + 19 + 22 + 27 + 29 + 23 + 20) / 20 =

relateret:  Grupperede data: eksempler og løste øvelser

= 22,3 år.

at finde median, Du skal først anmode om datasættet:

18, 18, 19, 19, 19, 20, 20, 21, 21, 22 , 22 , 22, 23, 23, 24, 25, 27, 27, 27, 29

Da dette er et lige antal datapunkter, er gennemsnittet af de to primære datapunkter, fremhævet med fed skrift, beregnet. Da de begge er 22, er medianen 22 år.

Endelig blev mode Det er de mest gentagne eller hyppigste data, med 22 år.

Interval, variation, standardafvigelse og bias

Intervallet er simpelthen forskellen mellem de største og mindste datapunkter og giver dig mulighed for hurtigt at vurdere dataenes variabilitet. Andre mål for spredning giver dog mere indsigt i dataenes fordeling.

Variation og standardafvigelse

Variationen betegnes, som om den er beregnet ved udtrykket:

For at fortolke resultaterne korrekt defineres standardafvigelsen derfor som kvadratroden af ​​variansen eller også kvasistandardafvigelsen, som er kvadratroden af ​​kvasivariansen:

Det er sammenligningen mellem middelværdien X og medianen Med:

-Hvis Med = middelværdi X: dataene er symmetriske.

-Når X>Mel: læn dig til højre.

- Hvad nu hvis X

Løst øvelse

Find middelværdien, medianen, modus, intervall, varians, standardafvigelse og bias for resultaterne af en IQ-test givet til 20 universitetsstuderende:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106, XNUMX, XNUMX

Opløsning

Vi vil bede om dataene, da det vil være nødvendigt at finde medianen.

106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124, XNUMX, XNUMX

Og lad os sætte dem i en tabel som følger for at gøre beregningerne nemmere. Den anden kolonne med titlen "Kumulativ" er summen af ​​de tilsvarende data plus den foregående.

Denne kolonne hjælper dig med nemt at finde gennemsnittet ved at dividere den sidste kumulative værdi med det samlede antal data, som det ses i slutningen af ​​kolonnen "Kumulativ":

X = 112,9

Medianen er gennemsnittet af de centrale data, der er fremhævet med rødt: tallet 10 og tallet 11. Da de er ens, er medianen 112.

Endelig er modusen den mest gentagne værdi og er 112, med 7 gentagelser.

Med hensyn til spredningsmålene er intervallet:

124-106 = 18.

Variansen fås ved at dividere det endelige resultat i højre kolonne med n:

s = 668,6 / 20 = 33,42

I dette tilfælde er standardafvigelsen kvadratroden af ​​variansen: √33.42 = 5.8.

På den anden side er værdierne for kvasivarians og kvasistandardafvigelse:

s c = 668,6 / 19 = 35,2

Kvasistandardafvigelse = √35,2 = 5,9

Endelig er biasen en smule til højre, da gennemsnittet på 112,9 er større end medianen på 112.

Referencer

  1. Berenson, M. 1985. Statistik for administration og økonomi. Interamericana SA
  2. Canavos, G. 1988. Sandsynlighed og statistik: Anvendelser og metoder. McGraw Hill.
  3. Devore, J. 2012. Sandsynlighedsregning og statistik for ingeniørvidenskab og naturvidenskab. 8. udgave. Cengage.
  4. Levin, R. 1988. Statistik for administratorer. 2. udgave. Prentice Hall.
  5. Walpole, R. 2007. Sandsynlighed og statistik for ingeniørvidenskab og naturvidenskab. Pearson.