Data tidak terkumpul: contoh dan latihan yang diselesaikan

Kemaskini terakhir: Mac 4, 2024
Pengarang y7rik

Data tidak terkumpul ialah maklumat yang tidak disusun ke dalam kategori atau kumpulan tertentu. Ia dibentangkan dalam bentuk mentahnya, tanpa sebarang pengelasan sebelumnya. Dalam konteks ini, contoh data tidak terkumpul mungkin termasuk senarai markah ujian pelajar, ketinggian individu dalam populasi tertentu atau masa tindak balas sekumpulan orang.

Dalam artikel ini, kami akan meneroka beberapa contoh data tidak terkumpul dan cara kami boleh menganalisisnya melalui latihan yang diselesaikan. Kami akan merangkumi teknik statistik asas, seperti mengira min, median, mod dan sisihan piawai, antara lain, untuk mengekstrak maklumat yang berkaitan dan mentafsir data dengan berkesan. Melalui latihan ini, anda akan dapat mengasah kemahiran analisis data anda yang tidak terkumpul dan menggunakan pengetahuan ini dalam situasi harian.

Bagaimana untuk mencari min bagi set data tidak terkumpul?

Untuk mencari min bagi set data yang tidak dikumpulkan, anda mula-mula menjumlahkan semua nilai dalam set dan kemudian membahagikan hasil itu dengan jumlah nilai. Sebagai contoh, jika kita mempunyai nilai berikut: 10, 15, 20, 25, dan 30, min akan didapati seperti berikut:

Jumlah nilai: 10 + 15 + 20 + 25 + 30 = 100

Jumlah bilangan nilai: 5

Purata = Jumlah nilai / Jumlah bilangan nilai

Purata = 100 / 5 = 20

Oleh itu, min bagi set data tidak terkumpul ialah 20.

Untuk memudahkan pengiraan min, anda boleh menggunakan kalkulator atau hamparan. Adalah penting untuk diingat bahawa min ialah ukuran kecenderungan memusat yang memberi kita gambaran tentang nilai tipikal set data.

Ukuran utama kecenderungan utama untuk data tidak terkumpul: pelajari tentangnya di sini!

Apabila berurusan dengan data tidak terkumpul—iaitu, data yang tidak disusun ke dalam kelas atau selang—adalah penting untuk memahami ukuran utama kecenderungan memusat. Langkah-langkah ini membantu kami meringkaskan dan mentafsir data dengan lebih cekap.

Ukuran utama kecenderungan memusat untuk data tidak terkumpul ialah purata, median dan fesyenMin dikira dengan menambah semua nilai data dan membahagikan dengan jumlah pemerhatian. Median ialah nilai yang membahagikan data kepada dua bahagian yang sama, bermakna separuh data lebih besar daripada median dan separuh kurang. Mod ialah nilai yang paling kerap muncul dalam data.

Untuk mengira min bagi set data yang tidak terkumpul, hanya tambah semua nilai dan bahagikan dengan jumlah pemerhatian. Sebagai contoh, jika kita mempunyai nilai 10, 15, 20, 25, dan 30, min ialah (10 + 15 + 20 + 25 + 30) / 5 = 20.

Untuk mencari median set data yang tidak terkumpul, anda perlu mengisih nilai dalam tertib menaik dan mencari nilai tengah. Jika terdapat bilangan cerapan genap, median ialah purata bagi dua nilai pusat. Sebagai contoh, jika kita mempunyai nilai 10, 15, 20, 25, dan 30, mediannya ialah 20.

Akhir sekali, mod hanyalah nilai yang paling kerap diulang dalam data. Jika tiada nilai berulang, data dianggap amodal. Sebagai contoh, jika kita mempunyai nilai 10, 15, 20, 25, dan 20, modnya ialah 20.

Berkaitan:  Apakah klasifikasi dalam statistik? (Dengan contoh)

Setiap satu daripada ini memberikan maklumat penting tentang pengedaran data dan boleh membantu kami memahami set pemerhatian dengan lebih baik.

Cari median bagi nombor 6, 7, 9, 10, 10 dan 12.

Apabila mengkaji data tidak terkumpul, adalah perkara biasa untuk bekerja dengan set nombor terpencil, tanpa sebarang organisasi tertentu. Untuk mencari median set data yang tidak terkumpul, hanya susunkannya dalam tertib menaik dan kenal pasti nilai pusat.

Dalam kes nombor 6, 7, 9, 10, 10 dan 12, median akan menjadi nombor pusat, iaitu 9. Oleh itu, median set nombor ini ialah 9.

Ini ialah contoh mudah tentang cara mencari median data tidak terkumpul. Untuk set yang lebih besar, ikuti prosedur yang sama: susun nombor dan kenal pasti nilai pusat.

Mempraktikkan latihan median dengan data tidak terkumpul boleh membantu mengukuhkan konsep dan mengasah kemahiran analisis data. Kebiasaan dengan jenis pengiraan ini adalah penting untuk mengendalikan pelbagai situasi analisis statistik.

Maksud data terkumpul: memahami cara menyusun maklumat dalam cara yang dikategorikan untuk analisis.

Maksud data terkumpul: Fahami cara menyusun maklumat yang dikategorikan untuk analisis. Apabila berurusan dengan set data yang besar, selalunya perlu mengumpulkannya ke dalam kategori tertentu untuk memudahkan analisis. Ini bermakna menyusun data ke dalam kumpulan atau selang, yang membolehkan kami mengekstrak maklumat yang lebih tepat dan relevan.

Contohnya, jika kami mempunyai senarai umur untuk sampel orang, kami boleh mengumpulkan data ini ke dalam julat umur, seperti 0-10 tahun, 11-20 tahun, 21-30 tahun dan seterusnya. Ini membolehkan kami menggambarkan taburan umur dengan lebih jelas dan mengenal pasti corak atau trend.

Untuk mengumpulkan data, adalah perlu untuk menentukan selang atau kategori yang akan digunakan dan kemudian mengklasifikasikan setiap pemerhatian mengikut kriteria ini. Kami kemudiannya boleh mengira ukuran statistik, seperti min, median dan mod, untuk setiap kumpulan, yang memberikan kami paparan data yang lebih terperinci dan tepat.

Oleh itu, ia adalah teknik asas untuk menganalisis set data yang besar.

Data tidak terkumpul: contoh dan latihan yang diselesaikan

Data tidak terkumpul: contoh dan latihan yang diselesaikan

Tidak berkumpulan data adalah yang diperoleh daripada kajian, tetapi tidak disusun mengikut kelas. Apabila terdapat bilangan titik data yang boleh diurus, biasanya 20 atau kurang, dan terdapat beberapa titik data yang berbeza, ia boleh dianggap sebagai maklumat tidak terkumpul dan diekstrak.

Data tidak terkumpul datang daripada penyelidikan atau kajian yang dijalankan untuk mendapatkannya dan oleh itu memerlukan pemprosesan. Mari lihat beberapa contoh:

Keputusan ujian IQ yang diberikan kepada 20 pelajar universiti rawak. Data yang diperoleh adalah seperti berikut:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112,106

-Umur 20 pekerja kedai kopi yang sangat popular:

Berkaitan:  Ralat pensampelan: formula dan persamaan, pengiraan, contoh

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

-Purata gred akhir 10 pelajar dalam kelas matematik:

3,2; 3.1; 2.4; 4,0; 3,5; 3,0; 3,5; 3,8; 4.2; 4.9

Sifat data

Terdapat tiga sifat penting yang mencirikan satu set data statistik, sama ada dikumpulkan atau tidak, iaitu:

-Kedudukan , iaitu kecenderungan data untuk berkumpul di sekitar nilai tertentu.

– Penyerakan , petunjuk tentang penyebaran atau penyebaran data di sekitar nilai tertentu.

-Bentuk , merujuk kepada cara data diagihkan, yang boleh dilihat apabila graf dibina. Terdapat lengkung yang sangat simetri dan juga lengkung yang condong ke kiri atau kanan nilai pusat tertentu.

Bagi setiap sifat ini, terdapat satu siri ukuran yang menerangkannya. Setelah diperoleh, mereka memberikan kami gambaran keseluruhan tentang tingkah laku data:

-Ukuran kedudukan yang paling biasa digunakan ialah min aritmetik atau min ringkas, median dan mod.

– Julat, varians dan sisihan piawai sering digunakan dalam serakan, tetapi ia bukan satu-satunya ukuran serakan.

-Dan untuk menentukan bentuk, min dan median dibandingkan melalui bias, seperti yang akan dilihat sebentar lagi.

Pengiraan min, median dan mod

- Min aritmetik , juga dikenali sebagai min dan dilambangkan sebagai X, dikira seperti berikut:

X = (x 1 +x 2 +x 3 +… .. x n ) / n

Di mana x 1 , x 2 ,…. x n, ialah data dan n ialah jumlahnya. Dalam notasi penjumlahan, kita mempunyai:

- Median ialah nilai yang muncul di tengah-tengah urutan data yang tersusun, jadi untuk mendapatkannya anda perlu mengisih data sebelum perkara lain.

Jika bilangan cerapan adalah ganjil, tiada masalah untuk mencari titik tengah set, tetapi jika kita mempunyai bilangan data genap, kedua-dua data pusat itu dicari dan dipuratakan.

- Mod ialah nilai yang paling biasa diperhatikan dalam set data. Ia tidak selalu wujud, kerana satu nilai mungkin berulang lebih kerap daripada yang lain. Mungkin juga terdapat dua titik data dengan frekuensi yang sama; dalam kes ini, kita bercakap tentang pengedaran bimodal.

Tidak seperti dua ukuran sebelumnya, mod boleh digunakan dengan data kualitatif.

Mari lihat bagaimana ukuran kedudukan ini dikira dengan contoh:

Contoh yang diselesaikan

Katakan kita ingin menentukan min aritmetik, median dan mod dalam contoh yang dicadangkan pada permulaan: umur 20 pekerja kafeteria:

24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

A purata dikira hanya dengan menambah semua nilai dan membahagikan dengan n = 20, iaitu jumlah bilangan data. dengan cara ini:

X = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =

Berkaitan:  Jangkaan matematik: formula, sifat, contoh, latihan

= 22,3 tahun.

untuk mencari median, anda mesti meminta set data dahulu:

18, 18, 19, 19, 19, 20, 20, 21, 21, 22 , 22 , 22, 23, 23, 24, 25, 27, 27, 27, 29

Oleh kerana ini ialah bilangan titik data genap, dua titik data utama, yang diserlahkan dalam huruf tebal, dipuratakan. Oleh kerana mereka berdua berumur 22 tahun, median ialah 22 tahun.

Akhirnya, fesyen Ia adalah data yang paling berulang atau paling kerap, dengan 22 tahun.

Julat, variasi, sisihan piawai dan bias

Julat ini hanyalah perbezaan antara titik data terbesar dan terkecil dan membolehkan anda menilai kebolehubahan data dengan cepat. Walau bagaimanapun, langkah serakan lain menawarkan lebih banyak cerapan tentang pengedaran data.

Variasi dan sisihan piawai

Variasi ditandakan seolah-olah ia dikira oleh ungkapan:

Oleh itu, untuk mentafsir keputusan dengan betul, sisihan piawai ditakrifkan sebagai punca kuasa dua varians atau juga sisihan kuasi piawai, iaitu punca kuasa dua bagi varians kuasi:

Ia adalah perbandingan antara min X dan median Med:

-Jika Med = min X: data adalah simetri.

-Apabila X>Med: bersandar ke kanan.

-Bagaimana jika X

Latihan yang diselesaikan

Cari min, median, mod, julat, varians, sisihan piawai dan bias untuk keputusan ujian IQ yang diberikan kepada 20 pelajar universiti:

119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106

Penyelesaian

Kami akan meminta data, kerana ia adalah perlu untuk mencari median.

106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124

Dan mari letakkannya dalam jadual seperti berikut, untuk memudahkan pengiraan. Lajur kedua, bertajuk "Kumulatif," ialah jumlah data yang sepadan ditambah dengan yang sebelumnya.

Lajur ini akan membantu anda mencari purata dengan mudah dengan membahagikan kumulatif terakhir dengan jumlah bilangan data, seperti yang dilihat pada penghujung lajur "Kumulatif":

X = 112,9

Median ialah purata data pusat yang diserlahkan dengan warna merah: nombor 10 dan nombor 11. Memandangkan ia adalah sama, median ialah 112.

Akhir sekali, mod ialah nilai yang paling berulang dan ialah 112, dengan 7 ulangan.

Mengenai ukuran serakan, julatnya ialah:

124-106 = 18.

Varians diperoleh dengan membahagikan hasil akhir dalam lajur kanan dengan n:

s = 668,6 / 20 = 33,42

Dalam kes ini, sisihan piawai ialah punca kuasa dua varians: √33.42 = 5.8.

Sebaliknya, nilai kuasi varians dan sisihan kuasi piawai ialah:

s c = 668,6/19 = 35,2

Sisihan kuasi piawai = √35,2 = 5,9

Akhirnya, bias sedikit ke kanan, kerana min 112,9 adalah lebih besar daripada median 112.

Rujukan

  1. Berenson, M. 1985. Statistik Pentadbiran dan Ekonomi. Interamericana SA
  2. Canavos, G. 1988. Kebarangkalian dan Statistik: Aplikasi dan Kaedah. Bukit McGraw.
  3. Devore, J. 2012. Kebarangkalian dan Statistik untuk Kejuruteraan dan Sains. Edisi ke-8. Cengage.
  4. Levin, R. 1988. Statistik untuk Pentadbir. Edisi ke-2. Prentice Hall.
  5. Walpole, R. 2007. Kebarangkalian dan statistik untuk kejuruteraan dan sains. Pearson.