Seri variasi. nilai rata-rata

Seri variasi: definisi, jenis, karakteristik utama. Metode kalkulasi
mode, median, rata-rata aritmatika dalam penelitian medis dan statistik
(tunjukkan dengan contoh bersyarat).

Deret variasi adalah deret nilai numerik dari sifat yang diteliti, berbeda satu sama lain dalam besaran dan terletak dalam urutan tertentu (dalam urutan menaik atau menurun). Setiap nilai numerik dari deret tersebut disebut varian (V), dan angka yang menunjukkan seberapa sering satu atau beberapa varian muncul dalam deret tertentu disebut frekuensi (p).

Banyaknya kasus observasi yang membentuk deret variasi dilambangkan dengan huruf n. Perbedaan makna dari ciri-ciri yang dipelajari disebut variasi. Jika sifat yang bervariasi itu tidak memiliki ukuran kuantitatif, maka variasi itu disebut kualitatif, dan rangkaian distribusinya bersifat atributif (misalnya, distribusi menurut hasil penyakit, menurut keadaan kesehatan, dsb.).

Jika fitur variabel memiliki ekspresi kuantitatif, variasi seperti itu disebut kuantitatif, dan deret distribusi disebut variasi.

Deret variasi dibagi menjadi terputus-putus dan kontinu - menurut sifat sifat kuantitatif, sederhana dan berbobot - menurut frekuensi kemunculannya.

Pada deret variasi sederhana, setiap varian hanya terjadi satu kali (p=1), pada deret berbobot, variasi yang sama terjadi beberapa kali (p>1). Contoh seri tersebut akan dibahas nanti dalam teks. Jika karakteristik kuantitatif kontinu, mis. antara nilai bilangan bulat ada nilai pecahan menengah, deret variasi disebut kontinu.

Misalnya: 10,0 - 11,9

14.0 - 15.9, dst.

Jika fitur kuantitatif terputus-putus, mis. nilai individualnya (varian) berbeda satu sama lain dengan bilangan bulat dan tidak memiliki nilai pecahan menengah; deret variasi disebut diskontinyu atau diskrit.

Menggunakan data detak jantung dari contoh sebelumnya

untuk 21 siswa, kami membuat seri variasi (Tabel 1).

Tabel 1

Distribusi mahasiswa kedokteran berdasarkan detak jantung (denyut / menit)

Jadi, untuk membangun seri variasi berarti nilai numerik yang tersedia (opsi) untuk mensistematisasikan, memesan, mis. mengatur dalam urutan tertentu (dalam urutan menaik atau menurun) dengan frekuensi yang sesuai. Dalam contoh ini, opsi disusun dalam urutan menaik dan dinyatakan sebagai bilangan diskontinu (diskrit), setiap opsi muncul beberapa kali, mis. kita berurusan dengan seri variasi tertimbang, diskontinu atau diskrit.

Sebagai aturan, jika jumlah pengamatan dalam populasi statistik yang kita pelajari tidak melebihi 30, maka cukup untuk mengatur semua nilai sifat yang dipelajari dalam deret variasi yang meningkat, seperti pada Tabel. 1, atau dalam urutan menurun.

Dengan banyaknya observasi (n>30), jumlah varian yang ditemui bisa sangat besar, dalam hal ini disusun suatu interval atau deret variasi berkelompok, dimana untuk mempermudah pemrosesan selanjutnya dan memperjelas sifat distribusi, varian digabungkan ke dalam kelompok.

Biasanya jumlah opsi grup berkisar antara 8 hingga 15.

Harus ada setidaknya 5 dari mereka, karena jika tidak, itu akan menjadi terlalu kasar, agregasi berlebihan, yang mendistorsi gambaran keseluruhan variasi dan sangat mempengaruhi keakuratan nilai rata-rata. Ketika jumlah opsi grup lebih dari 20-25, akurasi penghitungan nilai rata-rata meningkat, tetapi fitur variasi fitur secara signifikan terdistorsi dan pemrosesan matematika menjadi lebih rumit.

Saat menyusun seri yang dikelompokkan, perlu diperhitungkan

- kelompok varian harus diatur dalam urutan tertentu (dalam menaik atau menurun);

- interval dalam kelompok varian harus sama;

- nilai batas interval tidak boleh bertepatan, karena tidak akan jelas kepada kelompok mana untuk menetapkan opsi individu;

- perlu mempertimbangkan fitur kualitatif dari bahan yang dikumpulkan saat menetapkan batas interval (misalnya, ketika mempelajari berat orang dewasa, interval 3-4 kg diperbolehkan, dan untuk anak-anak dari bulan-bulan pertama kehidupan tidak boleh lebih dari 100 g)

Mari kita buat rangkaian (interval) yang dikelompokkan yang mencirikan data tentang detak jantung (jumlah denyut per menit) untuk 55 mahasiswa kedokteran sebelum ujian: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Untuk membuat baris yang dikelompokkan, Anda harus:

1. Tentukan ukuran interval;

2. Tentukan tengah, awal dan akhir varian kelompok dari deret variasi.

● Nilai interval (i) ditentukan oleh jumlah kelompok yang diduga (r), yang jumlahnya ditentukan tergantung pada jumlah pengamatan (n) menurut tabel khusus

Jumlah kelompok tergantung pada jumlah pengamatan:

Dalam kasus kami, untuk 55 siswa, Anda dapat membuat 8 hingga 10 kelompok.

Nilai interval (i) ditentukan oleh rumus berikut -

i = V max-V min / r

Dalam contoh kita, nilai intervalnya adalah 82-58 / 8 = 3.

Jika nilai interval adalah bilangan pecahan, hasilnya harus dibulatkan ke bilangan bulat terdekat.

Ada beberapa jenis nilai rata-rata:

● rata-rata aritmatika,

● rata-rata geometris,

● harmonik rata-rata,

● akar rata-rata kuadrat,

● progresif sedang,

● median

Dalam statistik medis, sarana aritmatika paling sering digunakan.

Mean aritmatika (M) adalah nilai generalisasi yang menentukan tipikal yang merupakan karakteristik dari seluruh populasi. Metode utama untuk menghitung M adalah: metode rata-rata aritmatika dan metode momen (deviasi bersyarat).

Metode rata-rata aritmatika digunakan untuk menghitung rata-rata aritmatika sederhana dan rata-rata aritmatika berbobot. Pilihan metode untuk menghitung mean aritmatika tergantung pada jenis deret variasi. Dalam kasus deret variasi sederhana, di mana setiap opsi hanya muncul satu kali, rata-rata sederhana aritmatika ditentukan oleh rumus:

dimana: M adalah mean aritmatika;

V adalah nilai fitur variabel (opsi);

- menunjukkan tindakan - penjumlahan;

n adalah jumlah total pengamatan.

Contoh menghitung mean aritmatika sederhana. Laju pernapasan (jumlah napas per menit) pada 9 pria berusia 35 tahun: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Untuk menentukan tingkat rata-rata frekuensi pernapasan pada pria usia 35 tahun, perlu:

1. Buatlah deret variasi, susun semua opsi dalam urutan menaik atau menurun, kita mendapatkan deret variasi sederhana, karena nilai varian hanya muncul sekali.

M = V / n = 171/9 = 19 napas per menit

Keluaran. Laju pernapasan pada pria usia 35 tahun rata-rata 19 gerakan pernapasan per menit.

Jika nilai individu varian diulang, tidak perlu menuliskan setiap varian dalam satu baris, cukup dengan mencantumkan ukuran varian (V) dan menunjukkan jumlah pengulangannya (p) di sebelahnya . deret variasi seperti itu, di mana varian-variannya seolah-olah ditimbang menurut jumlah frekuensi yang bersesuaian dengannya, disebut deret variasi berbobot, dan nilai rata-rata yang dihitung adalah rata-rata tertimbang aritmatika.

Rata-rata aritmatika tertimbang ditentukan dengan rumus: M = Vp / n

di mana n adalah jumlah pengamatan sama dengan jumlah frekuensi - .

Contoh menghitung rata-rata tertimbang aritmatika.

Durasi kecacatan (dalam hari) pada 35 pasien penyakit saluran pernapasan akut (ISPA) yang dirawat oleh dokter setempat selama kuartal pertama tahun ini adalah: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 hari...

Cara menentukan rata-rata lama kecacatan pada pasien ISPA adalah sebagai berikut:

1. Mari kita buat deret variasi berbobot, karena nilai varian individu diulang beberapa kali. Untuk melakukan ini, Anda dapat mengatur semua opsi dalam urutan menaik atau menurun dengan frekuensi yang sesuai.

Dalam kasus kami, opsi diatur dalam urutan menaik

2. Hitung mean aritmatika yang dibobot dengan rumus: M = Vp / n = 233/35 = 6,7 hari

Distribusi pasien dengan infeksi saluran pernapasan akut berdasarkan durasi kecacatan:

Lama tidak mampu bekerja (V) Jumlah pasien (p) Vp
p = n = 35 Vp = 233

Keluaran. Durasi kecacatan pada pasien penyakit saluran pernapasan akut rata-rata 6,7 ​​hari.

Fashion (Mo) adalah variasi paling umum dalam seri variasi. Untuk distribusi yang disajikan dalam tabel, varian yang sama dengan 10 sesuai dengan mode, itu terjadi lebih sering daripada yang lain - 6 kali.

Distribusi pasien berdasarkan lama tinggal di tempat tidur rumah sakit (dalam hari)

V
P

Kadang-kadang besaran modus yang tepat sulit ditentukan, karena dalam data yang diteliti mungkin ada beberapa pengamatan yang terjadi "paling sering".

Median (Me) adalah indikator nonparametrik yang membagi deret variasi menjadi dua bagian yang sama: jumlah varian yang sama terletak di kedua sisi median.

Misalnya, untuk distribusi yang ditunjukkan pada tabel, mediannya adalah 10, karena di kedua sisi nilai ini ada 14 opsi, yaitu. angka 10 menempati posisi tengah di baris ini dan merupakan mediannya.

Mengingat banyaknya observasi dalam contoh ini adalah genap (n = 34), median dapat ditentukan sebagai berikut:

Saya = 2 + 3 + 4 + 5 + 6 + 5 + 4 + 3 + 2/2 = 34/2 = 17

Ini berarti bahwa bagian tengah deret berada pada opsi ketujuh belas, yang sesuai dengan median sama dengan 10. Untuk distribusi yang disajikan dalam tabel, mean aritmatika adalah:

M = Vp / n = 334/34 = 10,1

Jadi, untuk 34 observasi dari tabel. 8, kita dapatkan: Mo = 10, Me = 10, mean aritmatika (M) adalah 10,1. Dalam contoh kami, ketiga indikator ternyata sama atau dekat satu sama lain, meskipun sangat berbeda.

Rata-rata aritmatika adalah jumlah yang dihasilkan dari semua pengaruh; semua opsi, tanpa kecuali, mengambil bagian dalam pembentukannya, termasuk yang ekstrem, sering kali tidak lazim untuk fenomena atau himpunan tertentu.

Modus dan median, berbeda dengan mean aritmatika, tidak bergantung pada besarnya semua nilai individual dari fitur yang bervariasi (nilai varian ekstrem dan tingkat hamburan deret). Rata-rata aritmatika mencirikan seluruh massa pengamatan, modus dan median - massa utama

Seri distribusi statistik- Ini adalah distribusi yang teratur dari unit-unit populasi ke dalam kelompok-kelompok sesuai dengan karakteristik tertentu yang bervariasi.
Tergantung pada fitur yang mendasari pembentukan deret distribusi, mereka membedakan deret distribusi atributif dan variasi.

Adanya ciri umum merupakan dasar pembentukan populasi statistik, yang merupakan hasil deskripsi atau pengukuran ciri-ciri umum dari objek penelitian.

Subyek kajian dalam statistika adalah perubahan (bervariasi) tanda atau tanda statistik.

Jenis fitur statistik.

Deret distribusi disebut atributif berdasarkan kriteria kualitas. Atributif Adalah tanda yang memiliki nama (misalnya, profesi: penjahit, guru, dll).
Merupakan kebiasaan untuk mengatur sejumlah distribusi dalam bentuk tabel. Meja 2.8 menunjukkan deret atributif dari distribusi.
Tabel 2.8 - Distribusi jenis bantuan hukum yang diberikan oleh pengacara kepada warga salah satu wilayah Federasi Rusia.

Seri variasi Apakah nilai karakteristik (atau interval nilai) dan frekuensinya.
Deret distribusi disebut deret variasi dibangun secara kuantitatif. Setiap seri variasi terdiri dari dua elemen: opsi dan frekuensi.
Varian dianggap sebagai nilai individual dari karakteristik yang diambil dalam rangkaian variasi.
Frekuensi adalah jumlah varian individu atau setiap kelompok dari seri variasi, mis. ini adalah angka yang menunjukkan seberapa sering satu atau beberapa varian muncul dalam deret distribusi. Jumlah semua frekuensi menentukan ukuran seluruh populasi, volumenya.
Frekuensi adalah frekuensi yang dinyatakan dalam pecahan satu atau sebagai persentase dari total. Dengan demikian, jumlah frekuensi adalah 1 atau 100%. Deret variasi memungkinkan seseorang untuk memperkirakan bentuk hukum distribusi berdasarkan data aktual.

Tergantung pada sifat variasi sifat, mereka dibedakan seri variasi diskrit dan interval.
Contoh dari seri variasi diskrit diberikan dalam tabel. 2.9.
Tabel 2.9 - Distribusi keluarga dengan jumlah kamar yang ditempati di apartemen individu pada tahun 1989 di Federasi Rusia.

Kolom pertama dari tabel menyajikan varian dari seri variasi diskrit, yang kedua - frekuensi dari seri variasi, yang ketiga - indeks frekuensi.

Seri variasi

Dalam populasi umum, fitur kuantitatif tertentu sedang diselidiki. Sampel volume diambil secara acak darinya n, yaitu banyaknya anggota sampel adalah n... Pada tahap pertama pemrosesan statistik, mulai pengambilan sampel, yaitu nomor pemesanan x 1, x 2, ..., x n naik. Setiap nilai yang diamati x saya ditelepon varian... Frekuensi saya Apakah jumlah pengamatan dari nilai x saya dalam sampel. Frekuensi relatif (frekuensi) aku Apakah rasio frekuensi saya untuk ukuran sampel n: .
Saat mempelajari deret variasi, konsep frekuensi akumulasi dan frekuensi akumulasi juga digunakan. Biarlah x beberapa nomor. Maka jumlah pilihan , yang nilainya kurang x, disebut frekuensi akumulasi: untuk x i n disebut frekuensi akumulasi w i max.
Sebuah fitur disebut diskrit bervariasi jika nilai individualnya (varian) berbeda satu sama lain dengan beberapa nilai terbatas (biasanya bilangan bulat). Deret variasi fitur semacam itu disebut deret variasi diskrit.

Tabel 1. Gambaran umum dari rangkaian frekuensi variasi diskrit

Nilai karakteristikx saya x 1 x 2 x n
Frekuensisaya m 1 m 2 M N

Suatu fitur disebut terus menerus bervariasi jika nilainya berbeda satu sama lain dengan jumlah kecil yang sewenang-wenang, mis. atribut dapat mengambil nilai apa pun dalam interval tertentu. Deret variasi kontinu untuk fitur semacam itu disebut interval.

Tabel 2. Tampilan umum deret variasi interval frekuensi

Tabel 3. Gambar grafis dari seri variasi

BarisPoligon atau histogramFungsi distribusi empiris
Diskrit
Selang
Melihat hasil pengamatan, ditentukan berapa banyak nilai opsi yang jatuh ke dalam setiap interval tertentu. Diasumsikan bahwa setiap interval milik salah satu ujungnya: baik dalam semua kasus dibiarkan (lebih sering), atau dalam semua kasus itu benar, dan frekuensi atau frekuensi menunjukkan jumlah opsi yang termasuk dalam batas yang ditunjukkan. Perbedaan a i - a i +1 disebut interval parsial. Untuk menyederhanakan perhitungan selanjutnya, deret variasi interval dapat diganti dengan deret diskrit konvensional. Dalam hal ini, nilai median Saya Interval -th diambil sebagai varian x saya, dan frekuensi interval yang sesuai saya- untuk frekuensi interval ini.
Untuk representasi grafis dari seri variasi, poligon, histogram, kurva kumulatif dan fungsi distribusi empiris paling sering digunakan.

Meja 2.3 (Pengelompokan penduduk Rusia berdasarkan pendapatan per kapita rata-rata pada bulan April 1994) disajikan seri variasi interval.
Lebih mudah untuk menganalisis seri distribusi dengan bantuan gambar grafis, yang memungkinkan untuk menilai bentuk distribusi. Gagasan yang jelas tentang sifat perubahan frekuensi deret variasi diberikan oleh poligon dan histogram.
Poligon digunakan saat menampilkan seri variasi diskrit.
Mari kita gambarkan, misalnya, secara grafis distribusi stok perumahan menurut jenis apartemen (Tabel 2.10).
Tabel 2.10 - Distribusi stok perumahan di wilayah perkotaan menurut jenis apartemen (nomor arbitrer).


Beras. Poligon alokasi stok perumahan


Pada sumbu ordinat, tidak hanya nilai frekuensi, tetapi juga frekuensi deret variasi dapat diplot.
Histogram diambil untuk gambar deret variasi interval... Saat membangun histogram, nilai interval diplot pada sumbu absis, dan frekuensi digambarkan oleh persegi panjang yang dibangun pada interval yang sesuai. Ketinggian batang dalam hal jarak yang sama harus sebanding dengan frekuensi. Histogram adalah grafik di mana suatu deret ditampilkan dalam bentuk batang-batang yang saling berdekatan.
Mari kita gambarkan secara grafis deret distribusi interval yang diberikan dalam tabel. 2.11.
Tabel 2.11 - Distribusi keluarga menurut ukuran ruang hidup per orang (angka arbitrer).
N p / p Kelompok keluarga menurut ukuran ruang hidup per orang Jumlah keluarga dengan ukuran ruang hidup tertentu Akumulasi jumlah keluarga
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Beras. 2.2. Histogram distribusi keluarga menurut ukuran ruang hidup per orang


Menggunakan data dari deret yang terakumulasi (Tabel 2.11), kami membangun distribusi kumulatif.


Beras. 2.3. Distribusi kumulatif keluarga menurut ruang hidup per orang


Representasi deret variasi dalam bentuk kumulasi sangat efektif untuk deret variasi, yang frekuensinya dinyatakan dalam pecahan atau persentase terhadap jumlah frekuensi deret tersebut.
Jika kita mengubah sumbu ketika menggambarkan secara grafis deret variasi dalam bentuk kumulasi, maka kita mendapatkan ogive... dalam gambar. 2.4 menunjukkan ogive yang dibangun berdasarkan data pada Tabel. 2.11.
Histogram dapat diubah menjadi poligon distribusi dengan mencari titik tengah sisi-sisi persegi panjang dan kemudian menghubungkan titik-titik tersebut dengan garis lurus. Poligon distribusi yang dihasilkan ditunjukkan pada Gambar. 2.2 dengan garis putus-putus.
Saat membangun histogram distribusi deret variasi dengan interval yang tidak sama pada sumbu ordinat, bukan frekuensi yang diplot, tetapi densitas distribusi fitur dalam interval yang sesuai.
Kepadatan distribusi adalah frekuensi yang dihitung per satuan lebar interval, mis. berapa banyak unit dalam setiap kelompok per unit interval. Contoh perhitungan densitas distribusi disajikan pada tabel. 2.12.
Tabel 2.12 - Distribusi perusahaan berdasarkan jumlah karyawan (angka bersyarat)
N p / p Kelompok perusahaan berdasarkan jumlah karyawan, orang Jumlah perusahaan Ukuran interval, orang Kepadatan distribusi
A 1 2 3=1/2
1 Sampai 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Untuk representasi grafis dari seri variasi juga dapat digunakan kurva kumulatif... Dengan bantuan cumulates (kurva penjumlahan), serangkaian frekuensi yang terakumulasi ditampilkan. Frekuensi yang terakumulasi ditentukan dengan menjumlahkan frekuensi secara berurutan berdasarkan kelompok dan menunjukkan berapa banyak unit populasi yang memiliki nilai fitur tidak lebih besar dari nilai yang dipertimbangkan.


Beras. 2.4. Rentang distribusi keluarga menurut ukuran ruang hidup per orang

Saat membangun kumulasi dari deret variasi interval, varian deret diplot sepanjang sumbu absis, dan frekuensi akumulasi diplot di sepanjang sumbu ordinat.

Deret distribusi statistik adalah jenis pengelompokan yang paling sederhana.

Seri distribusi statistik adalah distribusi kuantitatif yang teratur dari unit-unit populasi ke dalam kelompok-kelompok homogen menurut karakteristik yang bervariasi (atribut atau kuantitatif).

Tergantung pada tandanya, mendasari pembentukan kelompok, membedakan antara deret distribusi atributif dan variasional.

Atributif disebut deret distribusi yang dibangun menurut karakteristik kualitatif, yaitu fitur yang tidak memiliki ekspresi numerik. Contoh dari rangkaian distribusi atributif adalah distribusi populasi aktif secara ekonomi di Federasi Rusia berdasarkan jenis kelamin pada tahun 2010 (Tabel 3.10).

Tabel 3.10. Distribusi populasi aktif ekonomi Federasi Rusia berdasarkan jenis kelamin pada tahun 2010

Variasi seri distribusi disebut, dibangun atas dasar kuantitatif, yaitu. fitur yang memiliki ekspresi numerik.

Deret variasi distribusi terdiri dari dua elemen: varian dan frekuensi.

Varian beri nama nilai individual dari fitur, yang diperlukan dalam seri variasi.

Frekuensi adalah jumlah varian individu atau setiap kelompok dari seri variasi. Frekuensi menunjukkan seberapa sering satu atau beberapa nilai atribut muncul dalam populasi yang diteliti. Jumlah semua frekuensi menentukan ukuran seluruh populasi, volumenya.

Frekuensi disebut frekuensi, dinyatakan dalam pecahan unit atau sebagai persentase dari total. Dengan demikian, jumlah frekuensi adalah 1, atau 100%.

Tergantung pada sifat variasi sifat membedakan deret distribusi diskrit dan variasi interval.

Deret distribusi variasi diskrit - Ini adalah deret distribusi di mana grup disusun menurut fitur yang berubah secara terputus-putus, mis. melalui sejumlah unit tertentu, dan hanya menerima nilai integer. Misalnya, distribusi jumlah apartemen yang dibangun di Federasi Rusia dengan jumlah kamar di dalamnya I! 2010 (Tabel 3.11).

Tabel 3.11. Distribusi jumlah apartemen yang dibangun di Federasi Rusia dengan jumlah kamar di dalamnya pada tahun 2010

Variasi interval deret distribusi - Ini adalah deret distribusi di mana atribut pengelompokan, yang membentuk dasar pengelompokan, dapat mengambil nilai apa pun dalam interval yang berbeda satu sama lain dengan jumlah kecil yang sewenang-wenang.

Konstruksi deret variasi interval adalah bijaksana, pertama-tama, dengan variasi berkelanjutan dari sifat (Tabel 3.12), serta jika variasi diskrit dari sifat memanifestasikan dirinya dalam batas yang luas (Tabel 3.13), yaitu. jumlah opsi untuk fitur diskrit cukup besar.

Tabel 3.12. Distribusi subjek Distrik Federal Selatan Federasi Rusia berdasarkan wilayah pada 1 Januari 2011

Tabel 3.13. Distribusi mata pelajaran Distrik Federal Pusat Federasi Rusia berdasarkan jumlah lembaga pendidikan kota per 1 Januari 2011

Aturan untuk membangun deret distribusi mirip dengan aturan untuk membuat pengelompokan.

Analisis deret distribusi dapat dilakukan secara visual berdasarkan representasi grafisnya. Untuk tujuan ini, poligon, histogram, dan distribusi dibangun.

Poligon digunakan saat menampilkan deret distribusi variasi diskrit. Untuk membangunnya dalam sistem koordinat persegi panjang di sepanjang sumbu absis, nilai peringkat dari berbagai fitur diplot pada skala yang sama, dan skala diterapkan di sepanjang sumbu ordinat untuk menyatakan besarnya frekuensi. Diperoleh pada perpotongan sumbu absis (X) dan sumbu ordinat (Y) dari titik-titik dihubungkan oleh garis lurus, sebagai akibatnya diperoleh polyline, yang disebut poligon frekuensi.

Histogram digunakan untuk mewakili seri variasi interval. Saat membangun histogram, nilai interval diplot pada sumbu absis, dan frekuensi digambarkan oleh persegi panjang yang dibangun pada interval yang sesuai. Ketinggian batang harus sebanding dengan frekuensi.

Histogram dapat diubah menjadi poligon distribusi dengan menghubungkan titik tengah sisi atas persegi panjang dengan garis lurus.

Saat membangun histogram distribusi deret variasi dengan interval yang tidak sama pada sumbu ordinat, bukan frekuensi yang diplot, tetapi densitas distribusi fitur dalam interval yang sesuai. Kepadatan distribusi - adalah frekuensi, dihitung per satuan lebar interval,

itu. berapa banyak unit dalam setiap kelompok per unit interval.

Kurva kumulatif dapat digunakan untuk menggambarkan secara grafis deret variasi distribusi. Dengan menggunakan terakumulasi mewakili serangkaian akumulasi frekuensi. Akumulasi frekuensi ditentukan dengan menjumlahkan frekuensi secara berurutan dalam kelompok.

Saat membangun kumulasi dari deret variasi interval sepanjang sumbu absis (X) opsi seri diletakkan, dan frekuensi yang terakumulasi di sepanjang ordinat (Y) diplot pada bidang grafik dalam bentuk tegak lurus terhadap absis di batas atas interval. Kemudian tegak lurus ini terhubung dan garis putus-putus diperoleh, mis. mengumpul.

Jika representasi grafis dari deret variasi distribusi dalam bentuk sumbu kumulatif x dan U swap, ternyata ogive.

Seri variasi - seri di mana mereka dibandingkan (dengan tingkat kenaikan atau penurunan) pilihan dan yang sesuai frekuensi

Varian adalah ekspresi kuantitatif yang terpisah dari suatu fitur. Dilambangkan dengan huruf latin V ... Pemahaman klasik tentang istilah "varian" mengasumsikan bahwa setiap nilai unik dari suatu fitur disebut varian, tanpa memperhitungkan jumlah pengulangan.

Misalnya, dalam rangkaian variasi indikator tekanan darah sistolik yang diukur pada sepuluh pasien:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

hanya 6 nilai yang menjadi opsi:

110, 120, 130, 140, 160, 170.

Frekuensi adalah angka yang menunjukkan berapa kali suatu variasi diulang. Dilambangkan dengan huruf latin P ... Jumlah semua frekuensi (yang, tentu saja, sama dengan jumlah semua yang diselidiki) dilambangkan sebagai: n.

    Dalam contoh kita, frekuensi akan mengambil nilai berikut:
  • untuk opsi 110, frekuensinya adalah P = 1 (nilai 110 terjadi pada satu pasien),
  • untuk pilihan 120, frekuensinya adalah P = 2 (nilai 120 terjadi pada dua pasien),
  • untuk opsi 130, frekuensinya adalah P = 3 (nilai 130 terjadi pada tiga pasien),
  • untuk pilihan 140, frekuensinya adalah P = 2 (nilai 140 terjadi pada dua pasien),
  • untuk pilihan 160, frekuensinya adalah P = 1 (nilai 160 terjadi pada satu pasien),
  • untuk opsi 170, frekuensinya adalah P = 1 (nilai 170 terjadi pada satu pasien),

Jenis seri variasi:

  1. sederhana- ini adalah baris di mana setiap opsi hanya muncul sekali (semua frekuensi sama dengan 1);
  2. tergantung- baris di mana satu atau beberapa varian muncul berulang kali.

Seri variasi digunakan untuk menggambarkan susunan angka yang besar, dalam bentuk inilah data yang dikumpulkan dari sebagian besar penelitian medis pada awalnya disajikan. Untuk mengkarakterisasi seri variasi, indikator khusus dihitung, termasuk nilai rata-rata, indikator variabilitas (yang disebut varians), indikator keterwakilan data sampel.

Indikator seri variasi

1) Rata-rata aritmatika adalah indikator generalisasi yang mencirikan ukuran fitur yang dipelajari. Rata-rata aritmatika dilambangkan sebagai M , adalah jenis media yang paling umum. Rata-rata aritmatika dihitung sebagai rasio jumlah nilai indikator semua unit pengamatan dengan jumlah semua mata pelajaran. Metode untuk menghitung rata-rata aritmatika berbeda untuk seri variasi sederhana dan berbobot.

Rumus untuk perhitungan rata-rata aritmatika sederhana:

Rumus untuk perhitungan rata-rata aritmatika berbobot:

M = (V * P) / n

2) Mode adalah nilai rata-rata lain dari seri variasi, sesuai dengan varian yang paling sering diulang. Atau, dengan kata lain, ini adalah varian dengan frekuensi tertinggi. Dilambangkan sebagai moe ... Modus dihitung hanya untuk seri berbobot, karena dalam seri sederhana tidak ada varian yang diulang dan semua frekuensi sama dengan satu.

Misalnya, dalam rangkaian variasi nilai detak jantung:

80, 84, 84, 86, 86, 86, 90, 94;

nilai mode adalah 86, karena varian ini muncul 3 kali, oleh karena itu frekuensinya adalah yang tertinggi.

3) Median - nilai variasi yang membagi seri variasi menjadi dua: ada jumlah variasi yang sama di kedua sisinya. Median, seperti mean dan modus aritmatika, mengacu pada rata-rata. Dilambangkan sebagai Aku

4) Standar deviasi (sinonim: simpangan baku, simpangan sigma, sigma) - ukuran variabilitas seri variasi. Ini adalah indikator integral yang menyatukan semua kasus penyimpangan varian dari mean. Sebenarnya, ini menjawab pertanyaan: seberapa jauh dan seberapa sering varian menyebar dari mean aritmatika. Dilambangkan dengan huruf Yunani σ ("sigma").

Ketika ukuran populasi lebih dari 30 unit, standar deviasi dihitung menggunakan rumus berikut:

Untuk populasi kecil - 30 unit pengamatan atau kurang - standar deviasi dihitung menggunakan rumus yang berbeda:

Baris dibangun secara kuantitatif disebut variasi.

Rangkaian distribusi terdiri dari pilihan(nilai karakteristik) dan frekuensi(jumlah kelompok). Frekuensi yang dinyatakan sebagai nilai relatif (saham, persentase) disebut sering... Jumlah semua frekuensi disebut volume deret distribusi.

Berdasarkan jenisnya, seri distribusi dibagi menjadi: diskrit(dibangun di atas nilai atribut yang terputus-putus) dan selang(dibangun di atas nilai karakteristik yang berkelanjutan).

Seri variasi mewakili dua kolom (atau garis); di mana nilai individual dari atribut yang bervariasi diberikan, disebut sebagai opsi dan dilambangkan dengan X; dan di sisi lain - angka absolut yang menunjukkan berapa kali (seberapa sering) setiap opsi muncul. Indikator kolom kedua disebut frekuensi dan secara konvensional dilambangkan dengan f. Sekali lagi, kami mencatat bahwa di kolom kedua, indikator relatif juga dapat digunakan yang mencirikan pangsa frekuensi varian individu dalam jumlah total frekuensi. Indikator relatif ini disebut frekuensi dan secara konvensional dilambangkan melalui Jumlah semua frekuensi dalam hal ini sama dengan satu. Namun, frekuensi dapat dinyatakan sebagai persentase, dan kemudian jumlah semua frekuensi memberikan 100%.

Jika varian dari deret variasi dinyatakan dalam bentuk besaran diskrit, maka deret variasi tersebut disebut diskrit.

Untuk fitur kontinu, deret variasi dibuat sebagai: selang, yaitu, nilai-nilai atribut di dalamnya dinyatakan "dari ... ke ...". Pada saat yang sama, nilai minimum atribut dalam interval seperti itu disebut batas bawah interval, dan maksimum disebut batas atas.

Seri variasi interval juga dibangun untuk fitur diskrit yang bervariasi dalam rentang yang besar. Baris interval bisa dengan setara dan tidak setara interval.

Pertimbangkan bagaimana nilai interval yang sama ditentukan. Mari kita perkenalkan notasi berikut:

Saya- ukuran interval;

- nilai maksimum atribut untuk unit populasi;

- nilai minimum karakteristik untuk unit populasi;

n - jumlah kelompok yang dialokasikan.

jika n diketahui.

Jika jumlah kelompok yang dialokasikan sulit ditentukan sebelumnya, maka rumus yang diusulkan oleh Sturgess pada tahun 1926 dapat direkomendasikan untuk menghitung nilai interval yang optimal dengan volume populasi yang cukup:

n = 1+ 3.322 lg N, di mana N adalah jumlah unit secara agregat.

Ukuran interval yang tidak sama ditentukan dalam setiap kasus individu, dengan mempertimbangkan karakteristik objek penelitian.

Distribusi statistik sampel memanggil daftar opsi dan frekuensi yang sesuai (atau frekuensi relatif).

Distribusi statistik sampel dapat ditentukan dalam bentuk tabel, di kolom pertama di mana opsi berada, dan di kolom kedua - frekuensi yang sesuai dengan opsi ini ni, atau frekuensi relatif Pi .

Distribusi statistik sampel

Deret variasi disebut deret interval, di mana nilai-nilai karakteristik yang mendasari pembentukannya dinyatakan dalam batas-batas tertentu (interval). Frekuensi dalam hal ini tidak mengacu pada nilai karakteristik individu, tetapi ke seluruh interval.

Seri distribusi interval dibangun sesuai dengan fitur kuantitatif berkelanjutan, serta fitur diskrit yang bervariasi dalam batas yang signifikan.

Seri interval dapat diwakili oleh distribusi statistik sampel, yang menunjukkan interval dan frekuensi yang sesuai. Dalam hal ini, jumlah frekuensi varian yang termasuk dalam interval ini diambil sebagai frekuensi interval.

Saat mengelompokkan berdasarkan karakteristik kontinu kuantitatif, penting untuk menentukan ukuran interval.

Selain mean sampel dan varians sampel, karakteristik lain dari deret variasi juga digunakan.

Mode disebut opsi yang memiliki frekuensi tertinggi.

Tampilan