Interval kepercayaan. Interval kepercayaan

Interval kepercayaan(CI; dalam bahasa Inggris, interval kepercayaan - CI) yang diperoleh dalam suatu penelitian dengan sampel memberikan ukuran keakuratan (atau ketidakpastian) hasil penelitian untuk menarik kesimpulan tentang populasi semua pasien tersebut (populasi umum). Definisi yang benar dari CI 95% dapat dirumuskan sebagai berikut: 95% dari interval tersebut akan memuat nilai sebenarnya dalam populasi. Penafsiran ini agak kurang akurat: CI adalah rentang nilai yang 95% yakinnya berisi nilai sebenarnya. Saat menggunakan CI, penekanannya adalah pada penentuan pengaruh kuantitatif, bukan pada nilai P yang diperoleh dari hasil pengujian. signifikansi statistik. Nilai P tidak memperkirakan kuantitas apa pun, melainkan berfungsi sebagai ukuran kekuatan bukti terhadap hipotesis nol “tidak ada pengaruh”. Nilai P dengan sendirinya tidak memberi tahu kita apa pun tentang besarnya perbedaan, atau bahkan arahnya. Oleh karena itu, nilai P independen sama sekali tidak informatif dalam artikel atau abstrak. Sebaliknya, CI menunjukkan besarnya dampak yang langsung dirasakan, seperti manfaat pengobatan, dan kekuatan bukti. Oleh karena itu, DI berkaitan langsung dengan praktik EBM.

Pendekatan estimasi pada analisis statistik, yang dicontohkan oleh CI, bertujuan untuk mengukur kuantitas dampak yang diinginkan (sensitivitas tes diagnostik, tingkat kasus yang diprediksi, pengurangan risiko relatif dengan pengobatan, dll.) dan juga untuk mengukur ketidakpastian dalam hal tersebut. memengaruhi. Paling sering, CI adalah kisaran nilai di kedua sisi perkiraan yang kemungkinan besar berisi nilai sebenarnya, dan Anda dapat yakin 95% akan hal itu. Kesepakatan untuk menggunakan probabilitas 95% adalah sewenang-wenang, begitu pula dengan nilai P.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI didasarkan pada gagasan bahwa penelitian yang sama yang dilakukan pada sampel pasien yang berbeda tidak akan menghasilkan hasil yang sama, namun hasilnya akan didistribusikan di sekitar nilai yang sebenarnya tetapi tidak diketahui. Dengan kata lain, CI menggambarkannya sebagai “variabilitas yang bergantung pada sampel.” CI tidak mencerminkan ketidakpastian tambahan karena alasan lain; khususnya, hal ini tidak mencakup dampak mangkir secara selektif, kepatuhan yang buruk atau pengukuran hasil yang tidak akurat, kurangnya penyamaran, dan lain-lain. Oleh karena itu, CI selalu meremehkan jumlah total ketidakpastian.

Perhitungan Interval Keyakinan

Tabel A1.1. Kesalahan standar dan interval kepercayaan untuk pengukuran klinis yang dipilih

Biasanya, CI dihitung dari estimasi kuantitas yang diamati, seperti selisih (d) antara dua proporsi, dan kesalahan standar (SE) dalam estimasi perbedaan tersebut. Perkiraan 95% CI yang diperoleh dengan cara ini adalah d ± 1,96 SE. Rumusnya berubah sesuai dengan sifat ukuran hasil dan ruang lingkup CI. Misalnya, dalam uji coba vaksin pertusis aselular secara acak dan terkontrol plasebo, 72 dari 1.670 (4,3%) bayi yang menerima vaksin tersebut menderita pertusis dan 240 dari 1.665 (14,4%) pada kelompok kontrol. Perbedaan persentasenya, yang dikenal sebagai pengurangan risiko absolut, adalah 10,1%. SE selisih ini sebesar 0,99%. Dengan demikian, CI 95% adalah 10,1% + 1,96 x 0,99%, yaitu. dari 8.2 hingga 12.0.

Meskipun pendekatan filosofisnya berbeda, CI dan uji signifikansi statistik terkait erat secara matematis.

Dengan demikian, nilai P adalah “signifikan”, yaitu. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Ketidakpastian (ketidakakuratan) estimasi, yang dinyatakan dalam CI, sebagian besar terkait dengan akar kuadrat dari ukuran sampel. Sampel kecil memberikan lebih sedikit informasi dibandingkan sampel besar, dan CI juga lebih luas pada sampel yang lebih kecil. Misalnya, sebuah artikel yang membandingkan kinerja tiga tes yang digunakan untuk mendiagnosis infeksi Helicobacter pylori melaporkan sensitivitas tes napas urea sebesar 95,8% (95% CI 75-100). Meskipun angka 95,8% ini mengesankan, sampel kecil yang terdiri dari 24 pasien dewasa dengan J. pylori berarti terdapat ketidakpastian yang signifikan dalam perkiraan ini, seperti yang ditunjukkan oleh CI yang luas. Memang batas bawah 75% jauh lebih rendah dari perkiraan 95,8%. Jika sensitivitas yang sama diamati pada sampel yang terdiri dari 240 orang, 95% CI akan menjadi 92,5–98,0, sehingga memberikan jaminan lebih besar bahwa tes tersebut sangat sensitif.

Dalam uji coba terkontrol secara acak (RCT), hasil yang tidak signifikan (yaitu hasil dengan P >0,05) sangat rentan terhadap salah tafsir. CI sangat berguna di sini karena menunjukkan seberapa konsisten hasilnya dengan efek klinis yang sebenarnya. Misalnya, dalam RCT yang membandingkan jahitan kolon dan anastomosis stapel, infeksi luka terjadi pada 10,9% dan 13,5% pasien, masing-masing (P = 0,30). CI 95% untuk perbedaan ini adalah 2,6% (−2 hingga +8). Bahkan dalam penelitian terhadap 652 pasien ini, masih terdapat kemungkinan bahwa terdapat sedikit perbedaan dalam kejadian infeksi akibat kedua prosedur tersebut. Semakin sedikit penelitian, semakin besar ketidakpastiannya. Sung dkk. melakukan RCT untuk membandingkan infus octreotide dengan skleroterapi akut untuk perdarahan varises akut pada 100 pasien. Pada kelompok octreotide, tingkat pengendalian perdarahan adalah 84%; pada kelompok skleroterapi - 90%, yang memberikan P = 0,56. Perhatikan bahwa tingkat perdarahan yang berkelanjutan serupa dengan tingkat infeksi luka yang disebutkan dalam penelitian. Namun dalam kasus ini, CI 95% untuk perbedaan antar intervensi adalah 6% (−7 hingga +19). Kisaran ini cukup lebar dibandingkan dengan perbedaan 5% yang menjadi kepentingan klinis. Jelasnya, penelitian ini tidak mengesampingkan adanya perbedaan efektivitas yang signifikan. Oleh karena itu, kesimpulan penulis “infus oktreotida dan skleroterapi sama efektifnya dalam pengobatan perdarahan akibat varises” jelas tidak valid. Dalam kasus seperti ini, dimana 95% CI untuk pengurangan risiko absolut (ARR) mencakup nol, CI untuk NNT (angka yang diperlukan untuk mengobati) cukup sulit untuk diinterpretasikan. NPL dan CI-nya diperoleh dari kebalikan ACP (dikalikan 100 jika nilai tersebut dinyatakan dalam persentase). Disini didapat NPL = 100 : 6 = 16,6 dengan CI 95% -14,3 hingga 5,3. Seperti dapat dilihat dari catatan kaki “d” pada tabel. A1.1, CI ini mencakup nilai NPL dari 5,3 hingga tak terhingga dan NPL dari 14,3 hingga tak terhingga.

CI dapat dibuat untuk estimasi atau perbandingan statistik yang paling umum digunakan. Untuk RCT, hal ini mencakup perbedaan antara proporsi rata-rata, risiko relatif, rasio odds, dan NLR. Demikian pula, CI dapat diperoleh untuk semua estimasi utama yang dibuat dalam studi akurasi tes diagnostik—sensitivitas, spesifisitas, nilai prediksi positif (yang semuanya merupakan proporsi sederhana), dan rasio kemungkinan—estimasi yang diperoleh dalam meta-analisis dan perbandingan-dengan-kontrol. studi. Sebuah program komputer pribadi yang mencakup sebagian besar penggunaan MDI ini tersedia dalam Statistics with Confidence edisi kedua. Makro untuk menghitung CI untuk proporsi tersedia gratis untuk Excel dan program statistik SPSS dan Minitab di http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Beberapa perkiraan efek pengobatan

Meskipun CI diinginkan untuk hasil studi utama, namun tidak diperlukan untuk semua hasil. CI menyangkut perbandingan yang penting secara klinis. Misalnya, ketika membandingkan dua kelompok, CI yang benar adalah CI yang dibuat untuk perbedaan antar kelompok, seperti yang ditunjukkan pada contoh di atas, dan bukan CI yang dapat dibuat untuk estimasi masing-masing kelompok. Menyediakan CI terpisah untuk estimasi di setiap kelompok tidak hanya tidak membantu, namun presentasi ini juga bisa menyesatkan. Demikian pula, pendekatan yang benar ketika membandingkan efektivitas pengobatan pada subkelompok yang berbeda adalah dengan membandingkan dua (atau lebih) subkelompok secara langsung. Tidaklah tepat untuk berasumsi bahwa suatu pengobatan hanya efektif pada satu subkelompok jika CI-nya tidak menyertakan nilai yang menyatakan tidak ada efek dan subkelompok lainnya tidak. CI juga berguna saat membandingkan hasil di beberapa subgrup. Pada Gambar. A 1.1 menunjukkan risiko relatif eklampsia pada wanita dengan preeklamsia pada subkelompok wanita dari RCT magnesium sulfat terkontrol plasebo.

Beras. A1.2. Plot hutan menunjukkan hasil 11 uji klinis acak vaksin rotavirus sapi untuk pencegahan diare dibandingkan dengan plasebo. Interval kepercayaan 95% digunakan untuk memperkirakan risiko relatif diare. Ukuran kotak hitam sebanding dengan jumlah informasi. Selain itu, ringkasan perkiraan efektivitas pengobatan dan interval kepercayaan 95% (ditunjukkan dengan berlian) juga ditampilkan. Meta-analisis menggunakan model efek acak yang lebih besar dari beberapa model yang telah ditentukan sebelumnya; misalnya, ini bisa menjadi ukuran yang digunakan dalam menghitung ukuran sampel. Kriteria yang lebih ketat mengharuskan seluruh rentang CI menunjukkan manfaat yang lebih besar dari nilai minimum yang telah ditentukan.

Kita telah membahas kekeliruan dalam menganggap kurangnya signifikansi statistik sebagai indikasi bahwa dua pengobatan sama efektifnya. Penting juga untuk tidak menyamakan signifikansi statistik dengan kepentingan klinis. Kepentingan klinis dapat diasumsikan ketika hasilnya signifikan secara statistik dan besarnya perkiraan efektivitas pengobatan

Studi dapat menunjukkan apakah hasilnya signifikan secara statistik dan mana yang penting secara klinis dan mana yang tidak. Pada Gambar. A1.2 menunjukkan hasil dari empat pengujian, yang keseluruhan CI<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Salah satu cara untuk menyelesaikan masalah statistik adalah dengan menghitung selang kepercayaan. Ini digunakan sebagai alternatif yang lebih baik daripada estimasi titik ketika ukuran sampelnya kecil. Perlu diperhatikan bahwa proses penghitungan interval kepercayaan itu sendiri cukup rumit. Namun alat Excel membuatnya lebih mudah. Mari kita cari tahu bagaimana hal ini dilakukan dalam praktiknya.

Metode ini digunakan untuk estimasi interval berbagai besaran statistik. Tugas utama perhitungan ini adalah menghilangkan ketidakpastian estimasi titik.

Di Excel, ada dua opsi utama untuk melakukan penghitungan menggunakan metode ini: saat varians diketahui dan saat varians tidak diketahui. Dalam kasus pertama, fungsi tersebut digunakan untuk perhitungan KEPERCAYAAN.NORM, dan yang kedua - WALI.SISWA.

Metode 1: Fungsi CONFIDENCE NORM

Operator KEPERCAYAAN.NORM, yang termasuk dalam kelompok fungsi statistik, pertama kali muncul di Excel 2010. Versi sebelumnya dari program ini menggunakan analognya MEMERCAYAI. Tujuan dari operator ini adalah untuk menghitung interval kepercayaan yang terdistribusi normal untuk mean populasi.

Sintaksnya adalah sebagai berikut:

PERCAYA DIRI.NORM(alpha;standard_off;ukuran)

"Alfa"— argumen yang menunjukkan tingkat signifikansi yang digunakan untuk menghitung tingkat kepercayaan. Tingkat kepercayaannya sama dengan ekspresi berikut:

(1-"Alfa")*100

"Standar deviasi"- Ini adalah argumen, yang intinya jelas dari namanya. Ini adalah simpangan baku dari sampel yang diusulkan.

"Ukuran"— argumen yang menentukan ukuran sampel.

Semua argumen untuk operator ini wajib diisi.

Fungsi MEMERCAYAI memiliki argumen dan kemungkinan yang persis sama dengan yang sebelumnya. Sintaksnya adalah:

KEPERCAYAAN(alfa, standard_off, ukuran)

Seperti yang Anda lihat, perbedaannya hanya pada nama operatornya. Untuk alasan kompatibilitas, fungsi ini dibiarkan di Excel 2010 dan versi yang lebih baru dalam kategori khusus "Kesesuaian". Di versi Excel 2007 dan sebelumnya, ini ada di grup utama operator statistik.

Batas interval kepercayaan ditentukan dengan menggunakan rumus berikut:

X+(-)NORM KEPERCAYAAN

Di mana X adalah nilai rata-rata sampel, yang terletak di tengah rentang yang dipilih.

Sekarang mari kita lihat cara menghitung interval kepercayaan menggunakan contoh spesifik. 12 pengujian dilakukan, menghasilkan hasil yang berbeda-beda, tercantum dalam tabel. Inilah totalitas kami. Simpangan bakunya adalah 8. Kita perlu menghitung selang kepercayaan pada tingkat kepercayaan 97%.

  1. Pilih sel dimana hasil pengolahan data akan ditampilkan. Klik pada tombol "Masukkan Fungsi".
  2. Muncul Penyihir Fungsi. Buka kategori "Statistik" dan sorot namanya "PERCAYA.NORM". Setelah itu, klik tombolnya "OKE".
  3. Jendela argumen terbuka. Bidangnya secara alami sesuai dengan nama argumen.
    Tempatkan kursor di bidang pertama - "Alfa". Di sini kita harus menunjukkan tingkat signifikansinya. Seingat kami, tingkat kepercayaan kami 97%. Pada saat yang sama, kami mengatakan bahwa ini dihitung dengan cara ini:

    (1 tingkat kepercayaan)/100

    Artinya, dengan mengganti nilainya, kita mendapatkan:

    Dengan perhitungan sederhana kita mengetahui argumennya "Alfa" sama 0,03 . Masukkan nilai ini di bidang.

    Seperti diketahui, dengan syarat standar deviasinya sama dengan 8 . Oleh karena itu, di lapangan "Standar deviasi" tulis saja nomor ini.

    Di lapangan "Ukuran" Anda harus memasukkan jumlah elemen pengujian yang dilakukan. Seperti yang kita ingat, mereka 12 . Namun untuk mengotomatiskan rumus dan tidak mengeditnya setiap kali kita melakukan pengujian baru, mari kita tetapkan nilai ini bukan dengan bilangan biasa, tetapi menggunakan operator MEMERIKSA. Jadi, mari letakkan kursor di kolom tersebut "Ukuran", lalu klik segitiga yang terletak di sebelah kiri bilah rumus.

    Daftar fungsi yang terakhir digunakan akan muncul. Jika operator MEMERIKSA telah Anda gunakan baru-baru ini, seharusnya ada dalam daftar ini. Dalam hal ini, Anda hanya perlu mengklik namanya. Jika tidak, jika Anda tidak menemukannya, langsung saja ke intinya "Fungsi lainnya...".

  4. Yang sudah familiar muncul Penyihir Fungsi. Ayo kembali ke grup lagi "Statistik". Kami menyorot nama di sana "MEMERIKSA". Klik pada tombol "OKE".
  5. Jendela argumen untuk pernyataan di atas muncul. Fungsi ini dirancang untuk menghitung jumlah sel dalam rentang tertentu yang berisi nilai numerik. Sintaksnya adalah sebagai berikut:

    JUMLAH(nilai1,nilai2,…)

    Kelompok argumen "Nilai" adalah referensi ke rentang di mana Anda ingin menghitung jumlah sel yang diisi dengan data numerik. Total argumen seperti itu bisa mencapai 255, tetapi dalam kasus kita, kita hanya memerlukan satu.

    Tempatkan kursor di lapangan "Nilai1" dan, sambil menahan tombol kiri mouse, pilih pada lembar rentang yang berisi koleksi kita. Kemudian alamatnya akan ditampilkan di kolom. Klik pada tombol "OKE".

  6. Setelah itu, aplikasi akan melakukan penghitungan dan menampilkan hasilnya di sel tempatnya berada. Dalam kasus khusus kami, rumusnya terlihat seperti ini:

    NORM KEPERCAYAAN(0,03,8,JUMLAH(B2:B13))

    Hasil perhitungan secara keseluruhan adalah 5,011609 .

  7. Tapi itu belum semuanya. Seperti yang kita ingat, batas interval kepercayaan dihitung dengan menjumlahkan dan mengurangkan hasil perhitungan dari mean sampel KEPERCAYAAN.NORM. Dengan cara ini, batas kanan dan kiri interval kepercayaan masing-masing dihitung. Rata-rata sampel sendiri dapat dihitung menggunakan operator RATA-RATA.

    Operator ini dirancang untuk menghitung mean aritmatika dari rentang angka yang dipilih. Ini memiliki sintaks yang cukup sederhana berikut:

    RATA-RATA(angka1,angka2,…)

    Argumen "Nomor" dapat berupa nilai numerik tunggal atau referensi ke sel atau bahkan seluruh rentang yang memuatnya.

    Jadi, pilih sel di mana perhitungan nilai rata-rata akan ditampilkan, dan klik tombolnya "Masukkan Fungsi".

  8. Terbuka Penyihir Fungsi. Kembali ke kategori "Statistik" dan pilih nama dari daftar "RATA-RATA". Seperti biasa, klik tombolnya "OKE".
  9. Jendela argumen terbuka. Tempatkan kursor di lapangan "Nomor 1" dan menahan tombol kiri mouse, pilih seluruh rentang nilai. Setelah koordinat ditampilkan di lapangan, klik tombol "OKE".
  10. Setelah itu RATA-RATA menampilkan hasil perhitungan dalam elemen sheet.
  11. Kami menghitung batas kanan interval kepercayaan. Untuk melakukan ini, pilih sel terpisah dan beri tanda «=» dan menjumlahkan isi elemen sheet yang berisi hasil perhitungan fungsi RATA-RATA Dan KEPERCAYAAN.NORM. Untuk melakukan perhitungan, tekan tombol Memasuki. Dalam kasus kami, kami mendapatkan rumus berikut:

    Hasil perhitungan: 6,953276

  12. Dengan cara yang sama kita menghitung batas kiri selang kepercayaan, hanya saja kali ini dari hasil perhitungan RATA-RATA kurangi hasil perhitungan operator KEPERCAYAAN.NORM. Rumus yang dihasilkan untuk contoh kita adalah tipe berikut:

    Hasil perhitungan: -3,06994

  13. Kami mencoba menjelaskan secara detail semua langkah menghitung interval kepercayaan, jadi kami menjelaskan setiap rumus secara detail. Namun Anda bisa menggabungkan semua tindakan dalam satu rumus. Perhitungan batas kanan selang kepercayaan dapat dituliskan sebagai berikut:

    RATA-RATA(B2:B13)+PERCAYA DIRI.NORM(0,03,8,JUMLAH(B2:B13))

  14. Perhitungan serupa untuk batas kiri akan terlihat seperti ini:

    RATA-RATA(B2:B13)-PERCAYA DIRI.NORM(0,03,8,JUMLAH(B2:B13))

Metode 2: Fungsi TRUST.STUDENT

Selain itu, Excel memiliki fungsi lain yang berhubungan dengan penghitungan interval kepercayaan - WALI.SISWA. Ini hanya muncul di Excel 2010. Operator ini menghitung interval kepercayaan populasi menggunakan distribusi Student. Sangat mudah digunakan ketika varians dan, karenanya, deviasi standar tidak diketahui. Sintaks operatornya adalah:

PERCAYA DIRI.SISWA(alpha,standard_off,ukuran)

Seperti yang Anda lihat, nama operator tetap tidak berubah dalam kasus ini.

Mari kita lihat cara menghitung batas interval kepercayaan dengan simpangan baku yang tidak diketahui menggunakan contoh populasi yang sama yang kita bahas pada metode sebelumnya. Mari kita ambil tingkat kepercayaan seperti yang terakhir kali pada 97%.

  1. Pilih sel tempat penghitungan akan dilakukan. Klik pada tombol "Masukkan Fungsi".
  2. Di tempat terbuka Penyihir Fungsi pergi ke kategori "Statistik". Pilih nama "SISWA TERPERCAYA". Klik pada tombol "OKE".
  3. Jendela argumen untuk operator tertentu diluncurkan.

    Di lapangan "Alfa", mengingat tingkat kepercayaannya 97%, kita tuliskan angkanya 0,03 . Untuk kedua kalinya kami tidak akan memikirkan prinsip penghitungan parameter ini.

    Setelah ini, letakkan kursor di kolom tersebut "Standar deviasi". Kali ini indikator ini tidak kita ketahui dan perlu dihitung. Ini dilakukan dengan menggunakan fungsi khusus - STDEV.V. Untuk membuka jendela operator ini, klik segitiga di sebelah kiri bilah rumus. Jika kami tidak menemukan nama yang diinginkan dalam daftar yang terbuka, lanjutkan ke item tersebut "Fungsi lainnya...".

  4. Dimulai Penyihir Fungsi. Pindah ke kategori "Statistik" dan tandai nama di dalamnya "STDEV.B". Kemudian klik tombolnya "OKE".
  5. Jendela argumen terbuka. tugas operator STDEV.V adalah menentukan simpangan baku suatu sampel. Sintaksnya terlihat seperti ini:

    DEVIASI STANDAR.B(angka1;angka2;…)

    Tidak sulit menebak argumen itu "Nomor" adalah alamat elemen pemilihan. Jika pilihan ditempatkan dalam satu larik, Anda hanya dapat menggunakan satu argumen untuk menyediakan tautan ke rentang ini.

    Tempatkan kursor di lapangan "Nomor 1" dan, seperti biasa, sambil menahan tombol kiri mouse, pilih koleksi. Setelah koordinat sudah ada di lapangan, jangan buru-buru menekan tombol "OKE", karena hasilnya salah. Pertama kita perlu kembali ke jendela argumen operator WALI.SISWA untuk menambahkan argumen terakhir. Untuk melakukan ini, klik nama yang sesuai di bilah rumus.

  6. Jendela argumen untuk fungsi yang sudah dikenal akan terbuka kembali. Tempatkan kursor di lapangan "Ukuran". Sekali lagi, klik pada segitiga yang sudah kita kenal untuk menuju ke pemilihan operator. Seperti yang Anda pahami, kami membutuhkan nama "MEMERIKSA". Karena kita menggunakan fungsi ini dalam perhitungan pada metode sebelumnya, fungsi ini ada dalam daftar ini, jadi klik saja. Jika Anda tidak menemukannya, ikuti algoritma yang dijelaskan pada metode pertama.
  7. Sekali di jendela argumen MEMERIKSA, letakkan kursor di bidang "Nomor 1" dan dengan menekan tombol mouse, pilih koleksi. Kemudian klik tombolnya "OKE".
  8. Setelah itu, program melakukan perhitungan dan menampilkan nilai interval kepercayaan.
  9. Untuk menentukan batasannya, kita perlu menghitung mean sampel lagi. Tapi, mengingat algoritma perhitungannya menggunakan rumus RATA-RATA sama seperti pada cara sebelumnya, walaupun hasilnya tidak berubah, kami tidak akan membahasnya secara detail untuk kedua kalinya.
  10. Menjumlahkan hasil perhitungan RATA-RATA Dan WALI.SISWA, kita memperoleh batas interval kepercayaan yang tepat.
  11. Pengurangan dari hasil perhitungan operator RATA-RATA hasil perhitungan WALI.SISWA, kita mempunyai batas kiri interval kepercayaan.
  12. Jika perhitungannya ditulis dalam satu rumus, maka perhitungan batas siku-siku dalam kasus kita akan terlihat seperti ini:

    RATA-RATA(B2:B13)+PERCAYA DIRI.SISWA(0,03,STDEV.B(B2:B13),COUNT(B2:B13))

  13. Oleh karena itu, rumus menghitung batas kiri akan terlihat seperti ini:

    RATA-RATA(B2:B13)-PERCAYA DIRI.SISWA(0,03,STDEV.B(B2:B13),COUNT(B2:B13))

Seperti yang Anda lihat, alat Excel mempermudah penghitungan interval kepercayaan dan batasannya. Untuk tujuan ini, operator terpisah digunakan untuk sampel yang variansnya diketahui dan tidak diketahui.

Dan lain-lain, semuanya merupakan perkiraan analogi teoritisnya, yang dapat diperoleh jika tidak tersedia sampelnya, melainkan populasi umum. Namun sayang, biaya tersebut sangat mahal dan seringkali tidak dapat diakses oleh masyarakat umum.

Konsep estimasi interval

Setiap perkiraan sampel memiliki beberapa penyebaran, karena adalah variabel acak yang bergantung pada nilai dalam sampel tertentu. Oleh karena itu, untuk kesimpulan statistik yang lebih andal, seseorang harus mengetahui tidak hanya perkiraan titik, tetapi juga intervalnya, yang memiliki probabilitas tinggi γ (gamma) mencakup indikator yang dievaluasi θ (theta).

Secara formal, ini adalah dua nilai tersebut (statistik) T 1 (X) Dan T 2 (X), Apa T 1< T 2 , yang pada tingkat probabilitas tertentu γ syaratnya terpenuhi:

Singkatnya, itu mungkin terjadi γ atau lebih, indikator sebenarnya ada di antara titik-titik tersebut T 1 (X) Dan T 2 (X), yang disebut batas bawah dan batas atas interval kepercayaan.

Salah satu syarat untuk membangun interval kepercayaan adalah kesempitan maksimumnya, yaitu. itu harus sesingkat mungkin. Keinginan tersebut merupakan hal yang wajar, karena... peneliti mencoba melokalisasi lokasi parameter yang diinginkan dengan lebih akurat.

Oleh karena itu, interval kepercayaan harus mencakup probabilitas maksimum dari distribusi. dan penilaiannya sendiri harus menjadi pusatnya.

Artinya, kemungkinan penyimpangan (indikator sebenarnya dari perkiraan) ke atas sama dengan kemungkinan penyimpangan ke bawah. Perlu diperhatikan juga bahwa untuk distribusi asimetris, interval di sebelah kanan tidak sama dengan interval di sebelah kiri.

Gambar di atas dengan jelas menunjukkan bahwa semakin besar probabilitas kepercayaan, semakin lebar interval – hubungan langsung.

Ini adalah pengenalan singkat tentang teori estimasi interval parameter yang tidak diketahui. Mari kita lanjutkan mencari batas kepercayaan untuk ekspektasi matematis.

Interval kepercayaan untuk ekspektasi matematis

Jika data asli berdistribusi , maka rata-ratanya akan bernilai normal. Hal ini mengikuti aturan bahwa kombinasi linier dari nilai normal juga mempunyai distribusi normal. Oleh karena itu, untuk menghitung probabilitas kita dapat menggunakan peralatan matematika dari hukum distribusi normal.

Namun, hal ini memerlukan mengetahui dua parameter - ekspektasi dan varians, yang biasanya tidak diketahui. Anda tentu saja dapat menggunakan perkiraan sebagai pengganti parameter (rata-rata aritmatika dan ), tetapi distribusi rata-rata tidak akan sepenuhnya normal, melainkan akan sedikit merata ke bawah. Fakta ini dengan cerdik dicatat oleh warga William Gosset dari Irlandia, yang menerbitkan penemuannya dalam jurnal Biometrica edisi Maret 1908. Untuk tujuan kerahasiaan, Gosset menandatangani dirinya sebagai Pelajar. Ini adalah bagaimana distribusi t Student muncul.

Namun, distribusi data normal, yang digunakan oleh K. Gauss ketika menganalisis kesalahan dalam pengamatan astronomi, sangat jarang terjadi dalam kehidupan di bumi dan cukup sulit untuk ditentukan (diperlukan sekitar 2 ribu pengamatan untuk akurasi yang tinggi). Oleh karena itu, sebaiknya buang asumsi normalitas dan gunakan metode yang tidak bergantung pada sebaran data asli.

Timbul pertanyaan: berapakah distribusi mean aritmatika jika dihitung dari data yang distribusinya tidak diketahui? Jawabannya diberikan oleh teori probabilitas yang terkenal Teorema limit pusat(CPT). Dalam matematika, ada beberapa variannya (rumusannya telah disempurnakan selama bertahun-tahun), tetapi semuanya, secara kasar, bermuara pada pernyataan bahwa jumlah sejumlah besar variabel acak independen mematuhi hukum distribusi normal.

Saat menghitung mean aritmatika, jumlah variabel acak digunakan. Dari sini ternyata mean aritmatikanya berdistribusi normal, dimana ekspektasinya adalah ekspektasi data asli, dan variansnya adalah .

Orang pintar tahu cara membuktikan CLT, tapi kami akan memverifikasi ini dengan bantuan eksperimen yang dilakukan di Excel. Mari kita simulasikan sampel 50 variabel acak yang terdistribusi seragam (menggunakan fungsi Excel RANDBETWEEN). Kemudian kita akan membuat 1000 sampel tersebut dan menghitung mean aritmatika untuk masing-masing sampel. Mari kita lihat distribusinya.

Terlihat distribusi rata-ratanya mendekati hukum normal. Jika ukuran dan jumlah sampel diperbesar lagi maka kemiripannya akan semakin baik.

Sekarang setelah kita melihat dengan mata kepala sendiri validitas CLT, kita dapat, dengan menggunakan , menghitung interval kepercayaan untuk mean aritmatika, yang mencakup mean sebenarnya atau ekspektasi matematis dengan probabilitas tertentu.

Untuk menentukan batas atas dan batas bawah, Anda perlu mengetahui parameter distribusi normal. Biasanya, tidak ada, jadi perkiraan yang digunakan: rata-rata aritmatika Dan varians sampel. Saya ulangi, metode ini memberikan perkiraan yang baik hanya dengan sampel besar. Jika sampelnya kecil, sering kali disarankan untuk menggunakan distribusi Student. Jangan percaya! Distribusi Student untuk mean hanya terjadi jika data asli terdistribusi normal, yaitu hampir tidak pernah. Oleh karena itu, lebih baik segera menetapkan batas minimum untuk jumlah data yang diperlukan dan menggunakan metode yang benar secara asimtotik. Mereka bilang 30 observasi sudah cukup. Ambil 50 - Anda tidak akan salah.

T 1.2– batas bawah dan atas interval kepercayaan

– sampel mean aritmatika

s 0– standar deviasi sampel (tidak bias)

N - ukuran sampel

γ – probabilitas kepercayaan (biasanya sama dengan 0,9, 0,95 atau 0,99)

c γ =Φ -1 ((1+γ)/2)– nilai kebalikan dari fungsi distribusi normal standar. Sederhananya, ini adalah jumlah kesalahan standar dari rata-rata aritmatika ke batas bawah atau atas (ketiga probabilitas ini sesuai dengan nilai 1,64, 1,96, dan 2,58).

Inti dari rumusnya adalah diambil mean aritmatikanya dan kemudian disisihkan sejumlah tertentu ( dengan γ) kesalahan standar ( s 0 /√n). Semuanya diketahui, ambillah dan pertimbangkan.

Sebelum komputer pribadi digunakan secara luas, mereka biasa memperoleh nilai fungsi distribusi normal dan kebalikannya. Rumus tersebut masih digunakan sampai sekarang, namun akan lebih efektif jika menggunakan rumus Excel yang sudah jadi. Semua elemen dari rumus di atas ( , dan ) dapat dihitung dengan mudah di Excel. Tetapi ada rumus yang sudah jadi untuk menghitung interval kepercayaan - KEPERCAYAAN.NORM. Sintaksnya adalah sebagai berikut.

PERCAYA DIRI.NORM(alpha;standard_off;ukuran)

alfa– tingkat signifikansi atau tingkat kepercayaan, yang dalam notasi di atas sama dengan 1- γ, yaitu. probabilitas bahwa matematikaekspektasinya akan berada di luar interval kepercayaan. Dengan tingkat kepercayaan 0,95, alpha 0,05, dst.

standar_mati– deviasi standar data sampel. Tidak perlu menghitung kesalahan standar; Excel sendiri akan membaginya dengan akar n.

ukuran– ukuran sampel (n).

Hasil dari fungsi CONFIDENCE NORM merupakan suku kedua dari rumus menghitung selang kepercayaan, yaitu setengah interval Dengan demikian, titik bawah dan atas adalah rata-rata ± nilai yang diperoleh.

Dengan demikian, dimungkinkan untuk membangun algoritma universal untuk menghitung interval kepercayaan untuk mean aritmatika, yang tidak bergantung pada distribusi data asli. Harga universalitas adalah sifatnya yang asimtotik, yaitu. kebutuhan untuk menggunakan sampel yang relatif besar. Namun, di era teknologi modern, mengumpulkan sejumlah data yang dibutuhkan biasanya tidaklah sulit.

Menguji hipotesis statistik menggunakan interval kepercayaan

(modul 111)

Salah satu masalah utama yang dipecahkan dalam statistik adalah. Esensinya secara singkat adalah sebagai berikut. Misalnya, dibuat asumsi bahwa ekspektasi masyarakat umum sama dengan suatu nilai. Kemudian dibangun distribusi mean sampel yang dapat diamati untuk ekspektasi tertentu. Selanjutnya, mereka melihat di mana letak rata-rata riil dalam distribusi bersyarat ini. Jika melampaui batas yang dapat diterima, maka kemunculan rata-rata seperti itu sangat kecil kemungkinannya, dan jika percobaan diulang satu kali, hampir tidak mungkin, yang bertentangan dengan hipotesis yang diajukan, yang berhasil ditolak. Jika rata-rata tidak melampaui batas kritis, maka hipotesis tidak ditolak (tetapi juga tidak terbukti!).

Jadi, dengan bantuan interval kepercayaan, dalam kasus ekspektasi, Anda juga dapat menguji beberapa hipotesis. Ini sangat mudah dilakukan. Katakanlah rata-rata aritmatika untuk sampel tertentu sama dengan 100. Hipotesis diuji bahwa nilai yang diharapkan adalah, katakanlah, 90. Artinya, jika kita mengajukan pertanyaan secara primitif, bunyinya seperti ini: mungkinkah itu benar? nilai meannya sama dengan 90, rata-rata yang diamati ternyata 100?

Untuk menjawab pertanyaan ini, Anda juga memerlukan informasi tentang deviasi standar dan ukuran sampel. Misalkan simpangan bakunya adalah 30 dan jumlah pengamatannya adalah 64 (untuk memudahkan mengekstraksi akarnya). Maka standar error meannya adalah 30/8 atau 3,75. Untuk menghitung interval kepercayaan 95%, Anda perlu menambahkan dua kesalahan standar pada setiap sisi mean (lebih tepatnya, 1,96). Interval kepercayaannya kira-kira 100±7,5 atau dari 92,5 hingga 107,5.

Alasan selanjutnya adalah sebagai berikut. Jika nilai yang diuji berada dalam selang kepercayaan, maka tidak bertentangan dengan hipotesis, karena berada dalam batas fluktuasi acak (dengan probabilitas 95%). Jika titik yang diperiksa berada di luar selang kepercayaan, maka kemungkinan kejadian seperti itu sangat kecil, setidaknya di bawah tingkat yang dapat diterima. Artinya hipotesis ditolak karena bertentangan dengan data observasi. Dalam kasus kami, hipotesis tentang nilai yang diharapkan berada di luar interval kepercayaan (nilai yang diuji sebesar 90 tidak termasuk dalam interval 100±7,5), sehingga harus ditolak. Menjawab pertanyaan primitif di atas, harus dikatakan: tidak, tidak bisa, bagaimanapun, hal ini sangat jarang terjadi. Seringkali, mereka menunjukkan probabilitas spesifik dari penolakan hipotesis yang salah (tingkat p), dan bukan tingkat tertentu di mana interval kepercayaan dibangun, tetapi lebih dari itu di lain waktu.

Seperti yang Anda lihat, membangun interval kepercayaan untuk rata-rata (atau ekspektasi matematis) tidaklah sulit. Hal utama adalah memahami esensinya, dan kemudian segala sesuatunya akan berjalan terus. Dalam praktiknya, sebagian besar kasus menggunakan interval kepercayaan 95%, yang kira-kira lebarnya dua kesalahan standar di kedua sisi mean.

Itu saja untuk saat ini. Semua yang terbaik!

Setiap sampel hanya memberikan gambaran perkiraan populasi umum, dan semua karakteristik statistik sampel (rata-rata, mode, varians...) adalah semacam perkiraan atau perkiraan parameter umum, yang dalam banyak kasus tidak mungkin dihitung karena terhadap tidak dapat diaksesnya masyarakat umum (Gambar 20) .

Gambar 20. Kesalahan pengambilan sampel

Tetapi Anda dapat menentukan interval di mana, dengan tingkat probabilitas tertentu, terletak nilai sebenarnya (umum) dari karakteristik statistik. Interval ini disebut D interval kepercayaan (CI).

Jadi nilai rata-rata umum dengan probabilitas 95% ada di dalamnya

dari ke, (20)

Di mana T – tabel nilai ujian Siswa untuk α =0,05 dan F= N-1

CI 99% juga dapat ditemukan, dalam kasus ini T dipilih untuk α =0,01.

Apa arti praktis dari interval kepercayaan?

    Interval kepercayaan yang lebar menunjukkan bahwa mean sampel tidak mencerminkan mean populasi secara akurat. Hal ini biasanya disebabkan oleh ukuran sampel yang tidak mencukupi, atau karena heterogenitasnya, yaitu karena tidak adanya sampel. dispersi besar. Keduanya memberikan kesalahan rata-rata yang lebih besar dan, karenanya, CI yang lebih luas. Dan inilah yang menjadi dasar untuk kembali ke tahap perencanaan penelitian.

    Batas atas dan bawah CI memberikan perkiraan apakah hasilnya signifikan secara klinis

Mari kita membahas secara lebih rinci pertanyaan tentang signifikansi statistik dan klinis dari hasil studi sifat kelompok. Ingatlah bahwa tugas statistik adalah mendeteksi setidaknya beberapa perbedaan dalam populasi umum berdasarkan data sampel. Tantangan bagi dokter adalah mendeteksi perbedaan (bukan sembarang perbedaan) yang akan membantu diagnosis atau pengobatan. Dan kesimpulan statistik tidak selalu menjadi dasar kesimpulan klinis. Dengan demikian, penurunan hemoglobin yang signifikan secara statistik sebesar 3 g/l tidak perlu dikhawatirkan. Dan sebaliknya, jika suatu masalah pada tubuh manusia tidak meluas ke seluruh lapisan masyarakat, hal ini bukanlah alasan untuk tidak menangani masalah tersebut.

Mari kita lihat situasi ini contoh.

Para peneliti bertanya-tanya apakah anak laki-laki yang menderita suatu jenis penyakit menular tertinggal dalam pertumbuhan dibandingkan teman-temannya. Untuk tujuan ini, penelitian sampel dilakukan yang melibatkan 10 anak laki-laki yang menderita penyakit ini. Hasilnya disajikan pada Tabel 23.

Tabel 23. Hasil pengolahan statistik

batasan yang lebih rendah

batas atas

Standar (cm)

rata-rata

Dari perhitungan tersebut diperoleh rata-rata tinggi badan sampel anak laki-laki usia 10 tahun yang pernah menderita suatu penyakit menular mendekati normal (132,5 cm). Namun, batas bawah interval kepercayaan (126,6 cm) menunjukkan bahwa terdapat kemungkinan 95% bahwa tinggi rata-rata sebenarnya dari anak-anak ini sesuai dengan konsep “tinggi badan pendek”, yaitu. anak-anak ini terhambat.

Dalam contoh ini, hasil penghitungan interval kepercayaan signifikan secara klinis.

Ada dua jenis perkiraan dalam statistik: titik dan interval. Perkiraan poin adalah statistik sampel tunggal yang digunakan untuk memperkirakan parameter populasi. Misalnya, mean sampel adalah perkiraan titik ekspektasi matematis populasi, dan varians sampel S 2- estimasi titik varians populasi σ 2. telah ditunjukkan bahwa mean sampel adalah perkiraan ekspektasi matematis populasi yang tidak bias. Rata-rata sampel disebut tidak bias karena rata-rata seluruh mean sampel (dengan ukuran sampel yang sama) N) sama dengan ekspektasi matematis masyarakat umum.

Agar varians sampel S 2 menjadi estimasi varians populasi yang tidak bias σ 2, penyebut varians sampel harus ditetapkan sama dengan N – 1 , tapi tidak N. Dengan kata lain, varians populasi adalah rata-rata dari semua varians sampel yang mungkin terjadi.

Saat memperkirakan parameter populasi, perlu diingat bahwa statistik sampel seperti , bergantung pada sampel tertentu. Untuk mempertimbangkan fakta ini, untuk memperoleh estimasi interval ekspektasi matematis dari populasi umum, menganalisis distribusi rata-rata sampel (untuk lebih jelasnya, lihat). Interval yang dibangun dicirikan oleh tingkat kepercayaan tertentu, yang mewakili probabilitas bahwa parameter populasi sebenarnya diestimasi dengan benar. Interval kepercayaan serupa dapat digunakan untuk memperkirakan proporsi suatu karakteristik R dan sebagian besar penduduk yang terdistribusi.

Unduh catatan dalam atau format, contoh dalam format

Membangun interval kepercayaan untuk ekspektasi matematis populasi dengan deviasi standar yang diketahui

Membangun interval kepercayaan untuk bagian suatu karakteristik dalam populasi

Bagian ini memperluas konsep interval kepercayaan ke data kategorikal. Hal ini memungkinkan kita untuk memperkirakan bagian karakteristik dalam populasi R menggunakan berbagi sampel RS= X/N. Seperti yang ditunjukkan, jika jumlahnya NR Dan N(1 – hal) melebihi angka 5, maka distribusi binomial dapat diperkirakan seperti biasa. Oleh karena itu, untuk memperkirakan bagian suatu karakteristik dalam populasi R adalah mungkin untuk membangun interval yang tingkat kepercayaannya sama (1 – α)х100%.


Di mana PS- proporsi sampel dari karakteristik sama dengan X/N, yaitu. jumlah keberhasilan dibagi dengan ukuran sampel, R- bagian karakteristik dalam populasi umum, Z- nilai kritis dari distribusi normal terstandar, N- ukuran sampel.

Contoh 3. Misalkan sampel yang terdiri dari 100 faktur yang diisi selama sebulan terakhir diambil dari sistem informasi. Katakanlah 10 faktur ini dibuat dengan kesalahan. Dengan demikian, R= 10/100 = 0,1. Tingkat kepercayaan 95% sesuai dengan nilai kritis Z = 1,96.

Jadi, kemungkinan antara 4,12% dan 15,88% faktur mengandung kesalahan adalah 95%.

Untuk ukuran sampel tertentu, interval kepercayaan yang memuat proporsi karakteristik dalam populasi tampak lebih lebar dibandingkan variabel acak kontinu. Hal ini karena pengukuran variabel acak kontinu mengandung lebih banyak informasi daripada pengukuran data kategorikal. Dengan kata lain, data kategorikal yang hanya mengambil dua nilai mengandung informasi yang tidak cukup untuk memperkirakan parameter distribusinya.

DI DALAMmenghitung perkiraan yang diambil dari populasi yang terbatas

Estimasi ekspektasi matematis. Faktor koreksi untuk populasi akhir ( fpc) digunakan untuk mengurangi kesalahan standar dengan suatu faktor. Saat menghitung interval kepercayaan untuk estimasi parameter populasi, faktor koreksi diterapkan dalam situasi di mana sampel diambil tanpa dikembalikan. Dengan demikian, selang kepercayaan untuk ekspektasi matematis yang mempunyai tingkat kepercayaan sama dengan (1 – α)х100%, dihitung dengan rumus:

Contoh 4. Untuk mengilustrasikan penggunaan faktor koreksi untuk populasi terbatas, mari kita kembali ke masalah penghitungan interval kepercayaan untuk jumlah rata-rata faktur, yang dibahas di atas dalam Contoh 3. Misalkan sebuah perusahaan menerbitkan 5.000 faktur per bulan, dan X=110,27 dolar, S= $28,95, N = 5000, N = 100, α = 0,05, t 99 = 1,9842. Dengan menggunakan rumus (6) kita memperoleh:

Estimasi pangsa suatu fitur. Saat memilih tanpa pengembalian, interval kepercayaan untuk bagian atribut yang memiliki tingkat kepercayaan sama dengan (1 – α)х100%, dihitung dengan rumus:

Interval Keyakinan dan Masalah Etis

Saat mengambil sampel suatu populasi dan menarik kesimpulan statistik, masalah etika sering kali muncul. Yang utama adalah bagaimana interval kepercayaan dan estimasi titik statistik sampel selaras. Menerbitkan perkiraan titik tanpa menentukan interval kepercayaan terkait (biasanya pada tingkat kepercayaan 95%) dan ukuran sampel dari mana estimasi tersebut berasal dapat menimbulkan kebingungan. Hal ini dapat memberikan kesan kepada pengguna bahwa estimasi titik tersebut tepat sesuai dengan kebutuhannya untuk memprediksi properti seluruh populasi. Oleh karena itu, perlu dipahami bahwa dalam penelitian apa pun, fokusnya tidak boleh pada estimasi titik, tetapi pada estimasi interval. Selain itu, perhatian khusus harus diberikan pada pemilihan ukuran sampel yang benar.

Paling sering, objek manipulasi statistik adalah hasil survei sosiologis terhadap penduduk mengenai isu-isu politik tertentu. Pada saat yang sama, hasil survei dipublikasikan di halaman depan surat kabar, dan kesalahan pengambilan sampel serta metodologi analisis statistik dipublikasikan di tengah-tengah. Untuk membuktikan validitas estimasi titik yang diperoleh, perlu ditunjukkan ukuran sampel yang menjadi dasar perolehannya, batas interval kepercayaan, dan tingkat signifikansinya.

Catatan selanjutnya

Bahan yang digunakan adalah dari buku Levin dkk Statistika untuk Manajer. – M.: Williams, 2004. – hal. 448–462

Teorema limit pusat menyatakan bahwa dengan ukuran sampel yang cukup besar, distribusi rata-rata sampel dapat didekati dengan distribusi normal. Properti ini tidak tergantung pada jenis distribusi populasi.

Tampilan