Perhitungan koefisien determinasi pada Microsoft Excel. Mengevaluasi Hasil Regresi Linier

Dalam melakukan prosedur pengujian signifikansi koefisien determinasi, diajukan hipotesis nol terhadap alternatif H1, yaitu sebagai berikut:

Namun: tidak terdapat perbedaan yang signifikan antara koefisien determinasi sampel dan koefisien determinasi populasi umum B(r) = 0.

Hipotesis ini setara dengan hipotesis Ho: β1 = β2 = … = βm = 0, yaitu tidak ada satupun variabel penjelas yang dimasukkan dalam regresi mempunyai pengaruh yang signifikan terhadap variabel terikat.

H1: koefisien determinasi sampel jauh lebih besar dibandingkan koefisien determinasi populasi umum B(r) = 0.

Dari rumusan masalah jelas bahwa wilayah kritis satu sisi harus digunakan. Diterimanya hipotesis H1 berarti paling sedikit salah satu dari m variabel penjelas yang dimasukkan dalam regresi mempunyai pengaruh yang signifikan terhadap variabel y.

Statistik digunakan untuk menilai signifikansi koefisien determinasi berpasangan

Memiliki distribusi Fisher F dengan f1 = m = 1 dan f2 = n – 2 derajat kebebasan. Nilai statistik yang dihitung dengan rumus di atas dibandingkan dengan nilai kritis statistik ini pada tingkat signifikansi £ tertentu dan jumlah derajat kebebasan yang sesuai. Jika F > Ff1; f2;£, maka koefisien determinasi hitung berbeda nyata dari nol. Kesimpulan ini dipastikan dengan probabilitas 1 - £.


28 Memeriksa signifikansi koefisien regresi

Penyelidikan signifikansi statistik parameter persamaan regresi (koefisien regresi) dilakukan sesuai dengan T-Uji-t siswa, yang dihitung dengan rumus:

Di mana P- nilai parameter;
S hal- standar deviasi parameter.

Nilai perhitungan tes Siswa dibandingkan dengan nilai tabelnya pada tingkat kepercayaan yang dipilih (biasanya 0,95) dan jumlah derajat kebebasan N-k-1, dimana N- jumlah poin, k-jumlah variabel dalam persamaan regresi (misalnya, untuk model linier Y=A*X+B pengganti k=1).

Jika nilai yang dihitung tp lebih tinggi dari nilai tabel, maka koefisien regresi signifikan dengan tingkat kepercayaan tertentu. Jika tidak, ada alasan untuk mengecualikan variabel terkait dari model regresi.

Nilai parameter dan mereka deviasi standar biasanya dihitung dalam algoritma yang menerapkan metode kuadrat terkecil.


29 Memeriksa kualitas persamaan regresi secara keseluruhan. Koefisien determinasi. Memeriksa signifikansi koefisien determinasi

Setelah memeriksa signifikansi setiap koefisien regresi, kualitas persamaan regresi secara keseluruhan biasanya diperiksa. Untuk tujuan ini, seperti halnya regresi berpasangan, digunakan koefisien determinasi R2, yang dihitung dengan rumus:

DI DALAM kasus umum 0 < R 2 < 1. Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y. Поэтому естественно желание построить регрессию с наибольшим R 2 .

Untuk regresi berganda, koefisien determinasi merupakan fungsi tidak menurun dari jumlah variabel penjelas. Penambahan variabel penjelas baru tidak pernah menurunkan nilai R. Memang benar, setiap variabel penjelas berikutnya hanya dapat menambah, tetapi tidak mengurangi, informasi yang menjelaskan perilaku variabel terikat. Hal ini mengurangi (dalam kasus terburuk tidak menambah) area ketidakpastian dalam perilaku Y.

Koefisien determinasi () merupakan kuadrat dari koefisien korelasi berganda. Hal ini menunjukkan berapa proporsi varians dari karakteristik yang dihasilkan yang dijelaskan oleh pengaruh variabel independen.

Rumus menghitung koefisien determinasi:

di mana adalah data sampel, dan merupakan nilai model yang sesuai.

Ini juga merupakan korelasi kuadrat Pearson antara dua variabel. Ini menyatakan jumlah varians yang dibagi antara dua variabel.

Koefisien mengambil nilai dari interval. Bagaimana nilai lebih dekat ke 1, semakin dekat model tersebut dengan observasi empiris.

Dalam kasus model regresi linier berpasangan, koefisien determinasi sama dengan kuadrat koefisien korelasi, yaitu.

Setelah menilai signifikansi statistik individual dari setiap koefisien regresi, signifikansi gabungan dari koefisien tersebut biasanya dianalisis. Analisis tersebut dilakukan atas dasar pengujian hipotesis signifikansi umum - hipotesis bahwa semua koefisien regresi dengan variabel penjelas secara bersamaan sama dengan nol:

0: β 0 = β 1 = β 2 = ... = β m =0

Jika hipotesis ini tidak ditolak, maka disimpulkan bahwa pengaruh total seluruh m variabel penjelas X 1, X 2, ..., X m model terhadap variabel terikat Y dapat dianggap tidak signifikan secara statistik, dan kualitas keseluruhan persamaan regresinya rendah.

Hipotesis ini diuji berdasarkan analisis varians yang membandingkan varians yang dijelaskan dan varians residu.

H 0 : (varians yang dijelaskan) = (varians sisa),

H 1 : (varians yang dijelaskan) > (varians sisa).

F-statistik dibangun:

dimana varians yang dijelaskan; - varians sisa. Jika asumsi OLS terpenuhi, F-statistik yang dibangun memiliki distribusi Fisher dengan derajat kebebasan ν 1 =m, ν 2 = n-m-1. Oleh karena itu, jika pada tingkat signifikansi yang diperlukan α F diamati > F α,m,n-m-1 = F cr (titik kritis distribusi Fisher), maka H 0 ditolak dan digantikan oleh H 1 . Artinya varians yang dijelaskan jauh lebih besar varians sisa, dan oleh karena itu, persamaan regresi secara kualitatif mencerminkan dinamika perubahan variabel terikat Y.

Namun, dalam praktiknya, alih-alih hipotesis ini, hipotesis yang berkaitan erat tentang signifikansi statistik koefisien determinasi R2 lebih sering diuji:

Untuk menguji hipotesis ini digunakan F-statistik sebagai berikut:

Nilai F ketika asumsi OLS terpenuhi dan wajar. Namun memiliki distribusi Fisher yang mirip dengan distribusi F-statistik.

Analisis statistik F memungkinkan kita untuk menyimpulkan bahwa untuk menerima hipotesis bahwa semua koefisien regresi linier secara bersamaan sama dengan nol, koefisien determinasi R2 tidak boleh berbeda signifikan dari nol. Nilai kritisnya menurun seiring dengan bertambahnya jumlah observasi dan dapat menjadi sangat kecil.


30. Jalur, jalur penuh, jalur kritis, penentuan jalur kritis dengan metode empat sektor.

Jalur (path) adalah setiap rangkaian aktivitas yang kejadian akhir setiap aktivitasnya bertepatan dengan kejadian awal aktivitas berikutnya.

Jalur lengkap L adalah setiap jalur yang permulaannya bertepatan dengan kejadian jaringan awal, dan berakhir dengan kejadian jaringan terakhir.

Kritis jalur - jalur lengkap yang memiliki panjang (durasi) terbesar dari semua jalur lengkap. Panjangnya ditentukan. batas waktu penyelesaian pekerjaan sesuai jadwal jaringan. Jadwalnya mungkin agak penting. cara. Pekerjaan yang sangat penting. jalan, disebut kritis. Peningkatan durasi kritis bekerja sebagaimana mestinya meningkatkan total durasi pengerjaan SG.

Dengan metode empat sektor untuk menentukan jalur kritis, lingkaran diagram jaringan yang menunjukkan peristiwa tersebut dibagi menjadi empat sektor (Gbr.a). Banyaknya kejadian i ditempatkan di atas, waktu terjadinya peristiwa tp(i) yang paling awal di sebelah kiri, waktu terjadinya peristiwa tп(i) yang paling lambat di sebelah kanan, cadangan waktu kejadian ini R(i) berada pada waktu yang lebih rendah.

Gambar: a) simbol di bagian atas grafik; b) diagram jaringan.

Waktu awal kejadian tp(i) ditentukan oleh durasi lintasan maksimum max(t) ke (i) sebelum kejadian i: tp(i)=max(t) ke (i).

Lapis demi lapis, berpindah dari kejadian awal ke kejadian terakhir, kita tentukan tp(i). Selalu untuk kejadian awal tp(1)=0.

Untuk kejadian 3 (Gbr., b) – tp(3)=max(1+3.0+5)=5; untuk kejadian 4 – tp(4)=maks(1+2.5+6)=11.

Panjang jalur kritis Lcr=11. Lapis demi lapis, berpindah dari kejadian terakhir ke kejadian awal, kita tentukan tп(i). Selalu untuk kejadian terakhir tп(4)=t(Lкр)=11. Waktu terlambatnya kejadian tп(i) ditentukan oleh waktu yang cukup untuk melaksanakan pekerjaan setelah kejadian tersebut, yaitu. mengetahui durasi jalur maksimum max(t) setelah kejadian i setelah (i) dan durasi jalur kritis t(Lcr), kita dapat mencari tп(i)= t(Lcr)-max(t) setelah (i ).

Untuk kejadian 2 – tп(3)=11-max(3+6.2)=2.

Untuk jalur kritis, waktu awal terjadinya peristiwa tp(i) sama dengan waktu akhir terjadinya peristiwa tп(i), yaitu. tp(saya)= tп(saya). Mengetahui tanggal awal dan akhir penyelesaian acara jadwal jaringan, mudah untuk mengidentifikasi cadangan waktu untuk masing-masing acara R(i) = tп(i) - tp(i).

Waktu kelonggaran suatu peristiwa menunjukkan waktu maksimum yang diperbolehkan dimana momen penyelesaiannya dapat ditunda tanpa menyebabkan peningkatan jalur kritis. Peristiwa jalur kritis tidak memiliki waktu kelonggaran.

Hubungan antara parameter diagram jaringan untuk peristiwa dan pekerjaan ditunjukkan dalam tabel.

Tabel - Perhitungan parameter kerja

Cadangan waktu untuk pekerjaan R(ij) ditentukan dengan rumus: R(ij)= tп(j)- tр(i)-tij.

31. Perhitungan parameter waktu kejadian dalam masalah perencanaan jaringan.

Saat menganalisis diagram jaringan, parameter waktunya dihitung terlebih dahulu. Parameter waktu utama meliputi:

Durasi jalur kritis (critical period);

Tanggal penyelesaian dan cadangan jaringan;

Batas waktu penyelesaian pekerjaan individu dan cadangan waktunya.

Parameter waktu dasar

Waktu awal terjadinya peristiwa– saat paling awal saat semua pekerjaan sebelum kejadian ini selesai. Dihitung menggunakan rumus:

Dimana tanggal awal acara i.

Durasi pekerjaan i, j.

Subset yang mencakup semua pekerjaan yang termasuk dalam kejadian j.

Tanggal penyelesaian acara yang terlambat- momen yang membatasi setelah itu masih ada waktu sebanyak yang diperlukan untuk menyelesaikan semua pekerjaan setelah peristiwa ini.

Dihitung menggunakan rumus: .

Cadangan waktu acara menunjukkan periode maksimum yang diperbolehkan dimana penyelesaian acara i dapat ditunda tanpa melanggar waktu acara akhir.

R(saya)=

Cadangan waktu untuk peristiwa penting=0

Awal dimulainya pekerjaan bertepatan dengan awal selesainya acara i.

Tanggal penyelesaian awal pekerjaan ditentukan dengan rumus:

Tanggal keterlambatan penyelesaian pekerjaan bertepatan dengan tanggal keterlambatan penyelesaian acara j.

Tanggal terlambat mulai kerja ditentukan dengan rumus:

Cadangan waktu kerja penuh adalah cadangan waktu maksimum dimana permulaan pekerjaan dapat ditunda atau durasinya dapat ditingkatkan, dengan ketentuan seluruh rentang pekerjaan diselesaikan dalam masa kritis.

Cadangan waktu kerja bebas adalah cadangan waktu maksimum yang durasinya dapat ditunda atau ditingkatkan, asalkan tanggal mulai awal untuk semua pekerjaan berikutnya tidak dilanggar.

Pekerjaan penting, seperti peristiwa penting, tidak memiliki cadangan.

Perhitungan parameter waktu model jaringan dilakukan dalam 4 tahap:

1) langsung - perhitungan dimulai dari kejadian awal dan berlanjut hingga kejadian akhir tercapai. Untuk setiap peristiwa, tanggal paling awal terjadinya dihitung.

2) invers - perhitungan dimulai dengan kejadian invers dan berlanjut hingga kejadian awal tercapai. Untuk setiap peristiwa itu dihitung tanggal terlambat prestasinya.

3) event slack dihitung dan jalur kritis diidentifikasi. Jalur kritis merupakan jalur terpanjang yang melewati peristiwa yang waktu slacknya nol.

4) tabel ringkasan parameter waktu peristiwa dibuat.


32. Regresi. Variabel nonlinier dan konstruksinya.

Untuk menulis ketergantungan ini atau itu kira-kira. regresi Anda – Anda, koneksi. antara mereka sendiri tanda-tanda faktor dan tanda-tanda yang dihasilkan. Tingkat regresi bersifat linier dan nonlinier. Diri regresi Itu terjadi ruang uap(hubungan antara sifat faktor pertama dengan hasilnya) y = y(x) ; Dan banyak y = a + bx (regresi linier berpasangan, karena x dan y terlibat pada derajat 1, dan dan b adalah parameter kontrol yang mempunyai arti operasional) Saat meneliti. sosial-ekonomi yavl. dan proses, tidak semua dependensi dapat dijelaskan menggunakan lean. komunikasi. ITU. banyak digunakan di EMM. kelas nonlin. model regresi, kucing. dibagi menjadi 2 kelas: 1) model regresi non linier. relatif terhadap mereka yang dimasukkan dalam analisis independen. variabel, namun linier dalam parameter estimasinya; 2) model regresi, nonlinier dalam estimasi parameternya.Untuk mengestimasi parameter model nonlinier digunakan dua pendekatan. 1.berdasarkan linearisasi model (menggunakan transformasi yang sesuai dari variabel asli, ketergantungan yang dipelajari direpresentasikan dalam bentuk hubungan linier antara variabel yang ditransformasikan). 2.digunakan dalam kasus di mana tidak mungkin untuk memilih transformasi linierisasi yang sesuai. Lalu Spanyol metode non-lin. optimasi berdasarkan variabel input. Pendugaan parameter regresi, nonlinier terhadap variabel-variabel yang dimasukkan dalam analisis, tetapi linier terhadap parameter taksiran, dilakukan dengan menggunakan kuadrat terkecil dengan menyelesaikan sistem persamaan aljabar linier. Model regresi yang nonlinier terhadap variabel independen yang dimasukkan dalam analisis (tetapi linier dalam parameter yang diestimasi) mencakup polinomial di atas orde kedua dan fungsi hiperbolik. Model ini menyatakan bahwa variabel terikat yi berhubungan linier dengan parameter model Polinomial atau polinomial. fungsi diterapkan ketika menganalisis proses dengan perkembangan yang monoton dan tidak adanya batas pertumbuhan. (misalnya indikator alami produksi industri). Paulus. fungsi karakter. tidak adanya ketergantungan yang jelas dari kenaikan variabel faktor pada nilai variabel yang dihasilkan yi Bentuk umum polinomial orde ke-n (derajat ke-n): Paling sering digunakan di EMM. polinomial orde kedua (fungsi parabola), karakter. perkembangan proses yang dipercepat secara seragam (percepatan pertumbuhan atau penurunan level secara seragam).: Fungsi hiperbolik mencirikan nonlinier. hubungan antara variabel resultan yi dan variabel faktor xi, namun fungsi ini linier ditinjau dari parameter estimasinya (model ketergantungan biaya per unit produksi terhadap volume produksi) Fungsi hiperboloid atau hiperbolik berbentuk: hiperb ini. fungsinya sama sisi. Parameter yang tidak diketahui dari model regresi yang nonlinier dalam variabel faktor hanya dapat ditemukan setelah model disesuaikan dengan bentuk linier.Untuk memperkirakan parameter nonlin yang tidak diketahui. Model regresi harus dibawa ke bentuk linier. Inti dari proses linearisasi adalah nonlinier. menurut variabel faktor model regresi adalah menggantikan nonlin. variabel faktor secara online. variabel Perhatikan proses linierisasi fungsi polinomial berorde n: Ganti semua variabel faktor dengan variabel linier sebagai berikut: x = c1; x2=c2; x3=c3; … xn=cn.Maka model regresi berganda dapat dituliskan sebagai: yi= Perhatikan proses linierisasi fungsi hiperbolik: Fungsi ini dapat direduksi menjadi bentuk linier dengan mengganti variabel faktor nonlinier 1/x dengan variabel linier c. Maka model regresinya dapat dituliskan sebagai: yi = Oleh karena itu, model regresi bersifat non-linier. mengenai variabel independen yang dimasukkan dalam analisis, tetapi lin. sesuai dengan parameter estimasi, dapat diubah menjadi linier. pikiran. Hal ini memungkinkan untuk diterapkan pada model regresi linier metode klasik penentuan parameter model yang tidak diketahui (metode kuadrat terkecil), serta metode untuk menguji berbagai hipotesis. 33. Cadangan waktu untuk mengerjakan tugas perencanaan jaringan Jalur ini dicirikan oleh dua indikator - durasi dan cadangan. Untuk acara, tiga karakteristik dihitung: tanggal awal dan akhir acara, serta cadangannya.
Tanggal awal kejadian ditentukan oleh nilai segmen lintasan terpanjang dari awal hingga kejadian yang ditinjau, dan tр(1)=0, dan tр(N)=tKp(L):
tr(j)=maks(tр(j)+(i,j)); j=2,…,N
Tanggal keterlambatan penyelesaian suatu peristiwa mencirikan periode terakhir yang dapat diterima dimana peristiwa tersebut harus terjadi tanpa menyebabkan penundaan dalam penyelesaian peristiwa akhir:
tn(i)=min(tn(i)-t(i,j)); j=2,…,N-1
Indikator ini ditentukan oleh " kebalikan", dimulai dari kejadian terakhir, dengan memperhatikan relasi tn(N)=tp(N).
Semua kejadian, kecuali kejadian yang termasuk dalam jalur kritis, mempunyai cadangan R(i):
R(i)=tn(i)-tp(i)
Cadangan didefinisikan sebagai perbedaan antara panjang jalur kritis dan jalur yang dipertimbangkan. Dari definisi ini dapat disimpulkan bahwa aktivitas yang terletak pada jalur kritis dan jalur kritis itu sendiri tidak mempunyai kelonggaran nol. Cadangan waktu perjalanan menunjukkan seberapa besar durasi pekerjaan yang membentuk suatu jalur tertentu dapat ditingkatkan tanpa mengubah durasi total periode penyelesaian semua pekerjaan. Cadangan menunjukkan berapa periode maksimum yang diperbolehkan terjadinya peristiwa ini. tertunda tanpa menyebabkan bertambahnya waktu penyelesaian seluruh kompleks pekerjaan. Untuk seluruh pekerjaan (i,j), berdasarkan tanggal awal dan akhir penyelesaian seluruh kegiatan, dapat ditentukan indikator sebagai berikut:
Tanggal mulai awal - tpn(i,j)=p(i) ;
Tanggal akhir awal - tpo(i,j)=tp(i)+t(i,j);
Batas waktu terlambat - tno(U)=tn(j);
Tanggal mulai terlambat -tn(i,j)=tn(j)-t(i,j);
Cadangan penuh waktu -Rn(i,j)=tn(j)-tp(i)-t(i,j);
Cadangan independen -
Rн(i,j)=maks(0; tp(j)–tn(i)-t(i,j))=maks(0;Rn(i,j)-R(i)-R(j)) .
Cadangan waktu penuh menunjukkan berapa banyak waktu untuk menyelesaikan suatu pekerjaan tertentu dapat ditingkatkan, asalkan batas waktu penyelesaian seluruh rangkaian pekerjaan tidak berubah.
Kelonggaran waktu independen berhubungan dengan kasus ketika semua pekerjaan sebelumnya selesai pada tanggal yang terlambat, dan semua pekerjaan berikutnya dimulai pada tanggal yang lebih awal. Penggunaan cadangan ini tidak mempengaruhi jumlah cadangan waktu untuk pekerjaan lain.

34. Tanggal mulai dan selesai lebih awal dan terlambat untuk pekerjaan dalam masalah perencanaan jaringan

Pekerjaan adalah suatu proses yang mengarah pada pencapaian suatu hasil tertentu dan memerlukan pengeluaran sejumlah sumber daya, serta mempunyai perpanjangan waktu.

Awal dan akhir suatu pekerjaan dijelaskan oleh sepasang peristiwa yang disebut peristiwa awal dan akhir.


Parameter waktu pekerjaan ditentukan berdasarkan tanggal awal dan akhir kejadian:

· – mulai bekerja lebih awal;

· – penyelesaian awal pekerjaan;

· – tanggal penyelesaian terlambat;

· – tanggal mulai kerja yang terlambat;


35. Waktu kejadian dalam masalah perencanaan jaringan

Suatu peristiwa adalah suatu titik waktu ketika suatu pekerjaan berakhir dan pekerjaan lainnya dimulai. Suatu peristiwa adalah hasil kerja yang dilakukan dan, tidak seperti kerja, tidak berlangsung lama. Misalnya pondasi dituang beton, komponen disuplai, laporan diserahkan...

Dalam model jaringan, terdapat kejadian awal (dengan nomor 1), yang hanya keluar dari aktivitas, dan kejadian akhir (dengan nomor N), yang hanya berisi aktivitas.

Jalur adalah rangkaian aktivitas dalam diagram jaringan yang peristiwa akhir suatu aktivitas bertepatan dengan peristiwa awal aktivitas berikutnya. Jalur lengkap adalah jalur dari peristiwa awal hingga peristiwa akhir. Jalur kritis adalah durasi maksimum dari jalur yang lengkap. Aktivitas pada jalur kritis disebut kritis. Pekerjaan kritis tidak mempunyai free float dan total float. Jalur subkritis adalah jalur penuh yang durasinya paling dekat dengan jalur kritis. Diagram jaringan mungkin berisi lebih dari satu jalur kritis. Karya dan peristiwa yang terletak di sepanjang jalur ini juga disebut kritis. Interval cadangan dari t ke t* untuk kejadian yang terletak pada jalur kritis sama dengan 0. Untuk kejadian akhir dari jadwal jaringan, batas waktu akhir kejadian harus sama dengan batas waktu awal, yaitu tп = t*п.

– tanggal awal terjadinya kejadian i, jumlah minimum yang diperlukan untuk menyelesaikan seluruh pekerjaan yang mendahului kejadian i

– tanggal terlambat terjadinya peristiwa i, jika melebihinya akan menyebabkan penundaan serupa dalam terjadinya peristiwa akhir jaringan;

– cadangan acara i, mis. waktu dimana terjadinya peristiwa i dapat ditunda tanpa mengganggu penyelesaian proyek secara keseluruhan.

Tanggal awal Selesainya event dihitung dari event awal (I) hingga event akhir (Z) sebagai berikut:

1) untuk kejadian awal DAN;

2) untuk semua acara lainnya I

Keseimbangan antar industri dapat dikembangkan secara terencana dan periode pelaporan dalam arti alamiah, nilai alamiah dan nilai.

MOB secara fisik (dalam ukuran fisik) hanya mencakup saja spesies yang paling penting produk. Nilai dalam bentuk barang (keseimbangan tipe campuran) mencakup seluruh produk sosial. Keseimbangan nilai mencirikan proses reproduksi dalam istilah moneter.

MOB disajikan sebagai sebuah sistem persamaan linear. MOB adalah tabel yang mencerminkan proses pembentukan dan penggunaan total produk sosial dalam konteks industri. Tabel tersebut menunjukkan struktur biaya produksi setiap produk dan struktur distribusinya dalam perekonomian. Kolom-kolom tersebut mencerminkan komposisi nilai output bruto sektor-sektor ekonomi menurut unsur konsumsi antara dan nilai tambah. Garis tersebut mencerminkan arah penggunaan sumber daya di setiap industri.

V. Leontiev menciptakan metode “input-output” berbasis ilmiah, yang memungkinkan seseorang menganalisis hubungan antarsektoral dalam perekonomian nasional dan menentukan kemungkinan arah untuk mengoptimalkan struktur sektoral.

DI DALAM pandangan umum Model MOB Leontiev memiliki bentuk sebagai berikut:

di mana X adalah volume produksi suatu industri; Y adalah produk akhir industri ini; A adalah matriks koefisien teknologi biaya langsung, aij, yang menunjukkan berapa banyak output industri yang perlu dikeluarkan untuk menghasilkan satu unit output industri.


37. Jenis data dan jenis variabel dalam permasalahan ekonometrik

Saat memodelkan ekonometrik proses ekonomi, jenis data empiris (statistik) berikut digunakan:

a) spasial;

b) sementara.

Data spasial merupakan sekumpulan informasi mengenai objek ekonomi yang berbeda, namun dalam jangka waktu atau titik waktu yang sama. Contoh data tersebut adalah informasi tentang berbagai perusahaan (volume produksi, jumlah karyawan, biaya pokok aset produksi, keuntungan untuk jangka waktu tertentu, dll).

Data sementara adalah sekumpulan informasi yang mencirikan suatu objek yang sama, tetapi dalam periode yang berbeda atau momen dalam waktu. Contoh data tersebut adalah data volume bulanan perputaran kargo di pelabuhan, volume tahunan barang yang diangkut oleh perusahaan pelayaran, rata-rata biaya tahunan pengangkutan satu ton kargo oleh perusahaan pelayaran selama beberapa tahun. .

Variabel-variabel yang terlibat dalam model ekonometrik dibagi menjadi beberapa jenis berikut:

1) variabel eksogen atau independen saat ini (xt), yang nilainya ditetapkan dari luar model saat ini waktu t;

2) variabel endogen atau dependen saat ini (yt), yang nilainya ditentukan dalam model pada waktu tertentu t;

3) variabel tertinggal (eksogen (xt-1, xt-2, dst.) atau endogen (yt-1, yt-2, dst.)), bertanggal ke titik waktu sebelumnya dan berada dalam persamaan dengan variabel saat ini;

4) variabel yang telah ditentukan (penjelas), yang meliputi variabel eksogen saat ini (xt), variabel eksogen tertinggal (xt-1, xt-2, dst), serta variabel endogen tertinggal (yt-1, yt-2 dan lain-lain. )

Setiap model ekonometrik menjelaskan nilai variabel endogen saat ini bergantung pada variabel yang telah ditentukan sebelumnya.


Informasi terkait.


Jadi Dengan demikian, sifat-sifat koefisien determinasi berikut dapat dibedakan:

1. ; Menurut definisi

2. =0; dalam hal ini RSS = 0, yaitu regresi kita tidak menjelaskan, tidak memberikan apa pun dibandingkan dengan perkiraan sepele. Data tersebut memungkinkan kita untuk menyimpulkan bahwa y dan x adalah independen, perubahan variabel x sama sekali tidak mempengaruhi perubahan nilai rata-rata variabel y. Artinya, penyebaran titik-titik pada bidang korelasi relatif terhadap garis regresi yang dibangun meningkat (ketergantungan statistiknya sangat lemah, atau persamaan regresi yang dipilih salah).

3.=1; dalam hal ini semua titik () terletak pada garis lurus yang sama (ESS = 0). Kemudian berdasarkan data yang ada dapat disimpulkan bahwa terdapat hubungan fungsional yaitu linier antara variabel y dan x. Perubahan variabel y dijelaskan sepenuhnya oleh perubahan variabel X. Untuk garis regresi berpasangan, koefisien determinasi sama persis dengan kuadrat koefisien korelasi:

Secara umum, nilai koefisien determinasi tidak menunjukkan ada tidaknya hubungan antar faktor dan seberapa eratnya. Ini hanya berbicara tentang kualitas persamaan yang kami bangun.

Lebih mudah untuk membandingkan koefisien determinasi untuk beberapa persamaan regresi berbeda yang dibangun dari data observasi yang sama. Dari beberapa persamaan, persamaan yang koefisien determinasinya lebih besar lebih baik.

3. Koefisien determinasi disesuaikan

Satu Salah satu sifat koefisien determinasi adalah merupakan fungsi tak menurun dari jumlah faktor yang dimasukkan dalam model. Ini mengikuti dari definisi determinasi. Benar-benar dalam kesetaraan

Pembilangnya tidak bergantung, tetapi penyebutnya bergantung pada banyaknya faktor dalam model. Oleh karena itu, seiring bertambahnya jumlah variabel independen dalam model, koefisien determinasi tidak pernah berkurang. Kemudian jika kita membandingkan dua model regresi dengan variabel terikat yang sama, tetapi nomor yang berbeda faktor, maka akan diperoleh koefisien determinasi yang lebih tinggi pada model dengan jumlah yang besar faktor. Oleh karena itu, koefisien determinasi perlu disesuaikan dengan mempertimbangkan banyaknya faktor yang dimasukkan dalam model.

Koefisien determinasi yang disesuaikan (dikoreksi atau diperkirakan) ditentukan sebagai berikut:

Sifat-sifat koefisien determinasi yang disesuaikan:

1. Sangat mudah untuk melihat bahwa ketika >1, koefisien determinasi terkoreksi lebih kecil dari koefisien determinasi ().

2. , tetapi dapat mengambil nilai negatif. Apalagi jika disesuaikan dengan kebutuhan arti negatif, lalu mengambil nilai mendekati nol ().

Dengan demikian, koefisien determinasi yang disesuaikan merupakan upaya untuk menghilangkan pengaruh yang terkait dengan peningkatan R 2 dengan peningkatan jumlah regressor. - “penalti” untuk menambah jumlah variabel independen.

Koefisien determinasi

Untuk menilai kualitas seleksi fungsi linear(kedekatan letak data sebenarnya dengan garis regresi yang dihitung), kuadrat koefisien korelasi linier, yang disebut koefisien determinasi, dihitung.

Verifikasi dilakukan berdasarkan penelitian koefisien determinasi dan analisis varians.

Model regresi menunjukkan bahwa variasi Y dapat dijelaskan oleh variasi variabel bebas X dan nilai gangguan e. Kita ingin mengetahui seberapa besar variasi Y yang disebabkan oleh perubahan X dan seberapa besar konsekuensinya alasan acak. Dengan kata lain, kita perlu mengetahui seberapa cocok persamaan regresi yang diestimasi dengan data sebenarnya, yaitu. betapa sedikitnya variasi data di sekitar garis regresi.

Untuk menilai derajat kesesuaian garis regresi perlu dihitung koefisien determinasi yang hakikatnya dapat dipahami dengan jelas dengan mempertimbangkan penguraian jumlah total simpangan kuadrat variabel Y dari nilai rata-rata menjadi dua. bagian - "dijelaskan" dan "tidak dijelaskan" (Gbr. 4).

Dari Gambar. 4 jelas bahwa .

Mari kita kuadratkan kedua sisi persamaan ini dan menjumlahkan semuanya Saya dari 1 sampai N.

Mari kita tulis ulang jumlah produk dalam bentuk:

Properti berikut digunakan di sini:

2) metode kuadrat terkecil (LSM) didasarkan pada kondisi:

kondisi yang diperlukan untuk keberadaan fungsi minimum Q adalah persamaan dengan nol turunan parsial pertamanya terhadap b 0 dan b 1 .

.

Atau .

Oleh karena itu.



kamu saya


Gambar 4. Struktur variasi variabel terikat Y

Dengan demikian, hasilnya adalah:

(1)

Jumlah total simpangan kuadrat nilai individu variabel terikat Y dari nilai rata-rata disebabkan oleh pengaruh banyak alasan, yang secara kondisional kita bagi menjadi dua kelompok: faktor X dan faktor lainnya (pengaruh acak). Jika faktor X tidak mempengaruhi hasil (Y), maka garis regresi pada grafik sejajar dengan sumbu absis dan. Kemudian seluruh varians dari variabel terikat Y disebabkan oleh pengaruh faktor lain, dan jumlah total simpangan kuadrat bertepatan dengan jumlah sisa kuadrat. Jika faktor lain tidak mempengaruhi hasil, maka Y berhubungan dengan X secara fungsional, dan jumlah sisa kuadrat adalah nol. Dalam hal ini, jumlah deviasi kuadrat yang dijelaskan oleh regresi sama dengan jumlah kuadrat total.

Mari kita bagi kedua ruas persamaan (1) dengan ruas kiri (dengan jumlah total kuadrat), kita peroleh:

(2)

Proporsi varians variabel terikat yang dijelaskan dengan regresi disebut koefisien determinasi dan ditunjuk R 2 . Dari (2) ditentukan koefisien determinasi:

. (3)

Nilai koefisien determinasi berkisar antara 0 sampai 1 dan menjadi salah satu kriteria untuk memeriksa kualitas model linier. Semakin besar proporsi variasi yang dijelaskan, semakin kecil peran faktor lain; oleh karena itu, model linier mendekati data asli dengan baik, dan dapat digunakan untuk memprediksi nilai karakteristik yang dihasilkan.

koefisien determinasi mengambil nilai dari nol kapan X tidak mempengaruhi Y, hingga kesatuan, ketika perubahan Y sepenuhnya dijelaskan oleh perubahan tersebut X. Dengan demikian, koefisien determinasi mencirikan “kelengkapan” model.

Kelebihan koefisien determinasi: mudah dihitung, intuitif dan mempunyai interpretasi yang jelas. Namun meskipun demikian, penggunaannya terkadang menimbulkan masalah:

· tidak mungkin membandingkan nilai R2 untuk model dengan variabel terikat yang berbeda;

· R 2 selalu meningkat seiring dengan dimasukkannya variabel baru ke dalam model. Properti R 2 ini dapat menciptakan insentif bagi peneliti untuk memasukkan variabel tambahan secara berlebihan ke dalam model, dan dalam hal apa pun akan menjadi masalah untuk menentukan apakah variabel tambahan tersebut meningkatkan kualitas model;

· R 2 tidak banyak berguna untuk menilai kualitas model deret waktu, karena dalam model seperti itu nilainya seringkali mencapai 0,9 dan lebih tinggi; diferensiasi model berdasarkan koefisien yang diberikan adalah tugas yang sulit.

Salah satu masalah yang terdaftar - peningkatan R 2 ketika variabel tambahan dimasukkan ke dalam model - diselesaikan dengan mengoreksi koefisien untuk mengurangi jumlah derajat kebebasan sebagai akibat dari munculnya variabel tambahan dalam model.

Koefisien determinasi yang disesuaikan dihitung seperti ini:

, (4)

Seperti terlihat dari rumusnya, pada penjumlahan variabel hanya akan bertambah jika kenaikan R 2 “melebihi” kenaikan jumlah variabel. Benar-benar,

itu. proporsi varians residual dengan masuknya variabel baru akan berkurang, tetapi dikalikan dengan itu, pada saat yang sama akan meningkat seiring dengan bertambahnya jumlah variabel yang dimasukkan dalam model (p); akibatnya, jika dampak positif dari masuknya faktor-faktor baru “lebih besar daripada” perubahan jumlah derajat kebebasan, maka akan meningkat; jika tidak, mungkin akan berkurang.

Kualitas persamaan (kecukupan model yang dipilih terhadap data empiris) dinilai dengan menggunakan uji F. Inti dari penilaian ini adalah untuk menguji hipotesis nol H 0 tentang tidak signifikannya statistik persamaan regresi dan koefisien determinasi. Untuk melakukan ini, dilakukan perbandingan antara fakta F aktual dan nilai kritis (tabel) F tabel dari kriteria F Fisher:

. (5)

Jika hipotesisnya benar

H 0 : b 0 = b 1 = ... = b p = 0 (atau R 2 benar = 0)

statistik F fakta harus mematuhi distribusi F dengan jumlah derajat kebebasan pembilang dan penyebut masing-masing sama

n 1 = hal dan n 2 = n – hal – 1.

Nilai tabulasi uji-F untuk probabilitas 0,95 (atau 0,99) dan jumlah derajat kebebasan n 1 = p, n 2 = n – p – 1 dibandingkan dengan yang dihitung; bila pertidaksamaan F > F tabel terpenuhi, hipotesis nol bahwa arti sebenarnya koefisien determinasi adalah nol; Hal ini memberikan alasan untuk meyakini bahwa model tersebut memadai untuk proses yang diteliti.

Untuk model berpasangan, dalam kriteria pengujian R2, pembilangnya sesuai dengan satu derajat kebebasan dan (n – 2) derajat kebebasan sesuai dengan penyebutnya. Perhitungan uji F untuk menguji signifikansi R2 dilakukan sebagai berikut:



.

Beralih ke tabel F, kita melihat bahwa nilai tabel pada tingkat signifikansi 5% untuk n 1 = 1 dan n 2 = 50 kira-kira 4. Karena nilai kriteria F yang dihitung lebih besar dari nilai tabel, maka dengan probabilitas keyakinan 0,95 kita menolak hipotesis nol yang menyatakan bahwa nilai sebenarnya dari koefisien determinasi adalah nol.

Dengan demikian, kita dapat menyimpulkan bahwa koefisien determinasi (dan model secara keseluruhan) merupakan indikator yang dapat diandalkan secara statistik dari hubungan antara indeks saham yang dipertimbangkan.

Akar pangkat dua dari nilai koefisien determinasi untuk model berpasangan adalah koefisien korelasi– indikator kedekatan koneksi.

Tahap ketiga - memeriksa kelayakan premis dasar regresi klasik - adalah subjek studi lebih lanjut.

Untuk Analisis terhadap kualitas estimasi regresi linier secara keseluruhan biasanya menggunakan koefisien determinasi yang disebut juga kuadrat koefisien korelasi berganda. Untuk kasus regresi berpasangan, ini adalah kuadrat koefisien korelasi variabel dan.

Koefisien determinasi dihitung dengan menggunakan rumus:

jumlah sisa regresi kuadrat

Nilai aktual dan terhitung dari variabel yang dijelaskan.

Jumlah total kuadrat.

Ini mencirikan proporsi variasi (penyebaran) dalam variabel terikat yang dijelaskan menggunakan persamaan yang diberikan. Ukuran penyebaran suatu variabel terikat biasanya adalah variansnya, dan variasi residu dapat diukur sebagai varians dari deviasi di sekitar garis regresi. Jika pembilang dan penyebut pecahan yang dikurangkan dari kesatuan dibagi dengan jumlah observasi n, kita memperoleh estimasi sampel varians sisa dan varians variabel terikat masing-masing. Rasio varians sisa dan total mewakili proporsi varians yang tidak dapat dijelaskan. Jika kita mengurangkan bagian ini dari kesatuan, kita memperoleh bagian varians dalam variabel terikat. Dijelaskan menggunakan regresi. Kadang-kadang, ketika menghitung koefisien determinasi, untuk mendapatkan perkiraan yang tidak bias dari varians pembilang dan penyebut pecahan yang dikurangkan dari kesatuan, koreksi dilakukan untuk jumlah derajat kebebasan: maka

Atau, untuk regresi berpasangan, yang jumlah variabel independennya adalah 1,

Pembilang pecahan yang dikurangkan dari kesatuan adalah jumlah kuadrat simpangan pengamatan dari garis regresi, dan penyebutnya dari nilai rata-rata variabel. Jadi, pecahannya kecil (dan koefisiennya jelas mendekati satu) jika penyebaran titik-titik di sekitar garis regresi jauh lebih kecil daripada di sekitar nilai rata-rata.

Metode kuadrat terkecil (LSM) memungkinkan Anda menemukan garis yang jumlahnya minimal, dan mewakili salah satu kemungkinan garis yang kondisinya terpenuhi. Oleh karena itu, nilai pembilang pecahan yang dikurangkan satu lebih kecil dari nilai penyebutnya, sebaliknya garis regresi yang dipilih dengan metode kuadrat terkecil adalah garis lurus.

Jadi, koefisien determinasi adalah ukuran yang memungkinkan kita menentukan sejauh mana garis regresi yang ditemukan memberikan hasil terbaik untuk menjelaskan perilaku variabel dependen dari sekedar garis horizontal.

Arti dari koefisien determinasi dapat dijelaskan sedikit berbeda. Hal ini dapat ditunjukkan bahwa

dimana adalah deviasi titik ke-th pada garis regresi.

Dalam rumus ini, nilai di sebelah kiri dapat diartikan sebagai ukuran penyebaran keseluruhan (variasi) variabel, suku pertama di sebelah kanan dapat diartikan sebagai ukuran sisa, penyebaran yang tidak dapat dijelaskan (penyebaran titik di sekitar garis regresi). Jika kita membagi rumus ini dengan ruas kirinya dan menyusun ulang suku-sukunya, maka

Artinya, koefisien determinasi adalah proporsi bagian varians yang dijelaskan dari variabel terikat (atau proporsi varians yang dijelaskan, jika pembilang dan penyebutnya dibagi dengan dan ().

Koefisien determinasi sering diilustrasikan sebagai berikut (Gbr. 1)

Gambar 1 Ilustrasi koefisien determinasi

Disini TSS (Total Sum of Squares) adalah total penyebaran variabel, ESS (Explained Sum of Squares) adalah penyebaran yang dijelaskan dengan menggunakan regresi, USS (Unexplained Sum of Squares) adalah penyebaran yang tidak dapat dijelaskan dengan menggunakan regresi. Gambar tersebut menunjukkan bahwa dengan peningkatan bagian penyebaran yang dijelaskan, koefisiennya mendekati satu. Selain itu, gambar tersebut menunjukkan bahwa dengan penambahan satu variabel lagi biasanya meningkat, tetapi jika variabel-variabel penjelas tersebut berkorelasi tinggi satu sama lain, maka variabel-variabel tersebut menjelaskan bagian varians variabel yang sama, dalam hal ini sulit untuk dijelaskan. mengidentifikasi kontribusi masing-masing variabel dalam menjelaskan perilaku.

Jika terdapat hubungan linier yang signifikan secara statistik antara nilai dan, maka koefisiennya mendekati satu.

Namun, hal ini mungkin mendekati kesatuan hanya karena fakta bahwa kedua besaran ini mempunyai tren waktu yang jelas dan tidak terkait dengan saling ketergantungan sebab-akibatnya.

Dalam ilmu ekonomi, indikator volumetrik (pendapatan, konsumsi, investasi) biasanya memiliki tren seperti itu, namun indikator tempo dan indikator relatif (produktivitas, tingkat pertumbuhan, pembagian, rasio) tidak selalu demikian. Oleh karena itu, ketika memperkirakan regresi linier menggunakan indikator volumetrik deret waktu (misalnya, ketergantungan output pada input sumber daya atau volume konsumsi terhadap pendapatan), nilainya biasanya sangat mendekati kesatuan. Hal ini menunjukkan bahwa variabel terikat tidak dapat digambarkan hanya sebagai sama dengan rata-ratanya, namun hal ini sudah jelas karena mempunyai tren waktu.

Jika yang ada bukan deret waktu, melainkan sampel cross-sectional, yaitu data objek-objek yang sejenis pada titik waktu yang sama, maka untuk persamaan regresi linier yang diestimasi darinya, nilainya biasanya tidak melebihi tingkat 0,6 - 0,7.

Hal yang sama biasanya berlaku untuk regresi deret waktu jika tidak memiliki tren yang jelas. Dalam ilmu ekonomi makro, contoh ketergantungan tersebut adalah hubungan antara indikator relatif, spesifik, dan tingkat: ketergantungan tingkat inflasi pada tingkat pengangguran, tingkat akumulasi pada nilai suku bunga, tingkat pertumbuhan output dari tingkat pertumbuhan input sumber daya.

Oleh karena itu, dalam membangun model makroekonomi, terutama berdasarkan data deret waktu, perlu diperhatikan apakah variabel-variabel yang termasuk di dalamnya bersifat volumetrik atau relatif, dan apakah mempunyai tren waktu.

Tidak mungkin untuk menunjukkan batas pasti penerimaan indikator untuk semua kasus sekaligus. Penting untuk memperhitungkan jumlah derajat kebebasan persamaan, keberadaan tren dalam variabel, dan interpretasi persamaan yang bermakna. Indikatornya bahkan mungkin negatif. Biasanya, hal ini terjadi dalam persamaan tanpa suku bebas

Persamaan seperti itu diperkirakan, seperti dalam kasus umum, dengan menggunakan metode kuadrat terkecil. Namun, rangkaian pilihannya menyempit secara signifikan: tidak semua kemungkinan garis atau hyperplanes dipertimbangkan, namun hanya garis atau hyperplane yang melewati titik asal koordinat. Nilainya menjadi negatif jika penyebaran nilai variabel terikat di sekitar garis lurus (hyperplane) lebih kecil daripada di sekitar garis lurus terbaik (hyperplane) yang melalui titik asal. Nilai negatif dalam persamaan menunjukkan perlunya memasukkan suku bebas ke dalamnya. Situasi ini diilustrasikan pada Gambar. 2.

Gambar 2 Ilustrasi memasukkan suku bebas ke dalam persamaan

Garis 1 di atasnya merupakan grafik persamaan regresi tanpa suku bebas (melewati titik asal), garis 2 dengan suku bebas (sama), garis 3 - . Garis horizontal 3 memberikan jumlah deviasi kuadrat yang jauh lebih kecil daripada garis 1, dan oleh karena itu untuk garis 1 koefisien determinasinya akan negatif.

Mengoreksi jumlah derajat kebebasan selalu mengurangi nilai karena. Akibatnya bisa juga menjadi negatif. Namun ini berarti sebelum penyesuaian ini mendekati nol, dan proporsi varians pada variabel dependen yang dijelaskan oleh persamaan regresi sangat kecil.

Koefisien determinasi.

Analisisnya dilakukan misalnya dengan menggunakan koefisien determinasi

Alternatif ukuran derajat ketergantungan antara dua variabel adalah koefisien determinasi, yaitu koefisien korelasi kuadrat (r2). Koefisien determinasi dinyatakan dalam persentase dan mencerminkan besarnya perubahan indikator efektif (y) akibat perubahan variabel lain – indikator faktor (x).

Berdasarkan hasil contoh kita di atas, koefisien determinasinya adalah r = 0,471 b2 = 0,2224 = 22,24%. Artinya, lebih dari 22% perubahan pendapatan penjualan disebabkan oleh perubahan biaya iklan.

Tentukan koefisien determinasi menurut kondisi pengujian 1. Interpretasikan besarnya koefisien tersebut.

Dalam hal sulit untuk membenarkan bentuk ketergantungan, pemecahan masalah dapat dilakukan dengan menggunakan model yang berbeda dan hasil yang diperoleh dapat dibandingkan. Kecukupan model yang berbeda terhadap ketergantungan aktual diperiksa menggunakan kriteria Fisher, kesalahan perkiraan rata-rata dan nilai koefisien determinasi berganda, yang akan dibahas nanti (lihat 7.4).

Koefisien determinasi model, sama dengan kuadrat koefisien korelasi berganda tereduksi, adalah 99,31%; kesalahan standar model adalah 4415 ribu rubel, / statistik Fisher - 4,415, dan tingkat signifikansi hipotesis tentang tidak adanya koneksi kurang dari 0,01%.

Ekspresi ini sesuai dengan ekspresi m)2 (lihat rumus (8.2)). Identitas koefisien determinasi dan kuadrat hubungan korelasi menjadi dasar untuk menginterpretasikan nilai r2l sebagai proporsi total varians dari karakteristik resultan y, yang dijelaskan oleh variasi faktor-faktor x (dan hubungan antara variasi kedua sifat tersebut). Padahal, indikator utama keeratan hubungan adalah koefisien determinasi

Koefisien determinasi r2 = 71,3% yaitu variasi umur pasangan bergantung sebesar 71% pada variasi umur separuh lainnya. Koneksinya sangat dekat.

Karena r 2 merupakan analog dari koefisien determinasi, kita dapat menyimpulkan bahwa 42,2% variasi harga susu di total 136 perusahaan dikaitkan dengan variasi produktivitas sapi (dan dengan faktor-faktor yang bervariasi sesuai dengan produktivitas sesuai dengan reservasi yang dibuat sebelumnya tentang interpretasi hubungan berpasangan) .

Di sini Ry2 adalah koefisien determinasi persamaan dengan semua k faktor. Pembilang (8.43) adalah bagian variasi y yang dijelaskan tambahan jika faktor xm dimasukkan ke dalam persamaan setelah semua faktor lainnya. Dalam contoh kita, dengan menggunakan nilai yang dihitung sebelumnya R2 = 0,5765, ketika faktor x3 dimasukkan dalam analisis, kita memperoleh

Namun, kelemahan terbesar dari metode penguraian R2 ini adalah ketergantungan nilai p2 pada urutan penyertaan faktor yang diterima dalam persamaan regresi. Faktor pertama yang disertakan mengambil bagian terbesar dari efek sistem, dan faktor terakhir hanya mengambil bagian yang tidak signifikan. Misalnya kita menata ulang faktor dc dan xe, serta menghitung koefisien determinasi dua faktor /Z2 x = 0,8035 dengan menggunakan rumus berulang, maka akan diperoleh hasil yang berbeda dari sebelumnya.

Tanda-faktornya harus mempunyai hubungan sebab akibat dengan tanda yang ditimbulkannya (konsekuensi). Oleh karena itu, tidak dapat diterima, misalnya, memasukkan koefisien profitabilitas sebagai salah satu faktor Xj ke dalam model biaya, meskipun penyertaan faktor tersebut secara signifikan meningkatkan koefisien determinasi.

Prinsip kesederhanaan lebih disukai daripada model dengan jumlah faktor yang lebih sedikit dengan koefisien determinasi yang sama atau bahkan dengan koefisien yang sedikit lebih kecil.

Kelebihan maksimum yang mungkin terjadi adalah jika tidak ada kombinasi heterogen yaitu Ab dan Ba. Yaitu 140 + 80 + 230 = 450. Indikator kedekatan hubungan tersebut adalah rasio surplus aktual terhadap surplus marjinal 140.450 = 0,311. Seperti yang bisa kita lihat, indikator ini dekat dengan koefisien asosiasi, tetapi memiliki interpretasi yang sangat logis dan jelas; hubungannya adalah 0,311 atau 31,1% dari fungsi maksimum yang mungkin. Indikator ini bukan analog dari koefisien korelasi, melainkan koefisien determinasi. Oleh karena itu sah untuk ditetapkan sebagai R2 atau r 2. Bentuknya

Koefisien determinasi r2 sama dengan 0,88 atau 88% fluktuasi harga kentang berhubungan dengan fluktuasi hasil. Hanya tiga hasil kali deviasi mg yy yang positif, dan yang terkecil juga.

Melakukan analisis unit per unit dengan menggunakan persamaan regresi biasanya didasarkan pada penguraian besarnya deviasi dari rata-rata keseluruhan (y, - y) menjadi dua komponen (y, - y) dan (y, - y,). Jika persamaan regresi mencakup semua faktor penting dan signifikan yang menjadi sandaran nilai karakteristik yang dihasilkan, dan koefisien determinasi mendekati satu, maka faktor-faktor lain yang tidak termasuk dalam persamaan tersebut mencirikan ciri-ciri individu yang tidak penting, yang seringkali tidak memiliki ekspresi kuantitatif. Dalam hal ini, selisih (y, - y/) terbentuk karena ketidaksesuaian antara intensitas dampak terhadap y dari semua faktor yang diperhitungkan dalam kondisi unit ke-i tertentu dan intensitas rata-rata dampaknya, dinyatakan dalam nilai koefisien regresi yang termasuk dalam nilai perhitungan yf. Hal ini memberikan hak untuk menafsirkan selisih (y, -y) atau rasio y/y sebagai indikator bagaimana efisiensi penggunaan faktor-faktor yang diperhitungkan dalam satuan y/-y berkorelasi dengan efisiensi rata-rata penggunaannya. Selisih (y, - y) timbul karena adanya perbedaan nilai faktor-faktor yang diperhitungkan untuk suatu unit-i tertentu dan rata-rata populasi. Dekomposisi ini memungkinkan untuk mengidentifikasi cadangan yang tersedia untuk setiap unit dalam hal efisiensi penggunaan faktor dan tingkatnya.

Mengingat nilai koefisien determinasi yang dilaporkan dan dasar yang relatif rendah (/ 0 = 0,8] 54, r2, = 0,7974), perbedaan antara nilai aktual dan nilai yang dihitung (V, - V) tidak hanya menunjukkan perbedaan dalam efisiensi penggunaan faktor yang diperhitungkan - ketebalan reservoir - di tambang tertentu dibandingkan dengan efisiensi rata-rata kepercayaan, tetapi juga pengaruh faktor-faktor yang tidak diperhitungkan dalam persamaan regresi.

I Metode ketiga dalam membangun saham rata-rata multidimensi tidak memerlukan keterlibatan penilaian ahli subjektif - hanya informasi yang terkandung dalam saham asli yang digunakan. Fitur yang memiliki koefisien determinasi bagian lebih tinggi dengan seluruh fitur lainnya dianggap lebih informatif, sehingga lebih signifikan. Setelah menghitung koefisien determinasi berpasangan dan rata-rata, kami mengambil yang lebih kecil sebagai satu (satu poin) dan memperoleh skor untuk karakteristik lain sebagai rasio koefisien determinasi rata-ratanya terhadap yang lebih kecil (lihat Tabel 11.9).

Setelah memilih jenis persamaan dan menghitung parameternya, fungsi yang dipilih harus diperiksa kecukupannya. Inti dari tahap ini adalah apakah fungsi yang dipilih cukup mencirikan perkembangan fenomena ekonomi yang diteliti dan apakah ada faktor di antara faktor-faktor tersebut yang dapat dikecualikan karena tidak signifikannya kajian fenomena tersebut. Koefisien determinasi dan kriteria Fisher digunakan untuk penelitian ini.

Tampilan