Multikollinearlikning mavjudligini aniqlash. Multikollinearlikning ta'rifi Umumiy ma'noda multikollinearlikning nazariy ta'siri

Ko'p regressiya tenglamasini qurishda omillarning multikollinearligi muammosi paydo bo'lishi mumkin. Multikollinearlik funktsional (aniq) yoki stokastik (yashirin) shaklda namoyon bo'lishi mumkin bo'lgan ikki yoki undan ortiq tushuntirish o'zgaruvchilari o'rtasidagi chiziqli munosabatdir.
Tanlangan xususiyatlar o'rtasidagi bog'liqlikni aniqlash va bog'lanishning yaqinligini miqdoriy baholash korrelyatsion tahlil usullari yordamida amalga oshiriladi. Bu masalalarni yechish uchun avvalo, , baholanadi, so’ngra uning asosida qisman va ko’p korrelyatsiya va determinatsiya koeffitsientlari aniqlanadi va ularning ahamiyati tekshiriladi. Korrelyatsiya tahlilining yakuniy maqsadi regressiya tenglamasini keyingi qurish uchun x 1, x 2,…, x m omil xarakteristikalarini tanlashdir.

Agar omil o'zgaruvchilari qat'iy funktsional bog'liqlik bilan bog'langan bo'lsa, unda biz gaplashamiz to'liq multikollinearlik. Bunday holda, omil o'zgaruvchilari matritsasi ustunlari orasida X chiziqli bog'liq ustunlar mavjud va matritsa determinantlari xususiyatiga ko'ra, det(X T X) = 0, ya'ni matritsa (X T X) birlikdir, ya'ni teskari matritsa yo'q. OLS smetalarini tuzishda (X T X) -1 matritsasidan foydalaniladi. Shunday qilib, to'liq multikollinearlik bizga dastlabki regressiya modelining parametrlarini bir ma'noda baholashga imkon bermaydi.

Modelga kiritilgan omillarning multikollinearligi qanday qiyinchiliklarga olib keladi va ularni qanday hal qilish mumkin?

Multikollinearlik istalmagan oqibatlarga olib kelishi mumkin:

parametrlarni baholash ishonchsiz bo'lib qoladi. Ular katta standart xatolarni topadilar. Kuzatishlar hajmining o'zgarishi bilan hisob-kitoblar o'zgaradi (nafaqat kattalikda, balki belgida ham), bu modelni tahlil qilish va prognozlash uchun yaroqsiz holga keltiradi.
bir nechta regressiya parametrlarini omillar ta'sirining "sof" ko'rinishdagi xususiyatlari sifatida izohlash qiyinlashadi, chunki omillar o'zaro bog'liqdir; chiziqli regressiya parametrlari iqtisodiy ma'nosini yo'qotadi;
Faktorlarning ishlash ko'rsatkichiga alohida ta'sirini aniqlash imkonsiz bo'lib qoladi.

Faktor o'zgaruvchilari qandaydir stokastik bog'liqlik bilan bog'langan multikollinearlik turi deyiladi qisman. Agar omil o'zgaruvchilari o'rtasida yuqori darajadagi korrelyatsiya mavjud bo'lsa, u holda matritsa (X T X) degeneratsiyaga yaqin, ya'ni det(X T X) ≈ 0.
(X T X) -1 matritsasi yomon sharoitda bo'ladi, bu OLS baholarining beqarorligiga olib keladi. Qisman multikollinearlik quyidagi oqibatlarga olib keladi:

parametr baholarining tafovutlarining oshishi intervalli baholarni kengaytiradi va ularning aniqligini yomonlashtiradi;
pasayish t-koeffitsientlar statistikasi omillarning ahamiyati haqida noto'g'ri xulosalar chiqarishga olib keladi;
OLS baholarining beqarorligi va ularning farqlari.

Qisman multikollinearlikni aniqlash uchun aniq miqdoriy mezonlar mavjud emas. Multikollinearlikning mavjudligi matritsa determinantining (X T X) nolga yaqinligi bilan ko'rsatilishi mumkin. Juftlik korrelyatsiya koeffitsientlarining qiymatlari ham tekshiriladi. Agar interfaktor korrelyatsiya matritsasining determinanti birga yaqin bo'lsa, unda multikollinearlik yo'q.

Kuchli interfaktor korrelyatsiyasini yengish uchun turli yondashuvlar mavjud. Ulardan eng oddiyi model sifatiga arzimas darajada zarar yetkazish sharti bilan multikollinearlik uchun eng mas’ul bo‘lgan omilni (yoki omillarni) modeldan chiqarib tashlash (ya’ni, nazariy aniqlash koeffitsienti -R 2 y(x1...xm). ) sezilarli darajada kamayadi).

Multikollinearlikni yo'q qilish uchun qanday chorani qo'llash mumkin emas?
a) namuna hajmini oshirish;
b) boshqalar bilan yuqori korrelyatsiyaga ega bo'lgan o'zgaruvchilar bundan mustasno;
c) model spetsifikatsiyasining o'zgarishi;
d) tasodifiy komponentning transformatsiyasi.

Juftlangan (chiziqli) va qisman korrelyatsiya koeffitsientlari

Masalan, qiymatlar namunasi (x i, y i), i=1,n, (1) uchun x va y o‘zgaruvchilari orasidagi bog‘lanishning yaqinligi
bu erda x va y o'rtacha qiymatlar, S x va S y mos keladigan namunalarning standart og'ishlari.

Juftlik korrelyatsiya koeffitsienti -1 dan +1 gacha o'zgarib turadi. U mutlaq qiymatda birlikka qanchalik yaqin bo'lsa, x va y o'rtasidagi statistik bog'lanish chiziqli funksionalga shunchalik yaqin bo'ladi. Koeffitsientning ijobiy qiymati xarakteristikalar o'rtasidagi bog'liqlik to'g'ridan-to'g'ri ekanligini ko'rsatadi (x ortsa, y qiymati ortadi), manfiy qiymat bu bog'liqlikning teskari ekanligini ko'rsatadi (x oshgani sayin y qiymati kamayadi).
Korrelyatsiya koeffitsientining mumkin bo'lgan qiymatlarini quyidagi sifatli talqin qilishimiz mumkin: agar |r|<0.3 – связь практически отсутствует; 0.3≤ |r| < 0.7 - связь средняя; 0.7≤ |r| < 0.9 – связь сильная; 0.9≤ |r| < 0.99 – связь весьма сильная.
Omillarning multikollinearligini baholash uchun x 1, x 2,…, x m omilli xarakteristikalar bilan bog'liq (natijaviy) xarakteristikaning juft korrelyatsiya koeffitsientlari matritsasidan foydalaning, bu esa har bir omil x j ning ta'sir darajasini baholash imkonini beradi. y bog'liq o'zgaruvchisi, shuningdek, omillar o'rtasidagi munosabatlarning yaqinligi. Umumiy holatda korrelyatsiya matritsasi shaklga ega
.
Matritsa nosimmetrik, uning diagonalida ham bor. Agar matritsada interfaktor korrelyatsiya koeffitsienti r xjxi >0,7 bo'lsa, bu ko'p regressiya modelida multikollinearlik mavjud.
Xususiyatlarning o'zaro bog'liqligi o'rnatiladigan manba ma'lumotlari ma'lum bir umumiy populyatsiyadan olingan namuna bo'lganligi sababli, ushbu ma'lumotlardan hisoblangan korrelyatsiya koeffitsientlari tanlangan bo'ladi, ya'ni ular faqat munosabatni baholaydi. Savolga javob beradigan muhimlik testi kerak: olingan hisoblash natijalari tasodifmi yoki yo'qmi?
Juftlik korrelyatsiya koeffitsientlarining ahamiyati tomonidan tekshiring t- Talaba t testi. Umumiy korrelyatsiya koeffitsienti nolga teng degan gipoteza ilgari suriladi: H 0: r = 0. Keyin parametrlar o'rnatiladi: ahamiyatlilik darajasi a va erkinlik darajalari soni v = n-2. Ushbu parametrlar yordamida tcr talabalar taqsimotining kritik nuqtalari jadvalidan topiladi va mavjud ma'lumotlardan hisoblanadi. Kuzatilgan mezon qiymati:
, (2)
bu erda r - tadqiqot uchun tanlangan ma'lumotlardan hisoblangan juft korrelyatsiya koeffitsienti. Juftlangan korrelyatsiya koeffitsienti muhim hisoblanadi (koeffitsient nolga teng degan gipoteza rad etiladi) g = 1- a ishonch ehtimoli bilan, agar t Obs moduli t kritdan katta bo'lsa.
Agar o'zgaruvchilar bir-biri bilan korrelyatsiya qilingan bo'lsa, u holda korrelyatsiya koeffitsienti qiymatiga boshqa o'zgaruvchilar ta'siri qisman ta'sir qiladi.

Qisman korrelyatsiya koeffitsienti boshqa omillar ta'sirini bartaraf etishda natija va tegishli omil o'rtasidagi chiziqli munosabatlarning yaqinligini tavsiflaydi. Qisman korrelyatsiya koeffitsienti boshqa omillarning belgilangan qiymati bilan ikki o'zgaruvchi o'rtasidagi munosabatlarning yaqinligini baholaydi. Agar u hisoblansa, masalan, r yx 1| x2 (x 2 ning qat'iy ta'siri bilan y va x 1 o'rtasidagi qisman korrelyatsiya koeffitsienti), bu y va x 1 o'rtasidagi chiziqli munosabatlarning miqdoriy o'lchovi aniqlanganligini anglatadi, agar x 2 ning ushbu xususiyatlarga ta'siri bo'lsa, sodir bo'ladi. bartaraf etildi. Agar faqat bitta omilning ta'siri chiqarib tashlansa, biz olamiz qisman birinchi tartibli korrelyatsiya koeffitsienti.
Juftlangan va qisman korrelyatsiya koeffitsientlarining qiymatlarini taqqoslash belgilangan omilning ta'sir yo'nalishini ko'rsatadi. Agar qisman korrelyatsiya koeffitsienti r yx 1| bo'lsa x2 mos keladigan r yx 1 juftlik koeffitsientidan kichik bo'ladi, ya'ni y va x 1 xarakteristikalari o'rtasidagi bog'liqlik ma'lum darajada x 2 qo'zg'almas o'zgaruvchining ularga ta'siri bilan belgilanadi. Aksincha, qisman koeffitsientning juftlik koeffitsientiga nisbatan kattaroq qiymati sobit o'zgaruvchi x 2 o'z ta'siri bilan y va x 1 o'rtasidagi munosabatlarni zaiflashtirishini ko'rsatadi.
Bitta omil (x 1) ta'sirini hisobga olmaganda, ikkita o'zgaruvchi (y va x 2) o'rtasidagi qisman korrelyatsiya koeffitsientini quyidagi formula yordamida hisoblash mumkin:
. (3)
Boshqa o'zgaruvchilar uchun formulalar xuddi shunday tarzda tuzilgan. Ruxsat etilgan x 2 da
;
belgilangan x 3 da
.
Qisman korrelyatsiya koeffitsientlarining ahamiyati juft korrelyatsiya koeffitsientlari holatiga o'xshash tarzda tekshiriladi. Faqatgina farq erkinlik darajalari soni bo'lib, u v = n – l -2 ga teng olinishi kerak, bu erda l - sobit omillar soni.

Bosqichli regressiya

Ko'p regressiya modeliga kiritilgan x 1, x 2, …, x m omillarni tanlash ekonometrik modellashtirishning eng muhim bosqichlaridan biridir. Modelga omillarni ketma-ket (bosqichma-bosqich) kiritish (yoki chiqarib tashlash) usuli sizga mumkin bo'lgan o'zgaruvchilar to'plamidan model sifatini oshiradiganlarni tanlash imkonini beradi.
Usulni amalga oshirishda birinchi qadam korrelyatsiya matritsasini hisoblashdir. Juftlik korrelyatsiya koeffitsientlari asosida kollinear omillar mavjudligi aniqlanadi. Agar r xjxi >0,7 bo'lsa, x i va x j omillar kollinear hisoblanadi. Modelga o'zaro bog'liq omillardan faqat bittasi kiritilgan. Agar omillar orasida kollinear omillar bo'lmasa, unda sezilarli ta'sir ko'rsatadigan har qanday omillar y.

Ikkinchi bosqichda hosil bo'lgan atribut bilan juft korrelyatsiya koeffitsientining maksimal mutlaq qiymatiga ega bo'lgan bitta o'zgaruvchi bilan regressiya tenglamasi tuziladi.

Uchinchi bosqichda modelga yangi o'zgaruvchi kiritiladi, u ilgari kiritilgan o'zgaruvchining qat'iy ta'siri bilan bog'liq o'zgaruvchi bilan qisman korrelyatsiya koeffitsientining eng katta mutlaq qiymatiga ega.
Modelga qo'shimcha omil kiritilganda aniqlanish koeffitsienti ortishi va qoldiq dispersiya kamayishi kerak. Agar bu sodir bo'lmasa, ya'ni ko'p martalik aniqlash koeffitsienti biroz oshsa, unda yangi omilni kiritish nomaqbul hisoblanadi.

Misol № 1. Viloyatdagi 20 ta korxona uchun bir xodimga to'g'ri keladigan mahsulotning y (ming rubl) umumiy ishchilar sonidagi yuqori malakali ishchilar ulushiga bog'liqligi x1 (yil oxiridagi aktivlar qiymatining %) va foydalanishga topshirilishi. yangi asosiy vositalarning x2 (%) o'rganiladi. .

Y	X1	X2
6	10	3,5
6	12	3,6
7	15	3,9
7	17	4,1
7	18	4,2
8	19	4,5
8	19	5,3
9	20	5,3
9	20	5,6
10	21	6
10	21	6,3
11	22	6,4
11	23	7
12	25	7,5
12	28	7,9
13	30	8,2
13	31	8,4
14	31	8,6
14	35	9,5
15	36	10

Majburiy:

Bir ishchiga to'g'ri keladigan mahsulot va yuqori malakali ishchilar ulushi o'rtasidagi korrelyatsiya maydonini yarating. X1 va Y ko'rsatkichlari o'rtasidagi yaqinlik va bog'liqlik turi haqida gipotezani ilgari suring.
Ishonchliligi 0,9 bo'lgan yuqori malakali ishchilar ulushi va bir ishchiga to'g'ri keladigan ishlab chiqarish o'rtasidagi chiziqli munosabatlarning yaqinligini baholang.
Bir ishchiga to'g'ri keladigan mahsulotning yuqori malakali ishchilar ulushiga bog'liqligi uchun chiziqli regressiya tenglamasining koeffitsientlarini hisoblang.
Ishonchliligi 0,9 bo'lgan regressiya tenglamasi parametrlarining statistik ahamiyatini tekshiring va ular uchun ishonch oraliqlarini tuzing.
Determinatsiya koeffitsientini hisoblang. Fisherning F testidan foydalanib, 0,9 ishonchliligi bilan regressiya tenglamasining statistik ahamiyatini baholang.
Ishchilarning 24% yuqori malakaga ega bo'lgan korxona uchun har bir xodim uchun 0,9 mahsulot ishonchliligi bilan ball va intervalli prognozni bering.
Chiziqli ko'p regressiya tenglamasining koeffitsientlarini hisoblang va uning parametrlarining iqtisodiy ma'nosini tushuntiring.
Ishonchliligi 0,9 bo'lgan bir nechta tenglama koeffitsientlarining statistik ahamiyatini tahlil qiling va ular uchun ishonch oraliqlarini tuzing.
Juftlik va qisman korrelyatsiya koeffitsientlarini toping. Ularni tahlil qiling.
Ko'p martalik aniqlashning moslashtirilgan koeffitsientini toping. Uni tuzatilmagan (umumiy) aniqlash koeffitsienti bilan solishtiring.
Fisherning F testidan foydalanib, 0,9 ishonchliligi bilan regressiya tenglamasining adekvatligini baholang.
Ishchilarning 24% yuqori malakali, yangi asosiy vositalarni ishga tushirish esa 5% bo'lgan korxona uchun har bir xodimga 0,9 ishlab chiqarish ishonchliligi bilan ball va intervalli prognozni bering.
Tuzilgan tenglamani multikollinearlik mavjudligini quyidagidan foydalanib tekshiring: Talaba testi; ch2 testi. Natijalarni solishtiring.

Yechim Biz buni kalkulyator yordamida qilamiz. Quyida 13-bandga yechimning borishi keltirilgan.
R juft korrelyatsiya koeffitsientlari matritsasi:

-	y	x 1	x 2
y	1	0.97	0.991
x 1	0.97	1	0.977
x 2	0.991	0.977	1

Multikollinearlik mavjud bo'lganda, korrelyatsiya matritsasi determinanti nolga yaqin bo'ladi. Bizning misolimiz uchun: det = 0,00081158, bu kuchli multikollinearlik mavjudligini ko'rsatadi.
Eng muhim omillarni tanlash uchun x i, quyidagi shartlar hisobga olinadi:
- natijaviy xususiyat va omil o'rtasidagi bog'liqlik interfaktor aloqasidan yuqori bo'lishi kerak;
- omillar o'rtasidagi bog'liqlik 0,7 dan oshmasligi kerak. Agar matritsada interfaktor korrelyatsiya koeffitsienti r xjxi > 0,7 bo'lsa, bu ko'p regressiya modelida multikollinearlik mavjud.;
- xarakteristikaning yuqori interfaktor aloqasi bilan ular orasidagi korrelyatsiya koeffitsienti past bo'lgan omillar tanlanadi.
Bizning holatda, r x 1 x 2 |r|>0,7 ga ega, bu omillarning multikollinearligini va ulardan birini keyingi tahlildan chiqarib tashlash zarurligini ko'rsatadi.
Ushbu matritsaning birinchi qatorini tahlil qilish ko'p korrelyatsiya modeliga kiritilishi mumkin bo'lgan omil xususiyatlarini tanlash imkonini beradi. |r yxi | uchun omil xarakteristikalari 0,3 - deyarli hech qanday aloqa yo'q; 0,3 ≤ |r| ≤ 0,7 - o'rtacha ulanish; 0,7 ≤ |r| ≤ 0,9 - kuchli ulanish; |r| > 0,9 - ulanish juda kuchli.
Olingan juft korrelyatsiya koeffitsientlarining ahamiyatini Student t-testi yordamida tekshiramiz. T-statistik modulning qiymatlari topilgan kritik qiymatdan katta bo'lgan koeffitsientlar muhim hisoblanadi.
r yx 1 uchun t-statistikaning kuzatilgan qiymatlarini formuladan foydalanib hisoblaylik:

bu erda m = 1 - regressiya tenglamasidagi omillar soni.

Talabalar jadvalidan foydalanib, biz Tjadvalni topamiz
t krit (n-m-1;a/2) = (18;0,025) = 2,101
t obs > t krit ekan, korrelyatsiya koeffitsienti 0 ga teng degan gipotezani rad qilamiz. Boshqacha qilib aytganda, korrelyatsiya koeffitsienti statistik ahamiyatga ega
r yx 2 uchun t-statistikaning kuzatilgan qiymatlarini formuladan foydalanib hisoblaymiz:

t obs > t krit ekan, korrelyatsiya koeffitsienti 0 ga teng degan gipotezani rad qilamiz. Boshqacha qilib aytganda, korrelyatsiya koeffitsienti statistik ahamiyatga ega
Shunday qilib, (y va x x 1), (y va x x 2) o'rtasidagi bog'liqlik muhim ahamiyatga ega.
X2 omili (r = 0,99) samarali atributga eng katta ta'sir ko'rsatadi, ya'ni modelni qurishda u regressiya tenglamasiga birinchi bo'lib kiradi.
Multikollinearlikni sinash va yo'q qilish.
Multikollinearlikni o'rganishning eng to'liq algoritmi Farrar-Glober algoritmidir. U uchta turdagi multikollinearlikni tekshiradi:
1. Barcha omillar (ch 2 - chi-kvadrat).
2. Har bir omil boshqalar bilan (Fisher mezoni).
3. Har bir juft omil (Talabaning t-testi).
Farrar-Glouber usuli yordamida birinchi turdagi statistik mezonlardan (xi-kvadrat testi) foydalanib, o'zgaruvchilarni multikollinearlik uchun tekshiramiz.
Farrar-Glouber statistikasining qiymatini hisoblash formulasi:
ch 2 = -ln(det[R])
Bu erda m = 2 - omillar soni, n = 20 - kuzatishlar soni, det[R] - juftlashgan korrelyatsiya koeffitsientlari R matritsasining aniqlovchisi.
Biz uni jadval qiymati bilan v = m/2(m-1) = 1 erkinlik darajasi va ahamiyatlilik darajasi a bilan solishtiramiz. Agar ch 2 > ch 2-jadval bo'lsa, u holda omillar vektorida multikollinearlik mavjud.
ch 2-jadval (1;0,05) = 3,84146
Ikkinchi turdagi statistik mezonlardan (Fisher testi) foydalanib, o'zgaruvchilarni multikollinearlik uchun tekshiramiz.

Uchinchi turdagi statistik mezonlardan (Talaba testi) foydalanib, o‘zgaruvchilarning multikollinearligini tekshiramiz. Buning uchun biz qisman korrelyatsiya koeffitsientlarini topamiz.
Qisman korrelyatsiya koeffitsientlari.
Qisman korrelyatsiya koeffitsienti oddiy chiziqli juft korrelyatsiya koeffitsientidan farq qiladi, chunki u boshqa omillarning (x j) ta'sirini bartaraf etish sharti bilan mos belgilarning (y va x i) juftlik korrelyatsiyasini o'lchaydi.
Qisman koeffitsientlarga asoslanib, biz regressiya modeliga o'zgaruvchilarni kiritish oqlangan degan xulosaga kelishimiz mumkin. Agar koeffitsientning qiymati kichik yoki ahamiyatsiz bo'lsa, demak, bu omil va natija o'zgaruvchisi o'rtasidagi bog'liqlik juda zaif yoki umuman yo'q, shuning uchun omilni modeldan chiqarib tashlash mumkin.

Aloqa zichligi past.
r yx 1 / x 2 korrelyatsiya koeffitsientining ahamiyatini aniqlaymiz. Ko'rib turganimizdek, modelga x 1 kiritilgan bo'lsa, y va x 2 o'rtasidagi bog'liqlik kamaydi. Bundan xulosa qilishimiz mumkinki, x 2 ni regressiya tenglamasiga kiritish noo'rin bo'lib qoladi.
Xulosa qilishimiz mumkinki, regressiya tenglamasini tuzishda x 1, x 2 omillarni tanlash kerak.

Misol № 2. 30 ta kuzatuv uchun juft korrelyatsiya koeffitsientlari matritsasi quyidagicha bo'ldi:

	y	x 1	x 2	x 3
y	1,0
x 1	0,30	1,0
x 2	0,60	0,10	1,0
x 3	0,40	0,15	0,80	1,0

Omillarning multikollinearligini baholash. Standart masshtabda regressiya tenglamasini tuzing va xulosalar chiqaring.

4. Eng kichik kvadratlar usuli yordamida PLR parametrlarini statistik baholash. Eng kichik kvadratlarni baholashning xossalari

Eng kichik kvadratlarni baholash xususiyatlari:

5. Ko'p chiziqli regressiya sifatini tekshirish: parametrlarning ahamiyati, ishonch oraliqlari, modelning adekvatligi. Prognozlash.

6. Ko'p chiziqli regressiya (MLR). Klassik taxminlar. Model parametrlarini OLS baholash.

7. Ko'p chiziqli regressiyaning OLS baholarining xossalari. Gauss-Markov teoremasi.

8. Ko'p chiziqli regressiya sifatini tekshirish: parametrlarning ahamiyati, ishonch oraliqlari, modelning adekvatligi. Prognozlash.

5. Koeffitsient Aniqlanishlar

Ko'p chiziqli regressiya modeli yordamida prognozlash

9. Ekonometrik modelning spetsifikatsiyasi: ekzogen o'zgaruvchilarni tanlash usullari va diagnostikasi. Ramsey va Amemya testlari.

Ramsey mezoni:

10. Ekonometrik model spetsifikatsiyasi: chiziqli bo'lmagan modelning bog'liqlik shaklini tanlash

Spetsifikatsiya tamoyillari

11. Multikollinearlik muammosi. Multikollinearlikning mavjudligi va diagnostikasi oqibatlari.

Multikollinearlikni aniqlash usullari:

12. Multikollinearlikni bartaraf etish usullari. Asosiy komponent usuli. Ridge regressiyasi.

13. Modelning geteroskadastikligi muammolari. Uning diagnostikasi mezonlari.

1. Park mezoni.

2. Goldfeld-Kvandt mezoni.

3. Breusch-Pagan mezoni.

4. Oq mezon.

14. Umumlashtirilgan eng kichik kvadratlar (oms). Omnk uchun mlr baholarining xossalari. Model parametrlarini baholash masalasida tortilgan eng kichik kvadratlar usuli. Og'irlangan eng kichik kvadratlardan foydalangan holda hisob-kitoblarning xususiyatlari.

Savol 15. Model qoldiqlarining avtokorrelyatsiyasi muammosi. Modeldan foydalanishda avtokorrelyatsiyaning oqibatlari.

Qoldiqlarning avtokorrelyatsiyasi sabablari

Avtokorrelyatsiyaning oqibatlari:

16. Durbin-Vatson avtokorrelyatsiyasi diagnostika mezoni

17.Avtokorrelyatsiyani bartaraf etish usullari. Cochrane-Orcutt va Hildret-Lou ballarini baholash protseduralari

18. Taqsimlangan kechikishlari bo'lgan modellar: Koik bo'yicha kechikish tuzilishi: Maxsus holatlar (to'liq moslashtirilmagan va moslashish kutishlari bo'lgan model)

19 Taqsimlangan kechikishli modellar: kechikishlarning chiziqli-arifmetik tuzilishi va Almon bo‘yicha kechikishlarning ko‘pnomli tuzilishi.

20. Lag modellarida avtokorrelyatsiyani tekshirish uchun h-Durbin testi va bir nechta Lagrange testi

21. Vaqt seriyalari (vaqt) tushunchasi. VR modeli, VR tahlilining asosiy vazifalari. Vaqtni tekislash usullari (harakatlanuvchi o'rtacha, eksponensial tekislash, ketma-ket farqlar)

22 Vaqt seriyasining statsionarligi (vaqt). Temp darajalarining korrelyatsiya xususiyatlari.

23 Statsionar vaqt seriyalari modellari: avtoregressiya, harakatlanuvchi o'rtacha, yoy

24. Arissning statsionar bo'lmagan modeli. Model parametrlarini baholash.

28. Vaqt seriyalarini prognozlash. Prognozning aniqligi ko'rsatkichlari.

30. Ekonometrik modelga qo'g'irchoq o'zgaruvchilarni kiritish diagnostikasi uchun Chow testi.

32. Bir vaqtda ekonometrik tenglamalar sistemalari (SOE). Tizimning strukturaviy va qisqartirilgan shakli (grafik va matritsali tasvir).

33. Bir vaqtda tenglamalar sistemalarini (SOE) identifikatsiyalash masalalari. Tenglamalarning aniqlanishi (tartib va daraja mezonlari)

34. Bir vaqtda tenglamalar tizimini baholash usullari: bilvosita eng kichik kvadratlar usuli, ikki bosqichli eng kichik kvadratlar usuli. Baholarning qo'llanilishi va xususiyatlari

35. Ekonometrikaning hozirgi holati. Katta ekonometrik modellarga misollar

11. Multikollinearlik muammosi. Multikollinearlikning mavjudligi va diagnostikasi oqibatlari.

Agar mavjud bo'lsa ekzogen o'zgaruvchilarning chiziqli munosabati , masalan, keyin OLS taxminlar mavjud bo'lmaydi, chunki yagona bo'ladigan matritsaning teskarisi yo'q. Ekonometriyada bu holat muammo deb ataladi multikollinearlik.

Multikollinearlikning sabablari:

noto'g'ri model spetsifikatsiyasi

statistik ma'lumotlarni ehtiyotsizlik bilan yig'ish (takroriy kuzatishlardan foydalanish).

Farqlash aniq Va yashirin multikollinearlik.

Aniq - ma'lum aniq chiziqli munosabat model o'zgaruvchilari o'rtasida.

Misol uchun, agar investitsiya jarayoni modeli nominal va real foiz stavkalarini o'z ichiga olsa, ya'ni.

bu erda real va nominal stavkalar va inflyatsiya darajasi o'rtasidagi bog'liqlik ma'lum

keyin aniq multikollinearlik mavjud.

Yashirin mavjud bo'lganda yuzaga keladi stokastik (noaniq, tasodifiy) chiziqli bog'liqlik ekzogen o'zgaruvchilar o'rtasida.

yashirin ustunlik qiladi, uning mavjudligi bilan tavsiflanadi6 ta belgi :

1. Model parametrlarining OLS baholari o'zgarmas xususiyatlarini yo'qotadi .

2. OLS baholarining farqi oshiradi:

Bu tufayli, korrelyatsiya koeffitsienti, keyin, qaysi o'z ichiga oladi

3. pasayish kuzatiladi t- parametrlarning ahamiyatini ko'rsatuvchi statistik ma'lumotlar:

4. Determinatsiya koeffitsienti endi modelning adekvatligi o'lchovi emas, chunki past qiymatlar t-statistiklar tanlangan qaramlik modeliga ishonchsizlikka olib keladi.

5. Kollinear bo'lmagan ekzogen o'zgaruvchilar uchun parametrlarni baholash ma'lumotlarning o'zgarishiga juda sezgir bo'ladi.

6. Kollinear bo'lmagan ekzogen o'zgaruvchilar uchun parametr baholari ahamiyatsiz bo'lib qoladi.

Multikollinearlikni aniqlash usullari:

1-qadam.(Boshlang'ich) ko'p chiziqli regressiya modelida biz har qanday ekzogen o'zgaruvchi endogenga aylanadigan barcha kichik modellarni ko'rib chiqamiz, ya'ni.

2-qadam. Biz barcha olingan modellarni aniqlash koeffitsientlarini hisoblaymiz, ular asosida inflyatsiya omillari deb ataladigan narsalarni hisoblaymiz:

Agar bo'lsa, ular multikollinearlik mavjud degan xulosaga kelishadi.

a) ular modeldagi hech qanday tuzilmani o'zgartirmaydi, lekin kompyuterning eng kichik kvadratlari yordamida vizual usullar yordamida multikollinearlik muammosi mavjudligini tahlil qiladi.

b) original modeldan kollinear ekzogen o'zgaruvchilarni yo'q qilish orqali model spetsifikatsiyasini yaxshilash.

v) statistik ma'lumotlar hajmini oshirish.

d) kollinear o'zgaruvchilarni birlashtirish va modelga umumiy ekzogen o'zgaruvchini kiritish.

12. Multikollinearlikni bartaraf etish usullari. Asosiy komponent usuli. Ridge regressiyasi.

Agar modelning asosiy vazifasi bog'liq o'zgaruvchining kelajakdagi qiymatlarini bashorat qilish bo'lsa, u holda R2 aniqlashning etarlicha katta koeffitsienti (≥ 0,9) bilan multikollinearlikning mavjudligi ko'pincha modelning bashoratli sifatiga ta'sir qilmaydi.

Agar tadqiqotning maqsadi har bir tushuntiruvchi o'zgaruvchining bog'liq o'zgaruvchiga ta'sir darajasini aniqlash bo'lsa, u holda multikollinearlikning mavjudligi o'zgaruvchilar orasidagi haqiqiy munosabatlarni buzadi. Bunday vaziyatda multikollinearlik jiddiy muammo bo'lib ko'rinadi.

E'tibor bering, har qanday holatda ham mos keladigan multikollinearlikni yo'q qilishning yagona usuli yo'q. Buning sababi shundaki, multikollinearlikning sabablari va oqibatlari noaniq bo'lib, ko'p jihatdan tanlov natijalariga bog'liq.

USULLARI:

Modeldan o'zgaruvchi(lar)ni istisno qilish

Misol uchun, ma'lum bir tovarga bo'lgan talabni o'rganishda tushuntirish o'zgaruvchisi sifatida ushbu tovarning narxi va ko'pincha bir-biri bilan korrelyatsiya qiluvchi ushbu tovarning o'rnini bosuvchi narxlardan foydalanish mumkin. Modeldan o'rinbosarlarning narxini chiqarib tashlasak, biz spetsifikatsiya xatosini kiritishimiz mumkin. Natijada noxolis baholar olish va asossiz xulosalar chiqarish mumkin. Amaliy ekonometrik modellarda kollinearlik jiddiy muammoga aylanmaguncha tushuntiruvchi o'zgaruvchilarni istisno qilmaslik ma'qul.

Ko'proq ma'lumot yoki yangi namuna olish

Ba'zan namuna hajmini oshirish kifoya. Misol uchun, agar siz yillik ma'lumotlardan foydalansangiz, choraklik ma'lumotlarga o'tishingiz mumkin. Ma'lumotlar miqdorini oshirish regressiya koeffitsientlarining dispersiyasini kamaytiradi va shu bilan ularning statistik ahamiyatini oshiradi. Biroq, yangi namunani olish yoki eskisini kengaytirish har doim ham mumkin emas yoki jiddiy xarajatlar bilan bog'liq. Bundan tashqari, bu yondashuv avtokorrelyatsiyani kuchaytirishi mumkin. Ushbu muammolar foydalanish imkoniyatini cheklaydi bu usul.

Model spetsifikatsiyasini o'zgartirish

Ba'zi hollarda multikollinearlik muammosini modelning spetsifikatsiyasini o'zgartirish yo'li bilan hal qilish mumkin: yoki model shaklini o'zgartirish orqali yoki dastlabki modelda hisobga olinmagan, lekin bog'liq o'zgaruvchiga sezilarli ta'sir ko'rsatadigan tushuntirish o'zgaruvchilarni qo'shish orqali. .

Ba'zi parametrlar haqida oldindan ma'lumotdan foydalanish

Ba'zan, bir nechta regressiya modelini yaratishda siz ba'zi dastlabki ma'lumotlardan, xususan, ba'zi regressiya koeffitsientlarining ma'lum qiymatlaridan foydalanishingiz mumkin. Ba'zi bir dastlabki (odatda oddiyroq) modellar uchun yoki ilgari olingan namunaga asoslangan shunga o'xshash model uchun olingan koeffitsientlarning qiymatlari ishlab chiqilayotgan model uchun ishlatilishi mumkin. bu daqiqa modellar.

Tasavvur qilish uchun biz quyidagi misolni keltiramiz. Regressiya qurilgan. Faraz qilaylik, X1 va X2 o'zgaruvchilari o'zaro bog'liq. Oldin tuzilgan Y = g0 + g1X1+y boʻlgan juftlashgan regressiya modeli uchun Y ni X1 bilan bogʻlovchi statistik ahamiyatga ega g1 koeffitsienti aniqlandi (aniqlik uchun g1 = 0,8 boʻlsin). Agar Y va X1 o'rtasidagi munosabatlar o'zgarishsiz qoladi deb o'ylashga asos bo'lsa, u holda g1 = b1 = 0,8 ni o'rnatishimiz mumkin. Keyin:

Y = b0 + 0,8X1 + b2X2 + e. ⇒ Y – 0,8X1 = b0 + b2X2 + e.

Tenglama aslida juft regressiya tenglamasi bo'lib, u uchun multikollinearlik muammosi mavjud emas.

Ushbu usuldan foydalanish cheklovlari quyidagilarga bog'liq:

Dastlabki ma'lumotni olish ko'pincha qiyin,

uchun ajratilgan regressiya koeffitsienti bir xil bo'lishi ehtimoli turli modellar, baland emas.

O'zgaruvchilarni aylantirish

Ba'zi hollarda multikollinearlik muammosini o'zgaruvchilarni o'zgartirish orqali minimallashtirish yoki hatto yo'q qilish mumkin.

Masalan, empirik regressiya tenglamasi Y = b0 + b1X1 + b2X2 bo'lsin.

bu erda X1 va X2 korrelyatsiya qilingan o'zgaruvchilardir. Bunday vaziyatda siz nisbiy qiymatlarning regressiyaga bog'liqligini aniqlashga harakat qilishingiz mumkin. Ehtimol, shunga o'xshash modellarda multikollinearlik muammosi mavjud bo'lmaydi.

Asosiy komponent usuli ko'p regressiya modelidan o'zgaruvchilarni yo'q qilishning asosiy usullaridan biri hisoblanadi.

Bu usul regressiya modelida omil o'zgaruvchilarning multikollinearligini yo'q qilish yoki kamaytirish uchun ishlatiladi. Usulning mohiyati : omil o'zgaruvchilari sonini sezilarli darajada ta'sir qiluvchi omillarga kamaytirish . Bunga barcha omil oʻzgaruvchilari xi (i=0,...,n)ni asosiy komponentlar deb ataladigan yangi oʻzgaruvchilarga chiziqli aylantirish orqali erishiladi, yaʼni. omil o‘zgaruvchilari X matritsasidan F asosiy komponentlar matritsasiga o‘tish amalga oshiriladi. Bunday holda, birinchi asosiy komponentni tanlash barcha omil o'zgaruvchilari xi (i=0,...,n) umumiy dispersiyasining maksimaliga mos kelishi, ikkinchi komponentning maksimalga mos kelishi talabi ilgari suriladi. qolgan dispersiya, birinchi asosiy komponentning ta'siri bartaraf etilgandan keyin va hokazo.

Agar ko'p regressiya modeliga kiritilgan omil o'zgaruvchilardan hech biri chiqarib tashlanmasa, regressiya modeli koeffitsientlarini baholashning asosiy noaniq usullaridan biri qo'llaniladi - tizma regressiyasi yoki tizmasi. Ridge regressiya usulidan foydalanganda matritsaning barcha diagonal elementlariga kichik raqam qo'shiladi (XTX) t: 10-6 ‹ t ‹ 0,1. Ko'p regressiya modelining noma'lum parametrlarini baholash quyidagi formula yordamida amalga oshiriladi:

Bu erda ln - identifikatsiya matritsasi.

Asosiy qoidalar

Agar modeldagi regressorlar qat'iy funktsional bog'liqlik bilan bog'langan bo'lsa, u holda to'liq (mukammal) multikollinearlik. Bu tur multikollinearlik, masalan, eng kichik kvadratlar usuli bilan hal qilingan chiziqli regressiya masalasida, agar matritsaning determinanti nolga teng bo'lsa, paydo bo'lishi mumkin. To'liq multikollinearlik bizga asl modelning parametrlarini bir ma'noda baholashga va kuzatuvlar natijalariga ko'ra chiqish o'zgaruvchisiga regressorlarning hissalarini ajratishga imkon bermaydi.

Haqiqiy ma'lumotlar bilan bog'liq muammolarda to'liq multikollinearlik holati juda kam uchraydi. Buning o'rniga, dastur domenida biz ko'pincha shug'ullanishimiz kerak qisman multikollinearlik, bu regressorlar orasidagi juft korrelyatsiya koeffitsientlari bilan tavsiflanadi. Qisman multikollinearlik holatida matritsa to'liq darajaga ega bo'ladi, lekin uning determinanti nolga yaqin bo'ladi. Bunday holda, rasmiy ravishda model parametrlari va ularning aniqlik ko'rsatkichlari bo'yicha taxminlarni olish mumkin, ammo ularning barchasi beqaror bo'ladi.

Qisman multikollinearlikning oqibatlari orasida quyidagilar mavjud:

parametr baholaridagi farqlarning oshishi
parametrlar uchun t-statistik qiymatlarning pasayishi, bu ularning statistik ahamiyati haqida noto'g'ri xulosaga olib keladi.
model parametrlari va ularning dispersiyalarining beqaror baholarini olish
parametr bahosining nazariy nuqtai nazaridan noto'g'ri belgini olish imkoniyati

Qisman multikollinearlikni aniqlash uchun aniq miqdoriy mezonlar mavjud emas. Uning mavjudligi belgilari sifatida quyidagilar ko'pincha ishlatiladi:

Multikollinearlikni bartaraf etish usullari

Ushbu muammoni hal qilishda ikkita asosiy yondashuv mavjud.

Faktorlarni tanlash qanday amalga oshirilmasin, ularning sonini kamaytirish matritsaning shartliligini yaxshilashga va natijada model parametrlarini baholash sifatini oshirishga olib keladi.

Ro'yxatda keltirilgan usullarga qo'shimcha ravishda, juda yaxshi natijalar beradigan yana bir oddiy usul mavjud - bu oldindan markazlashtirish usuli. Usulning mohiyati shundaki, parametrlarni topishdan oldin matematik model Manba ma'lumotlari markazlashtirilgan: qatorning o'rtacha qiymati ma'lumotlar seriyasidagi har bir qiymatdan ayiriladi: . Ushbu protsedura LSM sharoitlarining giperplanlarini ular orasidagi burchaklar perpendikulyar bo'lishi uchun ajratish imkonini beradi. Natijada, model baholari barqaror bo'ladi (Ko'p faktorli modellarni ko'p kollinearlik sharoitida qurish).

Rossiya Federatsiyasi Ta'lim va fan bo'yicha Federal agentligi

Kostroma davlat texnologiya universiteti.

Oliy matematika kafedrasi

mavzu bo'yicha ekonometrika:

Multikollinearlik

Amalga oshirildi

1-kurs talabasi

sirtqi fakultet

uyqu "Buxgalteriya hisobi"

tahlil va audit."

Men tekshirdim

Katerjina S.F.

Kostroma 2008 yil

Multikollinearlik

Multikollinearlik tushuntiruvchi o'zgaruvchilarning yuqori o'zaro korrelyatsiyasini bildiradi. Multikollinearlik funktsional (aniq) va stokastik (yashirin) shakllarda namoyon bo'lishi mumkin.

Ko'ra multikollinearlikning funksional shaklida kamida izohlovchi o‘zgaruvchilar orasidagi juftlik munosabatlaridan biri chiziqli funksional munosabatdir. Bu holda X`X matritsasi maxsus, chunki u chiziqli bog'liq ustun vektorlarini o'z ichiga oladi va uning determinanti nolga teng, ya'ni. regressiya tahlilining asosi buziladi, bu mos keladigan normal tenglamalar tizimini echish va regressiya modeli parametrlarining baholarini olish mumkin emasligiga olib keladi.

Biroq, iqtisodiy tadqiqotlarda multikollinearlik ko'pincha stokastik shaklda namoyon bo'ladi, agar kamida ikkita tushuntirish o'zgaruvchisi o'rtasida yaqin korrelyatsiya mavjud bo'lsa. Bu holda X`X matritsasi yagona emas, lekin uning determinanti juda kichik.

Shu bilan birga, baholar vektori b va uning kovariatsiya matritsasi ∑ b proportsionaldir. teskari matritsa(X`X) -1 , bu ularning elementlari |X`X| determinant qiymatiga teskari proportsional ekanligini bildiradi. Natijada, b 0, b 1, ..., b p regressiya koeffitsientlarining muhim standart og'ishlari (standart xatolar) olinadi va ularning ahamiyatini t-test yordamida baholash mantiqiy emas, garchi umuman olganda regressiya modeli o'zgarishi mumkin F-testidan foydalangan holda muhim bo'lib chiqdi.

Hisob-kitoblar kuzatuvlar va namuna hajmidagi kichik o'zgarishlarga juda sezgir bo'ladi. Bu holda regressiya tenglamalari, qoida tariqasida, haqiqiy ma'noga ega emas, chunki uning ba'zi koeffitsientlari iqtisodiy nazariya nuqtai nazaridan noto'g'ri belgilarga va asossiz katta qiymatlarga ega bo'lishi mumkin.

Multikollinearlikning mavjudligi yoki yo'qligini aniqlashning aniq miqdoriy mezonlari mavjud emas. Biroq, uni aniqlash uchun ba'zi evristik yondashuvlar mavjud.

Bunday yondashuvlardan biri X 1 , X 2 , ..., X p tushuntiruvchi oʻzgaruvchilar orasidagi korrelyatsiya matritsasi tahlili va yuqori oʻzgaruvchan korrelyatsiyaga (odatda 0,8 dan katta) ega boʻlgan oʻzgaruvchilar juftlarini aniqlashdan iborat. Agar shunday o'zgaruvchilar mavjud bo'lsa, ular multikollinearlikka ega deyiladi. Bundan tashqari, tushuntirish o'zgaruvchilardan biri va ularning ba'zi bir guruhi o'rtasida bir nechta determinatsiya koeffitsientlarini topish foydalidir. Yuqori ko'p determinatsiya koeffitsientining mavjudligi (odatda 0,6 dan katta) multikollinearlikni ko'rsatadi.

Yana bir yondashuv X`X matritsasini tekshirishdir. Agar X`X matritsasining determinanti yoki uning minimal xos qiymati l min nolga yaqin bo'lsa (masalan, to'plangan hisoblash xatolari bilan bir xil tartibli), u holda bu multikollinearlikning mavjudligini ko'rsatadi. X`X matritsasining maksimal xos qiymati l max ning minimal xos qiymati l mindan sezilarli og'ish bilan ham xuddi shunday ko'rsatilishi mumkin.

Multikollinearlikni yo'q qilish yoki kamaytirish uchun bir qator usullar qo'llaniladi. Ulardan eng oddiyi (lekin har doim ham mumkin emas) yuqori korrelyatsiya koeffitsientiga ega bo'lgan ikkita tushuntirish o'zgaruvchisi (0,8 dan ortiq), bitta o'zgaruvchi ko'rib chiqilmaydi. Shu bilan birga, qaysi o'zgaruvchini saqlash va qaysi birini tahlildan olib tashlash, birinchi navbatda, iqtisodiy nuqtai nazardan kelib chiqqan holda hal qilinadi. Agar iqtisodiy nuqtai nazardan o'zgaruvchilarning hech biriga ustunlik berish mumkin bo'lmasa, u holda qaram o'zgaruvchi bilan yuqori korrelyatsiya koeffitsientiga ega bo'lgan ikkita o'zgaruvchidan biri saqlanib qoladi.

Multikollinearlikni yo'q qilish yoki kamaytirishning yana bir usuli - eng kichik kvadratlar usuli bilan aniqlangan xolis baholardan noxolis baholarga o'tish, ammo ular taxmin qilingan parametrga nisbatan kamroq dispersiyaga ega, ya'ni. b j yoki M (b j - b j) 2 parametridan b j bahosining kvadratik chetlanishining kichikroq matematik kutilishi.

Vektor bilan aniqlangan taxminlar, Gauss-Markov teoremasiga muvofiq, barcha chiziqli ob'ektiv baholovchilar sinfidagi minimal dispersiyalarga ega, ammo ko'p kollinearlik mavjud bo'lganda, bu farqlar juda katta bo'lishi mumkin va mos keladigan noto'g'ri baholovchilarga murojaat qilish mumkin. regressiya parametrlarini baholashning aniqligini oshirish. Rasmda tanlanma taqsimoti ph (b j ^) zichligi bilan berilgan noto'g'ri baho b j ^ bo'lgan holat ko'rsatilgan.

Haqiqatan ham, hisoblangan parametr b j uchun ruxsat etilgan maksimal ishonch oralig'i (b j -D, b j +D) bo'lsin. Shakldan ko'rinib turganidek (b j -D, b j +D) intervaldagi taqsimot egri chizig'i ostidagi maydon bilan aniqlangan ishonch ehtimoli yoki bahoning ishonchliligi bu holda kattaroq bo'ladi. smeta uchun b j ga nisbatan b j (rasmda bu joylar soyalangan). Shunga ko'ra, bahoning taxmin qilingan parametrdan o'rtacha kvadratik og'ishi noxolis baho uchun kamroq bo'ladi, ya'ni:

M (b j ^ - b j) 2< M (b j - β j) 2

"Tizim regressiyasi" (yoki "tizma regressiyasi") dan foydalanganda, xolis baholar o'rniga biz vektor tomonidan ko'rsatilgan ob'ektiv baholarni hisobga olamiz.

b t ^ =(X`X+t E p +1) -1 X`Y,

Qayerda τ – "tizma" yoki "tizma" deb ataladigan ba'zi ijobiy raqam

E p +1 – –chi tartibli birlik matritsasi (p+1).

Qo'shish τ X`X matritsasining diagonal elementlariga model parametrlarining baholarini siljitadi, lekin shu bilan birga normal tenglamalar tizimining matritsasi determinanti ortadi - (X`X) o'rniga dan teng bo'ladi.

|X`X+t E p +1 |

Shunday qilib, determinant |X`X| nolga yaqin.

Multikollinearlikni bartaraf qilish uchun bir-biriga juda yaqin korrelyatsiya bilan bog'langan X 1, X 2,…, X n asl tushuntirish o'zgaruvchilardan asl o'zgaruvchilarning chiziqli birikmalarini ifodalovchi yangi o'zgaruvchilarga o'tishdan foydalanish mumkin. Bunday holda, yangi o'zgaruvchilar zaif korrelyatsiya yoki butunlay bog'liq bo'lmagan bo'lishi kerak. Bunday o'zgaruvchilar sifatida biz, masalan, komponent tahlilida o'rganilgan boshlang'ich tushuntirish o'zgaruvchilari vektorining asosiy komponentlarini olamiz va asosiy komponentlar bo'yicha regressiyani ko'rib chiqamiz, bunda ikkinchisi umumlashtirilgan tushuntirish o'zgaruvchilari rolini bajaradi, bundan keyin mazmunli (iqtisodiy) talqin.

Asosiy komponentlarning ortogonalligi multikollinearlik effektini oldini oladi. Bundan tashqari, qo'llaniladigan usul bizga nisbatan ko'p miqdordagi boshlang'ich tushuntirish o'zgaruvchilari bilan oz sonli asosiy komponentlar bilan cheklanish imkonini beradi.

Multikollinearlik -- tushuntirish o'zgaruvchilari orasidagi bo'shashgan chiziqli munosabatlar ishonchsiz regressiya baholariga olib keladigan muammoni tavsiflash uchun ishlatiladigan tushuncha. Albatta, bunday qaramlik qoniqarsiz baholarga olib kelishi shart emas. Agar boshqa barcha shartlar qulay bo'lsa, ya'ni tushuntirish o'zgaruvchilarning kuzatishlar soni va tanlanma dispersiyalari katta bo'lsa va tasodifiy atamaning dispersiyasi kichik bo'lsa, oxirida siz juda yaxshi baho olishingiz mumkin.

Demak, multikollinearlik zaif munosabatlar va bir (yoki bir nechta) noqulay shartlarning birikmasidan kelib chiqishi kerak va bu savol.

uning turi emas, balki hodisaning namoyon bo'lish darajasi. Har qanday regressiyani baholash, agar barcha mustaqil o'zgaruvchilar butunlay o'zaro bog'liq bo'lmasa, ma'lum darajada zarar ko'radi. Ushbu muammoni ko'rib chiqish faqat regressiyani baholash natijalariga jiddiy ta'sir qilganda boshlanadi.

Bu muammo vaqtli qator regressiyalarida, ya'ni ma'lumotlar ma'lum vaqt oralig'idagi bir qancha kuzatuvlardan iborat bo'lganda keng tarqalgan. Ikki yoki undan ortiq mustaqil o'zgaruvchilar kuchli vaqt tendentsiyasiga ega bo'lsa, ular yuqori korrelyatsiyaga ega bo'ladi va bu multikollinearlikka olib kelishi mumkin.

Bu holatda nima qilish mumkin?

Multikollinearlikni yumshatish uchun ishlatilishi mumkin bo'lgan turli usullar ikki toifaga bo'linadi: birinchi toifa regressiya baholarining ishonchliligi uchun to'rtta shartning bajarilishi darajasini yaxshilashga urinishlarni o'z ichiga oladi; ikkinchi toifaga foydalanish kiradi tashqi ma'lumotlar. Agar birinchi navbatda to'g'ridan-to'g'ri olingan ma'lumotlardan foydalansak, kuzatishlar sonini ko'paytirish foydali bo'lishi aniq.

Vaqt seriyasi ma'lumotlaridan foydalanayotgan bo'lsangiz, bu har bir vaqt davrining davomiyligini qisqartirish orqali amalga oshirilishi mumkin. Masalan, 5.3 va 5.6-mashqlardagi talab funksiyasi tenglamalarini baholashda yillik maʼlumotlardan foydalanishdan choraklik maʼlumotlarga oʻtish mumkin.

Shundan so'ng, 25 ta kuzatuv o'rniga 100 ta kuzatuv bo'ladi. Bu shunchalik ravshan va amalga oshirish osonki, ko'pchilik vaqt seriyalaridan foydalanadigan tadqiqotchilar deyarli avtomatik ravishda choraklik ma'lumotlardan foydalanadilar, agar mavjud bo'lsa, yillik ma'lumotlar o'rniga, hatto multikollinearlik muammosi bo'lmasa ham, faqat argument uchun.regressiya koeffitsientlarining minimal nazariy dispersiyalari. Biroq, bu yondashuv bilan bog'liq muammolar mavjud. Avtokorrelyatsiya kiritilishi yoki kuchaytirilishi mumkin, lekin uni neytrallash mumkin. Bundan tashqari, choraklik ma'lumotlar tegishli yillik ma'lumotlarga qaraganda kamroq aniqlik bilan o'lchanadigan bo'lsa, o'lchov xatolaridan kelib chiqadigan noaniqlik kiritilishi (yoki kuchaytirilishi) mumkin. Bu muammoni hal qilish oson emas, lekin ahamiyatli bo'lmasligi mumkin.

Multikollinearlik - bu regressiya tenglamasida ikki yoki undan ortiq tushuntiruvchi o'zgaruvchilarning korrelyatsiyasi. U funktsional (aniq) va stokastik (yashirin) bo'lishi mumkin. Funktsional multikollinearlik bilan XTX matritsasi buziladi va (XTX)-1 mavjud emas, shuning uchun uni aniqlash mumkin emas. Ko'pincha multikollinearlik stokastik shaklda namoyon bo'ladi, OLS taxminlari esa rasmiy ravishda mavjud, ammo bir qator kamchiliklarga ega:

1) dastlabki ma'lumotlarning kichik o'zgarishi regressiya baholarining sezilarli o'zgarishiga olib keladi;
2) taxminlar katta standart xatolarga ega va ahamiyati past bo'lsa, umuman model muhim (yuqori R2 qiymati);
3) koeffitsientlarning intervalli baholari kengayib, ularning aniqligini yomonlashtiradi;
4) regressiya koeffitsienti uchun noto'g'ri belgini olish mumkin.

Aniqlash

Multikollinearlikning mavjudligini aniqlash mumkin bo'lgan bir nechta belgilar mavjud.

Birinchidan, juft korrelyatsiya koeffitsientlarining korrelyatsiya matritsasi tahlili:

- agar yuqori korrelyatsiya koeffitsientlariga ega bo'lgan juft o'zgaruvchilar mavjud bo'lsa (> 0,75 - 0,8), ular o'rtasidagi multikollinearlik haqida gapiradi;
- agar omillar o'zaro bog'liq bo'lmasa, u holda det Q = 1, agar to'liq korrelyatsiya bo'lsa, det Q = 0.

H0 ni tekshirishingiz mumkin: det Q = 1; statistik testdan foydalanish

bu yerda n - kuzatishlar soni, m = p+1.

Agar, u holda H0 rad etiladi va multikollinearlik isbotlanadi.

Ikkinchidan, tushuntirish o'zgaruvchilardan birining va boshqalarning ayrim guruhini aniqlashning bir nechta koeffitsientlari aniqlanadi. Yuqori R2 (> 0,6) mavjudligi multikollinearlikni ko'rsatadi.

Uchinchidan, XTX matritsasining minimal xos qiymatining nolga yaqinligi (ya’ni tenglamaning yechimi) det(XTX) ham nolga yaqin ekanligini va shuning uchun multikollinearlikni ko‘rsatadi.

To'rtinchidan, yuqori qisman korrelyatsiya koeffitsientlari.

namunaviy korrelyatsiya koeffitsientlari matritsasi elementlarining algebraik qo'shimchalari qayerda. Yuqori darajali qisman korrelyatsiya koeffitsientlari quyi tartibli qisman korrelyatsiya koeffitsientlari orqali takroriy formula yordamida aniqlanishi mumkin:

Beshinchidan, ba'zi odamlar multikollinearlik mavjudligi haqida gapirishadi tashqi belgilar qurilgan model, bu uning oqibatlari. Bular quyidagilarni o'z ichiga olishi kerak:

· ba'zi baholarda iqtisodiy nazariya nuqtai nazaridan noto'g'ri belgilar yoki asossiz katta mutlaq qiymatlar mavjud;
· boshlang'ich statistik ma'lumotlarning kichik o'zgarishi (ba'zi kuzatishlarni qo'shish yoki olib tashlash) model koeffitsientlari baholarining sezilarli o'zgarishiga, hatto ularning belgilarining o'zgarishiga olib keladi;
· regressiya koeffitsientlarining ko'p yoki hatto barcha baholari t-testiga ko'ra statistik jihatdan ahamiyatsiz bo'lib chiqadi, F-testiga ko'ra, butun model muhim.

Multikollinearlikni aniqlashning yana bir qancha usullari mavjud.

Agar modelning asosiy vazifasi bog'liq o'zgaruvchining kelajakdagi qiymatlarini bashorat qilish bo'lsa, u holda R2 aniqlashning etarlicha katta koeffitsienti bilan (> 0,9), multikollinearlikning mavjudligi odatda modelning bashorat qilish sifatiga ta'sir qilmaydi. Agar korrelyatsiya qilingan o'zgaruvchilar orasidagi bir xil munosabatlar kelajakda saqlanib qolsa, bu bayonot oqlanadi.

Agar tadqiqotning maqsadi har bir tushuntiruvchi o'zgaruvchining bog'liq o'zgaruvchiga ta'sir darajasini aniqlash bo'lsa, u holda ko'payishiga olib keladigan multikollinearlikning mavjudligi. standart xatolar, katta ehtimol bilan, o'zgaruvchilar orasidagi haqiqiy munosabatlarni buzadi. Bunday vaziyatda multikollinearlik jiddiy muammo hisoblanadi.