Multicollinearity байгаа эсэхийг тодорхойлох. Multicollinearity-ийн тодорхойлолт Multicollinearity-ийн онолын ерөнхий ойлголт

Олон тооны регрессийн тэгшитгэлийг байгуулах үед хүчин зүйлсийн олон шугаман байдлын асуудал үүсч болно. Олон шугаман байдалнь функциональ (тодорхой) эсвэл стохастик (далд) хэлбэрээр илэрч болох хоёр ба түүнээс дээш тайлбарлагч хувьсагчийн хоорондох шугаман хамаарал юм.
Сонгосон шинж чанаруудын хоорондын хамаарлыг тодорхойлох, холболтын ойр байдлын тоон үнэлгээг корреляцийн шинжилгээний аргыг ашиглан гүйцэтгэдэг. Эдгээр асуудлыг шийдвэрлэхийн тулд эхлээд , -ийг тооцоолж, дараа нь түүний үндсэн дээр хэсэгчилсэн болон олон тооны корреляци, детерминацийн коэффициентүүдийг тодорхойлж, тэдгээрийн ач холбогдлыг шалгана. Корреляцийн шинжилгээний эцсийн зорилго нь регрессийн тэгшитгэлийг цаашид байгуулахын тулд х 1, x 2,…, x m хүчин зүйлийн шинж чанарыг сонгох явдал юм.

Хэрэв хүчин зүйлийн хувьсагчдыг хатуу функциональ хамаарлаар холбосон бол бид үүнийг ярьдаг бүрэн олон шугаман байдал. Энэ тохиолдолд хүчин зүйлийн хувьсагчийн матрицын баганын дунд Xшугаман хамааралтай баганууд байдаг ба матрицын тодорхойлогчийн шинж чанараар det(X T X) = 0, өөрөөр хэлбэл матриц (X T X) нь ганц бие бөгөөд урвуу матриц байхгүй гэсэн үг. OLS тооцоололд (X T X) -1 матрицыг ашигладаг. Тиймээс бүрэн олон шугаман байдал нь анхны регрессийн загварын параметрүүдийг хоёрдмол утгагүй тооцоолох боломжийг бидэнд олгодоггүй.

Загварт багтсан хүчин зүйлсийн олон шугаман байдал нь ямар хүндрэл үүсгэдэг вэ, тэдгээрийг хэрхэн шийдвэрлэх вэ?

Multicollinearity нь хүсээгүй үр дагаварт хүргэж болзошгүй:

  1. параметрийн тооцоо нь найдваргүй болно. Тэд том стандарт алдаа олдог. Ажиглалтын хэмжээ өөрчлөгдөхийн хэрээр тооцоолол өөрчлөгддөг (зөвхөн хэмжигдэхүүн төдийгүй тэмдгээр) энэ нь загварыг дүн шинжилгээ хийх, урьдчилан таамаглахад тохиромжгүй болгодог.
  2. хүчин зүйлүүд хоорондоо харилцан уялдаатай байдаг тул олон тооны регрессийн параметрүүдийг "цэвэр" хэлбэрийн хүчин зүйлийн үйл ажиллагааны шинж чанар гэж тайлбарлахад хэцүү болдог; шугаман регрессийн параметрүүд эдийн засгийн утгыг алдах;
  3. Гүйцэтгэлийн үзүүлэлтэд хүчин зүйлсийн тусгаарлагдсан нөлөөллийг тодорхойлох боломжгүй болно.

Хүчин зүйлийн хувьсагчид ямар нэг стохастик хамаарлаар холбогддог олон шугаман байдлын төрлийг нэрлэдэг хэсэгчилсэн.Хэрэв хүчин зүйлийн хувьсагчдын хооронд өндөр корреляци байгаа бол матриц (X T X) нь доройтоход ойрхон, өөрөөр хэлбэл det (X T X) ≈ 0 байна.
(X T X) -1 матриц нь нөхцөл муутай байх бөгөөд энэ нь OLS үнэлгээний тогтворгүй байдалд хүргэдэг. Хэсэгчилсэн олон шугаман байдал нь дараахь үр дагаварт хүргэдэг.

  • параметрийн үнэлгээний зөрүү нэмэгдэх нь интервалын тооцоог өргөжүүлж, тэдгээрийн нарийвчлалыг улам дордуулдаг;
  • буурах т-коэффициентийн статистик нь хүчин зүйлийн ач холбогдлын талаар буруу дүгнэлт гаргахад хүргэдэг;
  • OLS тооцооны тогтворгүй байдал ба тэдгээрийн хэлбэлзэл.

Хэсэгчилсэн олон шугаман байдлыг илрүүлэх нарийн тоон шалгуур байдаггүй. Multicollinearity байгаа нь матрицын тодорхойлогч (X T X) нь тэгтэй ойролцоо байгааг харуулж болно. Хос корреляцийн коэффициентүүдийн утгыг мөн судалж үздэг. Хэрэв интерфакторын корреляцийн матрицын тодорхойлогч нь нэгтэй ойролцоо байвал олон шугаман байдал байхгүй болно.

Хүчтэй интерфакторын хамаарлыг даван туулах янз бүрийн арга байдаг. Тэдгээрийн хамгийн энгийн нь загварын чанарт бага зэрэг хохирол учруулах (тухайлбал, детерминацийн онолын коэффициент -R 2 y(x1...xm)) олон коллинеар байдлыг хамгийн их хариуцдаг хүчин зүйл (эсвэл хүчин зүйл) -ийг загвараас хасах явдал юм. ) бага зэрэг буурах болно).

Олон шугаман байдлыг арилгахын тулд ямар арга хэмжээ авч болохгүй вэ?
a) түүврийн хэмжээг нэмэгдүүлэх;
б) бусадтай өндөр хамааралтай хувьсагчдыг оруулахгүй;
в) загварын үзүүлэлтийн өөрчлөлт;
d) санамсаргүй бүрэлдэхүүнийг хувиргах.

Хосолсон (шугаман) ба хэсэгчилсэн корреляцийн коэффициентүүд

Жишээлбэл, утгын түүврийн хувьд x ба y хувьсагчдын хоорондох холболтын ойр байдал (x i, y i), i=1,n, (1)
Энд x ба y нь дундаж утгууд, S x ба S y нь харгалзах дээжийн стандарт хазайлт юм.

Хос корреляцийн коэффициент нь –1-ээс +1 хооронд хэлбэлздэг. Үнэмлэхүй утгаараа нэгдэлтэй ойртох тусам х ба у хоёрын статистик хамаарал шугаман функциональтай ойр байна. Коэффициентийн эерэг утга нь шинж чанаруудын хоорондын хамаарал шууд (х нэмэгдэх тусам y-ийн утга өсөх), сөрөг утга нь урвуу хамаарлыг (x нэмэгдэх тусам у-ийн утга буурна) илэрхийлнэ.
Корреляцийн коэффициентийн боломжит утгуудын чанарын тайлбарыг бид дараах байдлаар өгч болно: хэрэв |r|<0.3 – связь практически отсутствует; 0.3≤ |r| < 0.7 - связь средняя; 0.7≤ |r| < 0.9 – связь сильная; 0.9≤ |r| < 0.99 – связь весьма сильная.
Хүчин зүйлийн олон шугаман байдлыг үнэлэхийн тулд хүчин зүйлийн шинж чанар бүхий x 1, x 2,…, x m бүхий хамааралтай (үр дүнгийн) шинж чанарын хос корреляцийн коэффициентүүдийн матрицыг ашиглана, энэ нь хүчин зүйл бүрийн хүчин зүйлийн нөлөөллийн түвшинг үнэлэх боломжийг олгодог. хамааралтай хувьсагч y, түүнчлэн хүчин зүйлсийн хоорондын хамаарлын ойр . Ерөнхий тохиолдолд корреляцийн матриц нь хэлбэртэй байна
.
Матриц нь тэгш хэмтэй, диагональ дээр нь байдаг. Хэрэв матриц нь интерфакторын корреляцийн коэффициент r xjxi >0.7 байвал энэ олон регрессийн загварт олон шугаман байдал байна.
Шинж чанаруудын хамаарлыг тогтоосон анхны өгөгдөл нь тодорхой ерөнхий популяциас авсан түүвэр байдаг тул эдгээр өгөгдлөөс тооцсон корреляцийн коэффициентүүд нь сонгомол байх болно, өөрөөр хэлбэл тэдгээр нь зөвхөн хамаарлыг тооцдог. Тооцооллын үр дүн санамсаргүй байна уу, үгүй ​​юу гэсэн асуултад хариулах ач холбогдлын тест шаардлагатай байна.
Хос корреляцийн коэффициентийн ач холбогдолшалгана уу т-Оюутны тест. Ерөнхий корреляцийн коэффициент тэгтэй тэнцүү гэсэн таамаглал дэвшүүлэв: H 0: ρ = 0. Дараа нь параметрүүдийг тогтооно: ач холбогдлын түвшин α ба эрх чөлөөний зэрэглэлийн тоо v = n-2. Эдгээр параметрүүдийг ашиглан tcr-ийг Оюутны тархалтын эгзэгтэй цэгүүдийн хүснэгтээс олж, байгаа өгөгдлөөс тооцоолно. ажиглагдсан шалгуур үзүүлэлт:
, (2)
Энд r нь судалгаанд сонгосон өгөгдлөөс тооцсон хос корреляцийн коэффициент юм. Хосолсон корреляцийн коэффициент нь t Obs модуль нь t критээс их байвал γ = 1- α итгэлтэй магадлалаар (коэффициент тэгтэй тэнцүү гэсэн таамаглалыг няцаана) чухал ач холбогдолтой гэж үзнэ.
Хэрэв хувьсагчид хоорондоо харилцан хамааралтай бол корреляцийн коэффициентийн утгад бусад хувьсагчдын нөлөөлөл хэсэгчлэн нөлөөлдөг.

Хэсэгчилсэн корреляцийн коэффициентбусад хүчин зүйлийн нөлөөллийг арилгах үед үр дүн ба харгалзах хүчин зүйлийн хоорондох шугаман хамаарлын ойр байдлыг тодорхойлдог. Хэсэгчилсэн корреляцийн коэффициент нь бусад хүчин зүйлсийн тогтмол утгатай хоёр хувьсагчийн хоорондын хамаарлын ойр байдлыг үнэлдэг. Хэрэв тооцоолсон бол жишээлбэл, r yx 1| x2 (х 2-ийн тогтмол нөлөө бүхий y ба x 1 хоорондын хэсэгчилсэн корреляцийн коэффициент), энэ нь y ба x 1 хоорондын шугаман хамаарлын тоон хэмжигдэхүүнийг тодорхойлсон гэсэн үг бөгөөд хэрэв эдгээр шинж чанаруудад x 2-ийн нөлөөлөл бий болвол үүснэ. хасагдсан. Зөвхөн нэг хүчин зүйлийн нөлөөллийг хасвал бид авна хэсэгчилсэн нэгдүгээр зэрэглэлийн корреляцийн коэффициент.
Хосолсон ба хэсэгчилсэн корреляцийн коэффициентүүдийн утгыг харьцуулах нь тогтмол хүчин зүйлийн нөлөөллийн чиглэлийг харуулж байна. Хэрэв хэсэгчилсэн корреляцийн коэффициент r yx 1| x2 нь харгалзах хос коэффициент r yx 1-ээс бага байх бөгөөд энэ нь y ба x 1 шинж чанаруудын хоорондын хамаарал нь тэдгээрт тогтсон x 2 хэмжигдэхүүний нөлөөллөөр тодорхой хэмжээгээр тодорхойлогддог гэсэн үг юм. Эсрэгээр, хос коэффициенттэй харьцуулахад хэсэгчилсэн коэффициентийн их утга нь тогтмол хувьсагч x 2 нь түүний нөлөөгөөр y ба x 1 хоорондын хамаарлыг сулруулж байгааг харуулж байна.
Нэг хүчин зүйлийн (x 1) нөлөөллийг хассан тохиолдолд хоёр хувьсагчийн (y ба x 2) хэсэгчилсэн корреляцийн коэффициентийг дараахь томъёогоор тооцоолж болно.
. (3)
Бусад хувьсагчдын хувьд томьёог ижил төстэй байдлаар бүтээдэг. Тогтмол x 2 үед
;
тогтмол x 3 дээр
.
Хэсэгчилсэн корреляцийн коэффициентийн ач холбогдлыг хос корреляцийн коэффициенттэй адил шалгана. Ганц ялгаа нь v = n – l -2-тэй тэнцүү байх ёстой эрх чөлөөний зэрэглэлийн тоо бөгөөд энд l нь тогтмол хүчин зүйлийн тоо юм.

Алхам алхмаар регресс

Олон регрессийн загварт орсон x 1 , x 2 , …, x m хүчин зүйлсийг сонгох нь эконометрик загварчлалын хамгийн чухал үе шатуудын нэг юм. Загварт хүчин зүйлсийг дараалан (алхам алхмаар) оруулах (эсвэл хасах) арга нь боломжит багц хувьсагчдаас тухайн загварын чанарыг сайжруулах хувьсагчдыг сонгох боломжийг олгодог.
Аргыг хэрэгжүүлэхдээ хамгийн түрүүнд корреляцийн матрицыг тооцоолох хэрэгтэй. Хос корреляцийн коэффициент дээр үндэслэн коллинеар хүчин зүйл байгаа эсэхийг илрүүлдэг. r xjxi >0.7 бол x i ба x j хүчин зүйлсийг коллинеар гэж үзнэ. Загварт харилцан хамааралтай хүчин зүйлсийн зөвхөн нэгийг оруулсан болно. Хэрэв хүчин зүйлүүдийн дунд коллинеар хүчин зүйл байхгүй бол чухал нөлөө үзүүлэх хүчин зүйлүүд орно y.

Хоёрдахь алхамд үүссэн шинж чанар бүхий хос корреляцийн коэффициентийн хамгийн их үнэмлэхүй утгыг агуулсан нэг хувьсагчтай регрессийн тэгшитгэлийг байгуулна.

Гурав дахь шатанд өмнө нь оруулсан хувьсагчийн тогтмол нөлөөлөл бүхий хамааралтай хувьсагчтай хэсэгчилсэн корреляцийн коэффициентийн хамгийн том үнэмлэхүй утгыг агуулсан шинэ хувьсагчийг загварт нэвтрүүлнэ.
Загварт нэмэлт хүчин зүйл оруулах үед детерминацийн коэффициент нэмэгдэж, үлдэгдэл дисперс буурах ёстой. Хэрэв энэ нь тохиолдоогүй бол, өөрөөр хэлбэл олон тооны тодорхойлох коэффициент бага зэрэг нэмэгддэг бол шинэ хүчин зүйлийг нэвтрүүлэх нь зохисгүй гэж тооцогддог.

Жишээ №1. Бүс нутгийн 20 аж ахуйн нэгжийн хувьд нэг ажилтанд ногдох үйлдвэрлэлийн хэмжээ y (мянган рубль) нийт ажилчдын тоонд өндөр мэргэшсэн ажилчдын эзлэх хувь x1 (жилийн эцсийн хөрөнгийн үнийн%) болон ашиглалтад оруулах зэргээс хамаарна. шинэ үндсэн хөрөнгийн x2 (%) -ийг судалж байна. .

Ю X1 X2
6 10 3,5
6 12 3,6
7 15 3,9
7 17 4,1
7 18 4,2
8 19 4,5
8 19 5,3
9 20 5,3
9 20 5,6
10 21 6
10 21 6,3
11 22 6,4
11 23 7
12 25 7,5
12 28 7,9
13 30 8,2
13 31 8,4
14 31 8,6
14 35 9,5
15 36 10

Шаардлагатай:

  1. Нэг ажилтанд ногдох гарц ба өндөр мэргэшсэн ажилчдын эзлэх хувь хоорондын хамаарлын талбарыг бий болгох. X1 ба Y үзүүлэлтүүдийн хоорондын ойр байдал, хамаарлын хэлбэрийн талаарх таамаглал дэвшүүл.
  2. Нэг ажилчинд ногдох гарц ба өндөр мэргэшсэн ажилчдын эзлэх хувь хоорондын шугаман хамаарлын ойролцоо байдлыг 0.9-ийн найдвартайгаар үнэлнэ.
  3. Нэг ажилчинд ногдох үйлдвэрлэлийн хэмжээ өндөр мэргэшсэн ажилчдын эзлэх хувь хэмжээнээс хамаарах шугаман регрессийн тэгшитгэлийн коэффициентийг тооцоол.
  4. Регрессийн тэгшитгэлийн параметрүүдийн статистикийн ач холбогдлыг 0.9-ийн найдвартай байдлыг шалгаж, тэдгээрийн итгэлийн интервалыг байгуулна.
  5. Детерминацийн коэффициентийг тооцоол. Фишерийн F тестийг ашиглан регрессийн тэгшитгэлийн статистик ач холбогдлыг 0.9-ийн найдвартайгаар үнэл.
  6. Ажилчдын 24% нь өндөр мэргэшилтэй аж ахуйн нэгжийн хувьд нэг ажилтанд ногдох 0.9 гарцын найдвартай байдлын цэг ба интервалын прогнозыг өг.
  7. Шугаман олон тооны регрессийн тэгшитгэлийн коэффициентийг тооцоолж, параметрийн эдийн засгийн утгыг тайлбарлана уу.
  8. Найдвартай байдал нь 0.9-ийн олон тэгшитгэлийн коэффициентүүдийн статистикийн ач холбогдлыг шинжилж, тэдгээрийн итгэлийн интервалыг байгуул.
  9. Хос ба хэсэгчилсэн корреляцийн коэффициентийг ол. Тэдэнд дүн шинжилгээ хий.
  10. Олон тооны детерминацийн тохируулсан коэффициентийг ол. Үүнийг тохируулаагүй (нийт) детерминацийн коэффициенттэй харьцуул.
  11. Фишерийн F тестийг ашиглан регрессийн тэгшитгэлийн хүрэлцээг 0.9 найдвартайгаар үнэл.
  12. Ажилчдын 24% нь өндөр мэргэшсэн, шинэ үндсэн хөрөнгийн ашиглалт 5% байдаг аж ахуйн нэгжийн хувьд нэг ажилтанд ногдох 0.9 гарцын найдвартай байдлын оноо ба интервалын прогнозыг өг.
  13. Бүтээсэн тэгшитгэлийг ашиглан олон шугаман хамаарал байгаа эсэхийг шалгана уу: Оюутны тест; χ2 тест. Үр дүнг харьцуул.

ШийдэлБид үүнийг тооцоолуур ашиглан хийдэг. 13-р зүйлийн шийдлийн явцыг доор харуулав.
R хос корреляцийн коэффициентийн матриц:

- yx 1x 2
y 1 0.97 0.991
x 1 0.97 1 0.977
x 2 0.991 0.977 1

Multicollinearity байгаа тохиолдолд корреляцийн матрицын тодорхойлогч нь тэгтэй ойролцоо байна. Бидний жишээнд: det = 0.00081158, энэ нь хүчтэй олон шугаман холбоо байгааг харуулж байна.
Хамгийн чухал хүчин зүйлсийг сонгохын тулд x i дараах нөхцөлүүдийг харгалзан үзнэ.
- үр дүнгийн шинж чанар ба хүчин зүйлийн хоорондын холбоо нь интерфакторын холболтоос өндөр байх ёстой;
- хүчин зүйлсийн хоорондын хамаарал 0.7-оос ихгүй байх ёстой. Хэрэв матриц интерфакторын корреляцийн коэффициент r xjxi > 0.7 бол энэ олон регрессийн загварт олон коллинеар байдал байна.;
- шинж чанарын өндөр интерфакторын холболттой бол тэдгээрийн хоорондын корреляцийн коэффициент багатай хүчин зүйлсийг сонгоно.
Манай тохиолдолд r x 1 x 2 нь |r|>0.7 байна, энэ нь хүчин зүйлүүдийн олон шугаман байдал, тэдгээрийн аль нэгийг нь цаашдын шинжилгээнд оруулахгүй байх шаардлагатайг харуулж байна.
Энэхүү матрицын эхний эгнээний дүн шинжилгээ нь олон корреляцийн загварт багтах хүчин зүйлийн шинж чанарыг сонгох боломжийг олгодог. |r yxi | хүчин зүйлийн шинж чанар 0.3 - бараг ямар ч холболт байхгүй; 0.3 ≤ |r| ≤ 0.7 - дундаж холболт; 0.7 ≤ |r| ≤ 0.9 - хүчтэй холболт; |r| > 0.9 - холболт маш хүчтэй.
Олж авсан хос корреляцийн коэффициентүүдийн ач холбогдлыг Стьюдентын t тест ашиглан шалгая. t-статистикийн модулийн утга нь олдсон эгзэгтэй утгаас их байгаа коэффициентийг чухал гэж үзнэ.
Дараах томъёог ашиглан r yx 1-ийн t-статистикийн ажиглагдсан утгыг тооцоолъё.

Энд m = 1 нь регрессийн тэгшитгэлийн хүчин зүйлсийн тоо юм.

Оюутны хүснэгтийг ашиглан бид Ttable-ийг олно
t crit (n-m-1;α/2) = (18;0.025) = 2.101
t obs > t crit тул корреляцийн коэффициент 0-тэй тэнцүү гэсэн таамаглалыг бид үгүйсгэдэг. Өөрөөр хэлбэл корреляцийн коэффициент нь статистикийн ач холбогдолтой
r yx 2-ын t-статистикийн ажиглагдсан утгыг томъёогоор тооцоолъё.

t obs > t crit тул корреляцийн коэффициент 0-тэй тэнцүү гэсэн таамаглалыг бид үгүйсгэдэг. Өөрөөр хэлбэл корреляцийн коэффициент нь статистикийн ач холбогдолтой
Тиймээс (y ба x x 1), (y ба x x 2) хоорондын хамаарал чухал юм.
Үр дүнтэй шинж чанарт х2 хүчин зүйл (r = 0.99) хамгийн их нөлөө үзүүлдэг бөгөөд энэ нь загварыг бүтээхдээ регрессийн тэгшитгэлд хамгийн түрүүнд орох болно гэсэн үг юм.
Multicollinearity-ийг турших, арилгах.
Multicollinearity-ийг судлах хамгийн бүрэн гүйцэд алгоритм бол Фаррар-Глобер алгоритм юм. Энэ нь гурван төрлийн олон шугаман байдлыг шалгадаг:
1. Бүх хүчин зүйлүүд (χ 2 - хи-квадрат).
2. Хүчин зүйл бүр бусадтай (Фишерийн шалгуур).
3. Хос хүчин зүйл бүр (Оюутны t-тест).
Нэгдүгээр төрлийн статистик шалгуурыг (хи-квадрат тест) ашиглан Фаррар-Глоуберын аргыг ашиглан хувьсагчдыг multicollinearity эсэхийг шалгая.
Farrar-Glouber статистикийн утгыг тооцоолох томъёо нь:
χ 2 = -ln(det[R])
Энд m = 2 нь хүчин зүйлийн тоо, n = 20 нь ажиглалтын тоо, det[R] нь R хос корреляцийн коэффициентийн матрицын тодорхойлогч юм.
Бид үүнийг v = m/2(m-1) = 1 зэрэглэлийн эрх чөлөө ба ач холбогдлын α түвшний хүснэгтийн утгатай харьцуулна. Хэрэв χ 2 > χ хүснэгт 2 бол хүчин зүйлийн векторт олон шугаман байдал байна.
χ хүснэгт 2 (1;0.05) = 3.84146
Хоёрдахь төрлийн статистикийн шалгуурыг (Фишерийн тест) ашиглан хувьсагчдыг multicollinearity эсэхийг шалгая.

Гурав дахь төрлийн статистикийн шалгуурыг (Оюутны тест) ашиглан хувьсагчдыг multicollinearity эсэхийг шалгая. Үүнийг хийхийн тулд бид хэсэгчилсэн корреляцийн коэффициентийг олох болно.
Хэсэгчилсэн корреляцийн коэффициентүүд.
Хэсэгчилсэн корреляцийн коэффициент нь бусад хүчин зүйлсийн (x j) нөлөөллийг арилгасан тохиолдолд харгалзах шинж чанаруудын (y ба x i) хос харилцан хамаарлыг хэмждэгээрээ энгийн шугаман хос корреляцийн коэффициентээс ялгаатай.
Хэсэгчилсэн коэффициентүүд дээр үндэслэн бид регрессийн загварт хувьсагчдыг оруулах үндэслэлтэй гэж дүгнэж болно. Хэрэв коэффициентийн утга бага эсвэл ач холбогдолгүй бол энэ хүчин зүйл болон үр дүнгийн хувьсагчийн хоорондын хамаарал маш сул эсвэл бүрмөсөн байхгүй тул тухайн хүчин зүйлийг загвараас хасч болно.


Харилцааны нягтрал бага байна.
r yx 1 / x 2 корреляцийн коэффициентийн ач холбогдлыг тодорхойлъё. Бидний харж байгаагаар x 1-ийг загварт оруулсан тохиолдолд у ба x 2 хоорондын холболт буурсан байна. Эндээс бид регрессийн тэгшитгэлд x 2 оруулах нь тохиромжгүй хэвээр байна гэж дүгнэж болно.
Регрессийн тэгшитгэлийг байгуулахдаа x 1, x 2 хүчин зүйлсийг сонгох хэрэгтэй гэж бид дүгнэж болно.

Жишээ №2. 30 ажиглалтын хувьд хосолсон корреляцийн коэффициентийн матриц дараах байдалтай байна.

yx 1x 2x 3
y1,0
x 10,30 1,0
x 20,60 0,10 1,0
x 30,40 0,15 0,80 1,0
Хүчин зүйлийн олон шугаман байдлыг үнэлэх. Стандарт масштабаар регрессийн тэгшитгэл байгуулж, дүгнэлт гарга.
  • 4. Хамгийн бага квадратын аргыг ашиглан PLR параметрийн статистик үнэлгээ. Хамгийн бага квадратын тооцооллын шинж чанарууд
  • Хамгийн бага квадратын тооцооллын шинж чанарууд:
  • 5. Олон шугаман регрессийн чанарыг шалгах: параметрийн ач холбогдол, итгэлцлийн интервал, загварын хүрэлцээ. Урьдчилан мэдээлэх.
  • 6. Олон шугаман регресс (MLR). Сонгодог таамаглалууд. Загварын параметрүүдийн OLS үнэлгээ.
  • 7. Олон шугаман регрессийн OLS үнэлгээний шинж чанарууд. Гаусс-Марковын теорем.
  • 8. Олон шугаман регрессийн чанарыг шалгах: параметрийн ач холбогдол, итгэлцлийн интервал, загварын хүрэлцээ. Урьдчилан мэдээлэх.
  • 5. Коэффициент Тодорхойлолт
  • Олон шугаман регрессийн загвар ашиглан урьдчилан таамаглах
  • 9. Эконометрик загварын тодорхойлолт: экзоген хувьсагчдыг сонгох арга, оношлогоо. Рамси, Амемья нарын сорил.
  • Рэмсигийн шалгуур:
  • 10. Эконометрик загварын тодорхойлолт: шугаман бус загварын хамаарлын хэлбэрийг сонгох
  • Тодорхойлолтын зарчим
  • 11. Multicollinearity-ийн асуудал. Multicollinearity байгаа эсэх, оношлох үр дагавар.
  • Multicollinearity-ийг оношлох аргууд:
  • 12. Multicollinearity-ийг арилгах арга. Үндсэн бүрэлдэхүүн хэсгийн арга. Ridge регресс.
  • 13. Загварын гетероскедастикийн асуудлууд. Түүний оношлогооны шалгуурууд.
  • 1. Паркийн шалгуур.
  • 2. Голдфельд-Квандтын шалгуур.
  • 3. Брейш-Паганы шалгуур.
  • 4. Цагаан шалгуур.
  • 14. Ерөнхийжүүлсэн хамгийн бага квадратууд (омс). omnk-ийн млр тооцооны шинж чанарууд. Загварын параметрүүдийг тооцоолох асуудалд жигнэсэн хамгийн бага квадратын арга. Жигнэсэн хамгийн бага квадратыг ашиглан тооцооллын шинж чанарууд.
  • Асуулт 15. Загварын үлдэгдлийн автокорреляцийн асуудал. Загвар ашиглах үед автокорреляцийн үр дагавар.
  • Үлдэгдэл автокорреляцийн шалтгаанууд
  • Автокорреляцийн үр дагавар:
  • 16. Durbin-Watson автокорреляцийн оношлогооны шалгуур
  • 17.Автокорреляцийг арилгах арга. Кокрейн-Оркутт, Хилдрет-Лу нарын онооны журам
  • 18. Тархсан хоцрогдолтой загварууд: Коикийн дагуу хоцрогдлын бүтэц: Онцгой тохиолдлууд (бүрэн бус тохируулгатай, дасан зохицох хүлээлттэй загвар)
  • 19 Тархсан хоцрогдолтой загварууд: Алмоны дагуу хоцрогдлын шугаман арифметик бүтэц ба хоцрогдлын олон гишүүнт бүтэц
  • 20. Хоцрогдсон загваруудын автокорреляцийг шалгах h-Durbin тест ба олон Лагранжийн тест
  • 21. Хугацааны цувааны тухай ойлголт (хугацаа). VR загвар, VR шинжилгээний үндсэн ажлууд. Цагийг тэгшитгэх аргууд (хөдөлгөөнт дундаж, экспоненциал тэгшитгэх, дараалсан ялгаа)
  • 22 Хугацааны цувааны стационар байдал (хугацаа). Температурын түвшний хамаарлын шинж чанар.
  • 23 Хөдөлгөөнгүй хугацааны цувааны загварууд: авторегресс, хөдөлж буй дундаж, нуман
  • 24. Арисын суурин бус загвар. Загварын параметрүүдийн тооцоо.
  • 28. Хугацааны цувааны таамаглал. Урьдчилан таамаглах нарийвчлалын үзүүлэлтүүд.
  • 30. Эконометрик загварт дамми хувьсагчдыг оруулсан эсэхийг оношлох Чоу тест.
  • 32. Зэрэгцсэн эконометрик тэгшитгэлийн системүүд (SOE). Системийн бүтцийн болон багасгасан хэлбэр (график болон матрицын дүрслэл).
  • 33. Нэгэн зэрэглэлийн тэгшитгэлийн системийг (SOE) тодорхойлох асуудал. Шар буурцгийн тэгшитгэлийг тодорхойлох чадвар (дан болон зэрэглэлийн шалгуурууд)
  • 34. Нэгэн зэрэглэлийн тэгшитгэлийн системийг тооцоолох арга: шууд бус хамгийн бага квадратын арга, хоёр шатлалт хамгийн бага квадратын арга. Үнэлгээний хэрэглээ ба шинж чанарууд
  • 35. Эконометрикийн өнөөгийн байдал. Том хэмжээний эконометрик загваруудын жишээ
  • 11. Multicollinearity-ийн асуудал. Multicollinearity байгаа эсэх, оношлох үр дагавар.

    Хэрэв боломжтой бол экзоген хувьсагчдын шугаман хамаарал , жишээлбэл, дараа нь OLS тооцоо байхгүй болно, учир нь ганц бие байх урвуу матриц байхгүй. Эконометрикийн энэ байдлыг асуудал гэж нэрлэдэг multicollinearity.

    Олон шугаман байдлын шалтгаанууд:

    буруу загварын тодорхойлолт

    статистик мэдээллийг хайхрамжгүй цуглуулах (давтан ажиглалтыг ашиглах).

    Ялгах тодорхой Тэгээд далд multicollinearity.

    Ил тод - мэдэгдэж байна яг шугаман хамааралзагвар хувьсагч хооронд.

    Жишээлбэл, хэрэв хөрөнгө оруулалтын үйл явцын загварт нэрлэсэн болон бодит хүүгийн түвшин багтсан бол, i.e.

    Бодит ба нэрлэсэн ханш ба инфляцийн түвшин хоорондын хамаарлыг мэддэг

    тэгвэл илт олон шугаман байдал байна.

    Далд байгаа үед үүсдэг стохастик (тодорхой бус, санамсаргүй) шугаман хамаарал экзоген хувьсагчдын хооронд.

    далд давамгайлж, түүний оршихуй нь тодорхойлогддог6 тэмдэг :

    1. Загварын параметрүүдийн OLS тооцоолол нүүлгэн шилжүүлээгүй шинж чанараа алддаг .

    2. OLS үнэлгээний зөрүү нэмэгддэг:

    Үүний улмаас корреляцийн коэффициент, дараа нь, үүнд хүргэдэг

    3. Бууралт ажиглагдаж байна т- параметрүүдийн ач холбогдлын үзүүлэлт болох статистик:

    4. Бага утга учир детерминацийн коэффициент нь загварын хүрэлцээний хэмжүүр байхаа больсон. т-статистикчид сонгосон хамаарлын загварт үл итгэх байдалд хүргэдэг.

    5. Коллинеар бус экзоген хувьсагчдын параметрийн тооцоолол нь өгөгдлийн өөрчлөлтөд маш мэдрэмтгий болдог.

    6. Коллинеар бус экзоген хувьсагчдын параметрийн үнэлгээ ач холбогдолгүй болно.

    Multicollinearity-ийг оношлох аргууд:

    1-р алхам.(Анхны) олон шугаман регрессийн загварт бид аливаа экзоген хувьсагч эндоген болдог бүх дэд загваруудыг үзэх болно.

    Алхам 2.Бид үүссэн бүх загваруудын тодорхойлох коэффициентийг тооцоолж, үүний үндсэн дээр инфляцийн хүчин зүйл гэж нэрлэгддэг зүйлийг тооцоолно.

    Хэрэв , тэгвэл тэд multicollinearity байдаг гэж дүгнэдэг.

    a) загварт ямар ч бүтцийг өөрчлөхгүй, харин компьютерийн хамгийн бага квадратуудыг ашиглан харааны аргуудыг ашиглан олон шугаман байдлын асуудал байгаа эсэхийг шинжлэх.

    б) анхны загвараас коллинеар экзоген хувьсагчдыг хасах замаар загварын тодорхойлолтыг сайжруулах.

    в) статистик мэдээллийн хэмжээг нэмэгдүүлэх.

    г) коллинеар хувьсагчдыг нэгтгэж, нийтлэг экзоген хувьсагчийг загварт оруулах.

    12. Multicollinearity-ийг арилгах арга. Үндсэн бүрэлдэхүүн хэсгийн арга. Ridge регресс.

    Хэрэв загварын гол ажил бол хамааралтай хувьсагчийн ирээдүйн утгыг урьдчилан таамаглах явдал юм бол R2 (≥ 0.9) тодорхойлох хангалттай том коэффициенттэй бол олон шугаман хамаарал нь ихэвчлэн загварын таамаглах чанарт нөлөөлдөггүй.

    Хэрэв судалгааны зорилго нь тайлбарлагч хувьсагч бүрийн хамааралтай хувьсагчдад үзүүлэх нөлөөллийн түвшинг тодорхойлох явдал юм бол олон коллинеар байдал байгаа нь хувьсагчдын хоорондын жинхэнэ хамаарлыг гажуудуулна. Ийм нөхцөлд олон шугаман байдал нь ноцтой асуудал болж байна.

    Ямар ч тохиолдолд тохирох олон шугаман байдлыг арилгах ганц арга байхгүй гэдгийг анхаарна уу. Учир нь олон шугаман байдлын шалтгаан, үр дагавар нь хоёрдмол утгатай бөгөөд түүврийн үр дүнгээс ихээхэн хамаардаг.

    АРГА:

    Загвараас хувьсагч(ууд)-ыг хассан

    Жишээлбэл, тодорхой барааны эрэлтийг судлахдаа энэ барааны үнэ болон энэ барааны орлуулагчдын үнийг ихэвчлэн харилцан хамааралтай байдаг тайлбарлагч хувьсагч болгон ашиглаж болно. Загвараас орлуулах бүтээгдэхүүний үнийг хассанаар бид техникийн үзүүлэлтийн алдаа гаргах магадлалтай. Үүний үр дүнд өрөөсгөл тооцоо гаргаж, үндэслэлгүй дүгнэлт хийх боломжтой. Хэрэглээний эконометрик загваруудад коллинеар байдал нь ноцтой асуудал болох хүртэл тайлбарлагч хувьсагчдыг оруулахгүй байхыг зөвлөж байна.

    Илүү их мэдээлэл эсвэл шинэ дээж авч байна

    Заримдаа дээжийн хэмжээг нэмэгдүүлэхэд хангалттай. Жишээлбэл, хэрэв та жилийн өгөгдөл ашиглаж байгаа бол улирлын өгөгдөл рүү шилжиж болно. Өгөгдлийн хэмжээг нэмэгдүүлэх нь регрессийн коэффициентүүдийн хэлбэлзлийг бууруулж, улмаар статистикийн ач холбогдлыг нэмэгдүүлдэг. Гэсэн хэдий ч шинэ дээж авах эсвэл хуучин дээжийг өргөжүүлэх нь үргэлж боломжгүй байдаг эсвэл ноцтой зардалтай холбоотой байдаг. Үүнээс гадна энэ арга нь автокорреляцийг бэхжүүлж чадна. Эдгээр асуудлууд нь ашиглах чадварыг хязгаарладаг энэ арга.

    Загварын тодорхойлолтыг өөрчлөх

    Зарим тохиолдолд олон шугаман байдлын асуудлыг загварын тодорхойлолтыг өөрчлөх замаар шийдэж болно: загварын хэлбэрийг өөрчлөх, эсвэл анхны загварт харгалзаагүй тайлбарлагч хувьсагчдыг нэмэх, гэхдээ хамааралтай хувьсагчдад ихээхэн нөлөөлдөг. .

    Зарим параметрийн талаархи урьдчилсан мэдээллийг ашиглах

    Заримдаа, олон регрессийн загварыг бий болгохдоо та урьдчилсан мэдээлэл, тухайлбал зарим регрессийн коэффициентүүдийн мэдэгдэж буй утгыг ашиглаж болно. Зарим урьдчилсан (ихэвчлэн энгийн) загварууд эсвэл урьд нь олж авсан түүвэр дээр суурилсан ижил төстэй загварт зориулж олж авсан коэффициентүүдийн утгыг боловсруулж буй загварт ашиглаж болно. Энэ мөчзагварууд.

    Үүнийг харуулахын тулд бид дараах жишээг өгье. Регресс бий болсон. X1 ба X2 хувьсагчдыг харилцан хамааралтай гэж үзье. Өмнө нь бүтээгдсэн хосолсон регрессийн загварын Y = γ0 + γ1X1+υ хувьд статистикийн ач холбогдолтой γ1 коэффициентийг (тодорхой байдлын хувьд γ1 = 0.8 гэж үзье) тодорхойлсон бөгөөд Y-ийг X1-тэй холбосон. Хэрэв Y ба X1 хоорондын хамаарал өөрчлөгдөхгүй гэж үзэх үндэслэл байгаа бол бид γ1 = β1 = 0.8 гэж тохируулж болно. Дараа нь:

    Y = β0 + 0.8X1 + β2X2 + ε. ⇒ Y – 0.8X1 = β0 + β2X2 + ε.

    Уг тэгшитгэл нь үнэндээ хос регрессийн тэгшитгэл бөгөөд олон шугаман байдлын асуудал байхгүй.

    Энэ аргыг ашиглах хязгаарлалт нь дараахь шалтгаанаас үүдэлтэй.

      Урьдчилсан мэдээлэл олж авах нь ихэвчлэн хэцүү байдаг.

      хуваарилагдсан регрессийн коэффициент нь ижил байх магадлал янз бүрийн загварууд, өндөр биш.

    Хувьсагчдыг хөрвүүлэх

    Зарим тохиолдолд хувьсагчдыг хувиргах замаар олон шугаман байдлын асуудлыг багасгах эсвэл бүр арилгах боломжтой.

    Жишээлбэл, эмпирик регрессийн тэгшитгэлийг Y = b0 + b1X1 + b2X2 гэж үзье.

    Энд X1 ба X2 нь харилцан хамааралтай хувьсагч юм. Энэ тохиолдолд та харьцангуй утгуудын регрессийн хамаарлыг тодорхойлохыг оролдож болно. Ижил төстэй загваруудад олон шугаман байдлын асуудал гарахгүй байх магадлалтай.

    Үндсэн бүрэлдэхүүн хэсгийн арга нь олон регрессийн загвараас хувьсагчдыг арилгах үндсэн аргуудын нэг юм.

    Энэ аргыг регрессийн загварт хүчин зүйлийн хувьсагчийн олон шугаман байдлыг арилгах буюу багасгахад ашигладаг. Аргын мөн чанар : хүчин зүйлийн хувьсагчийн тоог хамгийн ихээр нөлөөлж буй хүчин зүйл болгон бууруулах . Энэ нь бүх хүчин зүйлийн xi (i=0,...,n) хувьсагчдыг үндсэн бүрэлдэхүүн хэсэг гэж нэрлэгддэг шинэ хувьсагч болгон шугаман хувиргах замаар хүрдэг. Х хүчин зүйлийн хувьсагчдын матрицаас F үндсэн бүрэлдэхүүн хэсгүүдийн матриц руу шилжих шилжилт хийгдэнэ. Энэ тохиолдолд эхний үндсэн бүрэлдэхүүнийг сонгох нь бүх хүчин зүйлийн xi (i=0,...,n) хувьсагчийн нийт дисперсийн хамгийн их утгатай, хоёр дахь бүрэлдэхүүн хэсэг нь хамгийн их утгатай тохирч байх шаардлагыг тавьж байна. эхний үндсэн бүрэлдэхүүн хэсгийн нөлөөллийг арилгасны дараа үлдсэн хэлбэлзэл гэх мэт.

    Хэрэв олон тооны регрессийн загварт багтсан хүчин зүйлсийн аль нь ч хувьсагчийг хасах боломжгүй бол регрессийн загварын коэффициентийг тооцоолох үндсэн хэвийсэн аргуудын нэгийг ашиглана. нурууны регресс буюу нуруу. Нурууны регрессийн аргыг ашиглах үед матрицын бүх диагональ элементүүдэд бага тоо нэмэгддэг (XTX) τ: 10-6 ‹ τ ‹ 0.1. Олон тооны регрессийн загварын үл мэдэгдэх параметрүүдийн тооцоог дараах томъёогоор гүйцэтгэнэ.

    Энд ln нь таних матриц юм.

    Үндсэн заалтууд

    Хэрэв загвар дахь регрессүүд нь хатуу функциональ хамаарлаар холбогдсон бол бүрэн (төгс) олон шугаман холбоо. Энэ төрөлЖишээлбэл, матрицын тодорхойлогч нь тэгтэй тэнцүү бол хамгийн бага квадратуудын аргаар шийдсэн шугаман регрессийн асуудалд олон шугаман хамаарал үүсч болно. Бүрэн олон шугаман байдал нь анхны загварын параметрүүдийг хоёрдмол утгагүй үнэлэх, ажиглалтын үр дүнд үндэслэн гаралтын хувьсагчид регрессүүдийн оруулсан хувь нэмрийг салгах боломжийг бидэнд олгодоггүй.

    Бодит өгөгдөлтэй холбоотой асуудлуудад бүрэн олон шугаман байдал маш ховор тохиолддог. Үүний оронд програмын домэйнд бид ихэвчлэн тулгардаг хэсэгчилсэн олон шугаман байдал, энэ нь регрессүүдийн хоорондын хос корреляцийн коэффициентээр тодорхойлогддог. Хэсэгчилсэн олон шугаман байдлын хувьд матриц бүрэн зэрэгтэй байх боловч тодорхойлогч нь тэгтэй ойролцоо байна. Энэ тохиолдолд загварын параметрүүд болон тэдгээрийн нарийвчлалын үзүүлэлтүүдийн тооцоог албан ёсоор авах боломжтой боловч тэдгээр нь бүгд тогтворгүй байх болно.

    Хэсэгчилсэн олон шугаман байдлын үр дагаврын дунд дараахь зүйлс орно.

    • параметрийн үнэлгээний хэлбэлзлийн өсөлт
    • параметрүүдийн t-статистик утгын бууралт нь тэдгээрийн статистик ач холбогдлын талаар буруу дүгнэлт хийхэд хүргэдэг.
    • загварын параметрүүдийн тогтворгүй тооцоолол ба тэдгээрийн хэлбэлзэл
    • параметрийн үнэлгээний онолын үүднээс буруу тэмдэг авах боломж

    Хэсэгчилсэн олон шугаман байдлыг илрүүлэх нарийн тоон шалгуур байдаггүй. Түүний оршихуйн шинж тэмдэг болгон дараахь зүйлийг ихэвчлэн ашигладаг.

    Multicollinearity-ийг арилгах аргууд

    Энэ асуудлыг шийдэх хоёр үндсэн арга байдаг.

    Хүчин зүйлсийг хэрхэн сонгохоос үл хамааран тэдгээрийн тоог багасгах нь матрицын нөхцөл байдлыг сайжруулж, улмаар загварын параметрүүдийн үнэлгээний чанарыг нэмэгдүүлэхэд хүргэдэг.

    Бүртгэгдсэн аргуудаас гадна нэлээд сайн үр дүнг өгдөг өөр нэг энгийн арга байдаг - энэ бол урьдчилан төвлөрүүлэх арга. Аргын мөн чанар нь параметрүүдийг олохын өмнө юм математик загварЭх өгөгдөл нь төвлөрсөн: өгөгдлийн цувралын утга тус бүрээс цувралын дундажийг хасна: . Энэ процедур нь LSM нөхцлийн гиперплангуудыг хооронд нь перпендикуляр байхаар тусгаарлах боломжийг олгодог. Үүний үр дүнд загварын тооцоолол тогтвортой болдог (Олон хүчин зүйлийн загварыг олон коллинеарийн нөхцөлд байгуулах).

    ОХУ-ын Боловсрол, шинжлэх ухааны холбооны агентлаг

    Кострома улсын технологийн их сургууль.

    Дээд математикийн тэнхим

    сэдвээр эконометрикийн чиглэлээр:

    Олон шугаман байдал

    Гүйцэтгэсэн

    1-р курсын оюутан

    захидал харилцааны факультет

    унтах "Нягтлан бодох бүртгэл"

    дүн шинжилгээ ба аудит".

    Би шалгасан

    Катержина С.Ф.

    Кострома 2008 он


    Олон шугаман байдал

    Multicollinearity гэдэг нь тайлбарлагч хувьсагчдын өндөр харилцан хамаарлыг хэлнэ. Multicollinearity нь функциональ (тодорхой) болон стохастик (далд) хэлбэрээр илэрч болно.

    дагуу multicollinearity функциональ хэлбэрээр ядажтайлбарлагч хувьсагчдын хоорондын хос хамаарлын нэг нь шугаман функциональ хамаарал юм. Энэ тохиолдолд X`X матриц онцгой, учир нь энэ нь шугаман хамааралтай баганын векторуудыг агуулдаг бөгөөд тодорхойлогч нь тэгтэй тэнцүү, өөрөөр хэлбэл. регрессийн шинжилгээний үндэслэл зөрчигдөж байгаа нь хэвийн тэгшитгэлийн харгалзах системийг шийдвэрлэх, регрессийн загварын параметрүүдийн тооцоог олж авах боломжгүй болоход хүргэдэг.

    Гэсэн хэдий ч эдийн засгийн судалгаанд дор хаяж хоёр тайлбарлагч хувьсагчийн хооронд нягт уялдаа холбоо байгаа тохиолдолд олон шугаман байдал нь стохастик хэлбэрээр илэрдэг. Энэ тохиолдолд X`X матриц нь ганц биш боловч тодорхойлогч нь маш бага байна.

    Үүний зэрэгцээ b үнэлгээний вектор ба түүний ковариацын матриц ∑ b нь пропорциональ байна. урвуу матриц(X`X) -1 , энэ нь тэдгээрийн элементүүд нь |X`X| тодорхойлогчийн утгатай урвуу пропорциональ байна гэсэн үг. Үүний үр дүнд b 0 , b 1 , ..., b p регрессийн коэффициентүүдийн мэдэгдэхүйц стандарт хазайлт (стандарт алдаа) гарч ирсэн бөгөөд тэдгээрийн ач холбогдлыг t тест ашиглан үнэлэх нь утгагүй боловч ерөнхийдөө регрессийн загвар өөрчлөгдөж магадгүй юм. F-тестийг ашигласнаар чухал ач холбогдолтой болсон.

    Тооцоолол нь ажиглалт болон түүврийн хэмжээ бага зэрэг өөрчлөгдөхөд маш мэдрэмтгий болдог. Энэ тохиолдолд регрессийн тэгшитгэл нь дүрмээр бол бодит утгагүй, учир нь түүний зарим коэффициентүүд нь эдийн засгийн онолын үүднээс буруу тэмдэгтэй, үндэслэлгүй том утгатай байж болно.

    Multicollinearity байгаа эсэх, байхгүй эсэхийг тодорхойлох нарийн тоон шалгуур байдаггүй. Гэсэн хэдий ч үүнийг тодорхойлох эвристик аргууд байдаг.

    Ийм аргуудын нэг нь X 1 , X 2 , ..., X p тайлбарлагч хувьсагчдын хоорондын корреляцийн матрицад дүн шинжилгээ хийж, хувьсагчийн хамаарал ихтэй (ихэвчлэн 0.8-аас их) хувьсагчийн хосыг тодорхойлох явдал юм. Хэрэв ийм хувьсагч байгаа бол тэдгээрийг multicollinearity гэж нэрлэдэг. Тайлбарлах хувьсагчдын аль нэг ба тэдгээрийн зарим бүлгийн хоорондын детерминацийн олон коэффициентийг олох нь бас ашигтай байдаг. Олон тооны детерминацийн коэффициент (ихэвчлэн 0.6-аас их) байгаа нь олон шугаман байдлыг илтгэнэ.

    Өөр нэг арга бол X`X матрицыг судлах явдал юм. Хэрэв X`X матрицын тодорхойлогч буюу түүний хамгийн бага хувийн утга λ min нь тэгтэй ойролцоо байвал (жишээлбэл, хуримтлагдсан тооцооллын алдаатай ижил дарааллаар), энэ нь олон шугаман хамаарал байгааг илтгэнэ. X`X матрицын хамгийн их хувийн утга λ max нь түүний хамгийн бага хувийн утга λ min -ээс мэдэгдэхүйц хазайлтаар ижил зүйлийг илэрхийлж болно.

    Multicollinearity-ийг арилгах эсвэл багасгахын тулд хэд хэдэн аргыг ашигладаг. Тэдгээрийн хамгийн энгийн нь (гэхдээ үргэлж боломжгүй) нь корреляцийн өндөр коэффициенттэй (0.8-аас дээш) хоёр тайлбарлагч хувьсагчийн нэг хувьсагчийг авч үзэхгүй. Үүний зэрэгцээ аль хувьсагчийг орхих, алийг нь шинжилгээнээс хасахыг эдийн засгийн үндэслэлд үндэслэн шийддэг. Хэрэв эдийн засгийн үүднээс авч үзвэл аль ч хувьсагчид давуу эрх олгох боломжгүй бол хамааралтай хувьсагчтай илүү өндөр корреляцийн коэффициенттэй хоёр хувьсагчийн аль нэгийг нь хадгална.

    Multicollinearity-ийг арилгах эсвэл багасгах өөр нэг арга бол хамгийн бага квадратын аргаар тодорхойлсон шударга бус тооцооллоос нэг талыг барьсан тооцоололд шилжих явдал боловч тооцоолсон параметртэй харьцуулахад бага тархалттай байдаг. β j эсвэл M (b j - β j) 2 параметрээс b j үнэлгээний квадрат хазайлтын бага математикийн хүлээлт.

    Вектороор тодорхойлсон тооцоолол нь Гаусс-Марковын теоремын дагуу бүх шугаман бус үнэлэгчийн ангиллын хамгийн бага дисперстэй байх боловч олон шугаман хамаарал байгаа тохиолдолд эдгээр хэлбэлзэл нь хэт их байж болох бөгөөд харгалзах хэвийсэн үнэлэгч рүү шилжих боломжтой. регрессийн параметрүүдийг тооцоолох нарийвчлалыг сайжруулах. Зураг дээр хэвийсэн тооцоо β j ^, түүврийн тархалтыг φ (β j ^) нягтралаар өгсөн тохиолдлыг харуулав.

    Үнэн хэрэгтээ, β j тооцоолсон параметрийн зөвшөөрөгдөх хамгийн их итгэлийн интервалыг (β j -Δ, β j +Δ) гэж үзье. Дараа нь зурагнаас харахад хялбар (β j -Δ, β j +Δ) интервал дээрх тархалтын муруйн доорх талбайгаар тодорхойлогдсон итгэлийн магадлал буюу тооцооны найдвартай байдал нь энэ тохиолдолд илүү их байх болно. b j-тэй харьцуулсан β j-ийн тооцооны хувьд (зураг дээр эдгээр хэсгүүд нь сүүдэрлэсэн байна). Үүний дагуу тооцоолсон параметрээс тооцоолсон дундаж квадрат хазайлт нь өрөөсгөл үнэлгээний хувьд бага байх болно, тухайлбал:

    М (β j ^ - β j) 2< M (b j - β j) 2

    Шударга бус тооцооны оронд "хялбарын регресс" (эсвэл "уулын регресс") -ийг ашиглахдаа вектороор тодорхойлсон хэвийсэн тооцооллыг авч үзнэ.

    β τ ^ =(X`X+τ E p +1) -1 X`Y,

    Хаана τ – "Уулын хяр" эсвэл "уул" гэж нэрлэгддэг зарим эерэг тоо

    E p +1 – --р эрэмбийн нэгж матриц (p+1).

    Нэмэлт τ X`X матрицын диагональ элементүүд рүү шилжих нь загварын параметрүүдийн тооцооллыг өөрчилдөг боловч үүнтэй зэрэгцэн хэвийн тэгшитгэлийн системийн матрицын тодорхойлогч нэмэгдэх болно - оронд нь (X`X) -аас тэнцүү байх болно.

    |X`X+τ E p +1 |

    Тиймээс тодорхойлогч |X`X| тэг дөхөж байна.

    Олон шугаман байдлыг арилгахын тулд нэлээд ойр хамаарлаар холбогдсон анхны X 1, X 2,…, X n тайлбарлагч хувьсагчдаас анхны шугаман хослолыг илэрхийлсэн шинэ хувьсагчид руу шилжих шилжилтийг ашиглаж болно. Энэ тохиолдолд шинэ хувьсагчид сул хамааралтай эсвэл бүрэн хамааралгүй байх ёстой. Ийм хувьсагчийн хувьд бид жишээлбэл, бүрэлдэхүүн хэсгүүдийн шинжилгээнд судлагдсан анхны тайлбарлагч хувьсагчдын векторын үндсэн бүрэлдэхүүн хэсгүүдийг авч, үндсэн бүрэлдэхүүн хэсгүүдийн регрессийг авч үздэг бөгөөд эдгээр нь ерөнхий тайлбарлагч хувьсагчийн үүрэг гүйцэтгэдэг. утга учиртай (эдийн засгийн) тайлбар.

    Үндсэн бүрэлдэхүүн хэсгүүдийн ортогональ байдал нь олон шугаман байдлын нөлөөллөөс сэргийлдэг. Үүнээс гадна ашигласан арга нь харьцангуй олон тооны анхны тайлбарлагч хувьсагчтай цөөн тооны үндсэн бүрэлдэхүүн хэсгүүдийг хязгаарлах боломжийг бидэнд олгодог.

    Олон шугаман байдал -тайлбарлагч хувьсагчдын хоорондын сул шугаман хамаарал нь найдваргүй регрессийн тооцоонд хүргэдэг асуудлыг тодорхойлоход хэрэглэгддэг ойлголт юм. Мэдээжийн хэрэг, ийм хараат байдал нь хангалтгүй үнэлгээнд хүргэдэггүй. Хэрэв бусад бүх нөхцөл таатай байвал, өөрөөр хэлбэл тайлбарлагч хувьсагчдын ажиглалтын тоо, түүврийн дисперс их, санамсаргүй нэр томъёоны дисперс бага байвал эцэст нь та нэлээд сайн тооцоолол авч болно.

    Тиймээс олон шугаман байдал нь сул харилцаа ба нэг (эсвэл хэд хэдэн) таагүй нөхцөл байдлын хослолоос үүдэлтэй байх ёстой бөгөөд энэ нь асуулт юм.

    түүний төрөл биш харин үзэгдлийн илрэлийн зэрэг. Бүх бие даасан хувьсагчид бүрэн хамааралгүй болоогүй л бол аливаа регрессийн тооцоо нь тодорхой хэмжээгээр хохирох болно. Энэ асуудлыг авч үзэх нь регрессийн үнэлгээний үр дүнд ноцтой нөлөөлсөн үед л эхэлдэг.

    Хугацааны цувааны регрессийн хувьд энэ асуудал нийтлэг байдаг, өөрөөр хэлбэл өгөгдөл нь тодорхой хугацааны туршид олон тооны ажиглалтаас бүрддэг. Хэрэв хоёр ба түүнээс дээш бие даасан хувьсагч нь цаг хугацааны хүчтэй хандлагатай бол тэдгээр нь маш их хамааралтай байх ба энэ нь олон шугаман байдалд хүргэдэг.


    Энэ тохиолдолд юу хийж болох вэ?

    Олон тооны уялдаа холбоог багасгахад ашиглаж болох янз бүрийн арга техникийг хоёр ангилалд хуваадаг: эхний ангилалд регрессийн тооцооллын найдвартай байдлын дөрвөн нөхцөлийг хангах түвшинг сайжруулах оролдлого; хоёр дахь ангилалд хэрэглээ орно гадаад мэдээлэл. Хэрэв бид эхлээд шууд олж авах боломжтой өгөгдлийг ашиглавал ажиглалтын тоог нэмэгдүүлэх нь мэдээжийн хэрэг.

    Хэрэв та хугацааны цувааны өгөгдлийг ашиглаж байгаа бол үүнийг хугацаа бүрийн үргэлжлэх хугацааг богиносгох замаар хийж болно. Жишээлбэл, Дасгал 5.3 ба 5.6 дахь эрэлтийн функцийн тэгшитгэлийг тооцоолохдоо жилийн өгөгдлийг ашиглахаас улирлын өгөгдөл рүү шилжиж болно.

    Үүний дараа 25 ажиглалтын оронд 100 байх болно. Энэ нь маш ойлгомжтой бөгөөд хийхэд маш хялбар тул цаг хугацааны цувааг ашигладаг ихэнх судлаачид олон шугаман байдлын асуудал биш байсан ч жилийн өгөгдлийн оронд боломжтой бол улирлын өгөгдлийг бараг автоматаар ашигладаг. зүгээр л аргументийн төлөө.регрессийн коэффициентүүдийн онолын хамгийн бага дисперсүүд. Гэсэн хэдий ч энэ арга барилд болзошгүй бэрхшээлүүд бий. Автокорреляцийг нэвтрүүлж эсвэл сайжруулж болох боловч саармагжуулж болно. Түүнчлэн, улирлын өгөгдлийг жилийн харгалзах өгөгдлөөс бага нарийвчлалтайгаар хэмждэг бол хэмжилтийн алдаанаас үүдэлтэй хазайлтыг нэвтрүүлэх (эсвэл олшруулах) боломжтой. Энэ асуудлыг шийдэхэд амаргүй ч ач холбогдолгүй байж магадгүй юм.

    Multicollinearity гэдэг нь регрессийн тэгшитгэл дэх хоёр ба түүнээс дээш тайлбарлагч хувьсагчийн хамаарлыг хэлнэ. Энэ нь функциональ (тодорхой) ба стохастик (далд) байж болно. Функциональ олон шугаман байдлын хувьд XTX матриц нь доройтож, (XTX)-1 байхгүй тул тодорхойлох боломжгүй юм. Ихэнх тохиолдолд multicollinearity нь стохастик хэлбэрээр илэрдэг бол OLS тооцоо албан ёсоор байдаг боловч хэд хэдэн сул талуудтай байдаг.

    • 1) анхны өгөгдлийн бага зэрэг өөрчлөлт нь регрессийн тооцоонд мэдэгдэхүйц өөрчлөлт гарахад хүргэдэг;
    • 2) тооцоолол нь том стандарт алдаатай, ач холбогдол багатай, харин загвар нь бүхэлдээ чухал ач холбогдолтой (R2-ийн өндөр утгатай);
    • 3) коэффициентүүдийн интервалын тооцоо өргөжиж, тэдгээрийн нарийвчлалыг улам дордуулдаг;
    • 4) регрессийн коэффициентийн буруу тэмдгийг авах боломжтой.

    Илрүүлэх

    Multicollinearity байгаа эсэхийг тодорхойлох хэд хэдэн шинж тэмдэг байдаг.

    Нэгдүгээрт, хос корреляцийн коэффициентүүдийн корреляцийн матрицад дүн шинжилгээ хийх:

    • - хэрэв корреляцийн коэффициент өндөр (> 0.75 - 0.8) хос хувьсагчид байгаа бол тэдгээрийн хоорондын олон шугаман байдлын тухай ярьдаг;
    • - хүчин зүйлс хамааралгүй бол det Q = 1, бүрэн хамаарал байвал det Q = 0 байна.

    Та H0-г шалгаж болно: det Q = 1; статистик тест ашиглан

    Энд n нь ажиглалтын тоо, m = p+1.

    Хэрэв, H0 татгалзаж, олон шугаман байдал нотлогдоно.

    Хоёрдугаарт, тайлбарлагч хувьсагчдын аль нэгийг болон бусад зарим бүлгийн тодорхойлох олон коэффициентийг тодорхойлдог. Өндөр R2 (> 0.6) байгаа нь олон шугаман байдлыг илтгэнэ.

    Гуравдугаарт, XTX матрицын хамгийн бага хувийн утгын тэгтэй ойролцоо байгаа нь (өөрөөр хэлбэл тэгшитгэлийн шийдэл) det(XTX) нь мөн тэгтэй ойролцоо, тиймээс олон шугаман холболт байгааг харуулж байна.

    Дөрөвдүгээрт, хэсэгчилсэн корреляцийн өндөр коэффициент.

    Түүврийн корреляцийн коэффициентийн матрицын элементүүдийн алгебрийн нэмэгдлүүд хаана байна. Дээд зэрэглэлийн хэсэгчилсэн корреляцийн коэффициентийг давтагдах томъёог ашиглан доод эрэмбийн хэсэгчилсэн корреляцийн коэффициентээр тодорхойлж болно.

    Тавдугаарт, зарим хүмүүс multicollinearity байгаа тухай ярьдаг гадаад шинж тэмдэгбүтээгдсэн загвар бөгөөд энэ нь түүний үр дагавар юм. Эдгээр нь дараахь зүйлийг агуулсан байх ёстой.

    • · зарим тооцоолол нь эдийн засгийн онолын үүднээс буруу тэмдэгтэй эсвэл үндэслэлгүй их үнэмлэхүй утгатай;
    • · Статистикийн анхны өгөгдөлд бага зэрэг өөрчлөлт оруулах (зарим ажиглалтыг нэмэх, хасах) нь загварын коэффициентүүдийн тооцоонд мэдэгдэхүйц өөрчлөлт гарах, тэр ч байтугай тэдгээрийн тэмдгүүдийг өөрчлөхөд хүргэдэг;
    • · Регрессийн коэффициентүүдийн ихэнх эсвэл бүр бүх тооцоолол нь t-тестийн дагуу статистикийн хувьд ач холбогдолгүй, харин загвар нь бүхэлдээ F тестийн дагуу чухал ач холбогдолтой байдаг.

    Multicollinearity-ийг тодорхойлох өөр хэд хэдэн аргууд байдаг.

    Хэрэв загварын гол ажил бол хамааралтай хувьсагчийн ирээдүйн утгыг урьдчилан таамаглах явдал юм бол R2 тодорхойлох хангалттай том коэффициент (> 0.9) тохиолдолд олон шугаман хамаарал нь ихэвчлэн загварын таамаглах чанарт нөлөөлдөггүй. Ирээдүйд хамааралтай хувьсагчдын хоорондын ижил хамаарал хэвээр байвал энэ мэдэгдэл зөвтгөгдөх болно.

    Хэрэв судалгааны зорилго нь тайлбарлагч хувьсагч бүрийн хамааралтай хувьсагчид үзүүлэх нөлөөллийн түвшинг тодорхойлох явдал юм бол олон коллинеар байдал байгаа нь өсөлтөд хүргэдэг. стандарт алдаа, хамгийн их магадлалтай нь хувьсагчдын хоорондох жинхэнэ харилцааг гажуудуулах болно. Ийм нөхцөлд multicollinearity нь ноцтой асуудал юм.