Buyurtma qilingan logistik regressiya | Statistik izohli chiqish

By 08.09.2021 08.09.2021

Bu sahifada chiqishni tushuntiruvchi izohlar bilan buyurtma qilingan logistik regressiya tahlilining namunasi ko'rsatilgan. Ma'lumotlar 200 ta o'rta maktab o'quvchilarida to'plangan bo'lib, ular fan, matematika, o'qish va ijtimoiy tadqiqotlar kabi turli testlar bo'yicha ballardir. Ushbu tahlilning natijasi- ijtimoiy-iqtisodiy holat ( ses)- past, o'rta va yuqori- biz fan testlari ( fan), ijtimoiy fanlar bo'yicha test ballari ( socst) va jinsi ( ayol) bilan qanday aloqalar borligini bilib olamiz. ). Bizning javob o'zgaruvchimiz, ses, sesdarajalari taxminiga ko'ra tartib sifatida ko'rib chiqiladiholati tabiiy tartibga ega (pastdan balandgacha), lekin qo'shni darajalar orasidagi masofalar noma'lum. Ushbu sahifaning birinchi yarmi koeffitsientlarni tartiblangan log-odds (logits), ikkinchi yarmi esa koeffitsientlarni proportsional koeffitsientlar nuqtai nazaridan izohlaydi.

Takrorlash jurnali a

a. Bu har bir iteratsiyadagi jurnallar ehtimoli ro'yxati. Shuni esda tutingki, tartibli logistika regressiyasi, ikkilik va multinomial logistik regressiya kabi, ehtimolning maksimal bahosini ishlatadi, bu iterativ protsedura. Birinchi takrorlash (iteratsiya 0 deb ataladi) - "null" yoki "bo'sh" modelning log ehtimolligi; ya'ni bashorat qilmaydigan model. Keyingi takrorlashda bashoratchi (lar) modelga kiritiladi. Har bir takrorlashda jurnalning ehtimoli oshadi, chunki maqsad - jurnalning ehtimolini maksimal darajada oshirish. Qachonki ketma -ket takrorlanishlar orasidagi farq juda kichik bo'lsa, model "yaqinlashdi" deyiladi, takrorlanish to'xtaydi va natijalar ko'rsatiladi. Ikkilik natijalar uchun ushbu jarayon haqida qo'shimcha ma'lumot olish uchun J. Skott Longning toifali va cheklangan bog'liq o'zgaruvchilar uchun regressiya modellariga qarang (52-61 betlar).

Model haqida qisqacha ma'lumot

b. Jurnalehtimoli - bu o'rnatilgan modelning jurnalga kirish ehtimoli. Bu modeldagi barcha bashoratchilarning regressiya koeffitsientlari bir vaqtning o'zida nol bo'ladimi yoki yo'qmi, ehtimollik nisbati testida ishlatiladi.

v. Obses soni- bu buyurtma qilingan logistik regressiyada qo'llaniladigan kuzatuvlar soni. Agar tenglamada ba'zi o'zgaruvchilar uchun qiymatlar etishmayotgan bo'lsa, bu ma'lumotlar to'plamidagi holatlar sonidan kam bo'lishi mumkin. Odatiy bo'lib, Stata tugallanmagan holatlarni ro'yxat bo'yicha o'chiradi.

d. LR chi2 (3)-BuLikelihood Ratio (LR) Chi-Square testi, bashoratchilarning regressiya koeffitsientining kamida bittasi modelda nolga teng emas. Qavs ichidagi raqam LR Chi-kvadrat statistikasini sinash uchun ishlatiladigan Chi-kvadrat taqsimotining erkinlik darajasini ko'rsatadi va modeldagi bashoratchilar soni bilan belgilanadi. LR Chi-kvadrat statistikasini -2*(L (null model)-L (o'rnatilgan model)) = -2*((-210.583)-(-194.802)) = 31.560, bu erda L (null model) bilan hisoblash mumkin.modeldagi javob o'zgaruvchisiga ega bo'lgan jurnalning ehtimolligi (Iteratsiya 0) va L (o'rnatilgan model)- barcha parametrlarga ega bo'lgan oxirgi iteratsiyadan (model yaqinlashgan holda) log ehtimoli.

e. Prob>chi2- bu LR testi statistikasini nol gipotezada kuzatilganidan ham haddan ziyod ko'proq olish ehtimoli; null gipoteza - modeldagi barcha regressiya koeffitsientlari nolga teng. Boshqacha qilib aytadigan bo'lsak, bu taxminiy o'zgaruvchilarning ta'siri bo'lmasa, bu chi-kvadrat statistikasini olish ehtimoli (31.56). Bu p-qiymati, odatda, 0,05 yoki 0,01 ga o'rnatiladigan I turdagi xatoni qabul qilishga tayyorligimiz bilan belgilanadi. LR testidan kichik p-qiymati, chi2 (3).

f. Pseudo R2-bu McFaddenning soxta R-kvadrati. Logistik regressiya OLS regressiyasida topilgan R-kvadratga teng emas; ammo, ko'p odamlar bir o'ylab topishga harakat qilishdi. Qarama-qarshi xulosalar chiqaradigan soxta R-kvadrat statistikaning keng tanlovi mavjud. Chunki bu statistika OLS regressiyasida R-kvadrat nimani anglatishini anglatmaydi (bashoratchilar tushuntirgan javob o'zgaruvchisi uchun dispersiya nisbati), biz bu statistikani juda ehtiyotkorlik bilan talqin qilishni taklif qilamiz.

Parametrlar bahosi

g. ses- Bu buyurtma qilingan logistika regressiyasidagi javob o'zgaruvchisi. Sesostida modellardagi prognozlar va maxfiy javob o'zgaruvchisining qo'shni darajalari uchun kesish nuqtalari joylashgan . Quyidagi diagramma yashirin uzluksiz SES bilan bog'langan kuzatilgan toifali SESni ko'rsatadi. 2.75 dan past latent ball olganlar "Past SES", 2.75 va 5.10 oralig'ida yashirin ball olganlar "O'rta SES" va 5.10 dan yuqori bo'lganlar "Yuqori SES" deb tasniflanadi.

h. Kofe.-Bu tartiblangan log-odds (logit) regressiya koeffitsientlari. Buyurtma qilingan logit koeffitsientining standart talqini shundan iboratki, bashoratchining bir birlik ortishi uchun javobning o'zgaruvchanlik darajasi tegishli regressiya koeffitsienti bo'yicha o'zgarishi kutilmoqda, shu bilan birga modeldagi boshqa o'zgaruvchilar o'zgarmaydi. Buyurtma qilingan logit -smetalarning talqini yordamchi parametrlarga bog'liq emas; yordamchi parametrlar javob o'zgaruvchining qo'shni darajalarini farqlash uchun ishlatiladi. Biroq, buyurtma qilingan logit modeli qaram o'zgaruvchining barcha darajalari bo'yicha bitta tenglamani baholagani uchun, bizning bitta tenglamali modelimiz to'g'rimi yoki moslashuvchan model kerakmi, degan tashvish tug'diradi. Biz bu gipotezani proportsional koeffitsientlar testi bilan sinab ko'rishimiz mumkin (akaParallel regressiya farazining Brant testi). Ushbu testni yozish orqali yuklab olish mumkinspost9 qidiruvbuyruq asosida va yordamida Brantbuyrug'ini (I dasturlari izlanglar va foydalanish haqida qo'shimcha ma'lumot olish uchun? qo'shimcha yordam olish uchun qidiruv buyrug'ini foydalanishingiz mumkin Qanday qarang Izlash).

fan- bu boshqa parametrlar modelda doimiy ravishda saqlanib qolganda, kutilayotgan ovozdarajasida fanbali bir birlik ortishi uchun tartib-qoidalar bahosi . Bir mavzu, uning oshirish uchun bo'lsa edi fanbir nuqtasi bilan hisobni, yuqori bo'lgan, uning buyurgan log-farq SESmodeli boshqa o'zgaruvchilar o'tkazdi doimiy esa turkumga 0.03 ortadi.

socst- bu boshqa o'zgaruvchilar modelida saqlanib qolganda, kutilgan ovozdarajasida socst skoriningbir birlik oshishi uchun buyurtma qilingan log-odds bahosi . A bir birligi o'sish socsttest ballar yuqori bo'lish buyurdi log-zid bir 0,0532 birligi o'sishiga olib keladi SESmodeli boshqa o'zgaruvchilar o'tkazdi doimiy esa turkumga.

urg'ochi- bu boshqa o'zgaruvchilar modelida saqlanib qolgan holda , ayol va erkakni kutilgan kunlarbo'yicha taqqoslashning taxminiy bahosi . Yuqori bo'lgan ayollar uchun buyurtma Logit SESmodeli boshqa o'zgaruvchilar o'tkazdi doimiy bo'lsa turkumga 0,4824 kam erkaklarda bo'ladi.

Yordamchi parametrlar- bu javob o'zgaruvchisining qo'shni darajalarini farqlash uchun ishlatiladigan chegara nuqtalarini (aka chegaralarini) bildiradi. Keyin chegarani maxfiy o'zgaruvchining nuqtalari, doimiy kuzatilmaydigan mexanizm/hodisalar, deb belgilash mumkin, natijada proksi o'zgaruvchida har xil kuzatiladigan qiymatlar paydo bo'ladi (maxfiy o'zgaruvchini o'lchash uchun bizning qaram o'zgaruvchining darajalari).

_cut1 -Bu, Ajrata kam ishlatiladigan yashirin o'zgaruvchilar taxmin cutpoint bo'lgan kichik tadbirkorliko'rta va yuqori kichik tadbirkorlikbashoratchi o'zgaruvchilar qiymatlari nolga muhokama bo'lsa. Bizning tug'dirdi asosiy maxfiy o'zgaruvchilar 2,75 yoki undan kam bo'lgan qiymatiga edi mavzular SESo'zgaruvchining past deb tasniflangan bo'ladi SESular erkak edi bu (o'zgaruvchan ayolnol da baholanadi) va nol edi fanniva socstsinov ball.

_cut2 -Bu o'zgaruvchi qiymatlari nolga baholanganda, past va o'rta tovushni yuqori ovozdan farqlash uchunishlatiladigan yashirin o'zgaruvchining taxminiy chegarasi. Bizning tug'dirdi asosiy maxfiy o'zgaruvchilar 5.11 yoki undan bir qiymati bor edi mavzular SESyuqori deb o'zgaruvchining tasniflanadi bo'ladi SESular erkak va nol edi bu fanniva socstsinov ball. Asosiy yashirin o'zgaruvchiga 2,75 dan 5,11 gacha qiymatga ega bo'lgan sub'ektlar o'rta sesdeb tasniflanadi .

i. Std. Xato.- Bu individual regressiya koeffitsientlarining standart xatolaridir. Ular ztestining statistikasini hisoblashda, j yuqori belgisida ham , regressiya koeffitsientining ishonch oralig'ida, k ustki belgisida ham ishlatiladi .

j. zva P>| z |-Bu test statistikasi va p-qiymati, individual bashoratchining regressiya koeffitsienti nolga teng, degan taxminlar esa, qolgan bashoratchilar modelda. Test statistikasi z- Koefningnisbati .uchun Std. Xato.tegishli bashoratchi. Zqiymati ikki tomonlama muqobil gipotezani qarshi sinov uchun foydalaniladigan standart normal taqsimlanishini quyidagicha KATSAYI.nolga teng emas. Ma'lum bir ztest statistikasi nol gipoteza ostida kuzatilganidan ham haddan tashqari katta bo'lishi ehtimoli P>| z |.

Zbashoratchi uchun test statistik fan(0,030 / 0.017) 0.070 bir bog'liq p-qiymati bilan 1,81 bo'ladi. Biz 0,05 bizning alfa darajasini o'rnatilgan bo'lsa, biz o'z kuchini faraz rad va regresyon koeffitsienti deb xulosa qilish uchun muvaffaqiyatsiz edi fantaxmin noldan statistik farq bo'lishi topilgani yo'q Ovozberilgan socstva ayolmodeli mavjud.

Zbashoratchi uchun test statistik socst(0.053 / 0.015) socsttaxmin noldan statistik farq bo'lishi qildi Ovozdeb berilgan fanva ayolmodeli mavjud. Kabi ikki tomonlama o'zgaruvchining uchun talqin ayol, bir uzluksiz o'zgaruvchining parallel: kuni erkaklar va ayollar o'rtasida kuzatilgan farq SESholati uchun nazorat qachon 0,05 darajasida statistik muhim bo'lishi topilmadi socstva fan(p = 0,085).

k. [95% konf. Interval]- bu modeldagi boshqa bashoratchilar hisobga olingan holda individual regressiya koeffitsienti uchun ishonch oralig'i (CI). 95% ishonch darajasiga ega bo'lgan bashoratchi uchun, biz "haqiqiy" populyatsion regressiya koeffitsienti intervalning pastki va yuqori chegarasi oralig'ida ekanligiga 95% ishonamiz, deymiz. Bu Coefsifatida hisoblanadi .± (z a/2 )*( Std.Err.), Bu erda z a/2 standart normal taqsimotda kritik qiymatdir. CI z gatengtest statistikasi: agar CI nolni o'z ichiga olsa, biz boshqa prognozlar modelda bo'lsa, ma'lum bir regressiya koeffitsienti nolga teng degan gipotezani rad qila olmaymiz. CIning afzalligi shundaki, u tasviriydir; u "haqiqiy" parametr bo'lishi mumkin bo'lgan diapazonni beradi.

Odds nisbati talqini

Quyida buyurtma qilingan logistika regressiyasining mutanosiblik koeffitsientlari bo'yicha talqini berilgan va uni yokivariantni ko'rsatish orqali olish mumkin. Sharhning bu qismi quyida keltirilgan natijalarga taalluqlidir.

a. Odds nisbati- bu ilgari ko'rsatilgan logit modeli (aka proportsional koeffitsient modeli) uchun proportsional koeffitsientlar. Ularni buyurtma qilingan logit koeffitsientlarini eksponentlash orqali olish mumkin, e coef.yoki yokivariantini ko'rsatish orqali . Eslatib o'tamiz, buyurtma qilingan logit modeli qaram o'zgaruvchining darajalari bo'yicha bitta tenglamani (regressiya koeffitsientlari) baholaydi. Biz zid yilda koeffitsiyentlarini yig'indidan ma'noda darajadagi o'zgarishlarni ko'rish va talqin bo'lsa, endi, biz guruhlar nisbatan ko'proq bo'lgan odamlarni taqqoslashadi kkamroq guruhlar mavjud yoki teng qilganlar versus uchun k, qaerda kjavob o'zgaruvchisining darajasi. Ta'rif shuni ko'rsatadiki, bashoratchi o'zgaruvchining bir birlik o'zgarishi uchun, kdan katta yoki kga teng bo'lgan guruhdagi holatlar uchun koeffitsientlar koeffitsientimarta kattaroqdir. Yoki umumiy munozarasi uchun biz ikkilik logistik regressiya uchun quyidagi statistik savollarga murojaat qilamiz: logistika regressiyasida koeffitsientlar nisbatini qanday izohlayman?

ilm-fan- Bu bir birlik oshirish uchun teng farq nisbati fanhaqida hisobida Kichik tadbirkorlikmodeli boshqa parametrlarga qattiq bo'lib, deb berilgan darajasi. Shunday qilib, bir, bir birlik oshirish uchun ilm-fansinov hisobida, yuqori farq kichik tadbirkorlik sub'ektlariningbirlashgan o'rta va past versus SEStoifasida boshqa o'zgaruvchilar berilgan katta 1.03 marta, model bo'lib o'tdi doimiy hisoblanadi. Xuddi shunday, fan bo'yichatest balining bir birlik ortishi uchun , boshqa o'zgaruvchilar doimiy bo'lib qolganda, yuqori va o'rta ovozlarningpast va past darajadagi kombinatsiyalari 1,03 baravar ko'p.

socst- Bu bir birlik oshirish uchun teng farq nisbati socsthisobni Kichik tadbirkorlikmodeli boshqa o'zgaruvchilar o'tkazdi doimiy ekanligini berilgan darajasi. Shunday qilib, bir, bir birlik ko'paytirish uchun socsttest hisobida, yuqori farq kichik tadbirkorlik sub'ektlariningbirlashgan o'rta va past versus kichik tadbirkorlik sub'ektlariningboshqa o'zgaruvchilar berilgan katta 1,05 marta, model bo'lib o'tdi doimiy hisoblanadi. Xuddi shunday, bir, bir birlik ko'paytirish uchun socsttest hisobida, birlashgan yuqori va o'rta farq kichik tadbirkorlik sub'ektlariningpast versus kichik tadbirkorlik sub'ektlariningboshqa o'zgaruvchilar berilgan katta 1,05 marta, bo'lib o'tgan doimiy hisoblanadi.

ayol- Bu haqida erkaklarga qiz bilan taqqoslab mutanosib ravishda farq nisbati Kichik tadbirkorlikmodeli boshqa o'zgaruvchilar berilgan bo'lib o'tdi doimiy etiladi. Ayollar uchun, yuqori farq kichik tadbirkorlik sub'ektlariningbirlashgan o'rta va past versus kichik tadbirkorlik sub'ektlariningsobit qoladi, boshqa o'zgaruvchilar berilgan, 0,6173 marta erkaklar uchun ancha past bo'ladi. Xuddi shu tarzda, yuqori va o'rta birlashgan toifalarida farq kichik tadbirkorlik sub'ektlariningpast versus kichik tadbirkorlik sub'ektlariningboshqa o'zgaruvchilar modeli bo'lib o'tdi doimiy bo'lgan bu, 0,6173 marta erkaklarga nisbatan ayollarda past bo'ladi.

b. [95% konf. Interval]- bu modeldagi boshqa bashorat qiluvchilarni hisobga olgan holda proportsional koeffitsientlar uchun CI. 95% ishonch darajasiga ega bo'lgan bashoratchi uchun, biz "haqiqiy" populyatsion proportsional koeffitsientlar oralig'ining pastki va yuqori chegarasi o'rtasida ekanligiga 95% ishonamiz, deymiz. CI ztesti statistikasiga teng : agar CI bittasini o'z ichiga olsa (nol emas, chunki biz koeffitsientlar nisbati bilan ishlaymiz), biz boshqa prognozlar berilgan bo'lsa, ma'lum bir regressiya koeffitsienti degan gipotezani rad eta olmaymiz. model. CIning afzalligi shundaki, u tasviriydir; u "haqiqiy" proportsional koeffitsientlar nisbati bo'lishi mumkin bo'lgan oraliqni beradi.