Sifarişli Logistik Reqressiya | Stata Əlavə Çıxış

Bu səhifə, çıxışı izah edən dipnotları olan sifarişli bir logistik reqressiya təhlili nümunəsini göstərir. Məlumat 200 lisey şagirdi haqqında toplanmışdır və bunlar elm, riyaziyyat, oxu və sosial araşdırmalar da daxil olmaqla müxtəlif testlərdəki ballardır. Bu analiz nəticəsi tədbir sosial-iqtisadi vəziyyəti (deyil sesaşağı, orta və yüksək olan biz münasibətlər elm test puanları (ilə mövcud görmek üçün gedir -) elm), sosial elm test puanları ( socst) və gender ( qadın). Bizim cavab dəyişən, ses, fərziyyə altında sıra kimi müalicə olacaq ki, səviyyəsi Müayinəstatusu təbii bir nizama malikdir (aşağıdan yuxarıya), ancaq bitişik səviyyələr arasındakı məsafələr bilinmir. Bu səhifənin birinci yarısı əmsalları sıralanmış log-odds (logits) baxımından, ikinci yarısı isə əmsalları mütənasib nisbətlər baxımından şərh edir.

Təkrarlama jurnalı a

a. Bu, hər bir iterasyonda log ehtimallarının siyahısıdır. Unutmayın ki, ikili və çoxnomial logistika reqressiyası kimi sifarişli logistika reqressiyası, iterativ bir prosedur olan maksimum ehtimal qiymətləndirməsindən istifadə edir. İlk iterasiya (iterasiya 0 adlanır) "sıfır" və ya "boş" modelin log ehtimaldır; yəni proqnozlaşdırıcı olmayan bir model. Növbəti iterasiyada proqnozlaşdırıcılar modelə daxil edilir. Hər bir təkrarlama zamanı, log ehtimalını artırır, çünki məqsəd log ehtimalını maksimuma çatdırmaqdır. Ardıcıl təkrarlamalar arasındakı fərq çox kiçik olduqda, modelin "yaxınlaşdığı" deyilir, təkrarlama dayanır və nəticələr göstərilir. İkili nəticələr üçün bu proses haqqında daha çox məlumat üçün J. Scott Long tərəfindən Kateqoriyalı və Məhdud Bağlı Dəyişənlər üçün Reqressiya Modellərinə baxın (səhifələr 52-61).

Model Xülasəsi

b. Giriş ehtimalı- Bu, quraşdırılmış modelin log ehtimalıdır. Modeldəki bütün proqnozlaşdırıcıların reqressiya əmsallarının eyni vaxtda sıfır olub olmadığına dair ehtimal nisbəti Chi-Square testində və iç içə modellərin testlərində istifadə olunur.

c. OBS sayı- Bu sifariş maddi reqressiya istifadə müşahidələr sayı. Tənlikdə bəzi dəyişənlər üçün dəyərlər çatışmırsa, bu verilənlər bazasındakı halların sayından az ola bilər. Varsayılan olaraq, Stata natamam halların siyahı əsasında silinməsini həyata keçirir.

d. LR chi2 (3)-Bu, proqnozlaşdırıcıların reqressiya əmsalından ən azı birinin modeldə sıfıra bərabər olmadığı ehtimalı nisbəti (LR) Chi-Square testidir. Mötərizədə olan rəqəm, LR Chi-Square statistikasını yoxlamaq üçün istifadə edilən Chi-Square paylanmasının sərbəstlik dərəcələrini göstərir və modeldəki proqnozlaşdırıcıların sayı ilə müəyyən edilir. LR Chi-Square statistikası -2*(L (sıfır model)-L (quraşdırılmış model)) = -2*((-210.583)-(-194.802)) = 31.560 ilə hesablana bilər, burada L (null model)yalnız modeldəki cavab dəyişənliyi olan log ehtimalından (İterasiya 0) və L (quraşdırılmış model)bütün parametrləri olan son iterasyondan (model yaxınlaşdıqda) log ehtimaldır.

e. Prob>chi2- Bu, sıfır fərziyyəsi altında müşahidə ediləndən daha çox həddindən artıq dərəcədə LR testi statistikasına sahib olma ehtimalıdır; sıfır hipotezi modeldəki bütün reqressiya əmsallarının sıfıra bərabər olmasıdır. Başqa sözlə, proqnozlaşdırıcı dəyişənlərin əslində heç bir təsiri olmadığı təqdirdə, bu xi-kvadrat statistikasını əldə etmək ehtimalı (31.56). Bu p dəyəri, adətən 0.05 və ya 0.01 olaraq təyin olunan I tip səhvini qəbul etmək istəyimiz müəyyən bir alfa səviyyəsi ilə müqayisə edilir. LR testindən chi2 (3).

f. Pseudo R2-Bu McFaddenin yalançı R kvadratıdır. Logistik reqressiyanın OLS reqressiyasında olan R-kvadratına ekvivalenti yoxdur; lakin, bir çox insan bir fikirlə qarşılaşmağa çalışdı. Ziddiyyətli nəticələr verə biləcək çox sayda yalançı R-kvadrat statistikası var. Bu statistika, OLS reqressiyasında R-kvadratının nə demək olduğunu ifadə etmədiyi üçün (proqnozlaşdırıcıların izah etdiyi cavab dəyişəninin varyans nisbəti) bu statistikanı çox ehtiyatla şərh etməyi təklif edirik.

Parametr təxminləri

g. ses- Bu, sifariş edilmiş logistik reqressiyadakı cavab dəyişicisidir. Altında sesmodelləri yordayan və bitişik səviyyəsi cut xal gizli cavab dəyişən. Aşağıdakı diaqram gizli fasiləsiz SES ilə eşlenen müşahidə olunan kateqoriyalı SES -i əks etdirir. 2.75 -dən aşağı gizli bal alanlar "Aşağı SES", 2.75 ilə 5.10 arasında gizli bal alanlar "Orta SES" və 5.10 -dan yuxarı olanlar "Yüksək SES" kimi təsnif edilir.

h. Qəhvə.-Bunlar sıralanmış log-odds (logit) reqressiya əmsallarıdır. Sifariş verilmiş logit əmsalının standart təfsiri budur ki, proqnozlaşdırıcının bir vahid artması üçün, cavab dəyişən səviyyəsinin sifarişli log-odds miqyasında müvafiq reqressiya əmsalı ilə dəyişəcəyi, modeldəki digər dəyişənlərin sabit qalması gözlənilir. Sifariş verilmiş logit qiymətləndirmələrinin təfsiri köməkçi parametrlərdən asılı deyil; köməkçi parametrlər cavab dəyişəninin bitişik səviyyələrini fərqləndirmək üçün istifadə olunur. Bununla birlikdə, sifariş olunan logit modeli asılı dəyişənin bütün səviyyələri üzərində bir tənliyi təxmin etdiyindən, bir tənlik modelimizin etibarlı olub-olmaması və ya daha çevik bir modelə ehtiyac olub olmaması narahatlıq doğurur. Bu fərziyyəni nisbi nisbət testi ilə sınaya bilərik (akaParalel reqressiya fərziyyəsinin Brant testi). Bu testi yazaraq yükləyə bilərsinizspost9 axtarışcommand line istifadə brantkomanda (I proqramları üçün axtarış və istifadə haqqında daha ətraflı məlumat üçün? əlavə yardım almaq üçün axtarış komanda istifadə edə bilərsiniz necə görmək axtarış).

elm-Bu , digər dəyişənlərin modeldə sabit saxlanılması nəzərə alınmaqla, gözlənilən səssəviyyəsində elmhesabının bir vahid artması üçün sifariş edilmiş log-odds təxminidir . Bir mövzu elmbalını bir pillə artırsaydı, modelin digər dəyişənləri sabit saxlanılarkən, daha yüksək seskateqoriyasına daxil olma əmri 0.03 artardı.

socst-Bu , digər dəyişənlərin modeldə sabit qalmasınəzərə alınmaqla, gözlənilən səssəviyyəsində socst skorundabir vahid artım üçün sifariş edilmiş log-odds təxminidir . Socsttest ballarında bir vahid artım, modeldəkidigər dəyişənlər sabit saxlanılarkən, daha yüksək bir səskateqoriyasına daxil olma əmrinin 0,0532ədəd artması ilə nəticələnəcək.

qadın-Bu , digər dəyişənlərin modeldə sabit olduğu nəzərə alınmaqla, qadınları kişilərlə gözlənilən səslərarasında müqayisə etmək üçün sifariş edilmiş log-odds təxminidir . Modeldəki digər dəyişənlər sabit saxlanıldıqda daha yüksək səskateqoriyasında olan qadınlar üçün sifariş edilən logit, kişilərdən 0,4824 azdır.

Köməkçi parametrlər- Bunlar cavab dəyişəninin bitişik səviyyələrini fərqləndirmək üçün istifadə olunan son nöqtələrə (aka eşiklərə) aiddir. Bir eşik, gizli dəyişən üzərində nöqtələr olaraq təyin edilə bilər, davamlı müşahidə olunmayan bir mexanizm/hadisələr, nəticədə proxy dəyişənində fərqli müşahidə olunan dəyərlər (gizli dəyişəni ölçmək üçün istifadə olunan asılı dəyişənimizin səviyyələri) ilə nəticələnə bilər.

_cut1 -Bu fərq aşağı etmək üçün istifadə gizli dəyişən hesablanır cutpoint edir SESorta və yüksək seskəsdirdiyi dəyişənlərin dəyərləri sıfıra qiymətləndirilir zaman. Bizim doğurdu əsas gizli dəyişən 2.75 və ya daha az bir dəyər idi Mövzu sesdəyişən aşağı kimi təsnif ediləcək sesonlar kişi verilən (dəyişən qadınsıfır qiymətləndirdi) və sıfır idi elmsocsttest puanları.

_cut2 -Bu, proqnozlaşdırıcı dəyişənlərin dəyərləri sıfırda qiymətləndirildikdə, aşağı və orta səsi yüksək səsdən fərqləndirmək üçün istifadə olunan gizli dəyişəndə ​​təxmin edilən kəsilmə nöqtəsidir. Bizim doğurdu əsas gizli dəyişən 5.11 və ya daha çox bir dəyər idi Mövzu sesyüksək dəyişən təsnif ediləcək sesonlar kişi və sıfır idi verilmiş elmsocsttest puanları. Altdakı gizli dəyişəndə ​​2.75 ilə 5.11 arasında bir dəyəri olan mövzular orta səsolaraq təsnif edilir .

i. Std. Səhv.- Bunlar fərdi reqressiya əmsallarının standart səhvləridir. Həm ztestinin statistikasının hesablanmasında, həm də üst sətirində j, həm də reqressiya əmsalının etibar sətrində, üst sətirində k istifadə olunur.

j. zP>| z |-Bunlar, qalan proqnozlaşdırıcıların modeldə olması nəzərə alınmaqla fərdi bir proqnozçunun reqressiya əmsalının sıfır olduğu hipotezinin test statistikası və p-dəyəridir. Test statistikası z Coefnisbətidir .üçün Std. Səhv.müvafiq proqnozlaşdırıcının. Zdəyər ki, iki tərəfli alternativ fərziyyə qarşı test üçün istifadə olunan standart normal paylanma belə Coef.sıfıra bərabər deyil. Xüsusi bir ztesti statistikasının sıfır fərziyyəsi altında müşahidə edildiyindən çox və ya daha çox olması ehtimalı P>| z |.

Zkəsdirdiyi üçün test statistik elm(0.030 / 0.017) 0.070 bir bağlı p-dəyəri ilə 1,81 edir. Biz 0.05 üçün alfa səviyyəsi müəyyən, biz null hipotez rədd və reqressiya əmsalı ki, bağlamaq üçün uğursuz elmqiymətləndirilməsi sıfırdan statistik fərqli olduğu təsbit olunmayıb sesverilmiş socstqadınmodel var.

Zkəsdirdiyi üçün test statistik socst(0.053 / 0.015) socstqiymətləndirilməsi sıfırdan statistik fərqli olduğu təsbit edilmişdir seski, verilmiş elmqadınmodel var. Kimi dichotomous dəyişən üçün şərh qadın, bir davamlı dəyişən paralellər: on kişi və qadınlar arasında müşahidə fərq sesstatusu nəzarət zaman 0,05 səviyyəsində statistik əhəmiyyətli olduğu müəyyən deyil socstelm(p = 0.085).

k. [95% Konf. Aralıq]- Bu modeldə digər proqnozlaşdırıcılar nəzərə alınmaqla fərdi bir reqressiya əmsalı üçün Etibar Aralığıdır (CI). 95% güvən səviyyəsi olan müəyyən bir proqnozçu üçün, "əsl" populyasiya reqressiya əmsalının aralığın aşağı və yuxarı həddi arasında olduğuna 95% əmin olduğumuzu söyləyərik. Coefolaraq hesablanır .± (z α/2 )*( Std.Err.), Burada z α/2 standart normal paylanmada kritik bir dəyərdir. CI, z -yəbərabərdirtest statistikası: CI sıfır ehtiva edərsə, digər proqnozlaşdırıcıların modeldə olduğu üçün müəyyən bir reqressiya əmsalının sıfır olduğu hipotezini rədd edə bilmərik. CI -nin bir üstünlüyü onun təsviri olmasıdır; "doğru" parametrinin yerləşə biləcəyi bir sıra təmin edir.

Oranların Təfsiri

Sifarişli logistik reqressiyanın nisbi nisbət nisbətləri baxımından təfsiri aşağıda verilmişdir və yaseçim göstərilərək əldə edilə bilər . Şərhin bu hissəsi aşağıdakı çıxışa aiddir.

a. Oran Oranı- Bunlar əvvəllər göstərilən sifarişli logit modeli (aka proporsional odds modeli) üçün nisbətli nisbətlərdir. Sifariş verilmiş logit əmsallarını, e coefieksponentləşdirməklə əldə edilə bilər .və ya və yaseçimi göstərərək . Xatırladaq ki, sifarişli logit modeli asılı dəyişənin səviyyələri üzərində tək tənliyi (reqressiya əmsallarını) təxmin edir. Biz bahis əmsalları məcmu mənada səviyyədə dəyişiklik keçirmək və şərh varsa, biz qruplar daha çox insanlar müqayisə olunur kaz qruplar və ya bərabər olanlar qarşı üçün kolduğu kcavab dəyişəninin səviyyəsidir. Şərh yordayan dəyişən bir vahid dəyişiklik, daha böyük bir qrup hallarda odds ki, ola bilər küçün qarşı az və ya bərabər kproporsional odds dəfə böyük. OR -un ümumi müzakirəsi üçün ikili logistik reqressiya üçün aşağıdakı Status FAQ -na müraciət edirik: Logistika reqressiyasında odds əmsallarını necə şərh edə bilərəm?

elm- Bu bir vahid artırılması üçün proporsional bahis nisbəti elmhaqqında hesab sesmodel digər dəyişənlərin sabit keçirilir ki, verilmiş səviyyədə. Belə ki, bir vahid artırılması üçün elmtest hesab yüksək odds SESbirgə orta və aşağı qarşı seskateqoriyalar digər dəyişənlərin verilmiş böyük 1,03 dəfə, model təşkil edilən daimi olunur. Eyni zamanda, bir bir vahid artırılması üçün elmtest hesab, birləşdirilmiş yüksək və orta odds sesaşağı qarşı sesdigər dəyişənlərin verilmiş böyük 1,03 dəfə təşkil edilən daimi olunur.

socst- Bu bir vahid artırılması üçün proporsional bahis nisbəti socsthaqqında hesab sesmodel digər dəyişənlərin keçirilən daimi var ki, verilmiş səviyyədə. Belə ki, bir vahid artım socsttest hesab yüksək odds SESbirgə orta və aşağı qarşı sesdigər dəyişənlərin verilmiş böyük 1,05 dəfə, model təşkil edilən daimi olunur. Eyni zamanda, bir bir vahid artım socsttest hesab, birləşdirilmiş yüksək və orta odds sesaşağı qarşı sesdigər dəyişənlərin verilmiş böyük 1,05 dəfə təşkil edilən daimi olunur.

dişi- Bu , modeldəki digər dəyişənlərin sabit olduğu nəzərə alınmaqla, qadınlarla kişilərin səsnisbətlərinin nisbi nisbətidir . Qadınlar üçün, yüksək odds SESbirgə orta və aşağı qarşı sesdaimi keçirilir digər dəyişənlərin verilmiş, 0,6173 dəfə kişilər üçün çox aşağı olur. Eyni zamanda, yüksək və orta birgə kateqoriyalar odds sesaşağı qarşı sesdigər dəyişənlərin model təşkil daimi verilmiş, 0,6173 dəfə kişilər ilə müqayisədə qadınlar üçün aşağı deyil.

b. [95% Konf. Aralıq]- Modeldəki digər proqnozlaşdırıcılar nəzərə alınmaqla nisbi nisbət nisbəti üçün CI -dir. 95% güvən səviyyəsi olan müəyyən bir proqnozlaşdırıcı üçün, "əsl" əhali nisbətli nisbət nisbətinin aralığın aşağı və yuxarı həddi arasında olduğuna 95% əmin olduğumuzu söyləyərik. CI ztesti statistikasına bərabərdir : CI bir ehtiva edərsə (sıfır deyil, çünki nisbət nisbətləri ilə işləyirik), müəyyən bir reqressiya əmsalının digər proqnozlaşdırıcılar daxilində olduğu bir hipotezi rədd edə bilmərik. model. CI -nin bir üstünlüyü onun təsviri olmasıdır; "doğru" nisbi nisbət nisbətinin yerləşə biləcəyi bir sıra təmin edir.