10.2 - İkili Logistik Reqressiya

İkili logistik reqressiya modelinə daha yaxından nəzər salaq. Xətti reqressiya modelinə oxşar olaraq, Y, X -in bəzi funksiyalarına bənzəyir.

Lakin, daha əvvəl də qeyd edildiyi kimi, logit link funksiyasından istifadə etdiyimiz üçün funksiya fərqlidir. Yenə də, bu sinifdə logit keçid funksiyasının necə hesablandığı haqqında çox təfərrüata girməyərək, çıxış "log odds" formasındadır.

"Logistika reqressiya cədvəlində" qeyd nisbətlərinin əslində "əmsal" olaraq verildiyinə diqqət yetirin. Nomenklatura, yamac üçün sadə xətti reqressiya əmsalına bənzəyir. Cədvəlin sırasından aşağıya doğru irəlilədikdə görə bilərik ki, yamacda olduğu kimi, log odds da əhəmiyyətlilik testini ehtiva edir, yalnız "t" testindən fərqli olaraq "t" testindən istifadə edərək kateqoriyalı cavab dəyişəninə görə əhəmiyyətlilik testi var. Xoşbəxtlikdən, qeyd nisbətlərini yamacla çox oxşar bir məntiqlə şərh edirik.

Günlük Oranını şərh etmək

  • Əgər \ (\ beta>0 \) olarsa, X daha yüksək olarsa hadisəni müşahidə etmə ehtimalı daha yüksək olur.
  • Əgər \ (\ beta
  • \ (\ Beta = 0 \) olarsa, X hadisəni müşahidə etmə ehtimalları haqqında bizə heç nə demir.

Serena'nın sorğu məlumatlarında bir lojistik reqressiya işlədikdə, çıxış 1.21 nisbətində bir günlük əmsalını göstərir. "Z-Dəyəri" nə baxırıq və böyük bir dəyəri görürük (15.47) ki, ev təsərrüfatlarının gəlirlərinin Serenaya səs vermə ehtimalları haqqında heç bir şey söyləməməsi ilə bağlı sıfır hipotezi rədd etməyimizə səbəb olur. Əmsal sıfırdan çox olduğu üçün, daha çox ev gəlirinin Serenaya səs vermə ehtimalını artırdığı qənaətinə gələ bilərik.

Katsayılar
Proqnozlaşdırıcı Qəhvə SE Coef 95% CI Z-Dəyəri P-Dəyəri VIF Sabit Ev Gəlirləri
-73.39 4.74 (-82.68, -64.09) -15.47 0.000
1.2183 0.0787 (1.0640, 1.3726) 15.47 0.000 1

Amma jurnalın əmsalları nədir? Yaxşı, sadəcə bu, logit link funksiyasından istifadənin nəticəsidir. Ancaq bu asanlıqla şərh edilə bilməz, buna görə də ehtimallarla əlaqəli nəticələrə diqqət yetiririk. Oranlar bizi əsas kateqoriyalı statistik funksiyaya qaytarır. Xatırladaq ki, odds nisbəti, baş verən hadisənin baş verməməsi ilə nisbətidir. 1 nisbət nisbəti, baş verən hadisənin tezliyində heç bir fərq olmadığını göstərir. Çıxışdakı nisbət nisbəti ilə nəticələrimizi 1 nisbət nisbəti ilə müqayisə edirik. Tipik olaraq, bu nisbət nisbətləri bir etibar aralığı ilə müşayiət olunur və heç bir əlaqənin olmaması üçün aralıqda "1" dəyərini axtarır. .

Sorğunun nəticəsi, ev gəlirlərinin hər vahid artımında (1.000 -lə ölçülən) Serena üçün 3.38 nisbətində artım nisbətlərini bizə izah edir.

Faydalı olaraq, log odds hipotez testinin nəticəsi və əmsal nisbəti güvən intervalı həmişə eyni olacaq!

Aşağıdakı nümunəmizdən hər iki halda sıfır hipotezini rədd edə bilərik və ev təsərrüfatlarının gəlirinin Serenaya səs verəcəyini əhəmiyyətli dərəcədə proqnozlaşdırdığı qənaətinə gələ bilərik!

Modelin ümumi əhəmiyyəti

Çox təfərrüata girməyəcəyimizə baxmayaraq, model uyğunluğunun ölçüsü minitab çıxışında sapma kimi təmsil olunur. Yenə ANOVA -dakı F testi kimi, xi kvadrat statistikası, proqnozlaşdırıcılarla əlaqəli bütün əmsalların sıfıra bərabər olduğu və bu əmsalların hamısının sıfıra bərabər olmadığı sıfır fərziyyəsini sınayır. Bu nümunədə, 0.000 p-dəyəri olan Chi-Square = 732, kifayət qədər dəlil olduğunu ifadə edərək, ev gəlirləri üçün əmsalın sıfırdan fərqli olduğunu göstərir.

Sapma cədvəli
Mənbə DF Seq Dev Töhfə Adj Dev Adj Orta Chi-Square P-Dəyəri Reqressiya Ev Gəlirləri Xəta Ümumi
1 732.7 52.86% 732.7 732.712 732.71 0.000
1 732.7 52.86% 732.7 732.712 732.71 0.000
998 653.5 47,14% 653.5 0.655
999 1386.2 100.00%

Ehtimal modeli

Cavab verə biləcəyimiz son sual, Serenanın qalib gəlmə ehtimalını proqnozlaşdırmaqla bağlı orijinal suala cavab verməkdir. Logistik reqressiya ilə əlaqəli dəyərlərin ən asan təfsiri, X -in hər bir dəyəri üçün proqnozlaşdırılan dəyərlərdir (bir ehtimal şəklini almaq üçün logistik reqressiya modelinin cəbrlə manipulyasiya oluna biləcəyini xatırlayın!). Minitab -da, X -in hər bir dəyəri üçün ehtimalların məlumatlarda saxlanılmasını tələb edə bilərik. Nəticə belə olacaq:

C2 C3 C4 Səs Bəli Ev Gəlirləri FITS
0 51.0189 0.00001
0 51.0639 0.00001
0 51.4582 0.00002
0 51.7075 0.00003
0 52.4308 0.00007
1 52.5291 0.00008
1 52.5586 0.00009
1 53.0822 0.00016
1 53.1185 0.00017
1 53.1301 0.00017
0 53.3159 0.00022

Bu çıxışdan indi bir evin Serenaya səs vermə ehtimalını görə bilərik. "Uyğun" sütunundakı aşağı dəyərlər Serenaya daha aşağı səs vermə ehtimalını ifadə edir. Məsələn, 52.5291 olan ev gəliri Serenaya .00008 səs vermə ehtimalına malikdir. Serenanın kampaniyası, bu ehtimalı proqnozlaşdırmaq və marketinqi hədəf almaq və "çəpərdə" olan ailələrə (məsələn, 40-60 % arasında) məlumat vermək qabiliyyətindən istifadə edə bilər.

Marketinq firması, 40-60% aralığında olan ev təsərrüfatlarına diqqət yetirmək üçün Serena'nın kampaniyasına bir tövsiyə verə bilər. Bu ev təsərrüfatları, Serenaya səs verməyin yalnız tarixdə deyil, önümüzdəki dörd il ərzində dövlətə rəhbərlik etmək üçün doğru qərar olacağına "inana" bilənlər ola bilər.

Minitab ®

Minitab: İkili Logistik Reqressiya

Minitab -da ikili logistik reqressiyanı həyata keçirmək üçün aşağıdakılardan istifadə edin:

Stat>Regression>Binary Logistic və daxil üçün "Səs Bəli ' Reaksiya və" Məişət Gəlir " Model .

Qeyd: Faktorlar pəncərəsi kateqoriyalı olan hər hansı bir dəyişənə aiddir.