Logistinė regresija: modelis ir metodai

Išsilavinimas:

Logistikos regresijos metodai tada naudojama diskriminantinė analizė,kai būtina aiškiai atskirti respondentus pagal tikslines kategorijas. Tokiu atveju pačios grupės yra pateiktos vieno univariant parametro lygmeniu. Paimkime išsamiau logistinės regresijos modelis, taip pat sužinokite, kodėl tai reikalinga.

regresijos logistika

Bendra informacija

Problemos, kurios sprendime yra pavyzdys, pavyzdys regresijos logistika, respondentų klasifikacija pagalgrupės, nusipirkiančios ir nedirbančios garstyčių. Diferencijavimas atliekamas pagal socialines ir demografines charakteristikas. Tarp jų visų pirma yra amžius, lytis, giminaičių skaičius, pajamos ir kt. Operacijose yra diferencijavimo ir kintamumo kriterijai. Pastaroji koduoja tikslines kategorijas, kurios iš tikrųjų turi atskirti respondentus.

Niuansai

Reikėtų pažymėti, kad atvejų, kuriais regresijos logistika, yra daug siauresnė už diskriminuojantįjįanalizė. Šiuo atžvilgiu pirmenybė yra pastarųjų kaip universalių diferencijavimo metodų naudojimas. Be to, ekspertai rekomenduoja pradėti klasifikacinius tyrimus su diskriminuojančia analize. Tik rezultatų neapibrėžtumui mes galime naudoti logistinę regresiją. Šis poreikis yra dėl kai kurių veiksnių. Logistinė regresija Jis naudojamas, kai aiškiai suprantamanepriklausomų ir priklausomų kintamųjų tipų. Atsižvelgiant į tai, pasirenkama viena iš trijų galimų procedūrų. Su diskriminuojančia analize, tyrėjas visada atlieka vieną statinę operaciją. Tai apima vieną priklausomą ir kelis nepriklausomus kategorinius kintamuosius su bet kokio tipo skale.

Tipai

Statistinių tyrimų uždavinys, kuris naudoja regresijos logistikayra nustatyti tikimybę, kadtam tikras respondentas bus priskirtas tam tikrai grupei. Diferencijavimas atliekamas pagal tam tikrus parametrus. Praktikoje, atsižvelgiant į vieno ar kelių nepriklausomų veiksnių vertybes, respondentus galima klasifikuoti į dvi grupes. Šiuo atveju binarinė logistinė regresija. Taip pat gali būti naudojami nurodyti parametraikai jie suskirstomi į daugiau nei dviejų grupių grupes. Tokioje situacijoje yra daugialypės logistinės regresijos. Gautos grupės yra išreikštos vieno kintamojo lygmenimis.

logistikos regresija

Pavyzdys:

Tarkime, yra respondentų atsakymai į klausimąar jie suinteresuoti pasiūlymu įsigyti žemės sklypą Maskvos priemiesčiuose. Galimybės yra "ne" ir "taip". Būtina išsiaiškinti, kurie veiksniai pirmiausia įtakoja galimų pirkėjų sprendimą. Norėdami tai padaryti, apklausiamam asmeniui pateikiami klausimai apie teritorijos infrastruktūrą, atstumą iki sostinės, svetainės plotą, gyvenamosios struktūros buvimą / nebuvimą ir kt. Naudodami binarinę regresiją respondentai gali būti suskirstyti į dvi grupes. Pirmasis bus tie, kurie nori įsigyti - potencialūs pirkėjai, o antrasis - atitinkamai tie, kurie tokio pasiūlymo nėra suinteresuoti. Be to, kiekvienam respondentui apskaičiuojama tikimybė, kad bus priskirta kategorijai.

Lyginamoji charakteristika

Skirtumas tarp dviejų pirmiau minėtų variantų,susideda iš skirtingo grupių skaičiaus ir nepriklausomų kintamųjų tipo. Pavyzdžiui, binarinėje regresijoje nagrinėjama dichotominio faktoriaus priklausomybė vienoje ar keliose nepriklausomose sąlygose. Pastarasis gali turėti bet kokio masto tipą. Daugiakultūrė regresija laikoma šios klasifikacijos variantu. Jame prie priklausomo kintamojo yra daugiau nei 2 grupės. Nepriklausomi veiksniai turi turėti kvadratinį arba vardinį skalę.

Logistikos regresija SPSS

Statistinėje pakuotėje 11-12, naujaanalizės variantas - kryptys. Šis metodas naudojamas tais atvejais, kai priklausomas veiksnys nurodo tą pačią (ordinalinę) skalę. Tokiu atveju nepriklausomi kintamieji yra pasirinkti iš vieno konkretaus tipo. Jie turi būti arba ordinaliniai, arba nominalūs. Klasifikavimas keliomis kategorijomis laikomas labiausiai universalus. Šis metodas gali būti naudojamas visuose tyrimuose, kuriuose logistikos regresija. Pagerinti modelio kokybę, tačiau tai įmanoma tik naudojant visus tris būdus.

adekvatumo ir logistinės regresijos kokybės kontrolė

Ordininis klasifikavimas

Verta paminėti, kad anksčiau buvo statistiniame paketenebuvo pateikta tipinė galimybė atlikti specializuotą analizę priklausomiems veiksniams, kurių skalė yra diagrama. Visiems kintamiesiems, kurių grupių skaičius didesnis nei 2, buvo naudojamas daugybinis variantas. Pateikta palyginti neseniai, eilės analizė turi keletą savybių. Jie atsižvelgia į skalės ypatumus. Tuo tarpu metodiniuose vadovuose - ordinalas logistikos regresija dažnai nelaikomas atskiru prietaisu. Taip yra dėl to, kad eilės analizė neturi reikšmingų pranašumų prieš daugialypę. Mokslininkas taip pat gali naudoti pastarąjį, jei yra tiek kintamasis, tiek nominalus priklausomas kintamasis. Tuo pat metu pačios klasifikacijos procesai labai nesiskiria vienas nuo kito. Tai reiškia, kad kryžminės analizės atlikimas nesukels jokių sunkumų.

Analizės parinktis

Apsvarstykite paprastą atvejį - binarinę regresiją. Pavyzdžiui, atliekant rinkodaros tyrimus apskaičiuojama tam tikro Maskvos universiteto absolventų paklausa. Klausimyne respondentams buvo pateikti klausimai, tarp jų:

  1. Ar tu darbini? (ql).
  2. Nurodykite baigimo metus (21 ak.).
  3. Koks yra vidutinis galutinis rezultatas (aver).
  4. Lytis (22 proc.).

Logistinė regresija leis įvertinti nepriklausomų veiksnių poveikįaver, q 21 ir q 22 kintamojo ql. Paprasčiau tariant, analizės tikslas bus nustatyti galimą absolventų įdarbinimą remiantis informacija apie lauką, baigimo metus ir vidutinį balą.

logistinio sigmoidinio regresijos rodiklis

Logistinė regresija

Nustatyti parametrus naudojant dvejetainįregresija, turėtumėte naudoti meniu Analizuoti ►Regression ►Binary Logistic. Logistikos regresijos lange pasirinkite priklausomą veiksnį kairėje esamų kintamųjų sąraše. Tai yra ql. Šis kintamasis turi būti dedamas į priklausomą lauką. Po to savarankiški veiksniai turėtų būti įtraukti į kovariacinę sritį - 21, 22, aver. Tada turėsite pasirinkti jų įtraukimo į analizę būdą. Jei nepriklausomų veiksnių skaičius yra didesnis nei 2, naudojamas ne visų kintamųjų, numatytų pagal numatytuosius nustatymus, vienalaikio įvedimo metodas, bet ir laipsniškas. Populiariausias metodas laikomas atgaliniu: LR. Pasirinkus mygtuką, galima įtraukti ne visus tyrime dalyvaujančius respondentus, o tik konkrečią tikslinę kategoriją.

Nustatykite kategorinius kintamuosius

Turi būti naudojamas kategoriškas mygtukasatvejis, kai vienas iš nepriklausomų kintamųjų yra nominalus, o kategorijų skaičius yra didesnis nei 2. Tokioje situacijoje langelyje "Apibrėžti kategorijų kintamieji" toks parametras pateikiamas kategorijų paketui "Kovariatai". Nagrinėjamame pavyzdyje toks kintamasis nėra. Po to išskleidžiamajame sąraše "Kontrastas" pasirinkite punktą "Nuokrypis" ir spustelėkite mygtuką "Keisti". Kaip rezultatas, iš kiekvieno nominalaus faktoriaus bus sudaromi keli priklausomi kintamieji. Jų skaičius atitinka pirminės būklės kategorijų skaičių.

Išsaugoti naujus kintamuosius

Pagrindiniame dialoge naudokite mygtuką IšsaugotiTyrimai atliekami kuriant naujus parametrus. Juose bus rodikliai, apskaičiuoti per regresijos procesą. Visų pirma galite kurti kintamuosius, kurie apibrėžia:

  1. Priklauso konkrečiai klasifikavimo kategorijai (grupės narys).
  2. Tikimybė paskirstyti respondentą į kiekvieną tikimybių grupę.

Naudodamas mygtuką "Parinktys", "explorer" nėragauna kokias nors reikšmingas savybes. Atitinkamai, tai gali būti ignoruojamas. Po pagrindinio lango paspaudimo "Gerai" bus rodomi analizės rezultatai.

logistinės regresijos koeficientas

Atitikties ir logistinės regresijos kokybės tikrinimas

Apsvarstykite lentelę "Omnibus Testsof Model"Koeficientai. Pateikiami aproksimacijos modelio kokybės analizės rezultatai. Atsižvelgiant į tai, kad buvo nustatyta laipsniško pasirinkimo galimybė, reikia pažiūrėti paskutinio etapo rezultatus (2 žingsnis). Teigiamas laikomas toks rezultatas, kai padidėja Chi-kvadratas, kai nustatomas aukštesnis laipsnio reikšmingumas (Sig. <0,05). Modelio kokybė vertinama modelio linijoje. Jei gaunama neigiama reikšmė, tačiau ji nėra laikoma reikšminga, nes bendra modelio reikšmingumas yra pastovus, jis gali būti laikomas praktiškai tinkamu.

Lentelės

Modelis suvestinė leidžia įvertinti rodiklįkumuliacinė dispersija, kurioje aprašomas sukonstruotas modelis (R plotas). Rekomenduojama naudoti "Nagelker" vertę. Teigiamas rodiklis gali būti laikomas parametru Nagelkerke R Square, jei jis yra didesnis nei 0.50. Po to įvertinami klasifikacijos rezultatai, pagal kuriuos faktiniai rodikliai, priklausantys vienai ar kitai tirtoms kategorijoms, yra lyginami su prognozėmis pagal regresijos modelį. Norėdami tai padaryti, naudokite klasifikavimo lentelę. Tai taip pat leidžia daryti išvadas apie diferenciacijos teisingumą kiekvienoje nagrinėjamoje grupėje.

logistinės regresijos modelis
Toliau pateikta lentelė suteikia galimybę išsiaiškinti analizės metu įvestų nepriklausomų veiksnių statistinę reikšmę, taip pat kiekvieną nestandartizuotą logistinės regresijos koeficientas. Remiantis šiais rodikliais galiteprognozuoti kiekvieno atrinkto respondento tapatybę konkrečiai grupei. Naudodami mygtuką "Išsaugoti" galite įvesti naujus kintamuosius. Juose bus pateikta informacija apie priklausymą konkrečiai klasifikacinei kategorijai (numatytoji kategorija) ir tikimybę būti įtrauktai į šias grupes (numatomų tikimybių narystė). Paspaudus "Ok" pagrindiniame langelyje "Multinomial Logistic Regression" pasirodys skaičiavimų rezultatai.

Pirma lentelė, kuri yra svarbiMokslininko rodikliai, - modelio įrengimo informacija. Aukštas statistinės reikšmės lygis parodys aukštą modelio naudojimo kokybę ir tinkamumą sprendžiant praktines problemas. Kitas svarbus stalas yra Pseudo R-aikštė. Tai leidžia apskaičiuoti visos dispersijos santykį priklausomu faktoriumi, kurį lemia nepriklausomi kintamieji, kurie yra pasirinkti analizei. Pagal tikimybės santykio testų lentelę galima daryti išvadas apie pastarųjų statistinę reikšmę. Parametrų įverčiai atspindi nestandartizuotus koeficientus. Jie naudojami skaičiuojant lygtį. Be to, kiekvienam kintamųjų deriniui nustatoma jų statistinė reikšmė priklausomam faktoriui. Tuo tarpu rinkodaros tyrimuose dažnai reikia atskirti respondentų kategorijas ne atskirai, bet kaip tikslinės grupės dalį. Tam naudokite lentelę Observedand Prognozuojamos dažniai.

Praktinis pritaikymas

Nagrinėjamas analizės metodas yra plačiai naudojamasprekybininkų darbe. 1991 m. Buvo sukurtas sigmoidinio logistikos regresijos rodiklis. Tai paprasta naudoti ir efektyvi priemonė, pagal kurią galėtumėte prognozuoti tikėtinas kainas prieš jų "perkaitimą". Rodiklis pateikiamas grafike kanalo forma, kurią sudaro dvi lygiagrečios linijos. Jie pašalinami vienodo atstumo nuo tendencijos. Koridoriaus plotis priklausys tik nuo laiko. Šis rodiklis naudojamas dirbant beveik visu turtu - nuo valiutų porų iki tauriųjų metalų.

logistikos regresija spss

Praktiškai sukūrėme 2 pagrindines strategijasįrankio programa: suskirstymas ir pasikeitimas. Pastaruoju atveju prekybininkas sutelks dėmesį į kanalo kainų pokyčių dinamiką. Kadangi sąnaudos artėja prie paramos ar atsparumo linijos, statymas yra susijęs su tikimybe, kad judėjimas prasidės priešinga kryptimi. Jei kaina yra artima viršutinei ribai, jūs galite atsikratyti turto. Jei jis yra apatinėje riboje, tai verta galvoti apie pirkimą. Skirstymo strategija apima užsakymų naudojimą. Jie nustatomi už ribų santykinai nedideliu atstumu. Atsižvelgiant į tai, kad kai kuriais atvejais kai kuriomis aplinkybėmis kaina jas pažeidžia per trumpą laiką, turėtumėte būti saugūs ir nustatyti stabdymo nuostolius. Tuo pačiu metu, žinoma, nepriklausomai nuo pasirinktos strategijos, prekybininkas turi būti kiek įmanoma atviresnis, kad suvoktų ir įvertintų rinkoje atsiradusią padėtį.

Išvada

Taigi, logistikos regresijos taikymasleidžia greitai ir lengvai klasifikuoti respondentus į kategorijas pagal nurodytus parametrus. Analizėje galite naudoti bet kokį konkretų metodą. Visų pirma, daugialypė regresija yra universali. Tačiau ekspertai rekomenduoja naudoti visus išvardytus metodus komplekse. Taip yra dėl to, kad šiuo atveju modelio kokybė bus gerokai didesnė. Tai, savo ruožtu, išplės savo taikymo sritį.

Komentarai (0)
Pridėti komentarą