آشنایی با مدل لوجیت (Logit Model) و نحوه محاسبه آن در نرم افزار SPSS

در تحليل روابط بين متغيرها برخی مواقع پیش می آید که متغیر وابسته دارای دو سطح است (دامی یا مجازی). مثلا ممکن است متغیر وابسته مشارکت و یا عدم مشارکت یک فرد در یک برنامه باشد. در این موارد برای تحلیل داده ها باید از مدل احتمالی خطی (لوجیت یا پرابیت) استفاده نمود. در ارتباط با مدل های احتمال خطی چند مسئله وجود دارد:
1. غیر نرمال بودن توزیع
2. ناهمگونی پراکنش واریانس های توزیع ها
3. عدم احتمال وجود Y بین صفر و یک
4. مشکوک بودن مقدار R2 بعنوان معیاری جهت نیکویی برازش
مدل های احتمالی خطی از لحاظ منطقی مدل های جذابی نیستند. زیرا فرض می کنند احتمال اين كه Y =1 باشد (وجود صفت در متغيير وابسته) بشکلی خطی با X ارتباط دارد. یعنی اثرات جانبی ثابت فرض می شود. این موضوع برخی اوقات بیش از حد ایده آل است.
بنابراین، نیاز به یک مدل احتمالی است که دارای دو ویژگی باشد:
(1) همچنانکه X افزایش می یابدPi نیز افزایش یابد اما از دامنه 0-1 خارج نشود، و
(2) رابطه بین Xi و Pi غیرخطی است، و هر چه به یک یا صفر نزدیکتر می شود با نرخ کمتر و کمتری در نتیجه زیاد و کم شدن مقادیر X تغییر می کند.
فرآیند تحلیل لگاریتم خطی لوجیت به تحلیل رابطه بین یک یا چند متغیر وابسته و چند متغیر مستقل می پردازد. در این تحلیل متغیرهای وابسته همواره طبقه ای بوده حال آنکه متغیرهای مستقل می توانند طبقه ای باشند یا نباشد. سایر متغیرهای مستقل، مانند متغیرهای کمکی (cell covariates)، می توانند پیوسته باشند، اما در این موارد تمامی سطوح متغیر مورد بررسی قرار نمیگیرد بلکه میانگین وزنی متغیر در خانه مربوط به آن متغیر لحاظ می گردد. و لگاریتم بخت متغیرهای وابسته بعنوان ترکیب خطی متغیرها مورد استفاده قرار میگیرد. این روش پارامترهای مدل های لگاریتم خطی لوجیت را با استفاده از الگوریتم نیومن راپسون تخمین می زند. مدل احتمالی خطی تکنیکی است که به ما اجازه می دهد احتمال وقوع یا عدم وقوع یک واقعه را برآورد نماییم. این کار با پیش بینی یک متغیر دو سطحی وابسته از طریق مجموعه ای از متغیرهای مستقل ممکن می گردد.

Pi = E(Y=1 | Xi ) = β1 + β2Xi

هرگاه درنتیجه ورود X مقدار Y = 1 گردد به این معنی است که مثلا فرد مشارکت خواهد کرد.
در مدل لوجیت بجای Pi از Ln نسبت بخت یا [P/(1-P)] استفاده میشود یعنی

Li = Ln [P/(1-P)]= Zi = β1 + β2Xi

1- همانگونه که P مقداری بین صفر تا یک می گیرد، لوجیت L نیز مقادیری بین ∞- تا ∞+ میگیرد.
2- اگر چه L رابطه ای خطی با X دارد احتمال آنها دارای رابطه خطی با X نیست.
3- تفسیر مدل لوجیت نیز به این شکل است : β2، شیب، میزان تغییر L به ازای یک واحد تغییر در X . β1 مقدار لگاریتم بخت است هنگامی که مقدار X برابر صفر است.
4- مدل احتمالی خطی فرض می کند که P1 ارتباطی خطی با Xi دارد، مدل لوجیت فرض می کند که این لگاریتم نسبت بخت است که ارتباطی خطی با Xi دارد.
پس مدل لوجیت همانند مدل های لگاریتم خطی و پرابیت نوع خاصی از مدل های خطی عمومی (general linear models) است (GLM، که شامل رگرسیون و مدل های ANOVA می گردد) که برای عملکرد بهتر بر روی متغیرهای دو بخشی و طبقه ای ارائه شده اند. مدل لوجیت شبیه مدل لگاریتم خطی است اما یک یا بیش از یک متغیر وابسته طبقه بندی شده را توضیح می دهد. البته زمانی که یک متغیر وابسته طبقه بندی شده وجود دارد، استفاده از رگرسیون لوجستیک دو و چند جمله ای نسبت به مدل لوجیت رایج تر است. همچنین رگرسیون لوجستیک بیشتر زمانی استفاده می شود که متغیرهای مستقل حالت پیوسته نیز دارند. مدل پروبیت نیز شکل متفاوتی از لوجیت است که پیش فرض های مربوط به داده های آن متفاوت است. مدل پروبیت زمانی که فرض نرمال بودن توزیع متغیر وابسته برقرار باشد کاربردش معمول تر است.
جهت مطالعه و دانلود فايل کامل این مطلب به زير بخش آشنايي با برخي از آزمون هاي آماري در قسمت مطالب مفيد مراجعه نماييد.

+ نوشته شده توسط علی اکبر براتی در شنبه 1390/08/28 و ساعت 20:15 |