رگرسیون چند متغیری دارای روشهای مختلفی است. تفاوت روشهای آن در نحوه انتخاب متغیرهای پیشبینی کننده است، برای تعیین رگرسیون از رابطه زیر در این پژوهش استفاده میگردد؛
: عملکرد بانک
: عرض از مبدأ
، ، … ، : کلیه متغیرهای مورد استفاده در این پژوهش
، ، … ، : ضریب رگرسیونهای به دست آمده کلیه متغیرهای در این پژوهش
: جملات خطا.
در چنین مدلی مفروضات اساسی زیر در نظر گرفته میشود:
-
- X ها متغیرهای تصادفی هستند، علاوه بر آن رابطه خطی کامل میان دو یا چند متغیر مستقل وجود ندارد.
-
- برای تمامی مشاهدات، امید ریاضی جمله خطا معادل صفر و واریانس مقدار آن ثابت است.
-
- جملات خطای مربوط به مشاهدات مختلف با یکدیگر همبستگی ندارد.
- جمله خطا به صورت نرمال توزیع شده است.
در این تحقیق چندین رگرسیون چند متغیره آزمون میشود.
۳-۱۱-۲- آزمون فروض کلاسیک
۳-۱۱-۲-۱- نبود خود همبستگی
با توجه به این که در مدلهای رگرسیون فرض بر آن است که جملات خطا () از دورهای به دوره بعد مستقل میباشند، اما در بسیاری موارد، جملات خطا در دوره های مختلف همبستهاند. در چنین مواردی جملات خطا اصطلاحاً دارای خود همبستگی یا همبستگی متوالی[۴۰]هستند. خود همبستگی جملات خطا معمولا در مطالعات سریهای زمانی مشاهده میشود. برخی از دلایل وجود خود همبستگی در جملات خطا عبارتند از (زارع و ذوالنور، ۱۳۷۴):
۱- متغیرهای توضیحی حذف شده. در چنین حالتی، از آنجایی که اغلب متغیرهای اقتصادی خود همبسته میباشند، خطای خود همبستگی به وجود میآید، گنجانیدن متغیرهای توضیحی حذف شده در مدل، این مشکل را برطرف میکند.
۲- مدل بندی اشتباه یک الگو. اگر الگویی خاص را خطی فرض نماییم، در حالی که شکل واقعی آن غیرخطی است، خطاها میتوانند منعکس کننده برخی وابستگیها باشند.
۳- تحریف مشاهدات آماری برخی داده های سریهای زمانی شامل نوعی از فرایند هموار سازی میباشند که توزیع واقعی داده ها در خلال دوره های مورد بررسی را به صورت میانگین متحرک درآورده و برای مثال آثار فصلی آن را در یک سری زمانی از بین میبرند. در نتیجه برای چنین متغیری، مقادیر میتوانند با یکدیگر همبستگی پیدا کنند.
وجود خود همبستگی در جملات خطای مدل رگرسیون منجر به نتایج زیر میشود (زارع، ۱۳۸۱و ذوالنور، ۱۳۷۴):
۱- ضرایب رگرسیون کماکان برآورد کننده های نا اریب[۴۱] میباشند. اما ویژگیهای واریانس حداقل را ندارند. این برآورده کننده ها نسبتاً ناکارا میباشند.
۲- میانگین مربعات جملات خطا، میتواند به صورتی قابل توجه واریانس واقعی جملات خطا را کم برآورد نماید.
۳- شیوه های فاصله اطمینان و آزمونها که در آن ها از توزیعهای t و F استفاده میشود، اکیداً قابل کاربرد نیستند.
۴- در نتیجه اریب بودن میانگین مربعات جملات خطا، نیز غیر قابل اتکا و اریب خواهد بود.
برای بررسی آنکه در یک مدل رگرسیون جملات خطا خود همبسته میباشند یا خیر، آزمونهایی طراحی شده است. در این میان آزمونهایی که بیشتر مورد استفاده قرار میگیرد، آزمون دوربین، واتسن است. آزمون دوربین- واتسن[۴۲] بر مدل خطای خود همبسته مرتبه اول مبتنی میباشد. این مدل به صورت زیر است:
(۱)
پارامتر خود همبستگی با مقدار
و ut : متغیر مستقل با فرض
در این مدل وقتی که مثبت باشد، خود همبستگی مثبت و وقتی که منفی باشد، خود همبستگی منفی وجود دارد. در حالت خود همبستگی وجود ندارد. از این رو در آزمون دوربین- واتسن فرضیات آزمون عبارتند از (ذوالنور، ۱۳۷۴):
آماره دوربین- واتسن برای این آزمون به صورت زیر میباشد:
که در آن et جمله خطای رگرسیون در دوره tام و n تعداد مشاهدات در برازش رگرسیون میباشد.
محاسبه حد دقیق عمل آزمون دوربین- واتسن مشکل است. بنابرین آزمون را با کران پایین (dL) و کران بالا (du) انجام میدهند. قاعده تصمیم در این آزمون به صورت زیر است:
فرض صفر رد میشود، خودهمبستگی مثبت وجود دارد.
نتیجه آزمون قطعی نیست.
نتیجه آزمون قطعی نیست.
فرض صفر تأیید میشود، خود همبستگی وجود ندارد.
فرض صفر رد میگردد، خود همبستگی منفی وجود دارد.
لازم به ذکر است که توصیه شده در مواردی که نتیجه آزمون قطعی نیست، برای بالا بردن اطمینان وجود خود همبستگی پذیرفته شود (گجراتی، ۱۹۹۵).
۳-۱۱-۲-۲- واریانس ناهمسانی جملات باقیمانده و اصلاح آن
این مشکل در تحلیل رگرسیونهای خطی چند متغیره زمانی به وجود می آید که فرض کلاسیک تساوی واریانس جملات باقیمانده با واقعیت منطبق نباشد. وجود رابطه میان واریانس جملات باقیمانده و یکی از متغیرهای مستقل، تنها یکی از مواردی است که فرض تساوی واریانس جملات باقیمانده را نقض می کند (ذوالنور، ۱۳۷۴). که در این صورت برای تشخیص واریانس ناهمسانی از آزمون گلدفلد-کوانت[۴۳] استفاده میشود. این آزمون شامل مراحل زیر است (همان ماخذ):
۱- مشاهدات برحسب مقادیر صعودی متغیر مستقلی مرتب میشوند که انتظار میرود با واریانس جملات باقیمانده، رابطه مستقیم داشته باشد.
۲- c مشاهده میانی را حذف میکنیم. عدد c را معمولاً به گونه ای بر میگزینیم که نزدیک به مشاهدات، حذف شوند، به شرط آنکه از تعداد پارامترهای مورد تخمین کمتر نباشد.
۳- با بهره گرفتن از روش حداقل مربعات معمولی، دو رگرسیون جداگانه برای دو گروه از مشاهدات باقیمانده، تخمین میزنیم. فرض میکنیم که ، مجموع مربعات جملات باقیماندهی رگرسیون اول[۴۴] (با مقادیر کوچکتر متغیر مستقل) و مجموع مربعات جملات باقیماندهی رگرسیون دوم[۴۵] (با مقادیر بزرگتر متغیر مستقل) باشند.
۴- با فرض تساوی واریانس جملات باقیمانده، نسبت ، دارای توزیع F با درجه های آزادی ( ) خواهد بود که در آن K تعداد پارامترهای مورد تخمین است. برای انجام این آزمون، فرض صفر، فرض تساوی واریانس جملات باقیمانده است و لذا در سطح اطمینان مثلا ۹۵% اگر P-Value بزرگتر از ۵% باشد، فرض صفر تأیید میشود و نتیجه میگیریم که مدل مشکل واریانس ناهمسانی ندارد.
یکی از روشهای سادهی تخمین پارامترها با فرض عدم تساوی واریانس جملات باقیمانده، تغییر متغیرها است البته به این شرط که واریانس جملات باقیمانده با مربع یکی از متغیرهای مستقل، رابطهای مستقیم داشته باشد. برخی اوقات مشکل واریانس ناهمسانی با تخمین تابع رگرسیون به صورت لگاریتمی حل میشود. البته در این حالت مدل قبلی با مدل جدید قابل مقایسه نیست چون متغیرهای مستقل و وابستهی دو مدل از یکدیگر متفاوتند (عباسی نژاد، ۱۳۸۰).