مقایسه توابع توان آزمون رگرسیون چند متغیره خطی و تحلیل واریانس بدون اثر متقابل
در تحلیل رگرسیونی ما قادریم که بین یک متغیر موردنظر به عنوان متغیر
وابسته (پاسخ) و یک یا چند متغیر مستقل تعیینی (پیش بین)، رابطهای را با
تجربه معین کرده و از آن استفاده نمائیم. علاوه بر این میتوانیم با
استفاده از آزمون فرضهای خطی به این نتیجه برسیم که کدامیک از متغیرهای
مستقل روی متغیر وابسته تاثیر دارند. میدانیم که آنالیز واریانس ، معادل
رگرسیون باا متغیرهای ظاهری است . لذا در اینجا نیز با استفاده از فرضهای
خطی میتوان تاثیر متغیرهای مستقل (عوامل مورد بررسی) را روی متغیر پاسخ
آزمون نمود. در این حالت اگر عوامل مورد بررسی کمی باشند، مقادیر این عوامل
در مدل شرکت ندارند. اگر بتوان مقادیر این عوامل را در مدل وارد نمود با
استفاده از مدل جدید میتوان مقادیر متغیر پاسخ را به ازای مقادیر عاملها،
تخمین زد. در این پایاننامه ابتدا روش فرموله کردن مسائل آنالیز واریانس
با عوامل کمی به مدل رگرسیون با شرکت مقادیر عامها گفته میشود. سپس معیاری
معرفی میشود که به کمک آن بتوان توان آزمونها را در دو حالت رگرسیون چند
متغیره خطی و آنالیز واریانس بدون اثر متقابل مقایسه نموده تا با استفاده
از آن معین کنیم که در چه وضعیتی بهتر است از چه روشی استفاده شود. قسمت
اول کار نظری است که با استفاده از روشها و محاسبات آماری لازم و مراجعه به
مقالهها و کتب مربوط انجام میپذیرد. و قسمت دوم عملی است که با تعیین
معیار بدست آمده و با استفاده از رایانه میتوان شرایط مختلف را بررسی
نمود. لذا ابتدا در فصل اول تعاریف و قضایای مربوط به فرضهای درجه دوم را
بیان کردهایم. در فصل دوم مدلهای خطی کلی را معرفی و قضیههای لازم را
آوردهایم. و سپس فرمول محاسبه مقدار توان آزمون فرضهای خطی کلی را بیان
نمودهایم. در فصل سوم رگرسیون چند متغیره خطی که حالت خاصی از مدلهای خطی
کلی است را معرفی نمودهایم. در فصل چهارم، تحلیل واریانس بدون اثر متقابل
را مورد بحث قرار داده و چگونگی استفاده از متغیرهای ظاهری برای تبدیل مدل
تحلیل واریانس به مدل رگرسیونی را بیان کردهایم. آنگاه روش فرموله نمودن
این مدل را در حالتی که عوامل کمی میباشند را به مدل رگرسیون با شرکت
مقادیر عوامل مورد بررسی شرح دادهایم و تابع توان آزمون را در هر حالت
معرفی کردهایم. و بالاخره در فصل آخر معیار گفته شده را معرفی و از آن
برای اهداف گفته شده استفاده شده است . آنگاه با استفاده از نرمافزار SAS،
برنامهها و جداولی ارائه دادهایم که با استفاده از آنها بتوان در عمل،
یکی از روشهای گفته شده را انتخاب نمود.
رگرسیون
|
|||||||||||||||||||||||||||||||||
کاربرد يک متغير براى عمل پيشبينى درخصوص متغير ديگر را رگرسيون مىگويند. رگرسيون با کاربرد يک متغير دانسته و مشخص، مقادير متغير غيرمشخص ديگرى را پيشبينى مىکند؛ (تاجداري، پرويز؛ روشهاى علمى تحقيق همراه با نظريهٔ ارزشيابي؛ ص ۳۰۳) مانند تشخيص ميزان تغيير درآمد بر اثر تغيير تحصيلات يا ميزان تغيير توليد کارخانه با ميزان تغيير در ضايعات توليد. ميزان تغيير يک متغير بر اثر متغير ديگر را ضريب رگرسيون نيز مىگويند که عبارت است از ميزان تغييرى که در متغير وابسته بر اثر يک واحد تغيير در متغير مستقل بروز مىکند. (درآمدى بر تحقيق پيمايشى و تحليل دادهها؛ ص ۲۱۴) |
|||||||||||||||||||||||||||||||||
رگرسيون بصورت دو متغيره و چند متغيره محاسبه مىشود. در رگرسيون دو متغيره، يک متغير مستقل و يک متغير تابع وجود دارد؛ ولى در رگرسيون چند متغيره يک متغير تابع و چند متغير مستقل وجود دارد؛ مثلاً در محاسبهٔ تأثير دو متغير تحصيلات و تجربه شغلى در درآمد، درآمد متغير تابع است و تحصيلات و تجربه شغلى دو متغير مستقل هستند. |
|||||||||||||||||||||||||||||||||
خط رگرسيون منعکسکننده مسر حرکت کلى نقاط پراکنده در دستگاه مختصات اسمى که مىتواند مبين شدت و ضعف و نوع همبستگى بين متغيرها باشد. براى رسم خط رگرسيون بايد از معادله رگرسيون استفاده کرد. در رگرسيون دو متغيره پس از آنکه مسجل شد بين دو متغير همبستگى معنىدار وجود دارد، از فرمول زير استفاده مىشود: |
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
در اين فرمول x، مقادير مستقل؛ y، مقادير متغير تابع و وابسته و b، a، ضرايبى هستند که از فرمولهاى زير محاسبه مىشوند: | |||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
وقتى اين مقادير محاسبه شد، مىتوان به x مقادير مختلف داد و مقدار y را محاسبه کرد و پس از محاسبهٔ مختصات حداقل دو نقطه در دستگاه (يعنى x و y هر يک)، مىتوان خط رگرسيون را در دستگاه مختصات ترسيم نمود. |
|||||||||||||||||||||||||||||||||
آزمون T. آزمون T براى نمونههاى کوچک کاربرد دارد (کمتر از ۳۰ مورد مشاهده)، در سال ۱۹۱۵ بوسيله فردى بهنام ويليام سيلى گوست (William Seely Gosset) مشاور آمار يکى از مؤسسات ايرلند مطرح شد. (روشهاى تحقيق در علوم تربيتى و رفتاري؛ ص ۳۵۳) مفهوم اظهارات او اين بود که انحراف استاندارد در نمونههاى کوچک يا انحراف استاندارد در جامعه شباهت کمى دارد؛ بنابراين، براى حل مسئله آزمون T را پيشنهاد کرد. توزيع T از بسيارى جهات شبيه توزيع با کميّت Z (نمرات استاندارد) است که از فرمول Z = (x-) / σ بدست آيد. به کمک کميّت Z مىتوان تفاوت موجود در پراکندگى ميان يک سرى انحراف نمره از ميانگين را بوسيله تقسيم انحراف هر نمره از ميانگين (x-) بر انحراف استاندارد آن سرى نمره (σ)، مرتفع نمود و نمرهها را با يکديگر مقايسه کرد. (آمار استنباطى در علوم انساني؛ ص ۵) البته توزيع T با کميّت Z و منحنى طبيعى تفاوت دارد؛ مثلاً توزيع کميّت Z طبيعى است، درحاليکه توزيع کميّت T تابع تعداد آزمودنىهاست که در درجه آزادى (df) تأثير دارد و هرچه درجهٔ آزادى بيشتر باشد شکل توزيع به منحنى توزيع طبيعى نزديکتر است. |
|||||||||||||||||||||||||||||||||
از آزمون T براى مقايسه و تشخيص تفاوت و رابطه علّى استفاده مىشود و موارد کاربرى آن عبارت است از: | |||||||||||||||||||||||||||||||||
الف – آزمون فرض درباره ميانگين جامعه | |||||||||||||||||||||||||||||||||
ب – آزمون T براى مقايسه ميانگينهاى دو گروه مستقل | |||||||||||||||||||||||||||||||||
ج – ازمون T براى گروههاى همبسته. (روشهاى تحقيق در علوم تربيتى و روانشناسى ص ۴۱۰) | |||||||||||||||||||||||||||||||||
الف – در مورد اول هدف آزمون فرضيهٔ صفر درباره نبود تفاوت بين ميانگين نمونه يا ميانگين جامعهاى است که از آن برگزيده شده است. براى اين امر از فرمول |
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
استفاده مىشودکه در آن x، ميانگين گروه نمونه؛ ، ميانگين جامعه يا عدد ثابت مورد ادعا براى جامعه؛ S، انحراف استاندارد نمونه و N، تعداد افراد نمونه (آزمودنىها) است. |
|||||||||||||||||||||||||||||||||
عدد محاسبه شده از طريق فرمول مزبور بايد با جدول توزيع T و با درجهٔ آزادى مربوط و نيز سطح احتمال موردنظر (5% يا ۱% = α) مقايسه شود. براى محاسبه درجهٔ آزادى از فرمول df=N-۱ استفاده مىشود. اگر T محاسبه شده از T جدول کمتر باشد فرضيهٔ صفر تأييد مىشود. |
|||||||||||||||||||||||||||||||||
ب – در مورد دوم هدف مطالعه تأثير متغيرهاى آزمايشى بر دو گروه آزمايش است که بدين وسيله تفاوت تأثير متغيرها سنجيده مىشود. براى اين کار از فرمول زير استفاده مىشود: |
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
در اين فرمول x۱ ميانگين گروه اول؛ x۲ ميانگين گروه دوم؛ x۲۱∑ مجموع مجذور انحراف از ميانگين نمرات گروه اول؛ x۲۲ ∑ مجموع مجذور انحراف از ميانگين نمرات گروه دوم و N۱ و N۲ فراوانى گروه اول و دوم است. |
|||||||||||||||||||||||||||||||||
براى محاسبه درجه آزادى از فرمول( d f = ( N۱ + N۲ – ۲ استفاده مىشود. | |||||||||||||||||||||||||||||||||
در پايان عدد محاسبه شده با T جدول در سطح احتمال موردنظر (5% يا ۱% = α) و درجهٔ آزادى مربوطه مقايسه مىشود. چنانچه از عدد T جدول بيشتر بود، فرضيه صفر مبنى بر نبود تفاوت رد مىشود و فرضيه تحقيق مورد تأييد قرار مىگيرد. |
|||||||||||||||||||||||||||||||||
ج – در مورد سوم از آزمون T براى مطالعه تأثير يک متغير مستقل در متغير تابع استفاده مىشود، درحاليکه متغير تابع در دو زمان يا تحت شرايطى مورد آزمون و اندازهگيرى قرار مىگيرد تا تأثير متغير مستقل يا رابطه علّى مورد مطالعه قرار گيرد؛ مانند تأثير يک متغير بر يک گروه نمونه و آزمودني، در زمان t۱ و نيز زمان t۲ و سپس مقايسه نتايج آزمون در دو زمان مزبور. براى اين کار از فرمول زير استفاده مىشود: |
|||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||
در اين فرمول D∑ ، مجموع تفاضل نمرههاى قبل و بعد از اجراى متغير مستقل و D۲∑ مجموع مجذور تفاضل نمرههاى قبل و بعد از اجراى متغير مستقل است. |
|||||||||||||||||||||||||||||||||
براى محاسبهٔ درجهٔ آزادى نيز از فرمول df=N-۱ استفاده مىشود. سپس نتيجه با مقادير جدول T مقايسه مىگردد | |||||||||||||||||||||||||||||||||
آزمون F. همانطور که ملاحظه شد، از آزمون T براى مطالعه تفاوت و اثرگذارى در رابطه با دو متغير استفاده مىشود، ولى گاهىاوقات محقق درصدد تشخيص تفاوت بين اثرگذارى چند متغير يا انتخاب بهترين آنهاست؛ براى مثال، مىخواهد بداند که بين چند روش تدريس مثلاً فارسى يا در بين چند روش توليد کالا با چند روش مديريت يا چند روش کاشت محصول، کدام روش بهتر است. |
|||||||||||||||||||||||||||||||||
براى اين کار، استفاده از آزمون T بصورت مقايسههاى زوجى امکانپذير است، ولى بروز اشتباهات آمارى و محاسبات غلط عملاً بهرهبردارى از اين روش را غيرممکن مىسازد؛ از اينرو، از روش آزمون ديگرى به نام آزمون( F (F test با روش تحليل واريانس استفاده مىشود. اين روش به محقق در تشخيص تفاوتهاى معنىدار بين گروهها و تأثير متغيرها در آنها کمک مىنمايد. از آنجا که بيان اين آزمون نياز به تفصيل و اطالهٔ کلام دارد، از توضيح آن در اينجا خوددارى مىشود و علاقهمندان مىتوانند به کتب آمار مراجعه نمايند. (آمار استنباطى در علوم انساني؛ و روشهاى علمى تحقيق همراه با نظريه ارزشيابى.) |