تحليل الانحدار

تحليل الانحدار أو تحليل الارتباط أو تحليل الانكفاء (بالإنجليزية: regression analysis) هو كل طريقة إحصائية يتم فيها التنبؤ بمتوسط متغير عشوائي أو عدة متغيرات عشوائية اعتمادا على قيم وقياسات متغيرات عشوائية أخرى. له عدة أنواع مثل: الانحدار الخطي، والانحدار اللوجستي، وانحدار بواسون، والتعليم المراقب والانحدار موزون الوحدة.

تحليل الانحدار هو أكثر من عملية ملائمة منحنى (أي اختيار المنحنى الأكثر ملائمة لمجموعة نقاط بيانية معطاة) فهو يتضمن ملائمة نموذج باستخدام مكونات حتمية واعتباطية. المكونات الحتمية تدعى المتنبئات أما المكونات الاعتباطية فتدعى الخطأ.

الشكل الأبسط لنموذج الانحدار يحوي متغيرا تابعا (غير مستقل) (يدعى أيضا متغير الخرج، أو المتغير الداخلي أو المتغير ع) إضافة إلى متغير مستقل (يدعى العامل، أو المتغير الخارجي، أو المتغير-س).

من الأمثلة النموذجية على تحليل الانحدار: اعتماد ضغط الدم Y على عمر الشخص X، أو اعتماد الوزن لحيوانات التجربة Y على معدل التغذية اليومي X. هذا الارتباط والتابعية بين X وY هي ما ندعوه بالانحدار أو الارتباط فنقول ارتباط Y ب X.

ويلاحظ من ذلك أن نموذج الانحدار يعتمد دائماً على علاقة السببية بمعنى ان يكون التغير في المتغير المستقل مسببا رئيسيا للتغير في المتغير التابع.

ونظرية تحليل الانحدار تعتمد على النظرية الاقتصادية بين متغيرين أي أنها تفترض ثبات العوامل الأخرى.

الانحدار

الانحدار مصطلح يستخدم فى الأصل لوصف حقيقة أنه إذا تم قياس أوزان أجسام مجموعة من الأباء والأبناء (مثلاً، فإن أوزان الأبناء تميل إلى التركز حول المتوسط أكثر من أوزان الآباء: إذ أن الآباء ثقيلو الوزن بصورة غير معتادة، يكون أبناؤهم من ذوى الأوزان الأخف، و الأباء خفيفو الوزن بصورة غير معتادة، يكون أبناؤهم من ذوى الأوزان الأثقل. ويشار إلى هذه الظاهرة على انها "انحدار حول المتوسط" (انظر مقاييس النزعة المركزية).

وفى الاستخدام الإحصائى، يشير الانحدار فى أبسط صوره (الانحدار الخطى لمتغيرين) إلى توفيق خط مستقيم يمثل الاتجاه العام لمجموعة من النقاط الخاصة بالبيانات المتاحة عن قيم متغيرين بقصد تمثيل الاتجاه بينهما. والانحدار علاقة غير متماثلة، بمعنى أنه يفترض أن متغيرا ما (وليكن Y (ص) مثلاً وهو المتغير التابع) يتحدد طبقا لمتغير آخر (و ليكن X (س) وهو المتغير المستقل)، وأن العلاقة بينهما خطية. ومن ثم فإنهما على مستوى متقارب فى القياس، وأن التوفيق بينهما غير كامل بمعنى أن:

Yi= a + Bxi + Ei

ومعنى ذلك أن قيمة المتغير التابع Y (ص) بالنسبة لفرد ما (i) تختلف على طول الخط مع قيمة المتغير حد X (س) مع مدى خطاً مقداره (e). ويمثل ميل هذا الخط بمعامل الانحدار، وهو معامل (X)، والمقدار الثابت a والذى يمثل طول الجزء المقطوع من محور، كما يتضح من الشكل المبين.

ومن الناحية الإحصائية، فإنه يفترض أن الأخطاء (Ei) متغيرات عشوائية مستقلة بمتوسط = صفر. كما أنها مستقلة أيضاً عن قيم المتغير المستقل (X). ويهدف تحليل الانحدار أساساً إلى حساب قيمة الميل (B) والذى يعبر عن التأثير العام لـ X. ويتم حسابه عادة باستخدام مبدأ المربعات الصغرى، والذى يمكن بواسطته إيجاد أفضل خط يمثل هذه البيانات عن طريق تصغير مجموع مربعات الأخطاء بين القيمة الحقيقية Y والقيمة المتوقعة من خط الاتحدار إلى أدنى حد ممكن. ويغطى معامل الارتباط r مقياسا لمدى جودة التوفيق لخط الانحدار لهذه البيانات. ويكون التوفيق تاماً وجيداً عندما تكون (1± = r)، ويكون التوفيق غير جيد كلما اقتربت قيمة ٣ من الصفر (0 = r). وفى الحالة الأولى يكون الارتباط قوياً، بينما يكون فى الثانية ارتباطاً ضعيفاً.

ويمكن تعميم الانحدار البسيط بعدة طرق: فمثلاً فى حالة وجود أكثر من متغير مستقل (الانحدار الخطى المتعدد)، وقد يكون لدوال أو علاقات أخرى. ومن ذلك: الانحدار الرتيب لبيانات غير مقيسة آو وصفية أو مرتبة، وتلك التى تستخدم فى القياسات متعددة الأبعاد، وكذلك الانحدار اللوغاريتمى والانحدار فى صورة كثيرة الحدود). وفى حالة وجود عدة متغيرات، فإن تموذج الانحدار الخطى المتعدد يمكن كتابتة بالصورة التالية:

Yi = a + Bi X ii + B2 X 2i +B3x3i+......+BkXki+E1

وهنا تمثل Bk معاملات الانحدار، وتعبر عن التأثير الجزئى للمتغير المسثقل xi على Yi مع ثبات (أو استبعاد التأثير الخطى للمتغيرات المستقلة الأخرى). وتعتبر معاملات الانحدار الجزئية (أو أوزان بيتا) ذات أهمية خاصة فى النماذج العلية ونظم المعادلات الهيكلية.

الانحدار الخطي

طالع أيضاً: انحدار خطي وانحدار خطي بسيط

في الانحدار الخطي، تكون مواصفات هذا النموذج بشرط أن المتغير المستقل،yi هو توافيق خطية للوسيط. مثلاً، في الانحدار الخطي البسيط ولعمل نموذج n من النقاط البيانية يوجد متغير: xi، ووسيطين، β0 وβ1:

الخط المستقيم: yi=β0+β1xi+εi,i=1,,n.

في الانحدار الخطي المتعدد، توجد عدة متغيرات مستقلة أو دوال من المتغيرات المستقلة. مثال ذلك، إضافة عنصر في xi2 للانحدار السابق يعطي:

قطع مكافئ: yi=β0+β1xi+β2xi2+εi,i=1,,n.

ما زال هذا انحداراً خطياً، بالرغم من أن التعبير على الطرف الأيمن هو دالة تربيعية في المتغير المستقلxi، لكنه لايزال خطياً في الوسائط β0, β1 وβ2.

في كلا الحالتين، εi ليست حد خطأ وi تدل على ملاحظة معينة. لو كان لدينا عينة عشوائية من التعداد السكاني، يمكننا تقدير وسائط السكان وإيجاد نموذج الانحدار الخطي للعينة:

yi=β^0+β^1xi+ei.

الحد ei يمثل الراسب، ei=yiy^i. أحد طرق التقدير تتمثل في أقل التربيعات الاعتيادية، SSE:

SSE=i=1Nei2.

تبسيط هذه الدالة ينجم عنه مجموعة من معادلات اعتيادية، يتم حلها لإيجاد تقديرات الوسيط، β^0,β^1.

في حالة الانحدار الخطي البسيط، تكون صيغ تقديرات أقل التربيعات:

β1^=(xix¯)(yiy¯)(xix¯)2 and β0^=y¯β1^x¯

حيث x¯ المتوسط الحسابي (لقيم x وy¯ متوسط قيم y.

على افتراض أن حد الخطأ السكاني ذو تباين ثابت، تعطى تقديرات التباين بالعلاقة: σ^ε2=SSEN2.

ويطلق عليها خطأ مربع المتوسط (MSE) للانحدار. تعطى الأخطاء المعيارية لتقديرات الوسيط بالعلاقة:<math>\hat\sigma_{\beta_0}=\hat\sigma_{\varepsilon} \sqrt{\frac{1}{N} + \frac{\bar{x}^2}{\sum(x_i-\bar x)^2}}</math>

<math>\hat\sigma_{\beta_1}=\hat\sigma_{\varepsilon} \sqrt{\frac{1}{\sum(x_i-\bar x)^2}}.</math>

انظر أيضا