ضریب همبستگی را تعیین کنید

نویسنده: Morris Wright
تاریخ ایجاد: 28 ماه آوریل 2021
تاریخ به روزرسانی: 19 ژوئن 2024
Anonim
محاسبه ضریب همبستگی r | آمار AP | آکادمی خان
ویدیو: محاسبه ضریب همبستگی r | آمار AP | آکادمی خان

محتوا

ضریب همبستگی ، نشان داده شده به r یا ρ ، اندازه گیری همبستگی خطی (رابطه هم از نظر قدرت و هم جهت) بین دو متغیر است. این از 1- تا 1+ است ، با استفاده از علائم منفی و منفی همبستگی مثبت و منفی را نشان می دهد. اگر ضریب همبستگی دقیقاً -1 باشد ، رابطه بین دو متغیر کاملاً منفی است. اگر ضریب همبستگی دقیقاً 1+ باشد ، رابطه کاملاً مثبت است. دو متغیر می توانند همبستگی مثبت ، همبستگی منفی یا اصلاً همبستگی نداشته باشند. شما می توانید همبستگی را با استفاده از برخی محاسبات همبستگی رایگان موجود در اینترنت یا با استفاده از توابع آماری یک ماشین حساب نمودار خوب ، با دست محاسبه کنید.

گام برداشتن

روش 1 از 4: ضریب همبستگی را با دست محاسبه کنید

  1. ابتدا داده های خود را جمع آوری کنید. برای شروع محاسبه یک همبستگی کارآمد ، ابتدا جفت داده ها را بررسی کنید. مفید است که آنها را به صورت عمودی و افقی در یک جدول قرار دهید. هر سطر یا ستون x و y را برچسب بزنید.
    • به عنوان مثال ، فرض کنید چهار جفت داده برای آن دارید ایکس و y. جدول ممکن است به این شکل باشد:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. محاسبه میانگین ایکس. برای محاسبه میانگین ، به تمام مقادیر ایکس اضافه کنید و سپس تقسیم بر تعداد مقادیر کنید.
    • با استفاده از مثال بالا ، توجه داشته باشید که چهار مقدار برای دارید ایکس. برای محاسبه میانگین ، تمام مقادیر را جمع می کنید ایکس و آن را بر 4 تقسیم کنید. محاسبه به صورت زیر است:
    • μایکس=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}میانگین را پیدا کنید y. به طور متوسط y برای یافتن آن ، همان مراحل را دنبال کنید ، تمام مقادیر y را با هم جمع کنید و سپس بر تعداد مقادیر تقسیم کنید.
      • در مثال بالا ، شما نیز چهار مقدار برای دارید y. همه این مقادیر را با هم جمع کنید و سپس آنها را بر 4 تقسیم کنید. محاسبات به این شکل است:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}انحراف معیار را تعیین کنید ایکس. وقتی توانایی خود را به دست آوردید ، می توانید انحراف معیار را محاسبه کنید. برای این کار از فرمول زیر استفاده کنید:
        • σایکس=1n1Σ(ایکسμایکس)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}انحراف معیار را محاسبه کنید y. با استفاده از همان مراحل اساسی ، انحراف استاندارد را پیدا کنید y. شما با استفاده از نقاط داده برای y ، از همان فرمول استفاده خواهید کرد.
          • با استفاده از داده های نمونه ، محاسبات شما به شرح زیر است:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}فرمول اساسی تعیین ضریب همبستگی را مرور کنید. فرمول محاسبه ضریب همبستگی از میانگین ها ، انحراف معیار و تعداد جفت ها در یک مجموعه داده استفاده می کند (نشان داده شده توسط n) ضریب همبستگی خود با حرف کوچک r یا حرف یونانی ρ (rho) نشان داده می شود. برای این مقاله ، ما از فرمولی که به عنوان ضریب همبستگی پیرسون معروف است استفاده خواهیم کرد همانطور که در زیر نشان داده شده است:
            • ρ=(1n1)Σ(ایکسμایکسσایکس)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } راست) * چپ ({ frac {y- mu _ {y}} { sigma _ {y}}} راست)}ضریب همبستگی را تعیین کنید. اکنون شما متغیرهای خود دارای معیارها و انحرافات استاندارد هستید ، بنابراین می توانید به فرمول ضریب همبستگی بروید. یادت باشد n تعداد مقادیر شما را نشان می دهد. شما قبلاً سایر اطلاعات مربوطه را در مراحل بالا بررسی کرده اید.
              • با استفاده از داده های نمونه ، می توانید داده ها را در فرمول ضریب همبستگی وارد کرده و به صورت زیر محاسبه کنید:
              • ρ=(1n1)Σ(ایکسμایکسσایکس)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } راست) * چپ ({ frac {y- mu _ {y}} { sigma _ {y}}} راست)}نتیجه را تفسیر کنید. برای این مجموعه داده ، ضریب همبستگی 0.988 است. این شماره دو مورد را در مورد داده به شما می گوید. به علامت عدد و اندازه عدد نگاه کنید.
                • از آنجا که ضریب همبستگی مثبت است ، می توانید بگویید که بین داده x و داده y همبستگی مثبت وجود دارد. این بدان معنی است که اگر مقادیر x افزایش یابد ، انتظار دارید مقادیر y نیز افزایش یابد.
                • از آنجا که ضریب همبستگی بسیار نزدیک به 1+ است ، داده های x و داده y بسیار نزدیک هستند. اگر بخواهید این نقاط را نمودار کنید ، می بینید که آنها تقریب بسیار خوبی با یک خط مستقیم هستند.

روش 2 از 4: استفاده از ماشین حساب های همبستگی آنلاین

  1. برای محاسبه همبستگی به صورت آنلاین جستجو کنید. اندازه گیری همبستگی یک محاسبه نسبتاً استاندارد برای آمار شناسان است. اگر دستی انجام شود ، این محاسبه برای مجموعه های داده بزرگ بسیار خسته کننده می شود. بنابراین ، بسیاری از منابع محاسبات همبستگی مشترک را به صورت آنلاین در دسترس قرار داده اند. از هر موتور جستجو استفاده کنید و عبارت جستجو "حسابگر همبستگی" را وارد کنید.
  2. داده ها را وارد کنید. دستورالعمل های موجود در وب سایت را با دقت بخوانید تا بتوانید داده ها را به درستی وارد کنید. مهم است که جفت داده ها به ترتیب نگه داشته شوند وگرنه نتیجه همبستگی نادرستی بدست می آورید. وب سایت های مختلف از فرمت های مختلف برای ورود داده استفاده می کنند.
    • به عنوان مثال ، در وب سایت http://ncalculators.com/statistics/correlation-coeffic-calculator.htm یک جعبه افقی برای ورودی مقادیر x و یک جعبه افقی دوم برای ورودی مقادیر y پیدا خواهید کرد. شما شرایط را وارد می کنید ، فقط با ویرگول از هم جدا می شوند. بنابراین ، مجموعه داده x که قبلاً در این مقاله محاسبه شده است ، باید 1،2،4،5 وارد شود. مجموعه داده y به صورت 1،3،5،7 وارد می شود.
    • در سایت دیگری ، http://www.alcula.com/calculators/statistics/correlation-coeffic/ ، می توانید داده ها را به صورت افقی یا عمودی وارد کنید ، به شرطی که نقاط داده را مرتب نگه دارید.
  3. نتایج را محاسبه کنید. این سایت های محاسبه محبوب هستند زیرا پس از وارد کردن داده ها فقط کافی است روی دکمه "محاسبه" کلیک کنید - نتیجه به صورت خودکار نشان داده می شود.

روش 3 از 4: استفاده از ماشین حساب نمودار سازی

  1. مشخصات خود را وارد کنید در ماشین حساب نمودار خود ، عملکرد آماری را فعال کنید و سپس دستور "ویرایش" را انتخاب کنید.
    • هر ماشین حساب دارای دستورات کلیدی کمی متفاوت است. در این مقاله دستورالعمل های خاصی برای Texas Instruments TI-86 ارائه شده است.
    • برای دسترسی به عملکرد Stat ، [2nd] -Stat (بالای کلید "+") را فشار دهید و سپس F2-Edit را فشار دهید.
  2. تمام داده های ذخیره شده قدیمی را حذف کنید. اکثر ماشین حساب ها داده های آماری را تا زمان پاک شدن حفظ می کنند. برای اطمینان از اینکه داده های قدیمی را با داده های جدید اشتباه نمی گیرید ، ابتدا باید تمام اطلاعات ذخیره شده قبلی را پاک کنید.
    • برای برجسته کردن دسته "xStat" از کلیدهای جهت دار برای حرکت مکان نما استفاده کنید. سپس "پاک کردن" و "Enter" را فشار دهید. این باید تمام مقادیر ستون xStat را پاک کند.
    • با استفاده از کلیدهای جهت دار دسته "yStat" را برجسته کنید. "پاک کردن" و "Enter" را فشار دهید تا داده های آن ستون نیز پاک شود.
  3. مقادیر داده خود را وارد کنید. با استفاده از کلیدهای جهت دار نشانگر را به اولین فضای زیر هدر xStat منتقل کنید. اولین مقدار داده خود را وارد کنید و سپس Enter را فشار دهید. شما باید فضای پایین صفحه "xStat (1) = __" را ببینید ، جایی که مقدار شما فضای خالی را پر می کند. وقتی Enter را فشار دهید ، داده ها جدول را پر می کنند ، مکان نما به خط بعدی منتقل می شود و خط در پایین صفحه اکنون باید "xStat (2) = __" را بخواند.
    • وارد کردن تمام مقادیر x را ادامه دهید.
    • وقتی مقادیر x را وارد کردید ، با استفاده از کلیدهای جهت دار به ستون yStat بروید و مقادیر y را وارد کنید.
    • وقتی همه داده ها وارد شد ، Exit را فشار دهید تا صفحه پاک شود و از فهرست Stat خارج شوید.
  4. آمار رگرسیون خطی را محاسبه کنید. ضریب همبستگی سنجشی است برای نزدیک شدن داده ها به یک خط مستقیم. یک ماشین حساب نمودار با توابع آماری می تواند بهترین خط برازش و ضریب همبستگی را خیلی سریع محاسبه کند.
    • عملکرد Stat را وارد کرده و سپس دکمه Calc را فشار دهید. در TI-86 ، این [2nd] [Stat] [F1] است.
    • محاسبات رگرسیون خطی را انتخاب کنید. در TI-86 ، این [F3] است ، با عنوان "LinR". صفحه نمایش گرافیکی سپس خط "LinR _" را با یک نشانگر چشمک زده نمایش می دهد.
    • اکنون باید نام دو متغیری را که می خواهید محاسبه کنید وارد کنید. اینها xStat و yStat هستند.
      • در TI-86 ، با فشار دادن [2nd] [List] [F3] لیست نام ("Names") را انتخاب کنید.
      • اکنون خط پایین صفحه شما باید متغیرهای موجود را نشان دهد. [xStat] را انتخاب کنید (این احتمالاً دکمه F1 یا F2 است) ، سپس یک کاما و سپس [yStat] وارد کنید.
      • برای محاسبه داده ها ، Enter را فشار دهید
  5. نتایج را تفسیر کنید. هنگامی که Enter را فشار می دهید ، ماشین حساب بلافاصله اطلاعات زیر را برای داده های وارد شده محاسبه می کند:
    • y=آ+بایکس{ displaystyle y = a + bx}مفهوم همبستگی را درک کنید. همبستگی به رابطه آماری بین دو کمیت اشاره دارد. ضریب همبستگی یک عدد واحد است که می توانید برای دو مجموعه از نقاط داده محاسبه کنید. این عدد همیشه چیزی بین 1 تا 1+ است و نشانگر نزدیک بودن این دو مجموعه داده است.
      • به عنوان مثال ، اگر شما قد و سن کودکان تا حدود 12 سال را اندازه گیری می کنید ، انتظار دارید که یک همبستگی مثبت و قوی پیدا کنید. بچه ها هر چه بزرگتر می شوند ، قد بلندتر می شوند.
      • مثالی از همبستگی منفی ، مقایسه زمانی است که شخصی برای تمرین گلف می گذراند با امتیاز گلف آن شخص. با پیشرفت تمرین ، امتیاز باید پایین بیاید.
      • در نهایت ، شما انتظار می رود که همبستگی کمی ، مثبت یا منفی ، بین اندازه کفش فرد ، به عنوان مثال ، و نمرات امتحان او وجود داشته باشد.
    • میانگین را محاسبه کنید. میانگین حسابی ، یا "میانگین" مجموعه داده ها با افزودن تمام مقادیر داده ها و سپس تقسیم بر تعداد مقادیر مجموعه محاسبه می شود. برای تعیین ضریب همبستگی داده های خود ، باید میانگین هر مجموعه داده را محاسبه کنید.
      • میانگین یک متغیر توسط متغیر با یک خط افقی در بالای آن نشان داده می شود. این اغلب برای مجموعه داده های x و y به عنوان "x-bar" یا "y-bar" شناخته می شود. متناوباً ، می توان میانگین را با حرف کوچک یونانی μ (mu) نشان داد. به عنوان مثال ، برای نشان دادن میانگین نقاط داده x ، می توانید از μ استفاده کنیدایکس یا μ (x)
      • به عنوان مثال ، اگر مجموعه ای از x (1،2،5،6،9،10) داشته باشید ، میانگین این داده ها به شرح زیر محاسبه می شود:
        • μایکس=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}اهمیت انحراف معیار را بدانید. در آمار ، انحراف معیار ، تغییر را اندازه گیری می کند و پراکندگی اعداد را از میانگین نشان می دهد. گروهی از اعداد با انحراف معیار کم کاملاً به یکدیگر نزدیک هستند. گروهی از اعداد با انحراف معیار بالا پراکنده تر هستند.
          • به عنوان نماد ، انحراف معیار با استفاده از حرف کوچک s یا حرف یونانی σ (سیگما) بیان می شود. بنابراین ، انحراف معیار داده x به صورت زیر نوشته می شود sایکس یا σایکس.
        • علامت گذاری جمع را تشخیص دهید. عملگر جمع یکی از متداول ترین عملگرها در ریاضیات است و مجموع مقادیر را نشان می دهد. با حروف بزرگ یونانی ، سیگما یا is نشان داده می شود.
          • به عنوان مثال ، اگر مجموعه ای از نقاط داده x (1،2،5،6،9،10) داشته باشید ، ∑x به این معنی است:
            • 1+2+5+6+9+10 = 33

نکات

  • از ضریب همبستگی به احترام کارل پیرسون ، توسعه دهنده آن ، بعنوان "ضریب همبستگی محصول-لحظه پیرسون" یاد می شود.
  • به طور کلی ، ضریب همبستگی بالاتر از 0.8 (مثبت یا منفی) نشان دهنده یک همبستگی قوی است. ضریب همبستگی کمتر از 0.5 (مثبت یا دوباره منفی) نشان دهنده ضریب همبستگی ضعیف است.

هشدارها

  • همبستگی نشان می دهد که دو مجموعه داده به نوعی به هم متصل شده اند. با این حال ، مراقب باشید که این را به عنوان یک رابطه علی تعبیر نکنید. به عنوان مثال ، اگر اندازه کفش افراد و قد آنها را مقایسه کنید ، احتمالاً یک همبستگی مثبت قوی پیدا خواهید کرد. افراد بزرگتر عموماً پاهای بزرگتری دارند. با این حال ، این بدان معنا نیست که قد بلند باعث رشد پاها می شود ، یا اینکه بزرگ پا باعث بلند شدن قد می شود. آنها فقط با هم اتفاق می افتند.