راه های محاسبه واریانس

نویسنده: Robert Simon
تاریخ ایجاد: 21 ژوئن 2021
تاریخ به روزرسانی: 23 ژوئن 2024
Anonim
نحوه محاسبه واریانس
ویدیو: نحوه محاسبه واریانس

محتوا

واریانس پراکندگی مجموعه داده را اندازه گیری می کند. این در ساخت مدل های آماری بسیار مفید است: واریانس کم می تواند نشانه این باشد که شما به جای رابطه اساسی در داده ها ، خطای تصادفی یا نویز را توصیف می کنید. با این مقاله ، wikiHow نحوه محاسبه واریانس را به شما می آموزد.

مراحل

روش 1 از 2: واریانس نمونه را محاسبه کنید

  1. مجموعه داده نمونه خود را بنویسید. در بیشتر موارد ، آماریان فقط اطلاعات مربوط به یک نمونه یا زیرمجموعه جمعیتی را که مطالعه می کنند ، دارند. به عنوان مثال ، به جای اینکه یک تحلیل کلی درباره "هزینه تمام اتومبیل های آلمان" انجام دهد ، ممکن است یک آمارشناس هزینه یک نمونه تصادفی از چند هزار اتومبیل را پیدا کند. آمار شناس می تواند با استفاده از این نمونه تخمین مناسبی از هزینه اتومبیل در آلمان بدست آورد. با این حال ، به احتمال زیاد دقیقاً با اعداد واقعی مطابقت ندارد.
    • مثلا: هنگام تجزیه و تحلیل تعداد مافین های فروخته شده در روز در یک کافی شاپ ، شما یک نمونه تصادفی شش روزه گرفتید و نتایج زیر را بدست آوردید: 38 ، 37 ، 36 ، 28 ، 18 ، 14 ، 12 ، 11 ، 10.7 ، 9.9. این یک نمونه است ، نه یک جمعیت ، زیرا برای هر روز باز بودن فروشگاه داده ندارید.
    • اگر هر نقاط داده در برنامه اصلی ، لطفا به روش زیر بروید.

  2. فرمول واریانس نمونه را بنویسید. واریانس مجموعه داده ها میزان پراکندگی نقاط داده را نشان می دهد. هر چه واریانس به صفر نزدیکتر باشد ، نقاط داده به هم نزدیکتر می شوند. هنگام کار با مجموعه داده های نمونه ، از فرمول زیر برای محاسبه واریانس استفاده کنید:
    • = /(n - 1)
    • واریانس است واریانس همیشه در واحدهای مربع محاسبه می شود.
    • یک مقدار را در مجموعه داده شما نشان می دهد.
    • ∑ ، به معنای "مجموع" ، به شما می گوید پارامترهای زیر را برای هر مقدار محاسبه کنید ، و سپس آنها را با هم جمع کنید.
    • x̅ میانگین نمونه است.
    • n تعداد نقاط داده است.

  3. میانگین نمونه را محاسبه کنید. از نماد x̅ یا "x-افقی" برای نشان دادن میانگین نمونه استفاده می شود. طبق میانگین محاسبه کنید: تمام نقاط داده را جمع کرده و بر تعداد نقاط تقسیم کنید.
    • مثلا: ابتدا نقاط داده خود را جمع کنید: 17 + 15 + 23 + 7 + 9 + 13 = 84
      بعد ، نتیجه را بر تعداد نقاط داده تقسیم کنید ، در این حالت شش: 84 ÷ 6 = 14.
      میانگین نمونه = x̅ = 14.
    • می توانید میانگین را به عنوان "نقطه مرکزی" داده ها تصور کنید. اگر داده ها حول میانگین باشد ، واریانس کم است. اگر آنها دور از حد متوسط ​​پراکنده شوند ، واریانس زیاد است.

  4. میانگین را از هر نقطه داده کم کنید. اکنون زمان محاسبه - x̅ ، جایی است که هر نقطه از مجموعه داده های شما قرار دارد. هر نتیجه نشان دهنده انحراف از میانگین هر نقطه مربوطه یا به عبارت ساده تر ، فاصله آن از میانگین است.
    • مثلا:
      - x̅ = 17 - 14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7 - 14 = -7
      - x̅ = 9 - 14 = -5
      - x̅ = 13 - 14 = -1
    • بسیار آسان است که محاسبات خود را بررسی کنید ، زیرا نتایج باید صفر باشد. این بدان دلیل است که با میانگین میانگین ، نتایج منفی (فاصله از میانگین تا اعداد کوچک) است. نتایج مثبت (فاصله از میانگین تا تعداد بیشتر) کاملاً حذف می شوند.
  5. همه نتایج را مربع کنید. همانطور که در بالا ذکر شد ، لیست انحراف فعلی (- x̅) مجموع صفر دارد. این بدان معناست که "انحراف متوسط" نیز همیشه صفر خواهد بود و در مورد پراکندگی داده ها چیزی نمی توان گفت. برای حل این مشکل ، مربع هر انحراف را پیدا می کنیم. به لطف آن ، همه اعداد مثبت هستند ، مقادیر منفی و مقادیر مثبت دیگر یکدیگر را لغو نمی کنند و مجموع آنها را صفر می کنند.
    • مثلا:
      (- ایکس)
      - ایکس)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • اکنون (- x̅) برای هر نقطه داده در نمونه دارید.
  6. جمع مقادیر مربع شده را پیدا کنید. اکنون زمان محاسبه کل عدد فرمول است:. سیکل بزرگ ، requires ، مستلزم این است که مقدار عنصر زیر را برای هر مقدار اضافه کنید. شما برای هر مقدار در نمونه (- x̅) محاسبه کرده اید ، بنابراین تنها کاری که باید انجام دهید این است که فقط نتایج را با هم جمع کنید.
    • مثلا: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. تقسیم بر n - 1 ، جایی که n تعداد نقاط داده است. مدت ها پیش ، هنگام محاسبه واریانس نمونه ، آمار شناسان فقط بر n تقسیم می شدند. این تقسیم میانگین انحراف مربع را به شما می دهد که دقیقاً با واریانس آن نمونه مطابقت دارد. با این حال ، به یاد داشته باشید که نمونه فقط تخمین جمعیت بیشتر است. اگر یک نمونه تصادفی دیگر بگیرید و همان محاسبه را انجام دهید ، نتیجه متفاوتی خواهید گرفت. همانطور که مشخص شد ، تقسیم بر n -1 به جای n ، تخمین بهتری از واریانس جمعیت بیشتری را به شما می دهد - که واقعاً به آن اهمیت می دهید. این اصلاح چنان رایج است که اکنون تعریف پذیرفته شده از واریانس نمونه است.
    • مثلا: شش نقطه داده در نمونه وجود دارد ، بنابراین n = 6.
      واریانس نمونه = 33,2
  8. واریانس و انحراف معیار را درک کنید. توجه داشته باشید که ، از آنجا که در فرمول قدرت وجود دارد ، واریانس در مربع واحد داده های اصلی اندازه گیری می شود. این از لحاظ بصری گیج کننده است. در عوض ، اغلب انحراف معیار کاملاً مفید است. اما هدر دادن هیچ تلاشی فایده ای ندارد ، زیرا انحراف استاندارد توسط ریشه مربع واریانس تعیین می شود. به همین دلیل واریانس نمونه با اصطلاحات نوشته می شود و انحراف استاندارد یک نمونه است.
    • به عنوان مثال ، انحراف استاندارد نمونه فوق = s = √33.2 = 5.76.
    تبلیغات

روش 2 از 2: واریانس یک جمعیت را محاسبه کنید

  1. شروع با مجموعه داده اصلی. اصطلاح "جمعیت" برای اشاره به تمام مشاهدات مربوطه استفاده می شود. به عنوان مثال ، اگر در مورد سن ساکنان هانوی تحقیق می کنید ، جمعیت کلی شما شامل سنین تمام افراد ساکن هانوی خواهد بود. معمولاً برای یک مجموعه داده بزرگ مانند این یک صفحه گسترده ایجاد می کنید ، اما در اینجا یک نمونه داده کوچکتر برای مثال وجود دارد:
    • مثلا: در اتاق یک آکواریوم ، دقیقاً شش آکواریوم وجود دارد. این شش مخزن حاوی تعداد زیر ماهی است:





  2. فرمول واریانس کلی را بنویسید. از آنجا که یک جمعیت شامل تمام داده های مورد نیاز ما است ، این فرمول دقیقاً واریانس جمعیت را به ما می دهد. برای تشخیص آن از واریانس نمونه (که فقط یک تخمین است) ، آمار شناسان از متغیرهای دیگری استفاده می کنند:
    • σ = /n
    • σ = واریانس نمونه. این سوسیس معمولی مربع شکل است. واریانس در واحد مربع اندازه گیری می شود.
    • عنصری را در مجموعه داده های شما نشان می دهد.
    • عنصر در for برای هر مقدار محاسبه می شود و سپس جمع می شود.
    • μ میانگین کلی است.
    • n تعداد نقاط داده در جمعیت است.
  3. میانگین جمعیت را پیدا کنید. هنگام تجزیه و تحلیل یک جمعیت ، نماد μ ("mu") میانگین حسابی را نشان می دهد. برای یافتن میانگین ، تمام نقاط داده را جمع کرده و سپس بر تعداد نقاط تقسیم کنید.
    • می توانید معنای متوسط ​​را "متوسط" بدانید ، اما مراقب باشید ، زیرا این کلمه تعاریف ریاضی بسیاری دارد.
    • مثلا: مقدار متوسط ​​= μ = = 10,5
  4. میانگین را از هر نقطه داده کم کنید. نقاط داده نزدیک به میانگین اختلاف نزدیک به صفر دارند. مسئله تفریق را برای همه نقاط داده تکرار کنید و احتمالاً شروع به احساس پراکندگی داده ها خواهید کرد.
    • مثلا:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. مربع هر علامت. در این مرحله ، برخی از نتایج بدست آمده از مرحله قبل منفی و برخی مثبت خواهند بود.اگر داده ها بر روی یک خط همسانگرد تجسم شوند ، این دو مورد نشان دهنده اعداد سمت چپ و راست میانگین است. این در محاسبه واریانس فایده ای نخواهد داشت ، زیرا این دو گروه یکدیگر را لغو می کنند. در عوض ، همه آنها را مربع کنید تا همه مثبت باشند.
    • مثلا:
      (- μ) برای هر مقدار از من از 1 تا 6 اجرا می شود:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. میانگین نتایج خود را پیدا کنید. اکنون برای هر نقطه داده مقداری در نظر گرفته اید ، مربوط (نه مستقیم) با فاصله آن نقطه از میانگین. میانگین را با جمع کردن آنها و تقسیم بر تعداد مقادیر خود ، به دست آورید.
    • مثلا:
      واریانس کلی = 24,25
  7. دستورالعمل تماس اگر مطمئن نیستید که این متناسب با فرمول ذکر شده در ابتدای روش چیست ، کل مسئله را با دست بنویسید و خلاصه نکنید:
    • پس از یافتن تفاوت از میانگین و مربع ، (- μ) ، (- μ) و غیره را به دست می آورید تا (- μ) ، آخرین نقطه داده کجاست. در مجموعه داده ها
    • برای یافتن میانگین این مقادیر ، آنها را با هم جمع کنید و بر n تقسیم کنید: ((- μ) + (- μ) + ... + (- μ)) / n
    • پس از بازنویسی عدد با علامت سیگموئید ،n، واریانس فرمول.
    تبلیغات

مشاوره

  • از آنجا که تفسیر واریانس دشوار است ، این مقدار اغلب به عنوان نقطه شروع یافتن انحراف استاندارد محاسبه می شود.
  • استفاده از "n-1" به جای "n" در مخرج ، تکنیکی به نام تصحیح بسل است. نمونه فقط یک برآورد از یک جمعیت کامل است و میانگین نمونه برای مطابقت با این برآورد تعصب خاصی دارد. این اصلاح تعصب فوق را برطرف می کند. این مسئله به این واقعیت مربوط می شود که هر بار n - 1 نقطه داده برشمرد ، آخرین نقطه n یک ثابت بود ، زیرا فقط مقادیر خاصی برای محاسبه میانگین نمونه (x̅) در فرمول واریانس استفاده شد.