محاسبه مجموع مربعات (SSE)

نویسنده: Charles Brown
تاریخ ایجاد: 9 فوریه 2021
تاریخ به روزرسانی: 1 جولای 2024
Anonim
What is Regression? | SSE, SSR, SST | R-squared | Errors (ε vs. e)
ویدیو: What is Regression? | SSE, SSR, SST | R-squared | Errors (ε vs. e)

محتوا

مجموع مربعات یا SSE ، یک محاسبه آماری اولیه است که منجر به مقادیر مختلف داده می شود. هنگامی که مجموعه ای از مقادیر داده دارید ، مفید است که بتوانید تعیین کنید که این مقادیر با چه ارتباط نزدیکی دارند. شما باید داده های خود را در یک جدول سازماندهی کنید و سپس محاسبات نسبتاً ساده را انجام دهید. هنگامی که SSE را برای یک مجموعه داده پیدا کردید ، می توانید واریانس و انحراف استاندارد را پیدا کنید.

گام برداشتن

روش 1 از 3: SSE را با دست محاسبه کنید

  1. یک جدول سه ستونی ایجاد کنید. روشن ترین روش برای محاسبه SSE شروع با یک جدول سه ستونی است. سه ستون را برچسب بزنید مقدار{ displaystyle { text {Value}}}جزئیات را پر کنید ستون اول حاوی مقادیر اندازه گیری های شما است. ستون را پر کنید مقدار{ displaystyle { text {Value}}}میانگین را محاسبه کنید. قبل از اینکه بتوانید خطای مربوط به هر اندازه گیری را محاسبه کنید ، باید میانگین کل مجموعه داده ها را محاسبه کنید.
    • میانگین یک مجموعه داده مجموع مقادیر تقسیم بر تعداد مقادیر مجموعه است. این را می توان به صورت نمادین ، ​​با متغیر نشان داد μ{ displaystyle mu}مقادیر خطای فردی را محاسبه کنید. در ستون دوم جدول خود ، باید مقادیر خطا را برای هر مقدار داده وارد کنید. خطا تفاوت بین اندازه گیری و میانگین است.
      • برای مجموعه داده های داده شده ، از هر مقدار اندازه گیری شده میانگین 98.87 را کم کنید و ستون دوم را با نتایج پر کنید. این ده محاسبه به شرح زیر است:
        • 99,098,87=0,13{ displaystyle 99.0-98.87 = 0.13}SSE را محاسبه کنید. در ستون سوم جدول ، مربع هر یک از مقادیر حاصل را در ستون وسط پیدا کنید. اینها مربعات انحراف از میانگین را برای هر مقدار داده اندازه گیری شده نشان می دهند.
          • برای هر مقدار در ستون وسط ، از یک ماشین حساب برای محاسبه مربع استفاده کنید. نتایج را در ستون سوم به شرح زیر ثبت کنید:
            • 0,132=0,0169{ displaystyle 0.13 ^ {2} = 0.0169}مربعات خطاها را جمع کنید. آخرین مرحله یافتن مجموع مقادیر ستون سوم است. نتیجه مورد نظر SSE یا مجموع مربعات خطاها است.
              • برای این مجموعه داده ، SSE با اضافه کردن ده مقدار در ستون سوم محاسبه می شود:
              • اساسE=6,921{ displaystyle SSE = 6.921}ستون های صفحه گسترده را برچسب گذاری کنید. شما یک جدول با سه ستون در Excel ایجاد می کنید ، با همان سه عنوان بالا.
                • در سلول A1 ، "Value" را به عنوان عنوان تایپ کنید.
                • در کادر B1 ، "انحراف" را به عنوان عنوان تایپ کنید.
                • در کادر C1 ، عنوان "مربع انحراف" را به عنوان عنوان تایپ کنید.
              • مشخصات خود را وارد کنید در ستون اول باید مقادیر اندازه گیری های خود را وارد کنید. اگر مجموعه کوچک باشد ، می توانید به راحتی آن را با دست تایپ کنید. اگر یک مجموعه داده بزرگ دارید ، ممکن است لازم باشد داده ها را در ستون کپی و جایگذاری کنید.
              • میانگین نقاط داده را تعیین کنید. اکسل تابعی دارد که میانگین را برای شما محاسبه می کند. در یک سلول خالی در زیر جدول داده خود (مهم نیست کدام سلول را انتخاب کنید) ، موارد زیر را وارد کنید:
                • = متوسط ​​(A2: ___)
                • وارد فضای خالی نشوید. آن فضا را با نام سلول آخرین نقطه داده خود پر کنید. به عنوان مثال ، اگر 100 نقطه داده داشته باشید ، از این تابع استفاده می کنید:
                  • = متوسط ​​(A2: A101)
                  • این تابع شامل داده های سلول های A2 تا A101 است ، زیرا ردیف بالا شامل عناوین ستون ها است.
                • وقتی Enter را فشار می دهید یا هنگامی که روی سلول دیگری در جدول کلیک می کنید ، سلول تازه برنامه ریزی شده به طور خودکار با میانگین مقادیر داده شما پر می شود.
              • تابع اندازه گیری خطا را وارد کنید. در اولین خانه خالی در ستون "انحراف" ، یک تابع وارد کنید تا تفاوت بین هر نقطه داده و میانگین محاسبه شود. برای این کار از نام سلول در جایی که میانگین قرار دارد استفاده کنید. بیایید فرض کنیم شما در حال حاضر از سلول A104 استفاده کرده اید.
                • عملکرد محاسبه خطا که در سلول B2 وارد می کنید:
                  • = A2- 104 دلار استرالیا علائم دلار برای اطمینان از قفل کردن جعبه A104 برای هر محاسبه مورد نیاز است.
              • تابع خطاهای مربع را وارد کنید. در ستون سوم می توانید به اکسل دستور دهید مربع مورد نظر را محاسبه کند.
                • در سلول C2 ، عملکرد زیر را وارد کنید:
                  • = B2 ^ 2
              • توابع را کپی کنید تا کل جدول را پر کنید. پس از وارد کردن توابع در سلول بالای هر ستون ، به ترتیب B2 و C2 ، باید کل جدول را پر کنید. شما می توانید عملکرد را در هر خط از جدول تایپ کنید ، اما این کار خیلی طولانی می شود. با استفاده از ماوس ، سلول های B2 و C2 را با هم برجسته کنید و بدون اینکه دکمه ماوس را آزاد کنید ، به سلول پایین هر ستون بکشید.
                • با فرض اینکه 100 نقطه داده در جدول خود دارید ، ماوس را به سلولهای B101 و C101 بکشید.
                • هنگامی که دکمه ماوس را رها می کنید ، فرمول ها در تمام سلول های جدول کپی می شوند. جدول باید به طور خودکار با مقادیر محاسبه شده پر شود.
              • SSE را پیدا کنید. ستون C جدول شما شامل تمام مقادیر خطای مربع است. آخرین مرحله این است که به Excel اجازه دهید مجموع این مقادیر را محاسبه کند.
                • در یک سلول زیر جدول ، احتمالاً C102 در این مثال ، عملکرد زیر را وارد کنید:
                  • = جمع (C2: C101)
                • اگر بر روی Enter کلیک کنید یا در یکی دیگر از سلول های جدول کلیک کنید ، مقدار SSE داده های خود را دریافت خواهید کرد.

روش 3 از 3: ارتباط SSE را با سایر آمارها انجام دهید

  1. انحراف از SSE را محاسبه کنید. یافتن SSE برای یک مجموعه داده به طور کلی یک عنصر اساسی برای یافتن مقادیر مفید دیگر است. اولین مورد واریانس است. واریانس اندازه گیری میزان انحراف داده های اندازه گیری شده از میانگین است. در واقع میانگین اختلافات مربع از میانگین است.
    • از آنجا که SSE حاصل جمع خطاهای مربع است ، می توانید میانگین (یعنی واریانس) را فقط با تقسیم بر تعداد مقادیر پیدا کنید. با این حال ، اگر واریانس یک سری نمونه را به جای کل جمعیت محاسبه کنید ، واریانس را به جای n با تقسیم بر (n-1) تقسیم می کنید. بنابراین:
      • واریانس = SSE / n ، اگر واریانس کل جمعیت را محاسبه کنید.
      • واریانس = SSE / (n-1) ، هنگام محاسبه واریانس نمونه ای از داده ها.
    • برای مسئله نمونه گیری از درجه حرارت بیماران ، می توانیم فرض کنیم که 10 بیمار فقط یک نمونه هستند. بنابراین ، واریانس به شرح زیر محاسبه می شود:
      • واریانس=SSE(n1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}}انحراف استاندارد SSE را محاسبه کنید. انحراف استاندارد مقداری است که معمولاً مورد استفاده قرار می گیرد و نشان می دهد که مقادیر یک مجموعه داده تا چه اندازه از میانگین فاصله دارد. انحراف معیار ریشه مربع واریانس است. به یاد داشته باشید که واریانس میانگین اندازه گیری خطای مربع است.
        • بنابراین ، پس از محاسبه SSE ، می توانید انحراف استاندارد را مانند این پیدا کنید:
          • انحراف معیار=SSEn1{ displaystyle { text {انحراف معیار}} = { sqrt { frac { text {SSE}} {n-1}}}}برای تعیین کوواریانس از SSE استفاده کنید. این مقاله بر مجموعه داده هایی متمرکز شده است که همزمان فقط یک مقدار واحد را اندازه می گیرند. با این حال ، در بسیاری از مطالعات ممکن است دو مقدار جداگانه را با یکدیگر مقایسه کنید. به عنوان مثال ، شما می خواهید بدانید که این دو مقدار چه ارتباطی با یکدیگر دارند نه فقط با میانگین مجموعه داده ها. این مقدار کوواریانس است.
            • محاسبات کوواریانس برای توضیح در اینجا خیلی دقیق است ، به جز اینکه توجه داشته باشید که برای هر نوع داده از SSE استفاده می کنید و سپس آن را مقایسه می کنید. برای توضیح بیشتر در مورد کوواریانس و محاسبات مربوطه ، می توانید مقالاتی در این زمینه در wikiHow پیدا کنید.
            • به عنوان نمونه ای از استفاده از کوواریانس ، می توانید سن بیماران را در یک مطالعه پزشکی با اثربخشی دارو در کاهش درجه حرارت تب مقایسه کنید. سپس یک مجموعه داده از سن و یک مجموعه داده دیگر از دما دارید. سپس SSE را برای هر مجموعه داده پیدا خواهید کرد و از آنجا واریانس ، انحراف معیار و کوواریانس را پیدا خواهید کرد.