ساده ترين اندازه پراكندگي براي يك مجموعه داده، برد آنها است كه آن را با نشان داده و به صورت زير تعريف مي شود:
كه بزرگترين اندازه و كوچكترين اندازه مشاهده شده است.
برد نيز همانند ميانگين تحت تأثير داده هاي پرت قرار مي گيرد و در چنين حالاتي يك معيار مناسب پراكندگي نيست. به علاوه، چون براي محاسبه برد فقط از دو اندازه بزرگترين مشاهده و كوچكترين مشاهده استفاده مي شود معمولاً معيار رضايت بخشي براي پراكندگي به حساب نمي آيد.
مثال: برد داده های 2،3،4،4،5،7،7،8،12 عبارت است از:
10=2-12
برد چاركها اين معيار در حقيقت برد پيراسته دادهها است و از دادههاي پرت تاثير نميگيرد . معمولا اين معيار را با IQR نمايش ميدهند كه عبارتند از :
كه در آن
و
به ترتيب چاركهاي اول و سوم مي باشند.
مثال: برد چارکهای داده های 77, 79, 80, 86, 87, 87, 94, 99 با توجه به اینکه
Q1 = (79 + 80) ÷ 2 = 79.5
Q3 = (87 + 94) ÷ 2 = 90.5
عبارت است از:
11=79.5-90.5
واريانس و انحراف معيار
مفديدترين اندازه پراكندگي واريانس و يا جذر آن، انحراف معيار داده ها است. اندازه انحراف معيار به ما مي گويد كه مشاهدات تا چه مقدار در اطراف ميانگين آنها قرار دارند، يك اندازه كم براي انحرف معيار مجموعه اي از داده ها نشان دهنده اين واقعيت است كه داده ها در دامنه كوچكي حول ميانگين پراكنده شدهاند و بالعكس انحراف معيار بزرگ بيان كننده دامنه گستردهتري است كه داده ها در حول ميانگين پراكنده گرديده اند. انحراف معيار ريشه دوم مثبت واريانس است كه براي جمعیت آن را با علامت و براي نمونه آن را با علامت نشان مي دهند. به عبارت ديگر علامت واريانس در جمعیت و در نمونه ميباشد. براي محاسبة واريانس با استفاده از دادههاي خام از روابط نيز استفاده مي شود.
مقادير و را انحراف از ميانگين ناميده و داريم
دليل تقسيم مجموع مربعات انحراف از ميانگين در نمونه بر (n-1 )، بر اساس خواص برآورد كردن واريانس جمعیت به وسيله واريانس نمونه است.
محاسبه واريانس با استفاده از جدول فراواني از روابط زير انجام مي گيرد كه با واريانس داده هاي خام اختلاف ناچيزي دارند.
با ساده كردن روابط فوق فرمولهاي زير به دست مي آيند.
دليل استفاده از انحراف معيار به عنوان اندازه پراكندگي داشتن واحد يكسان آن با واحد دادهها است. به عبارت ديگر چون واحد واريانس مجذور واحد دادهها مي باشد استفاده از انحراف معيار در مطالعه توصيفي آمار ترجيح داده مي شود.
مثال1: انحراف معیار داده های 10، 9، 8، 7، 6، 5، 4، 3، 2، 1 عبارت است از:
مثال2: در جدول فراوانی زیر که مربوط به نمره ریاضی یک نمونه 20 تایی از دانش آموزان است، واریانس را محاسبه کنید:
12-10
9-7
6-4
3-1
طبقه
4
8
6
2
فراوانی
يكي از موارد استفاده از انحراف معيار تعيين درصد داده هايي است كه در محدوده اي حول ميانگين قرار مي گيرند و در قضيه اي با نام چبيشف به صورت زير اثبات شده است.
قضيه چبيشف: براي هر عددبزرگتر از 1 ، حداقل از داده ها در فاصله اي به طول برابر انحرافمعيار از ميانگن داده ها قرار مي گيرند.
اگرچه علائم به كار گرفته شده براي جمعیت هستند، اين قضيه براي اطلاعات حاصل از نمونه نيز به كار برده مي شود، يعني فاصله حداقل از داده ها را در بر دارد. اين رابطه در حقيقت نحوة قرار گرفتن داده ها حول ميانگين را نشان مي دهد. با توجه به مثال زير شايد ضمن آشنايي با كاربرد اين قضية چبيشف، ادراك بيشتري نسبت به ارجحيت انحراف استاندارد نسبت به ديگر معيارها دستيابيد.
مثال : كار خانهاي دو نوع لاستيك اتوموبيل توليد ميكند. بر اساس اطلاعات گذشتة عملكرد اين دو نوع لاستيك، براي نوع A ميانگين عمر 10000 كيلومتر با انحراف استاندارد 2000 كيلومتر ، و براي نوع B ميانگين عمر 1100 كيلومتر با انحراف استاندارد 1000 كيلومتر ميباشد. ميخواهيم كدام لاستيك بهتر است ؟
اگر تنها بر اساس ميانگين عمر بخواهيم به اين سئوال پاسخ دهيم ، لاستيك نوع A بهتر به نظر ميرسد. اما اگر گام را فراتر نهاده و از معيار انحراف استاندارد و قضية چبيشف استفاده نماييم به نتيجة متفاوتي ميرسيم. براي مقدار 2= K و براي لاستيك نوع A سهچهارم لاستيكها داراي طول عمري در فاصلة (1400، 6000) و براي لاستيك نوع B سهچهارم لاستيكها داراي طول عمري در فاصلة (13000 ، 9000) و ميباشند كه نشان ميدهد در لاستيكهاي نوع B بهتر هستند.
ضريب تغييرات: براي مقايسه پراكندگي در دو جمعیت و يا دو نمونه اگر صفت هاي مورد بررسي داراي واحد اندازه گيري يكسان باشند ميتوان از اندازه هاي واريانس و يا انحراف معيار استفاده نمود. فرض كنيد در تحقيقي معدل ديپلم و دانشگاه و سن افرادي مورد سؤوال است. براي مقايسه پراكندگي در معدل هاي ديپلم يا پراكندگي در معدل هاي دانشگاه، از اندازه واريانس مي توان استفاده كرد. اما اگر بخواهيم پراكندگي سن را با پراكندگي معدل دانشگاه مقايسه كنيم، امكان استفاده از اندازه هاي واريانس و انحراف معيار به تنهايي نيست و لذا ضريب تغييرات كه به وسيله فرمولهاي زير محاسبه ميگردد را مي توان براي چنين مقايسه هائي به كار برد.
نمونه يا جمعیت اي كه داراي كوچكتري باشد از پراكندگي كمتري برخوردار است. با اين كار عملاً نقش واحد اندازه گيري را از بين مي بريم و امكان مقايسه داده ها با ماهيت مختلف و يا واحدهاي متفاوت را فراهم مي آوريم.
در بسياري مواقع انجام يك مقايسة مناسب براي يك اندازة پراكندگي با معيار مركزي متفاوت ما را بهتر است به جاي استفاده از انحراف استاندارد، ضريب تغييرات استفاده شود . به عنوان مثال در يك كارخانة توليد كاشي مزد روزانة كارگران 450 تومان و انحراف استاندارد 45 تومان و در يك كارخانة روغن نباتي اين معيارها به ترتيب 650 و 60 تومان مي باشند. مقايسة پراكندگي پرداخت مزد روزانة اين دو كارخانه با مقادير ضريب تغييرات نمايانگر اختلافي است كه به واقيت نزديكتر بوده و بر مقايسة مقادير استاندارد به تنهايي ، ترجيح داده ميشود