می دانیم نمودار چندبر فراواني براي تعداد مشاهده زياد به يك منحني هموار تبديل مي شود كه آن را منحني توزيع فراواني مي نامند. توزيع فراواني از مفاهيم اساسي در تئوري آمار بوده و اساس بخش عمده اي از روشهاي آمار استنباطي را تشكيل ميدهد. از معروفترين ( شايد معروفترين) توزيعهاي فراواني كه معادلة مختصاتي آن به صورت
است، توزيع نرمال استاندارد ناميده ميشود. اين منحني زنگي شكل از لحاظ تقارن، كشيدگي، و پخي تناسبي دارد.
از جملة متغيرهايي كه داراي توزيع فراواني نرمال ميباشد قد انسانها است.اين امر را مي توان با رسم چندبر فراواني قد تعداد زيادي از افراد تحقيق نماييد.
در عمل به ندرت متغيري وجود دارد كه منحني فراواني آن كاملا نرمال استاندارد باشد. اغلب منحني فراواني دادهها نامتقارن، كشيده يا پخ هستند. ميزان نرمال نبودن را با دو معيار چولگي و برجستگي ميسنجند. اين دو معيار به ميانگينهاي مخصوص بهنام گشتاورها بستگي دارد.
گشتاور و گشتاور مركزي دادهها فرض کنید داده به صورت با فراوانی های داشته باشیم.. ميانگين توان ام و ها يعني
را به ترتيب گشتاور
ام و گشتاور مركزي
ام دادهها مينامند (معمولأ
يك عدد طبيعي است).
چولگي ميزان عدم تقارن منحني فراواني را چولگي مينامند. فرض كنيد ميانگين، ميانه، نما و انحراف استاندارد و گشتاور مركزي سوم باشند. هركدام از فرمولهاي زير را ميتوان به عنوان معيار چولگي به كار برد:
استفاده از در مخرج، به اين دليل است كه ضرائب فوق به واحد اندازهگيري بستگي نداشته باشد.
درصورتيكه دادهها نسبت به ميانگين متقارن باشند، ضرايب بالا برابر صفر هستند. البته توجه داشته باشيد كه عكس اين موضوع لزومي ندارد صحت داشته باشد. برحسب اينكه مثبت يا منفي باشند، منحني فراواني چوله به راست يا چوله به چپ است. معمولا بواسطة اينكه محاسبة نما در عمل با دقت كافي مشكل است از اندازة استفاده ميشود.
برجستگي ميزان كشيدگي يا پخي منحني فراواني را نسبت به منحني نرمال استاندارد، برجستگي آن مي نامند. فرض كنيدگشتاور مركزي چهارم و انحراف استاندارد باشد. چون بر اساس خصوصيات توزيع فراواني نرمال استاندارد مقدار به عدد 3 نزديك است، معيار برجستگي را از رابطة زير محاسبه ميكنند.
به دست ميآورند. بر حسب آنكه k مثبت يا منفي باشد منحني فراواني نسبت به منحني نرمال استاندارد كشيده يا پخ ميباشد. اكر k نزديك صفر باشد، برجستگي منحني فراواني طبيعي است.
مثال: در بررسي طول عمر صد باطري اتومبيل اگر ميانگين، ميانه و انحراف استاندارد 5/3 و 48/3 و 65/1 سال مي باشد.در بارة شكل توزيع (نمودار هيستوگرام يا چندبر فراواني) آن چه ميتوان گفت؟
با اطلاعات داده شده ضريب چولگي دوم پيرسون عبارتند از
بنابراين منحني فراواني طول عمر باطري ها كمي چوله به راست مي باشد. با محاسبة ضريب برجستگي داريم
بنابراين منحني فر اواني عمر باطريها نسبت به منحني نرمال استاندارد پخ تر ميباشد.
همانگونه كه ديديد با استفاده از اين سه معيار مي توانيم شكل عمومي عملكرد باطري ها را تاحدود زيادي تشخيص دهيم.
دادههاي استاندارد در اين بخش به معرفي يكي از كاربردهاي مفيد ميانگين و انحراف استاندارد در مقايسة واحدهاي جمعیت براي موضوعات مختلف مي پردازيم.
فرض كنيد متغيرهاي مشاهدهاي با ميانگين و انحراف استاندارد باشند. دادههاي را دادههاي استاندارد نامند.
كاربرد دادههاي استاندارد در مثال زير واضحتر است:
مثال : نمره كاركنان يك كلاس اموزشي در آزمون كامپيوتر داراي ميانگين 72 و انحرافاستاندارد 15 و در آزمون نگارش داراي ميانگين 50 و انحراف استاندارد 20 است.
اگر نمره فردA در كامپيوتر 60 و در نگارش 35 باشد،آنگاه معلومات فردA در كدام موضوع بيشتر است؟
چون اين دو آزمون با مقياسهاي مختلف بهعمل آمدهاند، مقايسه اعداد 60 و 35 مفهومي ندارند. اگر نمرههاي دو آزمون تقريبأ داراي منحني فراواني نرمال باشند، تنها بعد از استاندارد كردن ميتوان آنها را با هم مقايسه كرد.
بنابراين نمره فردA در آزمون نگارش بهتر ميباشد، زيرا داريم