دانلود تحقیق آمار توصیفی

Word 4 MB 24430 56
مشخص نشده مشخص نشده ریاضیات - آمار
قیمت قدیم:۲۴,۰۰۰ تومان
قیمت: ۱۹,۸۰۰ تومان
دانلود فایل
کلمات کلیدی: آمار - آمار توصیفی
  • بخشی از محتوا
  • وضعیت فهرست و منابع
  • پیشگفتار
    در عصر حاضر کسی نمی‌تواند منکر این واقعیت باشد که آمار نقشی لاینفک در زندگی روزمره ما بازی می‌کند.

    اخبار روزانه رسانه‌های گروهی با گزارشی از وضع هوا به پایان می‌رسند و در طول اخبار، به جریان‌های بازار بورس و سهام اشاره می‌شود و روزنامه‌ها خبر از افزایش نرخ اجناس می‌دهند.


    آمار به عنوان پایه یک روش و راه موثر در بررسی مسائل موجود، در بسیاری از زمینه‌های علمی از جمله جامعه شناسی، کشاورزی، فیزیک و ....

    به‌ کار گرفته می‌شود.

    در دانش امروزی، معمولاً سعی می‌شود که اطلاعات موجود در یک زمینه خاص، در قالب اعداد نمایش داده شود تا به هنگام تجزیه و تحلیل اطلاعات، فهم بهتری از پدیده مورد مطالعه به‌ دست آمده و امکان مقایسه فراهم گردد.

    در یک جمله آمار مجموعه‌ای از روش‌های جمع آوری، تهیه و تنظیم و تجزیه و تحلیل اطلاعات است که برای کسب یک یا چند نتیجه به خدمت گرفته می‌شود.


    دیدگاه‌هایی درمورد آمار
    تهیه آمار کاری وقت‌گیر و زمان بر و اصولا کسالت‌آور است.


    آمار گورستانی از اعداد و ارقام است که در هر اداره و سازمان نمونه‌ای از آن پیدا می‌شود.


    آمار مجموعه‌ای از روابط و فرمول‌های ریاضی پیچیده و گیج‌کننده است.


    آمار شامل نمودارها و جدول‌هایی از اعداد است.


    آمار فرایندی است که در آن هر ده سال افرادی را به منازل فرستاده و اطلاعات خانوارها مانند تعداد فرزندان، سن افراد خانوار را از آنها کسب می‌کنند.


    آمار ابزاری است که بسیاری با توسل به آن افکار عمومی را به نفع خود جلب می‌کنند.


    آمار مفهومی است که برای ثبت و نمایش اطلاعات عددی به کار می‌رود، مانند تعداد بیکاران، جمعیت نواحی جنوب شهر تهران ، تعداد افراد تلف شده در اثر شیوع یک بیماری یا مقدار مسافت طی شده در زمان معینی به وسیله برنده مسابقه‌ دو.


    دید کلی
    بیشتر مردم با کلمه آمار، به مفهومی که برای ثبت و نمایش اطلاعات عددی بکار می‌رود، آشنا هستند: تعداد بیکاران، قیمت روزانه بعضی از سهام در بازار بورس، مثال‌هایی از این مفهوم‌اند.

    ولی این مفهوم با موضوع منطبق با موضوع اصلی مورد بحث آمار نیست.

    آمار عمدتا با وضعیت‌های سروکار دارد که در آنها وقوع یک پیشامد بطور حتمی قابل پیش بینی نیست.

    استنتاج‌های آماری غالباً غیر حتمی‌اند زیرا مبتنی بر اطلاعات ناکاملی هستند.

    معادل کلمه آمار در زبان انگلیسی Statistics است که از لحاظ تاریخی از کلمه لاتین Status مشتق شده است.


    نقش آمار در زندگی روزمره
    پی بردن به واقعیات امور از طریق گردآوری و تعبیر داده‌ها، منحصر به پژوهشگران حرفه‌ای نیست.

    این امر در زندگی روزمره همه مردم که می‌کوشند آگاهانه، ناآگاهانه مسائلی را درباره جامعه، محیط زندگی خود و کل دنیا درک کنند، معمول است.

    برای کسب اطلاع از وضع بیکاری، اثر یک مسکن در رفع بیماری و سایر مسائل مورد علاقه در زندگی روزمره، اطلاعات و ارقام را جمع‌آوری و آنها را تفسیر می‌نماییم یا کوشش می‌کنیم که تفسیرهای دیگران را بفهیم.

    بنابراین، هر روز از طریق تجزیه و تحلیل ضمنی اطلاعات مبتنی بر واقعیات، عمل کسب آگاهی انجام می‌گیرد.


    نقش آمار در پژوهش‌های علمی
    موضوع آمار عبارت است از هنر علم جمع آوری، تعبیر و تجزیه و تحلیل داده‌ها و استخراج تعمیم‌های منطقی در مورد پدیده‌های تحت بررسی.

    با توجه به مراحل اساسی یک تحقیق علمی که عبارتند از: مشخص کردن هدف، جمع آوری اطلاعات، تجزیه و تحلیل داده‌ها و بیان یافته‌های آشکار است که آمار بطور وسیعی در قلمرو تمام تحقیقات علمی بکار می‌رود.

    به ویژه، در مرحله جمع آوری اطلاعات، آمار راهنمای محقق در انتخاب روش‌ها و وسایل مناسب برای جمع‌آوری داده‌های اطلاعاتی است.

    در مراحل بعد از گرد آوری داده‌ها، نیاز بیشتری به روش‌های آماری وجود دارد.


    کاربرد آمار
    کاربرد روش‌های آماری در قلمروهای گوناگون از علوم انسانی، علوم مهندسی، رشته‌های علمی جدیدی پدید آورده است که در ارتباط متقابل با آمار هستند.

    نظیر آمار زیستی، روان‌سنجی، آمار مهندسی، آمار بازرگانی، اقتصادسنجی و جمعیت‌شناسی.

    به علاوه علم آمار در رشته‌های بسیار دیگری که هنوز از ترکیب آنها با آمار شاخه‌هایی با اسامی خاص پدید نیامده، از قبیل علوم سیاسی، هواشناسی و محیط‌شناسی نقش عمده‌ای ایفا می‌کند.



    فصل اول
    آمار توصیفی
    برای اینکه نتایج مناسب و مطلوب از اطلاعات که در آمارگیری‌ها جمع‌آوری می‌کنیم، به‌ دست آید باید:
    – اعداد نماینده واقعی مشاهدات بوده و غیرواقع یا غلط نباشند
    – به نحو مفیدی تهیه و تنظیم شوند
    – به نحو صحیح تجزیه و تحلیل گردند
    – قابل نتیجه گیری صحیح باشند
    به طور کلی، روشهایی که بوسیله آنها می‌توان اطلاعات جمع‌آوری شده را تنظیم، طبقه‌بندی و خلاصه نمود و آنها را بوسیله نمودارهایی نمایش داد، به آمار توصیفی موسوم است.

    هدف آمار توصیفی توجیه نیست، بلکه توصیف استخراج نکات اساسی و تحقق بخشیدن به ترکیب اطلاعات به کمک زبان اعداد است.

    برای معرفی این روشها نیاز به برخی اصطلاحات داریم که در ذیل به معرفی آنها می‌پردازیم.


    جمعیت
    مجموعه تمام افراد یا اشیایی که مطالعات آماری در مورد یک یا چند صفت آنها در یک مکان و زمان معین انجام می‌گیرد به جمعیت موسوم است.

    هر یک از این افراد یا اشیا را یک عضو جمعیت می‌نامند و تعداد اعضای جمعیت را اندازه جمعیت می‌نامند.


    مثال1: اندازه قد یا وزن دانشجویان بیست ساله یک شهر، تعداد لامپ‌های سالم و یا ناسالم تولید شده در یک کارخانه و در یک روز معین، مثالهایی از جمعیت‌های آماری‌ هستند.


    مثال2: اگر بخواهیم معدل دانشجویان یک دانشکده در یک نیمسال را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر کلیه دانشجویان آن دانشکده می‌باشند و صفت مورد مطالعه معدل نیمسال تحصیلی آنها است.

    همین‌طور اگر بخواهیم میزان کالری موجود در غذاهای کنسرو شده در یک کارخانه کنسرو سازی در یک روز معین را مورد بررسی قرار دهیم آنگاه جمعیت مورد نظر تمامی غذاهای کنسرو شده کارخانه در آن روز و صفت مورد مطالعه میزان کالری موجود در آنها می‌باشد.


    نکته: معمولا مطالعه ویژگی‌های مورد نظر، به هنگامی که جمعیت آماری بسیار گسترده باشد، مستلزم صرف هزینه و وقت زیادی می‌باشد و در بسیاری از مواقع، این امر اصولا امکان پذیر نیست.

    بنابراین در چنین موردی، برای مطالعه ویژگی مورد نظر، به قسمتی از جمعیت آماری اکتفا می‌کنیم نمونه زیر مجموعه‌ای از جمعیت که طبق یک قاعده و ضابطه خاصی برای مطالعه صفتی از جمعیت انتخاب می‌شود را یک نمونه گویند.

    تعداد اعضای نمونه به اندازه نمونه موسوم است.

    نکته: این نمونه وقتی مفید و قابل قبول خواهد بود که بتواند نماینده خوبی برای کل جمعیت مورد مطالعه باشد.

    با توجه به اهمیت این موضوع شاخه‌ای از آمار تحت عنوان نظریه نمونه‌گیری با بررسی نمونه‌ای به این امر مهم می‌پردازد.

    در بسیاری از موارد، معمولا نمونه تصادفی ساده را در نظر می‌گیرند.

    مثال: برای بررسی اندازه قد دانشجویان بیست ساله یک شهر، انتخاب مثلاً 150 نفر از بین این جمعیت به طور تصادفی، یا انتخاب 100 لامپ به تصادف از لامپ‌های تولیدی یک کارخانه در یک روز معین، برای تعیین کیفیت لامپهای تولیدی این کارخانه مثالهایی از نمونه تصادفی هستند.

    متغیر خصوصیت مورد مطالعه، از فردی به فرد دیگر، یا از شی به شی دیگر در جمعیت آماری تغییر می‌کند، که آن را اصطلاحاً متغیر می‌نامیم.

    معمولاً دو نوع متغیر در آمار مورد نظر هستند: متغیرهای گروهی، نظیر رنگ، نژاد، شغل و گروه خونی که شامل چند گروه یا طبقه می‌باشند.

    متغیرهای عددی که ممکن است نتیجه شمارش باشد، مانند تعداد احشام هر خانوار در یک روستا،‌تعداد حوادث در یک کارخانه در روزهای مختلف و یا نتیجه اندازه‌گیری باشد، مثل قد دانشجویان بیست ساله در یک شهر، حجم شربت مولتی ویتامین با استاندارد خاص.

    متغیر: متغیر‌های گسسته متغیر‌های گروهی متغیر‌های عددی که از راه شمارش به‌دست آمده اند متغیر‌های پیوسته متغیرهایی را که از طریق اندازه‌گیری به دست آمده باشند مقیاسهای اندازه‌گیری در بسیار از مسائل پیش‌رو،‌ اندازه‌گیری ویژگی یک متغیر مستلزم آگاهی و شناخت خاصی است.

    به طور کلی چهار نوع مقیاس برای اندازه‌گیری وجود دارد: مقیاس اسمی مقیاس ترتیبی مقیاس فاصله‌ای مقیاس نسبتی مقیاس اسمی: این نوع مقیاس اندازه‌گیری عمدتاً برای طبقه بندی داده‌ها به کار می‌رود و منظور از آن اطلاق یک عدد طبیعی به داده‌های متفاوت است.

    مثال: اختصاص اعداد 1 تا 4 به گروه‌های خونی A, B, AB, O.

    توجه داشته باشید که: این اعداد را نمی‌توان برای مقایسه یا چهار عمل اصلی به کار برد مقیاس ترتیبی: این نوع مقیاس اندازه‌گیری عموما برای طبقه بندی داده‌ها به منظور یک نوع برتری به کار می‌رود.

    مثال: در یک کارخانه ممکن است کارگران را به سه دسته ساده، نیمه ماهر و ماهر تقسیم‌بندی کنیم.

    اطلاق به ترتیب اعداد 1 تا 3 به این سه دسته یک مقیاس ترتیبی است.

    توجه داشته باشید که: این اعداد تنها برای مقایسه به کار می‌روند و نمی‌توان با آنها چهار عمل اصلی را انجام داد.

    مقیاس فاصله ای: این نوع مقیاس اندازه‌گیری عموما در زمینه‌های که علاوه بر حفظ ترتیب به نحوی فاصله بین ویژگی‌ها را نیز حفظ می‌کند.

    به عبارت دیگر در چنین مقیاسی نسبت تفاضل‌ها ثابت می‌ماند.

    مثال: اندازه‌گیری ضریب هوشی دانش آموزان کلاس اول دبستان در شهر اصفهان.

    توجه داشته باشید که: در این نوع مقیاس، عدد صفر یک مفهوم قراردادی است.

    مقیاس نسبتی: این نوع مقیاس اندازه‌گیری علاوه بر حفظ فاصله، نسبت را نیز حفظ می‌کند.

    به عبارت دیگر در این نوع اندازه‌گیری نسبت دو مقدار بستگی به واحد اندازه‌گیری ندارد.

    داده در یک بررسی آماری، بایستی صفت مورد مطالعه را به صورت اعداد و ارقام نمایش دهیم.

    اگر صفت مورد مطالعه کمی، مانند وزن، حجم، درجه حرارت و غیره باشد آنگاه این عمل به سادگی با اندازه‌گیری امکان پذیر است اما اگر صفت مورد مطالعه کیفی، مانند گروه خون، شغل، رنگ چشم و غیره باشد آنگاه بایستی با یک قاعده معین این مسائل کیفی را با اعداد و ارقام نشان داد.

    در هر صورت این اعداد و ارقام را داده ها گویند که به دو صورت گسسته و پیوسته می‌باشند.

    داده‌های گسسته داده‌هایی هستند که بین دو مقدار متصور آنها هیچ عدد دیگری وجود نداشته باشد، مانند تعداد فرزندان یک خانواده که شامل مقادیر 0، 1، 2 و...

    است و همچنین صفت شغل افراد که به آن مثلاً اعداد 1، 2، 3 و...

    را نسبت می‌دهیم و بین این مقادیر عدد دیگری در رابطه با صفت موردنظر وجود ندارد.

    داده‌های پیوسته داده هایی هستند که بین هر دو مقدار متصور آنها همواره عدد دیگری وجود دارد، مانند وزن افراد که بین دو نفر با وزنهای نزدیک به هم همواره می‌توان فردی را با وزنی بین وزن دو فرد یاد شده در جمعیت یافت.

    از جمله داده‌های گسسته می‌توان داده‌های مربوط به صفات گروه خون، رنگ، نژاد، شغل، تعداد کالاهای تولیدی و غیره را برشمرد و از جمله داده‌های پیوسته می‌توان داده‌های مربوط به صفات وزن، طول قد، فشار گاز، قطر لوله تولیدی یک کارخانه و غیره را برشمرد.

    داده خام: معمولا به داده‌های جمع آوری شده که انبوهی عدد است و هیچ نوع پردازشی روی آنها انجام نشده است داده خام می‌گویند.

    در آمار بعد از جمع‌آوری داده‌ها به بررسی آماری بر روی آنها می‌پردازیم.

    در مرحله نخست با توجه به اهداف بررسی، داده ها را تنظیم، طبقه بندی و خلاصه می‌کنیم به طوری که بتوانیم اطلاعات مفیدی برای نیل به اهداف و نتایج مورد نظر به دست آوریم.

    انجام این کار در سه مرحله به شرح زیر صورت می‌پذیرد: الف) تنظیم و طبقه بندی داده‌ها در یک جدول ب) ترسیم نمودارهای گوناگون از روی مقادیر ارائه شده در جدول ج) خلاصه کردن داده ها به یک یا چند عدد موسوم به شاخص یا آماره سه موضوع فوق از موضوعات اساسی بحث آمار توصیفی است که در ذیل به معرفی و بررسی آنها می‌پردازیم.

    فصل دوم جدول‌های آماری نخستین گام در خلاصه کردن داده‌ها، طبقه بندی و تنظیم آنها در یک جدول موسوم به جدول آماری است.

    یک جدول آماری بایستی به نحوی تنظیم شود که بتوان از آن به راحتی اطلاعات نهفته در داده‌ها را استخراج کرد.

    متداولترین جدول آماری جدول فراوانی است که در آن داده‌ها، تعداد موجود از هر داده و درصد موجود از هر داده مشخص می‌شود.

    پیش از آنکه نحوه تنظیم جدول فراوانی را بیان نماییم، ‌اطلاع از اصطلاحات زیر ضروری است.

    فراوانی مطلق هرگاه nداده y1, y2, k, yn از k نوع x1, x2, k, xk، با فرض ، به ترتیب با تعدادهای تشکیل شده باشند،‌ آنگاه را فراوانی مطلق می‌گوییم.

    به عبارت دیگر تعداد دفعاتی را که در داده‌های تکرار می‌شود، فراوانی می‌نامیم و آن را با نماد نمایش می‌دهیم.

    به خاطر داشته باشید که: اگر اندازه نمونه برابر n باشد، آنگاه برای فراوانی نسبی مثال: داده‌های زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان می‌دهد.

    فراوانی دادها را تعیین نمایید.

    7 6 6 3 4 3 5 5 6 8 3 4 8 4 7 5 8 5 5 3 6 5 5 6 6 5 6 7 8 2 مشاهده می‌شود که داده‌های تکرار اعداد 2،3،4،5،6،7،8 می‌باشند،‌بنابراین جدول زیر را برای فراوانی داده‌ها خواهیم داشت: نسبت فراوانی به اندازه نمونه را فراوانی نسبی می‌نامیم.

    اگر فراوانی در یک نمونه با اندازه n، برابر fi باشد، آنگاه فراوانی نسبی xi را با نماد ri نمایش خواهیم داد، به طوری که: به خاطر داشته باشید که برای مثال: داده‌های زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان می‌دهد.

    فراوانی نسبی را محاسبه کنید.

    7 6 6 3 4 3 5 5 6 8 3 4 8 4 7 5 8 5 5 3 6 5 5 6 6 5 6 7 8 2 جمع فراوانی‌های fi، تعداد کل جمعیت یعنی n است و جمع فراوانی‌های نسبی ri برابر یک می‌باشد.

    فراوانی تجمعی با توجه به تعریف فراوانی، فراوانی تجمعی ردیف i را با نماد نمایش می‌دهیم و به صورت زیر تعریف می‌کنیم: به خاطر داشته باشید که برای اندازه نمونه n و آنگاه: مثال: داده‌های زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان می‌دهد.

    فراوانی تجمعی را تعیین نمایید.

    7 6 6 3 4 3 5 5 6 8 3 4 8 4 7 5 8 5 5 3 6 5 5 6 6 5 6 7 8 2 فراوانی نسبی تجمعی با توجه به تعریف فراوانی نسبی،‌ فراوانی نسبی تجمعی ردیف i را با نماد Ri نماد نمایش می‌دهیم و به صورت زیر تعریف می‌کنیم: به خاطر داشته باشید که: برای اندازه نمونه n و آنگاه: مثال: داده‌های زیر میزان تصادف منجر به مرگ رد 30 منطقه را نشان می‌دهد.

    فراوانی نسبی تجمعی را تعیین نمایید.

    7 6 6 3 4 3 5 5 6 8 3 4 8 4 7 5 8 5 5 3 6 5 5 6 6 5 6 7 8 2 فصل سوم نمودارهای آماری معمولا داده‌ها را با نمودارهای مختلف نمایش می‌دهند.

    عموما این نمودارها در ارتباط با داده‌‌های پیو.سته به کار گرفته می شود و منظور از نمایش آنها،‌ تجسم عینی اطلاعات نهفته در داده‌ها است.

    در این بخش به معرفی چند نمودار معروف اکتفا می‌کنیم: هیستوگرام نمودار داده‌های پیوسته را نمودار هیستوگرام می‌نامند.

    در این نمودار محور افقی کران طبقات و محور عمودی فراوانی را نشان می‌دهد.

    در این نمودار باید مستطیل یا ستون‌ها به هم چسبیده باشند.

    چندبر فراوانی برای رسم این نمودار، xi یا نماینده طبقات در هر مستطیل را بوسیله خطاهای شکسته به یکدیگر متصل می‌کنیم و به خاطر زیبایی این نمودار از کوچکترین کران جدول فاصله طبقات (W) را کم کرده و به بزرگترین کران جدول فاصله طبقات (W) را اضافه می‌کنیم و ابتدا و انتهای نمودار را به وسط قاعده‌های جدید یا همان xiهای طبقه‌های جدید وصل می‌کنیم.

    چندبر فراوانی تجمعی: ‌برای رسم این نمودار محور افقی را xi (نماینده طبقات) و محور عمودی را Ri درنظر بگیرید و نقاط تلاقی آنها را بوسیله خط‌های شکسته به هم وصل کنید.

    منحنی‌های فراوانی و فراوانی تجمعی برای رسم منحنی فراوانی محور افقی را xi و محور عمودی را fi و برای رسم منحنی فراوانی تجمعی محور افقی را xi و محور عمودی را Ri قرار دهید و نقاط تلاقی را به یکدیگر وصل کنید.

    نمایش نمودار تنه و شاخه این نوع نمودار برای داده‌های کمی بکار می‌رود.

    برای رسم این نمودار ابتدا بهتر است داده‌ها را به صورت صعودی مرتب کنیم و ارقام مشاهدات را به دو قسمت به نام‌های تنه و شاخه تقسیم کنیم.

    تنه شامل یک یا چند رقم و شاخه شامل ارقام باقیمانده است.

    مثلاً عدد 32 را به 3 تنه و 2 شاخه تقسیم می‌کنیم.

    توجه: اگر داده‌های ارقام اعشاری باشند، آنها را سرراست می‌کنیم.

    نمودار جعبه‌ای رسم این نمودار را در انتهای فصل پنجم به طور جامع توضیح می‌دهیم.

    مثال 1: نمرات 80 دانشجو در امتحانات نهایی درس احتمال و آمار به شرح زیر است: 93 76 88 62 90 68 82 75 84 68 75 85 59 71 93 60 73 88 79 73 72 63 78 95 62 74 87 75 65 61 60 68 74 69 77 94 75 82 78 66 71 83 79 60 95 75 61 89 78 99 75 71 65 76 85 78 97 67 62 79 74 50 76 62 78 88 57 73 80 65 77 85 75 76 63 72 81 73 67 86 موارد زیر را بدست آورید.

    الف) تشکیل جدول فراوانی ب) رسم نمودارهای آماری حل: اندازه واقعی مدل‌ها در فاصله [5/99-5/49] است.

    در آن r تمام ارقام گرد شده است.

    C تعداد طبقات است که برابر 5 می‌باشد.

    اندازه طبقات برابر: نمودار هیستوگرام: که در آن: نمودار چندبر فراوانی نمودار چندبر فراوانی نمودار منحنی فراوانی نمودار منحنی فراوانی تجمعی پس از ساختن نمودار اولیه معمولا بهتر است مقادیر هر شاخه را از کوچک به بزرگ، با تعداد دفعات تکرار، ‌مرتب کرد، به صورت زیر: مثال 2: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار،‌ به شرح زیر است: 1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2 8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2 8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1 9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2 4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1 قسمت‌های زیر را محاسبه کنید.

    الف) تشکیل جدول فراوانی ب) رسم نمودارهای آماری چون داده‌ها تا یک رقم اعشار گرد شده‌اند، بنابراین می‌توان گفت که اندازه واقعی معدل‌ها در فاصله [1.35,2.95] است.

    برای محاسبه فاصله طبقات (W) ابتدا نیاز به محاسبات زیر است که در آن r تعداد ارقام گرد شده است.

    که در آن: C: تعداد طبقات W: طول واقعی کلاس R:‌ دامنه است.

    هیستوگرام چندبر فراوانی چندبر فراوانی تجمعی نمودار منحنی فراوانی تجمعی نمودار منحنی فراوانی نمودار تنه و شاخه فصل چهارم معیارهای مرکزی با استفاده از جدول فراوانی و رسم نمودارها می‌توانیم داده‌ها را به نحو مطلوبی تنظیم کرده و اطلاعات نهفته را تا حدودی مشخص کنیم.

    با این حال برای ارایه یک گزارش مناسب،‌بهتر است آنها را در یک یا چند عدد مناسب نیز خلاصه کنیم.

    چنین عددی می‌تواند معیار مرکزی باشد.

    مهمترین معیارهای مرکزی میانگین‌،‌ میانه و نما است که در بخش این به شرح هر یک از آنها خواهیم پرداخت.

    هرگاه n داده y1, y2, k, yn از k نوع ، با فرض ، به ترتیب با تعدادهای تشکیل شده باشند،‌ آنگاه را فراوانی می‌گوییم.

    میانگین میانگین به عنوان یک شاخص مرکزی به صورت ذیل تعریف می‌گردد: مثال: میانگین داده‌های زیر را که در خصوص تعداد فرزند کارمندان یک اداره است را بدست آورید: 5 5 4 3 3 2 2 1 1 1 1 0 0 یعنی به طور متوسط کارمندان دارای 15/2 فرزند هستند.

    توجه: میانگین جمعیت را با حرف یونانی نشان داده و آنرا "مو" تلفظ می‌کنند.

    میانگین نمونه را با حرف نمایش داده و آن را "ایکس بار" می‌نامند.

    میانگین انواع مختلف دارد که مختصر به چند نوع آن اشاره خواهیم کرد.

    مثال: فرض کنید تعداد دانشجویان تهران 2000 نفر می‌باشند.

    بطور تصادفی یک نمونه 100 تایی گرفته شده است تا قد دانشجویان مورد بررسی قرار گیرد و واحد اندازه‌گیری بر حسب سانتیمتر تا نزدیکترین واحد سر راست شده‌اند که نتایج آن بصورت زیر درآمده است.

    یعنی بطور متوسط قد دانشجویان 65/166 سانتیمتر است.

    یادآوری: k تعداد طبقات در جدول فروانی است.

    میانگین حسابی میانگین حسابی برای داده‌ها وقتی بکار گرفته می‌شوند که داده‌های آماری دارای اهمیت مساوی باشند که آن را با نماد نمایش می‌دهند و فرمول آن به صورت زیر است: میانگین وزنی اگر داده‌های آماری دارای اهمیت مساوی نباشند، به هر یک از این داده‌ها، وزنی به تناسب اهمیت آن اختصاص می‌دهند، یعنی متناظر هر یک از داده‌های وزنی به صورت درنظر می‌گیریم.

    به عبارت دیگر wi وزن‌هایی است که به هر یک از xiها به ازای نسبت داده شده است.

    میانگین وزنی را معمولاً با نماد نمایش می‌دهیم و فرمول آن به صورت زیر است: مثال: در یک شهر که 3 روزنامه محلی منتشر می‌شود، 18 درصد خانوارهای ساکن این شهربا هیچ یک از روزنامه‌ها مشترک نیستند، اما درصد آنها با یکی از روزنامه، 17 درصد با دو روزنامه، 4 درصد هر سه روزنامه مشترکند.

    متوسط اشتراک خانواده این شهر را با این روزنامه‌ها بدست آورید.

    میانگین هندسی تعاریف مختلفی برای این نوع میانگین آورده‌اند، اما رایجترین آنها این است: فرض کنید n مشاهده مثبت غیرصفر بصورت ذیل داریم: در اینصورت میانگین هندسی را به صورت زیر تعریف می‌کنیم: در مسائل اقتصادی یا جمعیت‌شناسی میانگین هندسی را معمولاً هرگاه xiها از درصد یا نسبت تشکیل شده باشند بکار می‌برند.

    تذکر: میانگین هندسی همواره از میانگین حسابی کوچکتر است به استثناء موارد نادری که تمام مقادیر یکسان می‌باشند که در این صورت میانگین هندسی و حسابی برابر می‌شوند.

    مثال: فرض کنید میزان تولید کارخانه‌ای در چهار سال متوالی 2، 4، 6 و 27 باشد.

    در حالت‌های زیر میزان افزایش متوسط را بدست آورید.

    الف) سال پایه ثبت باشد (یعنی تولید امسال را نسبت به یک سال درنظر می‌گیرند).

    ب) سال پایه ثابت نباشد (یعنی تولید هر سال را نسبت به سال قبل درنظر می‌گیرند).

    حل) الف: ب: میانه اگر داده‌ها را از کوچک به بزرگ مرتب نماییم،‌ عدد m را میانه این داده‌ها می‌نامیم، ‌اگر نصف داده‌ها در سمت چپ و نصف داده در سمت راست این عدد قرار گیرد محاسبه میانه برای داده‌های گسسته اگر y1, y2, k, yn داده‌های ما باشند و شکل مرتب شده آنها را با .

    نمایش دهیم.

    آنگاه: مثال: تعداد کتاب‌های منتشر شده سال 79 در 15 انتشاراتی به شرح زیر است.

    میانه را بدست آورید.

    4 3 2 10 1 9 8 6 5 4 11 2 10 10 9 ابتدا داده‌ها را به صورت صعودی مرتب می‌کنیم.

    داریم: 11 10 10 10 9 9 8 6 5 4 4 3 2 2 1 چون تعداد داده‌‌ها فرد است، پس میانه داده‌ها است.

    پس: در نتیجه میانه برابر 6 می‌باشد.

    محاسبه میانه برای داده‌های پیوسته برای محاسبه ابتدا ستون فراوانی انباشته (Fi) را تشکیل می‌دهیم.

    را محاسبه کرده و هر طبقه‌ای را که برابر یا بلافاصله بزرگتر از n/2 باشد را به عنوان رده میانه درنظر می‌گیریم.

    فرمول میانه به صورت زیر می‌باشد: که در آن: LM: کران پایین رده میانه n: تعداد داده‌ها Fb: فراوانی انباشته قبل از رده میانه fm: فراوانی رده میانه W: طول (فاصله) رده میانه است.

    مثال: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار،‌ به شرح زیر است: 1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2 8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2 8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1 9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2 4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1 میانه را حساب کنید.

    حل: ستون فراوانی انباشته را تشکیل می‌دهیم، داریم: ، پس طبقه 15/2-99/1 چون فراوانی انباشته آن را بلافاصله بعد از 25 است رده میانه است.

    نما داده‌ای که فراوانی آن نسبت به دیگر داده‌ها بیشتر باشد،‌ نما یا مد نامیده می‌شود و آن را با نماد M نمایش می‌دهیم.

    محاسبه نما برای داده‌های گسسته برای به دست آوردن نما،‌ نخست فراوانی داده‌ها را پیدا می‌کنیم و داده‌ای را که فراوانی آن بیشتر باشد،‌ به عنوان نما اختیار می‌کنیم و اگر دو داده،‌ دارای فراوانی یکسان و بیش از دیگر فراوانی‌ها باشند، ‌هر دو را به عنوان نما اختیار می‌کنیم و داده‌ها را دو نمایی می‌گوییم،‌ به شرط آن که این دو داده در یک صف غیرنزولی، ‌کنار هم نباشند.

    در صورتی که این دو داده در یک صف غیر نزولی،‌ کنار هم باشند نصف مجموع آنها را به عنوان نما اختیار می‌کنیم.

    اگر تمام داده دارای فراوانی یکسان باشند،‌می‌گوییم داده‌‌ها بدون نما هستند.

    به یاد داشته باشید که نما، ‌به عنوان یک معیار تمرکز در داده‌های گروهی به کار گرفته می‌شود.

    مثال: برای داده‌های 2، 2، 5، 7، 9، 9، 9، 10، 10، 11، 12و 18 نما برابر 9=M است، زیرا فراوانی داده 9 بیش از فراوانی دیگر داده‌ها است.

    مثال: برای داده‌ها 2، 3، 4، 4، 4، 5، 5، 7، 7، 7و 9، دو داده 4 و 7 به عنوان نما اختیار می‌شوند، زیرا فراوانی این دو داده، بیش از فراوانی داده‌های دیگر است.

    مثال: برای داده‌های 3، 5، 8، 10، 12، 15و 16، نما وجود ندارد، زیرا تمام داده‌ها دارای فراوانی یکسان هستند.

    مثال: برای داده‌ها 2، 3، 4، 4، 4، 5، 5، 5، 7، 7 و 9، 2 داده 4 و 5 را که دارای بیشترین فراوانی هستند به عنوان نما بر می‌گزینیم، ‌اما از آنجا که این دو داده در یک صف غیر نزولی در کنار یکدیگر قرار دادند، ‌نصف مجموف دو داده به عنوان نما اختیار می‌شود،‌ یعنی 5/4=M.

    محاسبه تما برای داده‌های پیوسته: برای محاسبه نما در این حالت ستون فراوانی را درنظر می‌گیریم و هر طبقه‌ای که بیشترین فراوانی را داشته باشد، آن طبقه را به عنوان نما تعیین می‌کنیم.

    فرمول نما در این حالت به صورت زیر است: که در آن: LM: کران پایین رده نما d1: اختلاف فراوانی رده نما با رده قبل از خودش d2: اختلاف فراوانی رده نما با رده بعد از خودش W: طول (فاصله) رده نما می‌باشد.

    مثال: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار،‌ به شرح زیر است: 1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2 8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2 8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1 9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2 4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1 نما را بدست آورید.

    از روی جدول ملاحظه می‌شود که فراوانی رده 95/1_75/1 دارای بیشترین فراوانی است بنابراین به عنوان رده نما در نظر می‌گیریم.

    چندکها چندک یک معیار کلی‌تر از میانه است و درعنوان حالت خاص میانه را نیز در بر می‌گیرد.

    اگر p یک عدد حقیقی بین صفر و یک باشد، ‌آنگاه عدد را چندک مرتبه p می‌نامیم.

    هرگاه p 100% داده‌ها سمت چپ و (p -1) 100% داده‌ها سمت راست باشند.

    چندک‌های معروف عبارتند از: چارکها چارکها به ازای 75/0، 5/0، 25/0 =p به دست می‌آیند و آنها را به ترتیب با نماد (چارک اول)،‌ (چارک دوم) و (چارک سوم) نشان می‌دهند.

    دهکها دهکها به ازای 9/0،.....،2/0،1/0=p به دست می‌آیند و آنها را به ترتیب با نماد (دهک اول)، (دهک دوم)، ......

    و (دهک نهم) نشان می‌دهند.

    صدکها صدکها به ازای 99/0،.....02/0، 01/0=p به دست می‌آیند و آنها را به ترتیب با نماد (صدک اول)، (صدک دوم)،.....و (صدک نود و نهم) نشان می‌دهند.

    محاسبه چندک برای داده‌های گسسته فرض کنید y1, y2, k, yn داده‌های ما باشند و شکل مرتب شده آنها را با نمایش دهیم.

    برای محاسبه چندک محاسبه چندک برای داده‌های پیوسته برای محاسبه چندک در فرمول میانه اولاً را به جای m و p را به جای 5/0 درنظر می‌گیریم.

    سپس سایر مراحل را مانند روش محاسبه میانه انجام می‌دهیم که فرمول آن به صورت زیر می‌شود: که در آن: : کران پایین رده چندک n: تعداد داده‌ها Fb: فراوانی انباشته قبل از رده چندک : فراوانی رده چندک w: طول (فاصله) رده چندک است.

    مثال: معدل 50 دانشجوی دانشگاه با تقریب تا یک رقم اعشار،‌ به شرح زیر است: 1/2 9/1 6/1 2/2 1/2 2/2 4/2 8/1 5/1 9/2 8/1 3/2 8/1 7/1 3/2 3/2 0/2 5/2 1/2 6/2 8/1 1/2 9/1 7/1 7/1 0/2 9/1 2/2 6/2 4/1 9/2 4/2 8/1 9/1 2/2 2/2 5/2 0/2 0/2 0/2 4/1 5/2 9/1 8/1 6/1 4/2 9/2 9/1 6/1 4/1 چندک مرتبه 25/0 را محاسبه کنید.

    ستون فراوانی تجمعی را محاسبه می‌کنیم.

    با توجه به ستون فراوانی تجمعی در جدول فراوانی، کلاسی را که چندک در آن قرار دارد مشخص می‌کنیم.

    برای این کار np را محاسبه می‌کنیم.

    چون طبقه سوم بلافاصله بعد از 5/12 آمده است، بنابراین طبقه سوم (95-1-75/1) به عنوان چندک مرتبه 25/0 انتخاب می‌کنیم.

    مقایسه معیارهای مرکزی داده پرت داده‌ای که با سایر داده‌های دیگر اختلاف زیادی داشته باشد، داده پرت نامیده می‌شود.

    در این حالت بایستی شاخص مرکزی مناسبی برای داده‌ها انتخاب و محاسبه شود.

    مثال: داده‌های زیر در خصوص تعداد ماموریت کارمندان یک اداره است.

    میانگین و میانه را محاسبه کرده و بیان کنید کدام شاخص مرکزی ماموریت داده‌ها را بهتر نشان دهد.

    90 15 14 13 13 12 11 9 7 7 5 3 2 2 1 حل.

    محاسبه میانگین: محاسبه میانه: چون داده‌ها به صورت صعودی مرتب شده‌اند و تعداد آنها (n) فرد است، بنابراین میانه است.

    در نتیجه میانه است.

    حال وضعیت مکانی داده پرت، میانگین و میانه را در داده‌ها که به صورت زیر است، درنظر می‌گیریم.

    90 15 14 .

    13 13 12 11 9 7 7 5 3 2 2 1 مشاهده می‌شود میانه در مرکز داده‌ها قرار گرفته است.

    چون در محاسبه میانگین همه داده‌ها با هم جمع می‌شود و داده پرت روی میانگین تاثیر نامطلوب می‌گذارد، ولی محاسبه میانه بر بزرگترین و کوچکترین داده توجه ندارد و میانه تحت تاثیر داده پرت قرار نمی‌گیرد.

    نتیجه: زمانی که داده پرت در داده‌ها وجود داشته باشد، میانه معیار مرکزی بهتری است و باید آن را بکار ببریم.

    توجه: اگر میانه به دو قسمت مساوی تقسیم نشود، یعنی مرکز داده‌ها را نشان ندهد، باید از میانگین به عنوان معیار مرکزی استفاده شود.

    فصل پنجم معیارهای پراکندگی با وجود این که در بسیاری از موارد، میانگین توصیف نسبتا کاملی از مجموعه داده‌ها ارائه می‌دهد،‌ اما گاهی وجود اطلاعات بیشتر در مورد داده‌ها ضروری است.

    یک مفهوم مهم در ارتباط با داده‌های آماری، ‌میزان تغییرات آنهاست،‌ بدین معنی که اندازه‌گیری‌ها تا چه اندازه از فردی به فرد دیگر یا شیی به شیی دیگر تغییر می‌کنند.

    در این بخش، ‌به بررسی و محاسبه میزان تغیرات به عنوان معیارهای پراکندگی خواهیم پرداخت.

    مهمترین معیارهای پراکندگی عبارتند از دامنه، ‌میانگین انحراف‌ها از میانگین، واریانس و انحراف معیار است.

    علاوه بر مطالب فوق، در این بخش ضریب تغیرات را نیز معرفی خواهیم کرد.

    دامنه اختلاف بزرگترین داده با کوچکترین داده را دامنه یا دامنه تغییرات می‌نامند و آن را با حرف R نشان می‌دهند که y(1) کوچکترین و y(n) بزرگترین داده هستند.

  • فهرست مطالب

    پیشگفتار 1
    دیدگاه‌هایی درمورد آمار 1
    دید کلی 2
    نقش آمار در زندگی روزمره 2
    نقش آمار در پژوهش‌های علمی 2
    کاربرد آمار 3
    فصل اول
    آمار توصیفی
    جمعیت 4
    نمونه 5
    متغیر 5
    مقیاسهای اندازهگیری 6
    داده 7
    فصل دوم
    جدولهای آماری
    فراوانی مطلق 9
    فراوانی نسبی 9
    فراوانی تجمعی 11
    فراوانی نسبی تجمعی 12
    فصل سوم
    نمودارهای آماری
    هیستوگرام 13
    چندبر فراوانی 13
    چندبر فراوانی تجمعی: 13
    منحنی‌های فراوانی و فراوانی تجمعی 13
    نمایش نمودار تنه و شاخه 14
    نمودار جعبه‌ای 14
    فصل چهارم
    معیارهای مرکزی
    میانگین 22
    میانگین حسابی 23
    میانگین وزنی 23
    میانگین هندسی 24
    میانه 25
    نما 27
    چندکها 29
    مقایسه معیارهای مرکزی 32
    داده پرت 32
    فصل پنجم
    معیارهای پراکندگی
    دامنه 34
    میانگین انحراف از میانگین 34
    واریانس 35
    انحراف معیار 36
    ضریب تغییرات 37
    ضریب چولگی و کشیدگی 38
    منحنی‌های فراوانی 39
    ضریب چولگی 40
    ضریب کشیدگی 43
    نمودار جعبه‌ای 44
    تشخیص داده پرت به روش چارک‌ها و رابطه داده پرت با نمودار جعبه‌ای (نمودار جعبه‌ای اصلاح شده) 49
    منابع 54

چکیده یکی از موضوعاتی که در چند سال اخیر ذهن اکثر اندیشمندان و حتی عموم را به خود مشغول کرده است مسأله طلاق[1] می باشد. در حال حاضر این پدیده در ایران به شکل یک مسأله و معضل اجتماعی ،مشکلات زیادی را برای افراد و خانواده های در معرض طلاق به وجود آورده است .هدف این مقاله بررسی عوامل مؤثر بر گرایش زوجین به طلاق (مطالعه موردی شهرستان داراب)می باشد. چارچوب نظری این پژوهش با توجه به ...

علم آمار، خود مبتنی است بر نظریه آمار که شاخه‌ای از ریاضیات کاربردی به حساب می‌آید. در نظریهٔ آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریهء احتمالات مدل‌ سازی می‌شوند. در این علم، مطالعه و قضاوت معقول در بارهٔ موضوع‌های گوناگون، بر مبنای یک جمع انجام می‌شود و قضاوت در مورد یک فرد خاص، اصلاً مطرح نیست. از جملهٔ مهم‌ترین اهداف آمار، می‌توان تولید «بهترین» اطّلاعات از داده‌های موجود ...

اهداف این فصل توضیح روش های استنتاج آماری که معمولاً در داده کاوی استفاده می شود. تشخیص پارامترهای آماری مختلف به منظور تقریب سازی اختلاف موجود در داده ها. توصیف مولفه ها و اصول اساسی ممیز کننده های Navia Bayesian و روش رگرسیون Logistic. معرفی مدل های log خطی با استفاده از تحلیل متناظر جداول توافقی. بحث و بررسی در مورد مفاهیم آنالیز واریانس (Anova) و تحلیل ممیزی خطی نمونه های ...

چکیده: عرصه کنونی کسب و کار ، تصویری جدید از سازمان ارائه می کند با این نگرش جدید ، سازمان مجموعه ای از فرایندهایی است که هدف آنها ایجاد ارزش برای مشتری است و مستلزم ایجاد ارزش برای مشتری ، آفرینش ارزش در خود سازمان است . برنامه سازمانی که می خواهد رویکرد فوق را دنبال کند در وهله اول ورود به حوزه سیگما هاست و در مرحله بعد طی مراحل بهبود تا رسیدن به سطح شش سیگما( six sigma) یعنی ...

امروزه کمتر شاخه‌ای از علوم را می‌توان یافت که نیازمند به تحقیق نباشد . بی‌تردید حل مشکلات و مسائل گوناگون جوامع و همچنین گسترش مرزهای دانش بستگی به انجام تحقیقات در زمینه‌های مختلف دارد . تحقیقات را بر اساس نتایج آنها می‌توان به سه گروه بنیادی ، کاربردی، بنیادی- کاربردی (توسعه‌ای) تقسیم نمود . از آنجا که تحقیقات بنیادی توسط مراکز تحقیقی خاصی صورت می‌گیرد ، اکثر تحقیقاتی که ...

ارزشیابی پیشرفت تحصیلی به نمره دادن و صدور گواهینامه خلاصه نمی شود بلکه یکی از اهداف اصلی آن کمک به معلم در بهبود شیوه های آموزشی خود و رفع نواقص یادگیری دانش آموزان است، در صورتی که ارزشیابی صحیح و مناسبی صورت نگیرد. تبعاتی همچون کاهش علاقه به یادگیری، افزایش اضطراب امتحان، بروز رفتارهای منفی در دانش آموزان، هدر رفتن سرمایه های مادی و انسانی، افزایش نرخ مردودی و تکرار پایه، ...

چکیده این تحقیق که با عنوان بررسی خصوصیات مدیران مدارس شهری شهرستان ساوجبلاغ و تطبیق آن با آیین نامه انتصاب مدبران انجام شده است از نوع تحقیقات توصیفی می‌باشد . اهداف مد نظر تحقق 1- بررسی خصوصیات مدیران مدارس شهری شهرستان ساوجبلاغ و تطبیق آن با آیین نامه انتصاب مدیران . 2- ارائه پیشنهادها و راه حلهای مناسب به مسئولین به منظور بهبود فرایند مدیریت و آموزش مدیران . در ارتباط با ...

الف) نظریه کوزنتس سیمون کوزنتس در یکی از مقالات خود به عنوان رشد اقتصادی و نابرابری درآمدی (1955) این فرضیه را مطرح نمود که در مسیر رشد اقتصادی در کشورهای نابرابری درآمد سخت افزایش یافته و پس از ثابت ماندن از سطح معینی، به تدریج کاهش می یابد. این الگو بعداً به نام منحنی u وارون کوزنتس (ku2cnt's ``u-Inverted curve) معروف شد. کوزنتس توسعه اقتصادی رات به عنوان فرآیند گذار از اقتصاد ...

مقدمه: آنالیز رشد گیاه یک تحلیلی توصیفی، چند جانبه و تکمیلی است که عملکرد و شکل گیاه را تفیر می کند و از داده های ساده اولیه مثل وزن، سطح، حجم، محتویات اجزاء گیاه برای بررسی درونی که در برگیرنده کل است. استفاده می کند (ایوانز 1972، کاستون و ونوس 1981، هانت 1990) در اواخر قرن 19 بررسیهای مربوط به رشد گیاه ابتدا فیزیولوژی گیاه، سپس کشاورزی، امروزه اکولوژی مربوط به تکامل گیاهی را ...

تعاریف اپیدمیولوژی شما در کتاب های مختلف با تعاریف متعددی از اپیدمیولوژی مواجه می‌شوید که شاید با نگاهی دقیق‌تر به کلمات کلیدی آنها بتوان تصویری جامع از این علم را استنباط کرد. گرچه تمامی این تعاریف در اصول مشترک هستند اما با مراجعه به هرکدام می‌توان از منظری متفاوت با اصول و اهداف این علم آشنا شد. آنچه مورد موافقت همگان است این است که اپیدمیولوژی، پایه علم بهداشت عمومی است، و ...

ثبت سفارش
تعداد
عنوان محصول