چرا از ضرایب برای مقایسه دو کمیت استفاده می کنیم و متمایز نمی کنیم؟ روش‌های مقایسه بر اساس اندازه: مستقیم، غیر مستقیم، با استفاده از چشم‌سنج چه چیزی قابل مقایسه است

با این حال، نمودار دایره ای همیشه وضوح لازم را برای ارائه اطلاعات ارائه نمی دهد. اولاً، ممکن است بخش های زیادی در یک دایره وجود داشته باشد. ثانیاً، همه بخش ها می توانند تقریباً یک اندازه باشند. این دو دلیل در کنار هم باعث می شوند تا نمودار دایره ای کاربرد چندانی نداشته باشد.

2.نمودار ستونی (هیستوگرام)-برای مقایسه چند کمیت در چندین نقطه استفاده می شود.

نمودارهای ستونی (همانطور که از نام آن پیداست) از میله ها تشکیل شده اند. ارتفاع ستون مشخص می شودمقادیر مقادیر مقایسه شده . هر ستون به آن گره خورده استنقطه مرجع .

3.نمودار خطی (گراف) -برای ردیابی تغییرات در مقادیر مختلف هنگام حرکت از یک نقطه به نقطه دیگر خدمت می کند.

ساخت نمودار خطی مشابه ساخت نمودار ستونی است. اما به جای ستون ها، ارتفاع آنها به سادگی مشخص می شود (نقطه، خط تیره، ضربدر) و علائم حاصل با خطوط مستقیم به هم متصل می شوند. به جای سایه زنی های مختلف (سایه دهی ستون ها) از علائم مختلف (الماس، مثلث، ضربدر و ...)، ضخامت و نوع خطوط مختلف (یکپارچه، نقطه چین و ...)، رنگ های مختلف استفاده می شود.

4. نمودار ردیفی (هیستوگرام انباشته) - به شما امکان می دهد به صورت بصری مجموع چند مقدار را در چندین نقطه مقایسه کنید و در عین حال سهم هر کمیت را در مجموع کل نشان دهید.

روش ساخت نمودار ردیفی بسیار شبیه به روش ساخت نمودار ستونی است. تفاوت این است که میله‌ها در نمودار ردیفی در کنار هم قرار نمی‌گیرند، بلکه یکی روی هم قرار می‌گیرند. قوانین محاسبه اندازه عمودی و افقی نمودار بر این اساس تغییر می کند.

5. نمودار مساحت (نمودار مساحت) -ترکیبی از یک نمودار ردیفی با یک نمودار خطی به شما امکان می دهد به طور همزمان تغییر در هر یک از چندین کمیت و تغییر مجموع آنها را در چندین نقطه دنبال کنید.

ستون های مجزا ادغام می شوند تا مناطق پیوسته را تشکیل دهند. از این رو نام - نمودار ناحیه یا نمودار مساحت. هر ناحیه مربوط به یک مقدار واحد است که نشان می دهد کدام سایه (رنگ آمیزی) متفاوت استفاده شده است. قبلاً ستون هایی در ردیف وجود داشت ، اکنون خطوطی وجود دارد (و مناطق مشخص شده توسط آنها).

    قالب بندی سلول ها قالب شماره در مایکروسافت اکسل.

قالب بندی در اکسل برای سهولت درک داده ها استفاده می شود که نقش مهمی در بهره وری دارد.

برای اختصاص فرمت باید موارد زیر را انجام دهید:

2. دستور "Format" - "Cells" (Ctrl+1) را انتخاب کنید.

3. در کادر محاوره ای ظاهر شده، پارامترهای قالب بندی مورد نظر را وارد کنید.

4. روی دکمه Ok کلیک کنید.

یک سلول فرمت شده فرمت خود را تا زمانی که قالبی روی آن اعمال شود حفظ می کند. قالب جدیدیا قدیمی حذف نمی شود. وقتی مقداری را در یک سلول وارد می‌کنید، قالبی که قبلاً در سلول استفاده شده است روی آن اعمال می‌شود.

برای حذف فرمت باید موارد زیر را انجام دهید:

1. یک سلول (محدوده سلول ها) را انتخاب کنید.

2. دستور "Edit" - "Clear" - "Formats" را انتخاب کنید.

3. برای حذف مقادیر در سلول ها، دستور "همه" را از زیر منوی "Clear" انتخاب کنید.

لطفا توجه داشته باشید که هنگام کپی کردن یک سلول، همراه با محتوای آن، فرمت سلول نیز کپی می شود. بنابراین، می‌توانید با قالب‌بندی سلول منبع قبل از استفاده از دستورات کپی و چسباندن، در زمان صرفه‌جویی کنید

قالب بندی را می توان با استفاده از نوار ابزار نیز انجام داد. بیشترین استفاده از دستورات قالب بندی در نوار ابزار Formatting قرار دارد. برای اعمال یک قالب با استفاده از دکمه نوار ابزار، یک سلول یا محدوده ای از سلول ها را انتخاب کنید و سپس روی دکمه کلیک کنید. برای حذف فرمت، دکمه را دوباره فشار دهید.

برای کپی سریع فرمت ها از سلول های انتخاب شده به سلول های دیگر، می توانید از دکمه Format Painter در پانل Formatting استفاده کنید.

قالب‌بندی را می‌توان برای نویسه‌های جداگانه یک مقدار متن در یک سلول و همچنین برای کل سلول اعمال کرد. برای انجام این کار، باید کاراکترهای مورد نظر را انتخاب کنید و سپس از منوی "Format" دستور "Cells" را انتخاب کنید. در مرحله بعد، ویژگی های مورد نیاز را تنظیم کرده و روی "Ok" کلیک کنید. برای مشاهده نتایج کار خود کلید Enter را فشار دهید.

تنظیم فرمت اعداد در اکسل

زیرا برنامه اکسلبرای پردازش اعداد طراحی شده است، تنظیم صحیح قالب آنها نقش مهمی ایفا می کند. برای انسان ها، عدد 10 به سادگی یک و صفر است. از منظر اکسل، این دو عدد بسته به اینکه نشان دهنده تعداد کارکنان یک شرکت، ارزش پولی، درصدی از کل یا قطعه ای از عنوان "10 شرکت برتر" باشند، می توانند اطلاعات بسیار متفاوتی را منتقل کنند. در هر چهار حالت، این عدد باید به صورت متفاوت نمایش داده شود و پردازش شود. اکسل از فرمت های داده زیر پشتیبانی می کند:

* عمومی- متن و مقادیر عددینوع دلخواه؛ * عددی- رایج ترین روش نمایش اعداد. * پولی- ارزش های پولی؛ * مالی- مقادیر پولی تراز شده توسط جداکننده قطعات صحیح و کسری؛ * تاریخ- تاریخ یا تاریخ و زمان؛ * زمان- زمان یا تاریخ و زمان؛ * درصد- مقدار سلول در 100 با نماد "%" در پایان ضرب می شود. * کسری- کسرهای گویا با صورت و مخرج؛ * نمایی- اعداد کسری اعشاری؛ * متن- داده های متنی به همان روشی که رشته ها وارد و پردازش می شوند، صرف نظر از محتوای آنها نمایش داده می شوند. * اضافی- فرمت های کار با پایگاه های داده و لیست های آدرس. * سفارشی- فرمت قابل تنظیم توسط کاربر

رایج ترین گزینه های قالب داده را می توان با استفاده از نوار ابزار Formatting اختصاص داد.

1. روی سلول C4 و سپس روی دکمه کلیک کنید فرمت درصدی. مقدار سلول C4 در 100 ضرب می شود و علامت "%" به آن اضافه می شود.

برنج. 9.14. برگه انتخاب فرمت داده

2. کلید پایین را فشار داده و روی دکمه کلیک کنید فرمت ارز.

3. روی سلول Sat کلیک کنید و سپس روی آن کلیک کنید فرمت محدود. این دکمه باعث می شود اعداد با استفاده از جداکننده اعشاری در یک ستون تراز شوند.

4. سلول C7 را انتخاب کرده و بر روی دکمه کلیک کنید عمق بیت را افزایش دهید. این دکمه فرمت اصلی را تغییر نمی دهد، اما یک رقم به قسمت کسری عدد اضافه می کند.

5. کلید Enter را فشار داده و روی دکمه کلیک کنید عمق بیت را کاهش دهید. این عملیات یک رقم اعشار را حذف می کند و عدد را گرد می کند. اکنون سلول های C4 تا C9 کاملاً متفاوت به نظر می رسند، اگرچه دقیقاً همان اعداد در ابتدا در آنها وارد شده است. فرمت های دیگر با استفاده از مراحل زیر اختصاص داده می شوند.

6. روی سلول C10 کلیک کرده و دستور را انتخاب کنید قالب > سلول ها.

7. در پنجره گفتگوی باز شده، برگه را باز کنید عدد(شکل 9.14).

8. فهرست شده است فرمت های اعدادروی مورد کلیک کنید تاریخ.

9. در لیستی که ظاهر می شود تایپ کنیدروی خط 14 مارس 01 (14-مارس-01) کلیک کنید. سپس بر روی دکمه کلیک کنید خوب.

برنج. 9.15. فرمت های اعداد مختلف

10. به طور مشابه، فرمت Exponential را به سلول C11 و قالب Numeric را به سلول C12 اختصاص دهید. اکنون جدول به این شکل خواهد بود (شکل 9.15). لطفاً توجه داشته باشید که مقدار متوسط ​​جدول تغییر نکرده است ، یعنی هنگام تغییر قالب ، فقط روش نمایش تغییر می کند و مقادیر عددی خود بدون تغییر باقی می مانند. برای بررسی این واقعیت، این مراحل را دنبال کنید.

11. روی سلول C11 دوبار کلیک کنید و مقدار 01/03/1900 را به 02/03/1900 تغییر دهید.

12. Enter را فشار دهید. مقدار متوسط ​​جدول (که در قالب پولی نمایش داده می شود) فوراً به 15.41 روبل تغییر می کند. پس از ورود به سیستم، می توانید تاریخ ها را با علاقه جمع آوری کنید و در نتیجه روبل دریافت کنید. این یک مثال معمولی از تخصیص اشتباه فرمت های داده است.

    محافظ ورق. محافظت از سلول ها در مایکروسافت اکسل

    فرمت ها و سبک های خودکار در مایکروسافت اکسل.

    استفاده از قالب بندی شرطی در مایکروسافت اکسل.

    ایجاد لیست و فرم داده در مایکروسافت اکسل. فهرست الزامات طراحی

    مرتب سازی و فیلتر کردن داده ها در مایکروسافت اکسل (فیلتر خودکار، فیلتر پیشرفته).

    گروه بندی و ساختار داده ها در مایکروسافت اکسل.

    مجموع خودکار: ایجاد یک جدول خلاصه، نمایش مجموع ها بر روی صفحه نمایش در زمینه یک یا چند گروه از رکوردها.

    ایجاد جدول محوری در مایکروسافت اکسل (در یک نوت بوک)

    پیوند داده ها و ادغام (در دفترچه یادداشت)

    مفاهیم نظریه پایگاه داده اصول سازماندهی داده ها

    مدل های سلسله مراتبی و شبکه ای سازماندهی داده ها.

    مدل رابطه ای سازماندهی داده ها. فرم های معمولی

    مفاهیم سیستم های مدیریت پایگاه داده (DBMS) و هدف آنها.

    سیستم های مدیریت پایگاه داده حرفه ای (DBMS).

    هدف، رویه عملیاتی، ایجاد پایگاه های داده MS Access DBMS.

    جداول پایگاه داده MS Access: هدف، ساختار، گزینه های ایجاد.

    انواع داده ها و ویژگی های فیلدها در MS Access DBMS.

    مفهوم دامنه، ویژگی، کلید یک پایگاه داده رابطه ای.

    ایجاد ساختاری از اتصالات بین جداول پایگاه داده.

    انواع روابط و محدودیت ها در MS Access DBMS.

    مفاهیم، ​​هدف و ویژگی های فرم ها.

    گزینه هایی برای ایجاد فرم ها با استفاده از Form Wizard

    کار با طراح فرم بخش های فرم

    استفاده از عبارات و فیلدهای محاسبه شده

    انواع کنترل فرم

    هدف، انواع و گزینه های ایجاد درخواست.

    نحوه استفاده از سازنده پرس و جو

    فیلتر کردن و مرتب سازی داده ها در کوئری ها

    استفاده از عملگرها و شرایط در کوئری ها.

    ایجاد فیلدهای محاسبه شده و پیوستن به پرس و جوها.

    نحوه کار با پرس و جوهای چند جدولی

    سوالات نهایی عملیات گروهی در MS Access.

    تغییر اطلاعات با استفاده از پرس و جوهای اصلاحی

    هدف و روش های ایجاد گزارش های MS Access.

    از ویزارد برای ایجاد گزارش استفاده کنید.

    کار با طراح گزارش

    گروه بندی داده ها و نتایج میانی در گزارش ها.

    ماکروها در اکسس و طراحی آنها

    حفاظت از اطلاعات در پایگاه های داده

    طبقه بندی شبکه های کامپیوتر. مفهوم سرور، ایستگاه های کاری.

    نرم افزاری برای کار در شبکه های محلی و اینترنت.

    تبادل داده در شبکه ها، پروتکل ها. سخت افزار شبکه اتصالات بین شبکه ها شبکه بی سیم.

    اینترنت، ساختار شبکه، مفاهیم اساسی. خدمات اینترنتی.

    اصول بازیابی اطلاعات

    نمایه سازی و موتور جستجو.

    نمودار یک سیستم بازیابی اطلاعات. استراتژی های جستجو رابط.

    برنامه های آنتی ویروس و طبقه بندی آنها

    اصول حفاظت از اطلاعات و اطلاعات تشکیل دهنده اسرار دولتی.

    راه های محافظت از برنامه ها و داده ها

    سخت افزار امنیتی

تجزیه و تحلیل داده ها با گروه بندی و محاسبه آمار توصیفی در گروه ها، مانند محاسبه میانگین و انحراف معیار آغاز می شود.

اگر دو گروه داده دارید، طبیعی است که میانگین ها را در این گروه ها مقایسه کنید. این نوع مشکل در عمل از جهات مختلفی به وجود می آید؛ برای مثال، ممکن است بخواهید میانگین درآمد دو گروه از افراد را با هم مقایسه کنید: آنهایی که تحصیلات عالی دارند و افراد بدون تحصیلات عالی. آموزش عالی.

در این فصل به متغیرهایی می پردازیم که در مقیاس پیوسته اندازه گیری می شوند، مانند درآمد یا فشار خون. متغیرهای اندازه گیری شده در مقیاس های ضعیف با استفاده از روش های خاص مورد بررسی قرار می گیرند. به طور خاص، متغیرهای طبقه بندی با استفاده از جداول احتمالی مورد بررسی قرار می گیرند (به فصل تجزیه و تحلیل و ساخت جداول مراجعه کنید). متغیرهای اندازه گیری شده در مقیاس های ترتیبی با استفاده از آمار ناپارامتریک بررسی می شوند (به بخش آمار ناپارامتریک مراجعه کنید).

بیایید یک مشکل معمولی را در نظر بگیریم. فرض کنید هنگام تولید بتن، به فکر اضافه کردن یک جزء جدید به آن هستید و معتقدید که باعث افزایش مقاومت بتن می شود. برای آزمایش مفروضات خود و اثبات آنها به مصرف کننده، چندین نمونه بتن با ماده افزودنی و چندین نمونه بدون افزودنی برداشته و مقاومت هر نمونه را اندازه گیری کرده اید.

بنابراین، ما دو ستون (دو گروه) از اعداد را به دست آوردیم: استحکام نمونه‌ها با ماده افزودنی و استحکام نمونه‌های بدون افزودنی. چگونه می توان این گروه ها را به طور معناداری با هم مقایسه کرد؟

یک رویکرد آشکار، مقایسه آمار توصیفی، مانند میانگین دو گروه است. البته، می توان میانگین ها یا سایر آمارهای توصیفی را با هم مقایسه کرد، اما نقطه طبیعی برای شروع، مقایسه میانگین هاست. بنابراین شما دو میانگین دارید: میانگین برای گروه اول و میانگین برای گروه دوم.

شما می توانید به طور رسمی یک میانگین را از دیگری کم کنید و بر اساس بزرگی تفاوت، نتیجه بگیرید که یک اثر وجود دارد. با این حال، توصیه می شود که گسترش داده ها را نسبت به میانگین، یعنی تغییرات در نظر بگیرید (به فصل مفاهیم ابتدایی مراجعه کنید). بدیهی است که یک رویه معقول باید تغییرات را در نظر بگیرد. اولین چیزی که به ذهن خطور می کند این است که تفاوت میانگین دو نمونه (گروه های داده) را به طور مناسب عادی سازی کنیم، مثلاً آن را بر انحراف معیار (ریشه دوم تغییرات) تقسیم کنیم.

این دقیقاً همان چیزی است که W. Gosset، آماردان انگلیسی که با نام مستعار Student شناخته می شود، استدلال کرد، که آزمون t را برای مقایسه میانگین دو نمونه اختراع کرد.

فرض کنید در حال آزمایش این فرضیه هستیم که مکمل بی اثر است (یا همانطور که در تجزیه و تحلیل داده ها می گویند: بدون اثر درمانی)، به عبارت دیگر، میانگین ها در دو گروه برابر است. این موقعیت مربوط به یک جایگزین است که بر اساس آن یک اثر وجود دارد - هنگامی که یک جزء جدید به آن اضافه می شود مقاومت بتن افزایش می یابد.

لطفاً توجه داشته باشید که جایگزین را می توان به روش دیگری بیان کرد، به عنوان مثال، میانگین ها برابر نیستند یا میانگین مقاومت نمونه ها افزایش یافته است (افزودن منجر به افزایش مقاومت بتن می شود).

اگر به طور تصادفی نمونه را به دو قسمت تقسیم کنید و عملکرد گروه اول و دوم را با هم مقایسه کنید، به احتمال زیاد با گروه های مستقل سروکار دارید.

در آمار آزمون t در هر دو گزینه سازماندهی داده موجود است.

یک توسعه طبیعی نمودار مقایسه میانگین ها، تعمیم آزمون t به سه یا چند گروه داده است که منجر به تجزیه و تحلیل واریانس (در اصطلاح انگلیسی، ANOVA مخفف تجزیه و تحلیل تنوع است) و همچنین به چند متغیره می شود. واکنش. اگر با یک پاسخ چند متغیره سروکار داریم، از روش های MANOVA استفاده می کنیم. به طور خلاصه، روش‌های ANOVA اجازه می‌دهند که میانگین‌های گروهی به شیوه‌ای معقول در صورت وجود بیش از دو گروه مقایسه شوند. به عنوان مثال، اگر می خواهید درآمد ساکنان چندین منطقه را مقایسه کنید، می توانید از تحلیل واریانس استفاده کنید. اگر در حال مطالعه دو منطقه هستید، از آزمون t استفاده کنید.

اجازه دهید یک مورد را توضیح دهیم که در طرح کلی نمی گنجد. تصور کنید در حال مطالعه یک متغیر طبقه بندی هستید که دو مقدار 0 و 1 را می گیرد و می خواهید تفاوت فراوانی وقوع 1 ها را در دو گروه مقایسه کنید. به عنوان مثال، شما می خواهید تعداد نسبی آرای داده شده برای یک نامزد در دو حوزه انتخاباتی را با هم مقایسه کنید. اصطلاح عدد نسبی به معنای تعداد آرای داده شده برای یک نامزد تقسیم بر تعداد کل رای دهندگان است. معیار آماری برای مقایسه فرکانس‌ها (اشتراک‌ها، نسبت‌ها...) در ماژول آمار و جداول پایه در گفتگوی سایر معیارهای اهمیت پیاده‌سازی می‌شود.


آزمون تی برای نمونه های مستقل

آزمون t متداول ترین روشی است که برای تشخیص تفاوت میانگین دو نمونه استفاده می شود. یک بار دیگر به شما یادآوری می کنیم که متغیرها باید در مقیاس نسبتاً غنی، به عنوان مثال، کمی اندازه گیری شوند.

البته استفاده از آزمون t هر چند بسیار ضعیف محدودیت هایی دارد.

در تئوری، آزمون t می تواند مورد استفاده قرار گیرد حتی اگر حجم نمونه بسیار کوچک باشد (به عنوان مثال، 10؛ برخی از محققان استدلال می کنند که نمونه های کوچکتر قابل بررسی هستند) و اگر متغیرها به طور نرمال توزیع شده باشند (در گروه ها) و واریانس های مشاهدات درون گروه ها خیلی متفاوت نیست. مشخص شده است که آزمون t در برابر انحراف از نرمال بودن مقاوم است.

فرض نرمال بودن را می توان با بررسی توزیع (مثلاً به صورت بصری با استفاده از هیستوگرام) یا با استفاده از تست نرمال بودن آزمایش کرد. لازم به ذکر است که آزمایش مؤثر فرضیه نرمال بودن برای حجم کافی از داده ها امکان پذیر است (به اظهارات فیشر در مورد آزمایش نرمال بودن، که در فصل مفاهیم اولیه تجزیه و تحلیل داده ها اشاره کردیم، مراجعه کنید).

لازم است به تفاوت واریانس گروه های مقایسه شده با دقت بیشتری نزدیک شود. برابری واریانس ها در دو گروه و این یکی از مفروضات است F-test، با استفاده از آن قابل بررسی است آزمون F (که در جدول خروجی موجود است آزمون t در STATISTICA). همچنین می توانید از معیار Levene پایدارتر استفاده کنید.

هنگام مقایسه میانگین ها، مانند همیشه در تجزیه و تحلیل داده ها، آنها بسیار مفید هستند. روش های بصری. به عنوان مثال، نمودار محدوده طبقه بندی شده زیر تفاوت معنی داری را در میانگین برای مردان و زنان نشان می دهد. در نمودار، نقطه ها مقادیر میانگین و همچنین انحرافات استاندارد (مستطیل ها) و خطاهای استاندارد(قطعات خط مستقیم)، به طور جداگانه برای مردان و زنان محاسبه می شود.


نمودار تفاوت واریانس ها را در گروه ها نشان می دهد - ارتفاع مستطیل زن بیشتر از ارتفاع مستطیل MALE است.

در صورتی که شرایط قابل اجرا باشد آزمون‌های t برآورده نمی‌شوند، تفاوت بین دو گروه داده را می‌توان با استفاده از یک جایگزین ناپارامتریک مناسب برای آزمون t ارزیابی کرد (برای بحث در مورد استفاده از روش‌های جایگزین به بخش آمار ناپارامتریک مراجعه کنید).

سطح P اهمیت یک آزمون f برابر است با احتمال رد کاذب این فرضیه که تفاوتی بین میانگین نمونه در زمانی که درست است (یعنی زمانی که میانگین ها واقعاً برابر هستند) وجود ندارد.

برخی از محققان پیشنهاد می کنند که در مواردی که تفاوت ها فقط در یک جهت در نظر گرفته می شود (مثلاً متغیر X در گروه اول بزرگتر (کوچکتر) از گروه دوم است)، توزیع t یک طرفه را در نظر بگیرید و نتیجه را برای تقسیم کنید. آزمون t دو طرفه سطح p به نصف برخی دیگر پیشنهاد می کنند همیشه با آزمون t-test استاندارد دو دنباله کار کنید.

برای اعمال آزمون t برای نمونه های مستقل، شما نیاز دارید حداقلیک متغیر مستقل (گروه‌بندی) و یک متغیر وابسته (مثلاً مقدار آزمایشی برخی از شاخص‌ها که در دو گروه مقایسه می‌شود).

ابتدا با استفاده از مقادیر متغیر گروه بندی، به عنوان مثال، مرد و زن اگر متغیر گروه بندی جنسیت باشد، یا دارای مدرک دانشگاهی و بدون مدرک دانشگاهی، اگر متغیر گروه بندی تحصیلات باشد، داده ها به دو گروه تقسیم می شوند. سپس میانگین متغیر وابسته مانند فشار خون یا درآمد برای هر گروه محاسبه می شود. این میانگین های نمونه با یکدیگر مقایسه می شوند.

البته هنگام استفاده آزمون t مانند هر آزمون دیگری در تجزیه و تحلیل داده ها نیاز به عقل سلیم دارد. کاربرد اگر مقادیر دو متغیر قابل مقایسه نباشند، توجیه کمی برای آزمون t وجود دارد. به عنوان مثال، اگر شما در حال مقایسه میانگین مقداری در نمونه ای از بیماران قبل و بعد از درمان هستید، اما از روش های محاسباتی متفاوت استفاده می کنید.

شاخص کمی یا واحدهای دیگر در بعد دوم، سپس مقادیر بسیار معنی‌دار t-test را می‌توان با تغییر واحدهای اندازه‌گیری مصنوعی به‌دست آورد. به همین ترتیب، مقایسه درآمد به روبل با کاهش ارزش چند برابر یا تورم بالا معنی ندارد.

بخش بعدی فرمول هایی را برای محاسبه آمار آزمون t Student برای آزمایش برابری میانگین دو نمونه ارائه می دهد. اگر فقط علاقه مند هستید استفاده عملی، می توانید از این بخش صرف نظر کنید.

تعریف رسمی آزمون t

به طور رسمی، در مورد دو گروه (k = 2) آمار آزمون t به شکل زیر است:

که در آن x¯ 1 (n 1)m x¯ 2 (n2) میانگین نمونه نمونه های اول و دوم است، s ~ 2 برآورد واریانس است که از تخمین های واریانس برای هر گروه از داده ها تشکیل شده است:

اگر فرضیه: "میانگین ها در دو گروه برابر است" درست باشد، آمار t^(n 1 +n 2 -2) دارای توزیع دانشجویی با (n 1 +n 2 -2) درجه آزادی است (نگاه کنید به، برای مثال، انتشارات مرجع Ayvazyan S A., Enyukov I. S., Meshalkin L. D., Applied Statistics., M.: Finance and Statistics, 1983. P. 395-397).

مقادیر مطلق بزرگ آمار t^(n 1 + n 2 - 2) بر خلاف فرضیه برابری مقادیر متوسط ​​گواهی می دهد.

با استفاده از ماشین حساب احتمال STATISTICA، نقطه 100a/2% توزیع Student را با درجه آزادی (n 1 + n 2 - 2) خواهیم یافت.

اجازه دهید نقطه پیدا شده را با × نشان دهیم

اگر | t^(n 1 +n 2 -2)| > t(a /2)، سپس این فرضیه رد می شود.

توجه داشته باشید که مقادیر مطلق بزرگ آماره t دانشجویی t^(n 1 + n 2 -2) می تواند هم به دلیل تفاوت معنی دار در میانگین ها و هم به دلیل تفاوت معنی دار در واریانس های گروه های مقایسه شده ایجاد شود.

آزمون آماری برای برابری یا همگنی واریانس دو نمونه نرمال بر اساس آماره زیر است:

که تحت این فرضیه: "واریانس ها در دو گروه برابر است" دارای توزیع F(n 1 -1، n 2 -1) است.

بیایید سطح اهمیت a را تنظیم کنیم.

با استفاده از یک ماشین حساب احتمال، 100 (1 - a/2)٪ و 100 (a/2)٪ از نقطه توزیع F (n 1 -1، n 2 -1) را محاسبه می کنیم.

اگر F 1-a/2 (n 1 -1، n 2 -1)< F(n 1 -1, n 2 -1) < F a/2 (n 1 -1, n 2 -1), то гипотеза об однородности дисперсии не отвергается.

آزمون تی برای نمونه های وابسته

میزان تفاوت میانگین دو گروه به تنوع درون گروهی (واریانس) متغیرها بستگی دارد.

بسته به اینکه چقدر این مقادیر برای هر گروه متفاوت است، "تفاوت خام" بین میانگین های گروه نشان دهنده یک رابطه قوی تر یا ضعیف تر بین متغیرهای مستقل (گروه بندی) و وابسته است.

برای مثال، اگر در یک مطالعه، میانگین WCC (تعداد گلبول‌های سفید خون) 102 برای مردان و 104 برای زنان بود، در این صورت تفاوت تنها 2 بین میانگین‌های درون گروهی بسیار مهم خواهد بود اگر مقادیر WCC همه مردان بین 101 و 103. و تمام مقادیر WCC برای زنان در محدوده 103-105 است. سپس می توان WCC (مقدار متغیر وابسته) را به خوبی از روی جنسیت موضوع (متغیر مستقل) پیش بینی کرد. با این حال، اگر همان تفاوت 2 از داده های بسیار پراکنده به دست آید (به عنوان مثال، از 0 تا 200 متغیر است)، آنگاه می توان تفاوت را کاملاً نادیده گرفت.

بنابراین، واضح است که کاهش تنوع درون گروهی، حساسیت معیار را افزایش می‌دهد.

تست T برای نمونه‌های وابسته زمانی سودمند است که یک منبع مهم تغییرات درون گروهی (یا خطا) را بتوان به راحتی شناسایی کرد و از تجزیه و تحلیل حذف کرد. به ویژه، این امر در مورد آزمایش‌هایی اعمال می‌شود که در آن دو گروه مشاهدات مورد مقایسه بر اساس یک نمونه مشاهدات (موضوع) هستند که دو بار آزمایش شده‌اند (مثلاً بیماران قبل و بعد از درمان).

در چنین آزمایشاتی، بخش قابل توجهی از تنوع درون گروهی (تغییر) در هر دو گروه را می توان با تفاوت های فردی بین افراد توضیح داد. توجه داشته باشید که در واقعیت این وضعیت با وضعیتی که گروه‌های مورد مقایسه کاملاً مستقل هستند تفاوت چندانی ندارد (آزمون t را برای نمونه‌های مستقل ببینید)، که در آن تفاوت‌های فردی نیز به واریانس خطا کمک می‌کنند. با این حال، در مورد نمونه‌های مستقل، هیچ کاری نمی‌توانید در این مورد انجام دهید، زیرا نمی‌توانید بخشی از تغییرات مرتبط با تفاوت‌های فردی بین افراد را شناسایی کنید (یا «حذف» کنید). اگر همان نمونه دو بار آزمایش شود، این بخش از تغییرات را می توان به راحتی حذف کرد.

به جای بررسی جداگانه هر گروه و تجزیه و تحلیل مقادیر خام، می توان به سادگی به تفاوت بین دو معیار (مثلاً پیش آزمون و پس آزمون) برای هر موضوع نگاه کرد. با کم کردن مقادیر اول از دوم (برای هر موضوع) و سپس تجزیه و تحلیل فقط این "تفاوت های خالص (دو به دو)"، بخشی از تغییرات ناشی از تفاوت در سطوح اولیه افراد را حذف خواهید کرد.

در مقایسه با آزمون t برای نمونه‌های مستقل، این رویکرد همیشه نتیجه "بهتر" می‌دهد، زیرا این معیار حساس‌تر می‌شود.

مفروضات نظری آزمون I برای نمونه های مستقل در مورد آزمون نمونه های وابسته نیز صدق می کند. این بدان معنی است که تفاوت های زوجی باید به طور معمول توزیع شوند. اگر این درست نیست، می توانید از یکی از آزمون های ناپارامتریک جایگزین استفاده کنید (به بخش آمار ناپارامتریک مراجعه کنید).

در سیستم STATISTICA، آزمون ^ برای نمونه های وابسته را می توان برای لیستی از متغیرها محاسبه کرد و سپس به عنوان یک ماتریس مشاهده کرد. داده های از دست رفته به صورت جفتی یا سطر به ردیف پردازش می شوند.

در این مورد، نتایج قابل توجهی ممکن است "صرفاً به طور تصادفی" ایجاد شود. اگر آزمایش‌های مستقل زیادی دارید، «به طور کاملاً تصادفی» ممکن است یک یا چند آزمایش را پیدا کنید که نتایج آنها قابل توجه است.

همانطور که قبلا ذکر شد، مقایسه میانگین ها در بیش از دو گروه با استفاده از تحلیل واریانس (مخفف انگلیسی - ANOVA) انجام می شود.

اگر بیش از دو "نمونه وابسته" وجود داشته باشد (به عنوان مثال، قبل از درمان، پس از درمان-1 و پس از درمان-2)، آنگاه می توان از ANOVA اندازه گیری های مکرر استفاده کرد. اقدامات مکرر در ANOVA را می توان به عنوان تعمیم آزمون f برای نمونه های وابسته برای افزایش حساسیت آنالیز در نظر گرفت.

به عنوان مثال، تجزیه و تحلیل واریانس به شما این امکان را می دهد که نه تنها سطح پایه متغیر وابسته، بلکه عوامل دیگر را نیز به طور همزمان کنترل کنید و بیش از یک متغیر وابسته را در طرح آزمایشی بگنجانید.

تکنیک زیر از ترکیب نتایج چند آزمون t جالب است. این تکنیک همچنین می تواند برای ترکیب نتایج سایر معیارها مورد استفاده قرار گیرد (نگاه کنید به: Handbook of Applied Statistics / Edited by E. Lloyd and W. Lederman, vol. 1. M.: Finance and Statistics, 1989. P. 274). این مثال برای ما نیز جالب است زیرا می‌توانیم قابلیت‌های جدید STATISTICA را نشان دهیم.

مثال 1

فرض کنید با استفاده از آزمایش های مستقل، سطوح معنی داری a(1)، a(2) ... a(m) را به دست آورده اید. بیایید فرض کنیم این سطوح به اندازه کافی قانع کننده نیستند. اگر سطوح معنی‌داری قطعی نباشد، ممکن است منطقی باشد که داده‌ها را ترکیب کرده و آنها را به عنوان نتیجه یک آزمایش کامل در نظر بگیریم.

بر اساس فرضیه صفر، سطوح معناداری که به عنوان متغیرهای تصادفی در نظر گرفته می شوند، به طور یکنواخت توزیع می شوند. بنابراین، ارزش

L = -2× (Ln(a(l)) + Ln(a(2)) + ... + Ln(a(m))

دارای توزیع کای دو با درجه آزادی 2 متر است.

به عنوان مثال، اگر در آزمایش های مقاومت بتن سطوح قانع کننده ناکافی 0.047، 0.054، 0.042 به دست آمد، سطح معنی داری آزمایش ترکیبی 0.005547 است و فرضیه ناکارآمدی افزودنی به وضوح رد می شود.

برای درک این موضوع از ابزارهای سیستم STATISTICA استفاده خواهیم کرد. ابتدا بیایید مقدار L را برای مثال با تنظیم یک فرمول در یک صفحه گسترده محاسبه کنیم.

یک فایل ایجاد کنید و ورودی زیر را در خط اول وارد کنید:

متغیر var7 حاوی مقدار L است که با فرمول محاسبه می شود.


سپس ماشین حساب احتمال STATISTICA را باز کرده و توزیع خی دو را در آن انتخاب کرده و تعداد درجه آزادی b را وارد کرده و در قسمت کای دو مقدار 18.29 را وارد کنید.


در نتیجه در میدان آرما 0.005547 گرفتیم.

بنابراین، سطح معنی‌داری ترکیبی از سه آزمون t بدست می‌آید (مقایسه کنید با نتایج ارائه شده در کتابچه راهنمای آمار کاربردی، ویرایش شده توسط E. Lloyd و W. Lederman، جلد 1. M.: Finance and Statistics، 1989. ص 275). این به وضوح سطح بالایی از اهمیت دارد، بنابراین فرضیه صفر رد می شود.

مثال 2

در اینجا ما با فایل intemet2000.sta کار خواهیم کرد. همچنین می توانید از فایل ad.study.sta از پوشه Examples استفاده کنید.

فایل intemet2000.sta حاوی نتایج یک نظرسنجی از چندین کاربر در مورد درک آنها از سایت های ENNUI و POURRITURE است.

این نوع داده ها با استفاده از اینترنت آسان است. به عنوان مثال می توانید یک پرسشنامه در وب سایت خود ارسال کنید که بازدیدکنندگان آن را پر کنند.

در این نمونه مدل، کاربران به سایت‌ها در مقیاس‌های مختلف (کامل بودن، ساخت‌پذیری راه‌حل، محتوای اطلاعاتی، طراحی و غیره) امتیاز دادند.

یک سوال جالب: آیا درک مردان و زنان از وب سایت ها متفاوت است؟

مردان ممکن است در برخی از مقیاس ها امتیاز بالاتر یا کمتری نسبت به زنان داشته باشند.

برای حل این مشکل می توانید از آزمون t برای نمونه های مستقل استفاده کنید. متغیر گروه بندی جنسیت داده ها را به دو گروه تقسیم می کند. نمونه های مردان و زنان با توجه به میانگین نمرات آنها در هر مقیاس مقایسه خواهد شد. به سکوی پرتاب برگردید و روی روش تست نمونه مستقل t-test کلیک کنید تا کادر محاوره ای T باز شود -معیار نمونه های مستقل (گروه ها).


روی دکمه کلیک کنید متغیرهابرای باز کردن گفتگوی انتخاب متغیر استاندارد. در اینجا می توانید متغیرهای مستقل (گروه بندی) و متغیرهای وابسته را انتخاب کنید.

برای مثال ما، متغیر GENDER را به عنوان متغیر مستقل و متغیرهای 3 تا 25 (شامل پاسخ ها) را به عنوان متغیرهای وابسته انتخاب کنید.


کلیک خوبدر این کادر محاوره ای برای بازگشت به کادر محاوره ای که انتخاب شما در آن نمایش داده می شود.


از کادر محاوره ای آزمون تی برای نمونه های مستقل (گروهی)همچنین بسیاری از درمان های دیگر در دسترس هستند.

کلیک خوببرای نمایش جدول نتایج


بیشترین به روشی سریعکلید بررسی جدول این است که به ستون پنجم (شامل سطوح p) نگاه کنید و تعیین کنید که کدام مقادیر p کمتر از سطح معناداری تعیین شده 0.05 است.

برای اکثر متغیرهای وابسته، میانگین برای دو گروه (مرد - مرد و زن - زن) بسیار نزدیک است.

تنها متغیری که برای آن آزمون f سطح معناداری تعیین شده 0.05 را برآورده می کند، اندازه گیری 7 است که سطح p برای آن 0.0087 است. همانطور که ستون های حاوی مقادیر متوسط ​​نشان می دهند (دو ستون اول را ببینید)، برای مردان این متغیر به طور متوسط ​​مقادیر قابل توجهی بزرگ تری می گیرد - در مقیاس اندازه گیری انتخاب شده برای مردان برابر با 5.46 و برای زنان - 3.63 است. در عین حال، ما نمی‌توانیم این احتمال را که تفاوت مشاهده‌شده در واقع وجود نداشته باشد و فقط نتیجه یک تصادف تصادفی باشد را رد کنیم، اگرچه این بعید به نظر می‌رسد.

نمودار پیش فرض برای این جداول نتایج یک نمودار محدوده است. برای رسم این نمودار، در هر نقطه از ردیف مربوط به متغیر وابسته (مثلاً میانگین اندازه گیری 7) راست کلیک کنید.

در منوی زمینه که باز می شود، نمودار را انتخاب کنید نمودار محدودهاز زیر منو نمودارهای آماری سریع. بعد، گزینه را انتخاب کنید میانگین / خطای استاندارد / انحراف استاندارد. پنجره نمودار محدودهو فشار دهید خوببرای ساخت یک نمودار

تفاوت در میانگین در نمودار مهم تر به نظر می رسد و نمی توان آن را صرفاً بر اساس متغیر بودن داده های اصلی توضیح داد.

با این حال، تفاوت غیرمنتظره دیگری در نمودار قابل توجه است. واریانس برای گروه زنان بسیار بزرگتر از واریانس برای گروه مردان است (به کادرهایی که انحراف معیار برابر با جذر واریانس را نشان می دهند نگاه کنید).

اگر واریانس ها در دو گروه تفاوت معنی داری داشته باشند، یکی از الزامات استفاده از آزمون r نقض می شود و تفاوت میانگین ها باید به طور ویژه مورد توجه قرار گیرد.

علاوه بر این، واریانس معمولاً با میانگین همبستگی دارد، یعنی هر چه میانگین بزرگتر باشد، واریانس بزرگتر است.


اما در این مورد چیزی برعکس مشاهده می شود. در چنین شرایطی، یک محقق با تجربه پیشنهاد می کند که توزیع متغیر Measur 7 ممکن است نرمال نباشد (برای مردان، زنان یا هر دو).

بنابراین، برای بررسی اینکه آیا تفاوت مشاهده شده در نمودار واقعاً شایسته توجه است یا خیر، معیار تفاوت واریانس ها را در نظر می گیریم.

بیایید به جدول نتایج برگردیم و به سمت راست اسکرول کنیم، نتایج آزمون F را خواهیم دید. مقدار آزمون F در واقع با سطح معناداری مشخص شده 0.05 مطابقت دارد، که به معنی تفاوت معنی داری در واریانس های متغیر Measur 7 در گروه مردان - مردان و زنان - زنان است.

با این حال، معنی‌داری تفاوت مشاهده‌شده در واریانس‌ها به سطح حاشیه‌ای معنی‌داری نزدیک است (سطح p آن 029/0 است).


اکثر محققان این واقعیت را به تنهایی برای باطل کردن آزمون t برای تفاوت میانگین کافی نمی دانند، که سطح بالایی از اهمیت را برای این تفاوت می دهد (0087/0 - p).

مقایسه های متعدد

هنگام مقایسه میانگین ها در سه یا چند گروه، می توان از روش های مقایسه چندگانه استفاده کرد. اصطلاح مقایسه های چندگانه به سادگی به معنای مقایسه های متعدد است.

مشکل این است: ما n> 2 گروه مستقل از داده ها داریم و می خواهیم میانگین آنها را به روشی معقول مقایسه کنیم. فرض کنید از آزمون F استفاده کردیم و این فرضیه را رد کردیم: «میانگین همه گروه‌ها برابر هستند». میل طبیعی ما یافتن گروه های همگنی است که میانگین آنها با یکدیگر برابر باشد.

البته می توان با استفاده از آزمون t گروه ها را با هم مقایسه کرد و از طریق مقایسه های متعدد، گروه های مشابه را یافت. اما معلوم می شود که محاسبه خطای رویه انجام شده یا به قول آنها آزمون ترکیبی با شروع از سطح معنی داری مشخص شده هر آزمون t دشوار است.

بخش مشکل این است که وقتی بسیاری از گروه ها را با استفاده از آزمون t مقایسه می کنید، ممکن است یک اثر کاملاً تصادفی پیدا کنید. تصور کنید که شما آزمایشی از یک داروی جدید در 1000 کلینیک انجام داده اید و در هر کلینیک گروهی از بیمارانی که دارو مصرف می کنند با گروهی از بیمارانی که دارونما مصرف می کنند، مقایسه می کنید. البته، به طور کاملاً تصادفی ممکن است کلینیکی وجود داشته باشد که در آن اثر را پیدا کنید. با این حال، با احتمال زیاد، این ممکن است یک اثر هنری باشد.

برای محافظت از خود در برابر این نوع حوادث، معیارهای خاصی برای مقایسه های متعدد یا چندگانه استفاده می شود.

در سیستم STATISTICA، روش های مقایسه چندگانه در ماژول پیاده سازی شده است آمار و جداول پایهدر گفتگو


شرحی از روش‌های مقایسه چندگانه را می‌توان یافت، برای مثال، در کتاب: کندیال ام جی و استوارت ای. استنتاج و روابط آماری. م.: ناوکا، 1973. صص 71-79.

توجه داشته باشید که رایج ترین روش ها برای مقایسه چند گروه در ماژول آنالیز واریانس عمومی پیاده سازی شده است.

ANOVA یک طرفه را می توان در ماژول انجام داد آمار و جداول پایه


تحلیل واریانس یک طرفه و مقایسات تعقیبی میانگین ها

بنابراین، اگر می‌خواهید با مطالعه تفاوت‌های بین چند گروه به جلو بروید، تجزیه و تحلیل بیشتر باید در گروه‌بندی گفتگو و تحلیل واریانس یک‌طرفه (ANOVA) انجام شود. ما با داده هایی کار می کنیم که در فایل adstudy.sta (پوشه Examples) قرار دارند.

با تنظیمات زیر با ما همراه باشید.

ابتدا گروه بندی و متغیرهای وابسته در فایل داده را به صورت استاندارد انتخاب کنید.

سپس کدهای گروه بندی متغیرها را انتخاب کنید. با استفاده از این کدها مشاهدات موجود در فایل به چند گروه تقسیم می شوند که به مقایسه آنها می پردازیم.


پس از انتخاب متغیرهای تجزیه و تحلیل و تعریف کدهای متغیر گروه بندی، کلیک کنید خوبو مراحل محاسباتی را شروع کنید.

در پنجره ای که ظاهر می شود، می توانید نتایج تجزیه و تحلیل را با جزئیات مشاهده کنید.


با دقت به کادر محاوره ای نگاه کنید. نتایج را می توان در قالب جداول و نمودار نمایش داد. برای مثال، می‌توانید اهمیت تفاوت‌ها در ابزارها را با استفاده از روش آزمایش کنید تحلیل واریانس.

روی دکمه کلیک کنید تحلیل واریانس، و نتایج ANOVA یک طرفه را برای هر متغیر وابسته خواهید دید.


لطفاً توجه داشته باشید که در جدول تحلیل واریانس ما قبلاً با آزمون F سروکار داریم.

همانطور که از نتایج به دست می آید، برای متغیرهای Measur 5، Measur 7 و Measur 9 روش تحلیل واریانس یک طرفهنتایج آماری معنی داری در سطح p به دست آورد<0,05.

این نتایج نشان می دهد که تفاوت میانگین ها معنی دار است. بنابراین، با استفاده از آزمون F (این معیار، آزمون t را به تعدادی از گروه های بزرگتر از دو تعمیم می دهد)، فرضیه همگن بودن گروه های مورد مقایسه را رد می کنیم.

به گفتگوی نتایج بازگردید و روی دکمه کلیک کنید مقایسات پست هوک میانگین هابه منظور ارزیابی اهمیت تفاوت بین میانگین گروه های خاص. اولین قدم انتخاب متغیر وابسته است. در این مثال متغیر Measur 7 را انتخاب می کنیم.

بعد از اینکه کلیک کردید خوبدر پنجره انتخاب متغیر، کادر محاوره ای روی صفحه ظاهر می شود مقایسات پست هوک میانگین ها


در این پنجره می توانید چندین معیار پسین را انتخاب کنید.

اجازه دهید، برای مثال، آزمون کمترین تفاوت معنی‌دار (LSD) را انتخاب کنیم.

آزمون ISR معادل آزمون t نمونه های مستقل است که بر اساس N گروه مقایسه شده است.

یک آزمون t-test نمونه های مستقل نشان می دهد (بر روی STATISTIC A! بررسی کنید) که تفاوت معنی داری بین پاسخ های MALES و پاسخ های FEMALES برای متغیر Measur 7 وجود دارد.


با استفاده از رویه گروه بندی و ANOVA یک طرفه،می بینیم (جدول نتایج را ببینید) که تفاوت معنی داری در میانگین فقط برای افرادی که SOKE را انتخاب کرده اند وجود دارد.

نمایش گرافیکی نتایج. تفاوت در میانگین ها را می توان در نمودارهای موجود در کادر محاوره ای مشاهده کرد آمار توصیفی و همبستگی درون کلاسی - نتایج.

به عنوان مثال، برای مقایسه توزیع متغیرهای انتخاب شده در گروه ها، روی دکمه Categorized Range Plots کلیک کنید و گزینه را انتخاب کنید. میانه / کوارت / برداز کادر محاوره ای نمودار محدوده.

بعد از اینکه کلیک کردید خوب,STATISTICA آبشاری از نمودارهای محدوده تولید می کند.


نمودار نشان می دهد که تفاوت واضحی بین گروه FEMALE - SOKE و گروه MALE - SOKE وجود دارد.

این نوع تجزیه و تحلیل با گروه بندی پیچیده تر و مقایسه میانگین ها در گروه های حاصل، به ویژه اغلب در نظرسنجی های انبوه، می تواند با موفقیت در STATISTICA انجام شود.

آشنایی با ارزشاست یکی از وظایف تربیت حسی و ذهنی استکودکان پیش دبستانی

در روند زندگی روزمره، خارج از آموزش خاصفرزندان به روش های اندازه گیری پذیرفته شده عمومی تسلط نداشته باشید، آنها فقط با درجه موفقیت کم یا زیاد سعی می کنند از اعمال بیرونی بزرگترها کپی کنند، اغلب بدون اینکه در معنا و محتوای آنها تحقیق کنند.

بر اساس ویژگی های ایده های کودکان در مورد اندازه اشیاء، کار آموزشی در یک توالی مشخص ساخته می شود.

در آغازدر حال شکل گیری است ایده اندازه به عنوان ویژگی فضایی یک شی.به کودکان آموزش داده می شود که این علامت را در کنار دیگران شناسایی کنند، با استفاده از تکنیک های ویژه معاینه: کاربرد و پوشش.

عملا مقایسه کردن(مقایسه) اشیاء متضاد و هم اندازه، بچه ها ایجاد روابط "برابری - نابرابری".

مقایسهعملیات ایجاد شباهت و تفاوت بین اشیاء و پدیده های دنیای واقعی نامیده می شود.

نتایج مقایسه در گفتار منعکس می شوداستفاده از صفت: طولانی تر، کوتاه تر، یکسان(از نظر طول مساوی) گسترده تر، باریک تر، یکسان(از نظر عرض برابر است) بالاتر، پایین تر، یکسان(از نظر قد مساوی) بیشتر، کمتر، یکسان(در اندازه برابر) و غیره. بنابراین، در ابتدا فقط مقایسه زوجی اشیا برای یک ویژگی ارائه می شود.

بر این اساس ادامه دارد کار بیشتر، که در طی آن کودکان در هنگام مقایسه چندین شیء آموزش داده می شوداز یکی از آنها استفاده کنید به عنوان یک مدل

کاربرد و روش های پوششدرخواست دادن برای تدوین یک سری سفارشی (سریال).بعد بچه ها یاد می گیرند آن را طبق قانون ایجاد کنید. چیدمان اشیاء (3-5 قطعه) به ترتیب صعودی یا نزولی بر اساس طول، عرض، ارتفاع و سایر ویژگی ها، آنها این را در گفتار منعکس می کنند: وسیع ترین، باریک ترین، باریک ترین، باریک ترینو غیره.

وظیفه پیگیری - توانایی ساخت یک سری اشیاء را تثبیت می کندبا طول، عرض، ارتفاع و سایر ویژگی ها، به درستی این را در گفتار منعکس می کند، چشم کودکان را رشد می دهد، به آنها یاد می دهد اندازه اشیاء مختلف را با چشم تعیین کنند، آنها را با اندازه اشیاء شناخته شده مقایسه کنند و همچنین با استفاده از یک معیار معمولی.



بدین ترتیب،

- در جوانی و میانیکودکان پیش دبستانی تعیین می کنند اندازه اشیا با مقایسه مستقیم آنها(برنامه ها یا پوشش ها)؛

در قدیمی تر - اعمال می شود و روش مقایسه غیر مستقیم(ارزیابی اندازه اشیاء درک شده در مقایسه با موارد شناخته شده ای که قبلاً در تجربه کودک با آن مواجه شده اند، اندازه گیری با یک معیار معمولی).

اندازه گیریشامل می شود دو عملیات منطقی:

اولی است فرآیند جداسازی، که به کودک اجازه می دهد بفهمد که کل را می توان به قطعات تقسیم کرد.

دومی است عملیات تعویض، متشکل از اتصال قطعات جداگانه.

جوهر اندازه گیریشامل تقسیم کمی اشیاء اندازه گیری شده و تعیین ارزش یک شی معین در رابطه با معیار اتخاذ شده است. از طریق عملیات اندازه گیری، یک رابطه عددی بین کمیت اندازه گیری شده و یک واحد اندازه گیری، مقیاس یا استاندارد از پیش انتخاب شده برقرار می شود.

فعالیت اندازه گیری بسیار پیچیده است. نیازمند مهارت های خاص، آشنایی با سیستم اندازه گیری ها و استفاده از ابزار اندازه گیری است. استفاده از اقدامات مشروطمیکند اندازه گیری در دسترس برای کودکان. اصطلاح "اندازه گیری با استانداردهای متعارف" به معنای توانایی استفاده از ابزار اندازه گیری است.

در مهدکودک بچه ها استاد می شوند چندین نوع اندازه گیری با استانداردهای متعارف.

به نمای اولباید نسبت داده شود اندازه گیری خطیهنگامی که کودکان با استفاده از نوارهای کاغذ، چوب، طناب، پله ها و سایر اقدامات معمولی، اندازه گیری طول، عرض، ارتفاع اشیاء مختلف را یاد می گیرند.

نوع دوم اندازه گیری - تعیین با استفاده از یک اندازه گیری معمولی حجم جامدات حجیم: کودکان یاد می گیرند که از لیوان، لیوان، قاشق و سایر ظروف برای اندازه گیری میزان غلات و شکر دانه ریز در کیسه استفاده کنند.

نوع سوم- این یک اندازه گیری مایعات با یک اندازه گیری معمولی است تا بفهمید چند لیوان آب در دکانتر و غیره وجود دارد.

کاربرد اندازه گیری هامی دهد دقت روابط ایجاد شده در طول فرآیند اندازه گیری"برابری - نابرابری"، "جزئی - کل"، به ما امکان می دهد تا ویژگی های آنها را به طور کامل و عمیق تر شناسایی کنیم.

بنابراین، در یک مؤسسه آموزشی پیش دبستانی، اندازه گیری فعالیت ها ماهیت ابتدایی و ترویجی دارد. کودک ابتدا یاد می گیرد که اشیاء را با استانداردهای معمولی اندازه گیری کند و تنها در نتیجه این پیش نیازها برای تسلط بر اندازه گیری "واقعی" ایجاد می شود.

جهت گیری کودکان در اندازه اشیا تا حد زیادی استمشخص چشم سنج- مهمترین توانایی حسی. رشد چشم ارتباط مستقیمی با تسلط بر روش های خاص مقایسه اشیاء دارد. در ابتدا، کودکان اجسام را بر اساس طول، عرض، ارتفاع با کاربرد و کاربرد عملی و سپس بر اساس اندازه گیری مقایسه می کنند. چشم، همانطور که بود، اعمال عملی دست را تعمیم می دهد.

در گروه میانیتوجه زیادی می شود رشد چشم. به کودکان "وظایفی داده می شود که از چهار یا پنج شی نمونه ای را بیابند که از نظر اندازه با یک نمونه یا بزرگتر، کوچکتر است (طول یکسان، پیدا کردن طولانی تر، کوتاه تر، و غیره). برای تکمیل تمام وظایف ارائه شده در برنامه گروه میانی، باید حداقل 10-12 درس را انجام دهید.

دانش و مهارت های کسب شده در چنین کلاس هایی ضروری است به طور سیستماتیک تحکیم و در سایر فعالیت ها اعمال شود:

مقایسه اندازه قسمت های مختلف گیاهان،

· نوارهایی با اندازه های مورد نیاز برای تعمیر کتاب انتخاب کنید،

· نقاشی، مجسمه سازی اشیاء با اندازه های مناسب،

· مشاهده کنید که چگونه ابعاد یک خانه در حال ساخت تغییر می کند و غیره.

توجه زیادی به رشد چشم در کودکان می شود. بر اساس تسلط بر تکنیک‌های مقایسه مستقیم اندازه اشیاء (ابر قرار دادن، اعمال، اندازه‌گیری با استفاده از معیار)، کودکان یاد می‌گیرند مسائلی را حل کنند که به اقدامات بصری پیچیده‌تر نیاز دارند.

پیش دبستانی های ارشدانجام دادن پیچیده تر از گروه متوسط، وظایف برای رشد چشم:

· با چشم اشیاء بزرگتر یا کوچکتر از نمونه را پیدا کنید.

· دو شی را طوری انتخاب کنید که با هم برابر نمونه و غیره باشند.

منطقه ای که در آن اشیاء با اندازه مورد نیاز جستجو می شوند به تدریج گسترش می یابد.

اشیاء مختلف می توانند به عنوان نمونه عمل کنند. در عین حال می توان از همان نمونه برای مقایسه اشیاء در طول، عرض و ... استفاده کرد. کودکان هر بار با استفاده از تکنیک کاربرد (نزدیک) یا اندازه گیری با معیار صحت راه حل مشکل چشم را بررسی می کنند. وظایف مشابهی را می توان برای کودکان در انواع مختلف فعالیت ها تعیین کرد.

در روند آموزش کودکان در ساخت یک سری سفارشی، معلم یک قاعده را معرفی می کند: غیرممکن است که اشیاء را بچسبانید یا مرتب کنید. کودکان هر عنصر بعدی را در میان عناصر باقی مانده با چشم پیدا می کنند.

قابل ارائه است و کارهای پیچیده تر. به عنوان مثال، 2 شی را با چشم انتخاب کنید و سومی را از آنها به اندازه نمونه بسازید. یک مکاتبه بین چندین (2-3) ردیف از اشیاء، به ترتیب اندازه، برقرار کنید.

این کار نه آنقدر در کلاس های ریاضی که در ساعات بازی نیاز به توجه دارد. خارج از کلاس، آنها از بازی های آموزشی "تخته ها را تا کنید"، "آنها را مرتب کنید"، "کدام جعبه؟"، "اولین کسی است؟" استفاده می کنند. (نویسنده T. G. Vasilyeva).

یادداشت‌های قبلی روش‌هایی را برای آزمایش فرضیه‌های مربوط به داده‌های عددی و دسته‌بندی شرح داده‌اند: , چندین و همچنین، به شما امکان می‌دهد یک یا . در این یادداشت، روش‌هایی را برای آزمون فرضیه‌های مربوط به تفاوت‌های بین سهم یک صفت در جمعیت‌های عمومی بر اساس چندین نمونه مستقل در نظر خواهیم گرفت.

برای نشان دادن روش های مورد استفاده، از سناریویی برای ارزیابی رضایت مهمانان هتل استفاده شده است. متعلق به شرکتاملاک ریزورت تی اس. تصور کنید که مدیر شرکتی هستید که دارای پنج هتل واقع در دو جزیره تفریحی است. اگر مهمانان از خدمات راضی باشند، احتمال زیادی وجود دارد که سال آینده بازگردند و به دوستان خود توصیه کنند در هتل شما اقامت کنند. برای ارزیابی کیفیت خدمات، از مهمانان خواسته می شود تا پرسشنامه ای را پر کنند و نشان دهند که آیا از مهمان نوازی راضی هستند یا خیر. شما باید داده های نظرسنجی را تجزیه و تحلیل کنید تا رضایت کلی مهمانان را تعیین کنید، احتمال بازگشت مهمانان در سال آینده را تخمین بزنید و دلایل نارضایتی احتمالی برخی از مشتریان را مشخص کنید. به عنوان مثال، در یکی از جزایر، این شرکت مالک هتل های Beachcomber و Windsurfer است. آیا خدمات در این هتل ها یکسان است؟ اگر نه، چگونه می توان از این اطلاعات برای بهبود عملکرد شرکت استفاده کرد؟ علاوه بر این، اگر برخی از مهمانان گفتند که دیگر پیش شما نمی آیند، چه دلایلی را بیشتر از دیگران بیان می کنند؟ آیا می توان گفت که این دلایل فقط مربوط به یک هتل خاص است و در کل شرکت به طور کلی صدق نمی کند؟

از نمادهای زیر در اینجا استفاده می شود: ایکس 1 - تعداد موفقیت در گروه اول، ایکس 2 - تعداد موفقیت در گروه دوم، n 1 ایکس 1 - تعداد شکست در گروه اول، n 2 ایکس 2 - تعداد شکست در گروه دوم، X =ایکس 1 + ایکس 2 - تعداد کل موفقیت ها، nایکس = (n 1 ایکس 1 ) + (n 2 ایکس 2 ) - تعداد کل خرابی ها، n 1 - حجم نمونه اول، n 2 - حجم نمونه دوم، n = n 1 + n 2 - حجم کل نمونه جدول نشان داده شده دارای دو سطر و دو ستون است و به همین دلیل به آن جدول فاکتور 2x2 می گویند. سلول های تشکیل شده از تقاطع هر سطر و ستون حاوی تعداد موفقیت یا شکست هستند.

اجازه دهید استفاده از جدول احتمالی را با استفاده از مثالی از سناریویی که در بالا توضیح داده شد، نشان دهیم. بیایید بگوییم که سوال "آیا سال آینده برمی گردی؟" 163 از 227 مهمان در هتل بیچکامبر و 154 از 262 مهمان در هتل ویندسورفر پاسخ مثبت دادند. اگر سطح معنی داری 0.05 باشد، آیا بین رضایت مهمانان هتل (که احتمال بازگشت مهمانان در سال آینده است) از نظر آماری تفاوت معناداری وجود دارد؟

برنج. 2. جدول فاکتور 2x2 برای ارزیابی کیفیت خدمات مهمان

خط اول تعداد مهمانان هر هتل را نشان می دهد که می خواهند سال آینده برگردند (موفقیت). در خط دوم - تعداد مهمانانی که ابراز نارضایتی کردند (شکست). سلول های واقع در ستون Total شامل تعداد کل مهمانانی است که قصد دارند در سال آینده به هتل بازگردند و همچنین تعداد کل مهمانانی که از خدمات ناراضی هستند. سلول‌های واقع در ردیف «کل» شامل تعداد کل مهمان‌های بررسی‌شده در هر هتل است. درصد مهمانانی که قصد بازگشت دارند با تقسیم تعداد مهمانانی که چنین گفته اند بر تعداد کل مهمانان هتل بررسی شده محاسبه می شود. سپس از آزمون χ 2 برای مقایسه سهم های محاسبه شده استفاده می شود.

برای آزمون فرضیه های صفر و جایگزین H 0: p 1 = p 2; Н 1: р 1 ≠ р 2ما از آزمون χ 2 -statistics استفاده می کنیم.

آزمون کای دو برای مقایسه دو نسبت.آماره χ 2 برابر است با مجموع مجذورات تفاوت بین تعداد موفقیت های مشاهده شده و مورد انتظار تقسیم بر تعداد موفقیت های مورد انتظار در هر خانه از جدول:

جایی که f 0- تعداد مشاهده شده از موفقیت ها یا شکست ها در یک سلول خاص از جدول احتمالی ویژگی ها، f e

آماره χ 2 با توزیع χ 2 با یک درجه آزادی تقریب زده می شود.

یا شکست در هر سلول از جدول احتمالی، باید معنای آنها را درک کنید. اگر فرضیه صفر درست باشد، یعنی. نسبت موفقیت در دو جامعه برابر است، سهم نمونه محاسبه شده برای هر یک از دو گروه تنها به دلایل تصادفی می تواند با یکدیگر متفاوت باشد، و هر دو سهم تخمینی از پارامتر کلی جامعه است. آر. در این وضعیت، آماری که هر دو نسبت را در یک تخمین پارامتر کلی (متوسط) ترکیب می کند آر ، نشان دهنده نسبت کل موفقیت ها در گروه های ترکیبی است (یعنی برابر است با تعداد کل موفقیت ها تقسیم بر حجم کل نمونه). اضافه شدن او، 1 – ، نشان دهنده میزان شکست کلی در گروه های ترکیبی است. با استفاده از نمادهایی که معنای آنها در جدول در شکل 1 توضیح داده شده است. 1. می توانید فرمول (2) را برای محاسبه پارامتر استخراج کنید :

جایی که - سهم متوسط ​​از صفت.

برای محاسبه تعداد مورد انتظار موفقیت fه(یعنی محتویات ردیف اول جدول احتمالی)، لازم است حجم نمونه در پارامتر ضرب شود. . برای محاسبه تعداد مورد انتظار شکست f e(یعنی محتویات ردیف دوم جدول احتمالی)، لازم است حجم نمونه در پارامتر ضرب شود. 1 – .

آماره آزمون محاسبه شده با استفاده از فرمول (1) با توزیع χ2 با یک درجه آزادی تقریب می شود. برای سطح معناداری معین α، فرضیه صفر رد می شود اگر آمار χ 2 محاسبه شده بزرگتر از χ U 2 باشد، مقدار بحرانی بالای توزیع χ 2 با یک درجه آزادی. بنابراین، قاعده تصمیم گیری به شرح زیر است: فرضیه اچ 0 اگر χ 2 > χ U 2 رد می شود، در غیر این صورت فرضیه H 0منحرف نمی شود (شکل 3).

برنج. 3. منطقه بحرانی آزمون χ2 برای مقایسه سهام در سطح معناداری α

اگر فرضیه صفر درست باشد، آمار χ 2 محاسبه شده نزدیک به صفر است زیرا مجذور اختلاف بین مشاهده شده f 0 و انتظار می رود fهمقادیر در هر سلول بسیار کوچک است. از سوی دیگر، اگر فرضیه صفر H 0نادرست است و بین سهم های موفقیت در جمعیت های عمومی وجود دارد تفاوت معنی دار، آمار χ 2 محاسبه شده باید بزرگ باشد. این با تفاوت بین تعداد مشاهده شده و مورد انتظار موفقیت ها یا شکست ها در هر سلول توضیح داده می شود که وقتی مربع افزایش می یابد. با این حال، سهم تفاوت بین مقادیر مورد انتظار و مشاهده شده در آمار کلی χ 2 ممکن است یکسان نباشد. همان تفاوت واقعی بین f 0و f eاگر سلول حاوی نتایج تعداد کمی از مشاهدات نسبت به تفاوت مربوط به تعداد بیشتری از مشاهدات باشد، ممکن است تأثیر بیشتری بر آمار χ2 داشته باشد.

به منظور نشان دادن معیار χ2 برای آزمایش این فرضیه که دو سهم برابر هستند، اجازه دهید به سناریویی که قبلا توضیح داده شد، که نتایج آن در شکل نشان داده شده است، برگردیم. 2. فرضیه صفر (H 0: p 1 = p 2) بیان می کند که هنگام مقایسه کیفیت خدمات در دو هتل، نسبت مهمانانی که قصد بازگشت در سال آینده را دارند تقریباً یکسان است. برای تخمین پارامتر آر، نشان دهنده نسبت مهمانانی است که قصد بازگشت به هتل را دارند، اگر فرضیه صفر درست باشد، از مقدار استفاده می شود. ، که با فرمول محاسبه می شود

سهم مهمانانی که از خدمات ناراضی بودند = 1 – 0.6483 = 0.3517. ضرب این دو نسبت در تعداد مهمانان Beachcomber مورد بررسی، تعداد مورد انتظار مهمانانی را که قصد بازگشت در فصل آینده را دارند و همچنین تعداد مسافرانی که دیگر در این هتل اقامت نخواهند کرد به ما می دهد. سهم مورد انتظار میهمانان در هتل ویندسورفر به طور مشابه محاسبه می شود:

بله - Beachcomber: = 0,6483, n 1 = 227 بنابراین f e = 147,16.
بله - ویندسوفر: = 0,6483, n 2 = 262 بنابراین f e = 169,84.
خیر - Beachcomber: 1 - = 0,3517, n 1 = 227 بنابراین f e = 79,84.
خیر - موج سواری بادی: 1 - = 0,3517, n 2 = 262 بنابراین f e = 92,16.

محاسبات در شکل نشان داده شده است. 4.

برنج. 4. آمار χ 2 برای هتل ها: (الف) داده های اولیه. (ب) جدول عامل 2x2 برای مقایسه مشاهده شده ( f 0 ) و مورد انتظار ( fه) تعداد مهمانان راضی و ناراضی از خدمات؛ (ج) محاسبه آمار χ2 هنگام مقایسه نسبت مهمانان راضی از خدمات؛ (د) محاسبه مقدار بحرانی آماره χ 2

برای محاسبه مقدار بحرانی آزمون χ 2 -statistic، استفاده می کنیم تابع اکسل=HI2.INR(). اگر سطح معنی داری α = 0.05 باشد (احتمال جایگزینی با تابع CH2.OBR 1 –α است)، و توزیع χ2 برای جدول عامل 2×2 یک درجه آزادی داشته باشد، مقدار بحرانی آماره χ2 است. 3.841 است. از آنجایی که مقدار آماری χ2 محاسبه شده 9.053 (شکل 4c) بزرگتر از 3.841 است، فرضیه صفر رد می شود (شکل 5).

برنج. 5. تعیین مقدار بحرانی آماره χ 2 با یک درجه آزادی در سطح معنی داری 05/0 = α

احتمال آراینکه فرضیه صفر با آمار χ 2 برابر با 9.053 (و یک درجه آزادی) درست است، در اکسل با استفاده از تابع =1 - CH2.DIST(9.053;1; TRUE) = 0.0026 محاسبه می شود. آر-مقدار 0.0026 احتمال این است که تفاوت بین نسبت نمونه مهمانان راضی از خدمات هتل های ساحلی و ویندسورفر برابر یا بیشتر از 0.718 - 0.588 = 0.13 باشد، اگر در واقع نسبت آنها در هر دو جمعیت یکسان باشد. . بنابراین، می توان ادعا کرد که تفاوت آماری معنی داری در خدمات مهمان بین این دو هتل وجود دارد. تحقیقات نشان می دهد که تعداد مهمانان رضایت از خدمات در هتل بیچکامبر مقدار بیشترمهمانانی که قصد دارند دوباره در هتل ویندسورفر اقامت کنند.

آزمون فرضیات در مورد جدول عامل 2x2.برای به دست آوردن نتایج دقیق از داده های داده شده در جدول 2×2، تعداد موفقیت ها یا شکست ها باید بیشتر از 5 باشد. اگر این شرط رعایت نشد، یک تست فیشر.

هنگام مقایسه درصد رضایت مشتریان از کیفیت خدمات در دو هتل، آزمون Z و χ2 به نتایج یکسانی منجر می شود. این را می توان با وجود رابطه نزدیک بین توزیع نرمال استاندارد شده و توزیع χ2 با یک درجه آزادی توضیح داد. در این مورد، آماره χ 2 همیشه آماره Z مربع است. برای مثال، هنگام ارزیابی رضایت مهمان، متوجه شدیم که ز-statistic +3.01 است و χ 2 -statistic 9.05 است. با نادیده گرفتن خطاهای گرد کردن، به راحتی می توان تأیید کرد که مقدار دوم مربع مقدار اول است (یعنی 3.01 2 = 9.05). علاوه بر این، با مقایسه مقادیر بحرانی هر دو آمار در سطح معنی‌داری α = 0.05، می‌توان دریافت که مقدار χ 1 2 برابر با 3.841، مجذور مقدار بحرانی بالای آماره Z برابر با + است. 1.96 (یعنی χ 1 2 = Z 2). علاوه بر این، آر-مقادیر هر دو معیار یکسان است.

بنابراین، می توان استدلال کرد که هنگام آزمون فرضیه های صفر و جایگزین H 0: p 1 = p 2; Н 1: р 1 ≠ р 2آزمون های Z و χ 2 معادل هستند. با این حال، اگر نه تنها تشخیص تفاوت ها، بلکه تعیین نسبت بزرگتر نیز ضروری باشد (p 1 > p 2)، بایدآزمون Z را با یک منطقه بحرانی محدود شده توسط دم توزیع نرمال استاندارد شده اعمال کنید. در ادامه، استفاده از آزمون χ 2 را برای مقایسه نسبت های یک صفت در چند گروه توضیح خواهیم داد. لازم به ذکر است که معیار Z در این شرایط قابل اعمال نیست.

استفاده از آزمون χ 2 برای آزمون فرضیه برابری چند سهم

آزمون کای اسکوئر را می توان به یک مورد کلی تر تعمیم داد و برای آزمون فرضیه برابری چند سهم از یک مشخصه استفاده کرد. اجازه دهید تعداد جمعیت های مستقل تجزیه و تحلیل شده را با حرف نشان دهیم با. اکنون جدول اقتضایی مشخصه ها از دو خط و باستون ها. برای آزمون فرضیه های صفر و جایگزین H 0: p 1 = p 2 = … = ص 2, H 1:نه همه آرjبرابر یکدیگر (j = 1, 2, …, ج), از آماره آزمون χ 2 استفاده می شود:

جایی که f 0- تعداد موفقیت یا شکست مشاهده شده در یک سلول خاص از جدول فاکتور 2* با, fه- تعداد نظری یا مورد انتظار موفقیت یا شکست در یک سلول خاص از جدول احتمالی، مشروط بر اینکه فرضیه صفر درست باشد.

برای محاسبه تعداد مورد انتظار موفقیت یا شکست در هر سلول از جدول احتمالی، باید موارد زیر را در نظر داشته باشید. اگر فرضیه صفر درست باشد و نسبت‌های موفقیت در همه جمعیت‌ها برابر باشد، نسبت‌های نمونه مربوطه می‌توانند تنها به دلایل تصادفی با یکدیگر متفاوت باشند، زیرا همه نسبت‌ها تخمین‌هایی از نسبت صفت را نشان می‌دهند. آردر جمعیت عمومی در این وضعیت، آماری که همه نسبت ها را در یک تخمین پارامتر کلی (یا متوسط) ترکیب می کند آر، حاوی اطلاعات بیشتری نسبت به هر یک از آنها به طور جداگانه است. این آمار، نشان داده شده توسط ، نشان دهنده نسبت کلی (یا متوسط) موفقیت ها در نمونه تلفیقی است.

محاسبه میانگین سهم:

برای محاسبه تعداد مورد انتظار موفقیت f eدر ردیف اول جدول احتمالی، لازم است حجم هر نمونه در پارامتر ضرب شود. برای محاسبه تعداد مورد انتظار شکست f eدر سطر دوم جدول احتمالی، لازم است حجم هر نمونه در پارامتر ضرب شود 1 – . آماره آزمون محاسبه شده با استفاده از فرمول (1) با توزیع χ2 تقریبی شده است. تعداد درجات آزادی این توزیع با کمیت داده می شود (r – 1)(ج – 1) ، جایی که r- تعداد سطرها در جدول فاکتورها، با- تعداد ستون های جدول برای جدول فاکتور 2*sتعداد درجات آزادی برابر است (2 - 1) (s - 1) = s - 1. برای یک سطح اهمیت معین α، فرضیه صفر رد می شود اگر آماره χ2 محاسبه شده بزرگتر از مقدار بحرانی فوقانی χ U2 باشد که در توزیع χ2 با s – 1درجه آزادی. بنابراین، قاعده تصمیم گیری به شرح زیر است: فرضیه H 0اگر χ 2 > χ U 2 رد می شود (شکل 6)، در غیر این صورت فرضیه رد می شود.

برنج. 6. منطقه بحرانی آزمون χ2 برای مقایسه با نسبت در سطح معنی داری α

آزمون فرضیات مربوط به جدول عامل 2*c.برای به دست آوردن نتایج دقیق بر اساس داده های ارائه شده در جدول عامل 2 * با، لازم است تعداد موفقیت ها یا شکست ها به اندازه کافی زیاد باشد. برخی از آماردانان بر این باورند که اگر فرکانس های مورد انتظار بیشتر از 0.5 باشد، این آزمایش نتایج دقیقی به دست می دهد. محققان محافظه کارتر نیاز دارند که بیش از 20 درصد سلول های جدول احتمالی حاوی مقادیر مورد انتظار کمتر از 5 باشند و هیچ سلولی نباید دارای مقدار مورد انتظار کمتر از یک باشد. شرط آخر به نظر ما یک سازش معقول بین این افراط ها است. برای ارضای این شرط، دسته‌هایی که حاوی مقادیر کوچک مورد انتظار هستند باید در یکی ترکیب شوند. پس از این، معیار دقیق تر می شود. اگر به دلایلی ترکیب چند دسته امکان پذیر نباشد، باید از روش های جایگزین استفاده کرد.

برای نشان دادن آزمون χ 2 برای آزمون فرضیه برابری سهام در چند گروه، اجازه دهید به سناریوی شرح داده شده در ابتدای فصل برگردیم. بیایید یک نظرسنجی مشابه را در نظر بگیریم که در آن مهمانان سه هتل متعلق به شرکت T.S Resort Resources شرکت می کنند (شکل 7a).

برنج. 7. جدول فاکتور 2x3 برای مقایسه تعداد مهمانان راضی و ناراضی از خدمات: (الف) مشاهده شده تعداد موفقیت ها یا شکست ها - f 0; (ب) تعداد مورد انتظار موفقیت یا شکست - fه; (ج) محاسبه آمار χ 2 هنگام مقایسه نسبت مهمانان راضی از خدمات

فرضیه صفر بیان می کند که نسبت مشتریانی که قصد بازگشت در سال آینده را دارند در تمام هتل ها تقریباً یکسان است. برای تخمین پارامتر آر، نشان دهنده نسبت مهمانانی که قصد بازگشت به هتل را دارند، از مقدار استفاده می شود آر = ایکس /n= 513 / 700 = 0.733. درصد مهمانانی که از خدمات ناراضی بودند 1 – 0.733 = 0.267 است. با ضرب سه سهم در تعداد مهمانان مورد بررسی در هر هتل، تعداد مورد انتظار مهمانانی که قصد بازگشت در فصل آینده را دارند و همچنین تعداد مشتریانی که دیگر در این هتل اقامت نخواهند کرد را به دست می آوریم (شکل 7b).

برای آزمون فرضیه های صفر و جایگزین، از آماره آزمون χ 2 استفاده می شود که با استفاده از مقادیر مورد انتظار و مشاهده شده طبق فرمول (1) محاسبه می شود (شکل 7c).

مقدار بحرانی آماره χ 2 با فرمول =HI2.OBR() تعیین می شود. از آنجایی که میهمانان سه هتل در نظرسنجی شرکت کردند، آمار χ 2 دارای (2 – 1) (3 – 1) = 2 درجه آزادی است. در سطح معناداری 0.05 = α، مقدار بحرانی آماره χ 2 5.991 است (شکل 7d). از آنجایی که آماره χ2 محاسبه شده 40.236 از مقدار بحرانی فراتر می رود، فرضیه صفر رد می شود (شکل 8). از سوی دیگر، احتمال آراین واقعیت که فرضیه صفر با آمار χ 2 برابر با 40.236 (و دو درجه آزادی) صادق است، در اکسل با استفاده از تابع =1-CHI2.DIST() = 0.000 محاسبه می شود (شکل 7d). آر- مقدار 000/0 و کمتر از سطح معناداری 05/0 = α است. بنابراین فرض صفر رد می شود.

برنج. 8. حوزه های پذیرش و رد فرضیه برابری سه سهم در سطح معناداری 05/0 و دو درجه آزادی.

رد فرضیه صفر هنگام مقایسه نسبت های نشان داده شده در جدول عامل 2* با، فقط می توان گفت که نسبت رضایت مهمانان از خدمات در سه هتل منطبق نیست. برای اینکه بفهمید کدام لوب ها با بقیه متفاوت هستند، لازم است از روش های دیگری مانند روش ماراسکویلو استفاده کنید.

روش ماراسکویلوبه شما امکان می دهد همه گروه ها را به صورت جفت با هم مقایسه کنید. در مرحله اول روش، تفاوت‌های p s j - p s j محاسبه می‌شود (که در آن jj) بین s(s – 1)/2در جفت سهام محدوده بحرانی مربوطه با استفاده از فرمول محاسبه می شود:


در سطح معناداری کلی α، مقدار جذر مقدار بحرانی بالای توزیع کای اسکوئر است که s – 1درجه آزادی. برای هر جفت کسر نمونه، یک محدوده بحرانی جداگانه باید محاسبه شود. در آخرین مرحله، هر یک از s(s – 1)/2جفت سهام با محدوده بحرانی مربوطه مقایسه می شود. اگر تفاوت مطلق سهام نمونه |p s j – ps j | از محدوده بحرانی فراتر می رود.

اجازه دهید روش ماراسکویلو را با استفاده از مثال نظرسنجی از مهمانان سه هتل نشان دهیم (شکل 9a). با استفاده از آزمون کای اسکوئر، دریافتیم که از نظر آماری تفاوت معنی داری بین نسبت مهمانان هتلی که قصد بازگشت در سال آینده را داشتند وجود دارد. از آنجایی که نظرسنجی شامل مهمانان از سه هتل است، لازم است 3 (3 – 1)/2 = 3 مقایسه زوجی انجام شود و سه محدوده بحرانی محاسبه شود. ابتدا سه سهم نمونه را محاسبه می کنیم (شکل 9b). در سطح معنی داری کلی 0.05، مقدار بحرانی بالای آماره آزمون χ2 برای توزیع خی دو با (c - 1) = 2 درجه آزادی با فرمول =CI2.ORB(0.95;2) = تعیین می شود. 5.991. بنابراین، = 2.448 (شکل 9c). در مرحله بعد، سه جفت اختلاف مطلق و محدوده بحرانی مربوطه را محاسبه می کنیم. اگر اختلاف مطلق بیشتر از محدوده بحرانی آن باشد، سهام مربوطه به طور قابل توجهی متفاوت در نظر گرفته می شود (شکل 9d).

برنج. 9. نتایج روش Marascuilo برای آزمون فرضیه در مورد برابری سهام مهمانان راضی از سه هتل: (الف) داده های نظرسنجی. (ب) نسبت نمونه؛ (ج) مقدار بحرانی بالای آزمون χ2 -statistic برای توزیع chi-square. (د) سه جفت اختلاف مطلق و محدوده بحرانی مربوطه

همانطور که می بینیم، در سطح معنی داری 0.05، میزان رضایت میهمانان هتل پالم رویال (p s2 = 0.858) بیشتر از مهمانان نخل طلایی (p s1 = 0.593) و پالم پرنسس است. هتل ها (p s3 = 0.738). علاوه بر این میزان رضایت میهمانان هتل پالم پرنسس نسبت به میهمانان هتل نخل طلایی بیشتر است. این نتایج باید مدیریت را وادار کند که دلایل این تفاوت ها را تجزیه و تحلیل کند و سعی کند مشخص کند که چرا رضایت مهمانان هتل نخل طلایی به طور قابل توجهی کمتر از مهمانان سایر هتل ها است.

از مطالب کتاب لوین و همکاران آمار برای مدیران استفاده شده است. - م.: ویلیامز، 2004. - ص. 708-730

به تصویر نگاه کنید. دو لیوان می بینید که هر کدام حاوی مقدار مشخصی مایع است. به من بگویید، کدام لیوان مایع بیشتری دارد؟ اگر فکر می کنید درست است، در اشتباهید! پاسخ صحیح این است: خطایی که هنگام اندازه‌گیری حجم مایع با این لیوان‌ها رخ می‌دهد، تشخیص اینکه کدام بشر حاوی مایع بیشتری است، غیرممکن می‌کند.

این را چگونه باید فهمید؟ به یاد داشته باشیم که استفاده از هر ابزار اندازه گیری لزوماً با خطای اندازه گیری همراه است. بستگی به مقدار تقسیم مقیاس این دستگاه دارد. از آنجایی که تقسیمات روی فنجان سمت راست بزرگتر است، به این معنی است که خطا در اندازه گیری حجم بیشتر خواهد بود. بیایید حجم مایعات را با در نظر گرفتن خطاها اندازه گیری کنیم.

اجازه دهید مقادیر حجم اندازه گیری شده (که با نقاط زرد مشخص شده اند) و فواصل بین محدودیت های خطاهای اندازه گیری را روی دو خط عددی به تصویر بکشیم:



بر خلاف مقادیر اندازه گیری شده، مقادیر واقعی حجم مایع در یک مکان نامعلوم در فواصل زمانی قرار دارند. حجم واقعی مایع در فنجان سمت چپ ممکن است مثلاً 270 میلی لیتر و حجم واقعی مایع در فنجان سمت راست مثلاً 250 میلی لیتر (که با نقاط قرمز مشخص شده است) باشد.



ما به طور خاص عدد دوم "قرمز" را کمتر از اولی انتخاب کردیم (در نهایت چنین وضعیتی نیز می تواند اتفاق بیفتد). این بدان معناست که لیوان سمت راست ممکن است دارای حجم کمتری از مایع نسبت به سمت چپ باشد، علیرغم اینکه سطح مایع در فنجان سمت راست بالاتر است. باور نکردنی اما واقعی!