تحلیل واریانس. مدل تحلیل واریانس چند متغیره ANOVA مولفه های واریانس

تحلیل واریانس

1. مفهوم تحلیل واریانس

تحلیل واریانستجزیه و تحلیل تغییرپذیری یک صفت تحت تأثیر هر عامل متغیر کنترل شده است. در ادبیات خارجی، تجزیه و تحلیل واریانس اغلب به عنوان ANOVA شناخته می شود که به عنوان تجزیه و تحلیل متغیر (Analysis of Variance) ترجمه می شود.

مشکل ANOVAشامل جداسازی تنوع از نوع متفاوت از تغییرپذیری عمومی یک صفت است:

الف) تغییرپذیری ناشی از عملکرد هر یک از متغیرهای مستقل مورد مطالعه؛

ب) تغییرپذیری ناشی از تعامل متغیرهای مستقل مورد مطالعه؛

ج) تنوع تصادفی ناشی از همه متغیرهای ناشناخته دیگر.

تغییرپذیری ناشی از عملکرد متغیرهای مورد مطالعه و اثر متقابل آنها با متغیرهای تصادفی همبستگی دارد. شاخص این رابطه آزمون F فیشر است.

فرمول محاسبه معیار F شامل برآوردهای واریانس، یعنی پارامترهای توزیع صفت است، بنابراین معیار F یک معیار پارامتریک است.

هر چه تغییرپذیری یک صفت به دلیل متغیرها (عوامل) مورد مطالعه یا اثر متقابل آنها باشد، بالاتر است. مقادیر معیار تجربی.

صفر فرضیه در تحلیل واریانس بیان می‌کند که مقادیر میانگین مشخصه مؤثر مورد مطالعه در همه درجه‌بندی‌ها یکسان است.

جایگزین فرضیه بیان خواهد کرد که مقادیر میانگین مشخصه حاصل در درجه بندی های مختلف عامل مورد مطالعه متفاوت است.

تجزیه و تحلیل واریانس به ما امکان می دهد تغییری را در یک مشخصه بیان کنیم، اما نشان نمی دهد جهتاین تغییرات.

بیایید بررسی خود را در مورد تحلیل واریانس با ساده ترین حالت شروع کنیم، زمانی که عمل تنها را مطالعه می کنیم یکیمتغیر (یک عامل).

2. تجزیه و تحلیل واریانس یک طرفه برای نمونه های نامرتبط

2.1. هدف روش

روش تحلیل واریانس تک عاملی در مواردی استفاده می شود که تغییرات در یک مشخصه مؤثر تحت تأثیر شرایط متغیر یا درجه بندی یک عامل مورد مطالعه قرار گیرد. در این نسخه از روش، تأثیر هر یک از درجه بندی های عامل است ناهمساننمونه هایی از موضوعات حداقل باید سه درجه بندی از فاکتور وجود داشته باشد. (ممکن است دو درجه بندی وجود داشته باشد، اما در این صورت نمی توانیم وابستگی های غیرخطی ایجاد کنیم و استفاده از وابستگی های ساده تر معقول تر به نظر می رسد).

نسخه ناپارامتریک این نوع تحلیل، آزمون کروسکال-والیس H است.

فرضیه ها

H 0: تفاوت بین درجه های عامل (شرایط مختلف) بیشتر از تفاوت های تصادفی در هر گروه نیست.

H 1: تفاوت بین درجه های عامل (شرایط مختلف) بیشتر از تفاوت های تصادفی در هر گروه است.

2.2. محدودیت های تحلیل واریانس یک طرفه برای نمونه های نامرتبط

1. تحلیل واریانس یک طرفه به حداقل سه درجه بندی عامل و حداقل دو آزمودنی در هر درجه بندی نیاز دارد.

2. مشخصه به دست آمده باید به طور معمول در نمونه مورد مطالعه توزیع شود.

درست است، معمولاً مشخص نمی شود که آیا ما در مورد توزیع مشخصه در کل نمونه بررسی شده صحبت می کنیم یا در بخشی از آن که مجموعه پراکندگی را تشکیل می دهد.

3. مثالی از حل مسئله با استفاده از روش آنالیز واریانس یک طرفه برای نمونه های نامرتبط با استفاده از مثال:

به سه گروه مختلف از شش آزمودنی فهرستهای ده کلمه ای داده شد. کلمات به گروه اول با سرعت کم - 1 کلمه در 5 ثانیه، به گروه دوم با سرعت متوسط ​​- 1 کلمه در 2 ثانیه و به گروه سوم با سرعت بالا - 1 کلمه در ثانیه ارائه شد. عملکرد بازتولید به سرعت ارائه کلمه بستگی دارد. نتایج در جدول ارائه شده است. 1.

تعداد کلمات تکثیر شده میز 1

موضوع شماره

سرعت کم

سرعت متوسط

سرعت بالا

مبلغ کل

H 0: تفاوت در طول تولید کلمه بینگروه ها بیشتر از تفاوت های تصادفی مشخص نیستند داخلهر گروه

H1: تفاوت در حجم تولید کلمه بینگروه ها بیشتر از تفاوت های تصادفی هستند داخلهر گروه با استفاده از مقادیر تجربی ارائه شده در جدول. 1، مقادیری را تعیین می کنیم که برای محاسبه معیار F لازم است.

محاسبه مقادیر اصلی برای تحلیل واریانس یک طرفه در جدول ارائه شده است:

جدول 2

جدول 3

دنباله ای از عملیات در آنالیز واریانس یک طرفه برای نمونه های نامرتبط

نام SS که اغلب در این جدول و جداول بعدی یافت می‌شود، مخفف «مجموع مربع‌ها» است. این مخفف بیشتر در منابع ترجمه شده استفاده می شود.

اس اس حقیقتبه معنای تغییرپذیری ویژگی به دلیل عملکرد عامل مورد مطالعه است.

اس اس بطور کلی- تنوع کلی صفت؛

اس C.A.-تغییرپذیری ناشی از عوامل محاسبه نشده، تنوع "تصادفی" یا "باقیمانده".

ام‌اس- "میانگین مربع" یا انتظار ریاضی از مجموع مربع ها، مقدار متوسط ​​SS مربوطه.

df - تعداد درجات آزادی که هنگام در نظر گرفتن معیارهای ناپارامتری، آن را با یک حرف یونانی نشان می دهیم. v.

نتیجه گیری: H 0 رد می شود. H 1 پذیرفته می شود. تفاوت در یادآوری کلمات بین گروه ها بیشتر از تفاوت های تصادفی در هر گروه بود (05/0=α). بنابراین سرعت ارائه کلمات بر حجم بازتولید آنها تأثیر می گذارد.

نمونه ای از حل مشکل در اکسل در زیر ارائه شده است:

اطلاعات اولیه:

با استفاده از دستور: Tools->Data Analysis->One-way ANOVA، نتایج زیر را دریافت می کنیم:

همانطور که قبلاً اشاره شد، روش پراکندگی ارتباط نزدیکی با گروه بندی های آماری دارد و فرض می کند که جامعه مورد مطالعه بر اساس ویژگی های عاملی به گروه هایی تقسیم می شود که تأثیر آنها باید بررسی شود.

بر اساس تحلیل واریانس، موارد زیر تولید می شود:

1. ارزیابی قابلیت اطمینان تفاوت در میانگین های گروه برای یک یا چند ویژگی عامل.

2. ارزیابی قابلیت اطمینان تعاملات عاملی؛

3. ارزیابی تفاوت های جزئی بین جفت میانگین ها.

کاربرد تحلیل واریانس بر اساس قانون تجزیه واریانس (تغییرات) یک مشخصه به اجزا است.

کل تغییرات D o مشخصه حاصل در طول گروه بندی را می توان به اجزای زیر تجزیه کرد:

1. بین گروهی کردن D m مرتبط با یک مشخصه گروه بندی.

2. برای باقی مانده(درون گروهی) D B به مشخصه گروه بندی مرتبط نیست.

رابطه بین این شاخص ها به صورت زیر بیان می شود:

D o = D m + D in. (1.30)

بیایید با یک مثال به استفاده از تحلیل واریانس نگاه کنیم.

فرض کنید می خواهید ثابت کنید که آیا تاریخ کاشت بر عملکرد گندم تأثیر می گذارد یا خیر. داده های تجربی اولیه برای تحلیل واریانس در جدول ارائه شده است. 8.

جدول 8

در این مثال، N = 32، K = 4، l = 8.

اجازه دهید تغییرات کل در عملکرد را تعیین کنیم، که مجموع انحرافات مجذور مقادیر فردی یک صفت از میانگین کلی است:

که در آن N تعداد واحدهای جمعیت است. Y i - مقادیر بازده فردی؛ Y o میانگین کلی عملکرد کل جمعیت است.

برای تعیین تغییرات کل بین گروهی که تغییر ویژگی مؤثر را با توجه به عامل مورد مطالعه تعیین می کند، لازم است مقادیر میانگین مشخصه مؤثر برای هر گروه را دانست. این تغییرات کل برابر است با مجموع مجذور انحراف میانگین‌های گروه از مقدار میانگین کلی صفت، وزن‌دهی به تعداد واحدهای جمعیت در هر گروه:

تغییرات کل درون گروهی برابر است با مجموع انحرافات مجذور مقادیر فردی یک صفت از میانگین های گروهی برای هر گروه، که در تمام گروه های جامعه جمع می شود.

تأثیر یک عامل بر مشخصه حاصل در رابطه بین Dm و Dv آشکار می شود: هر چه تأثیر عامل بر مقدار مشخصه مورد مطالعه بیشتر باشد، Dm بیشتر و Dv کمتر است.

برای انجام تجزیه و تحلیل واریانس، لازم است منابع تنوع در یک صفت، حجم تغییرات بر اساس منبع، و تعیین تعداد درجات آزادی برای هر جزء تغییرات تعیین شود.

مقدار تغییرات قبلاً مشخص شده است؛ اکنون باید تعداد درجات آزادی تنوع را تعیین کرد. تعداد درجات آزادی تعداد انحرافات مستقل مقادیر فردی یک مشخصه از مقدار متوسط ​​آن است. تعداد کل درجات آزادی، مربوط به مجموع مجذور انحرافات در ANOVA، به مولفه های تغییرات تجزیه می شود. بنابراین، مجموع مجذور انحرافات D o منطبق بر تعداد درجات آزادی تغییرات برابر با N - 1 = 31 است. تغییرات گروهی D m مربوط به تعداد درجات آزادی تغییرات برابر با K - 1 است. = 3. تغییر باقیمانده درون گروهی مربوط به تعداد درجات آزادی تغییرات برابر با N – K = 28 است.


حال با دانستن مجموع انحرافات مجذور و تعداد درجات آزادی می توان واریانس هر جزء را تعیین کرد. اجازه دهید این واریانس ها را نشان دهیم: d m - گروه و d در - درون گروه.

پس از محاسبه این واریانس‌ها، به تعیین اهمیت تأثیر عامل بر ویژگی حاصل می‌پردازیم. برای انجام این کار، نسبت را پیدا می کنیم: d M / d B = F f،

مقدار F f نامیده می شود معیار فیشر ، در مقایسه با جدول، جدول F. همانطور که قبلاً اشاره شد، اگر جدول F f > F، تأثیر عامل بر ویژگی مؤثر ثابت شده است. اگر F f< F табл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

مقدار نظری با احتمال مرتبط است و در جدول مقدار آن در سطح معینی از احتمال قضاوت آورده شده است. ضمیمه حاوی جدولی است که به شما امکان می دهد مقدار F ممکن را برای احتمال قضاوت تنظیم کنید، رایج ترین مورد استفاده: سطح احتمال "فرضیه صفر" 0.05 است. به جای احتمالات "فرضیه صفر"، جدول را می توان جدولی برای احتمال 95/0 از اهمیت تأثیر عامل نامید. افزایش سطح احتمال به یک مقدار F بالاتر جدول برای مقایسه نیاز دارد.

مقدار جدول F همچنین به تعداد درجات آزادی دو پراکندگی مورد مقایسه بستگی دارد. اگر تعداد درجات آزادی به بی نهایت متمایل شود، جدول F به وحدت گرایش دارد.

جدول مقادیر جدول F به صورت زیر ساخته می شود: ستون های جدول درجه آزادی تغییرات را برای پراکندگی بزرگتر نشان می دهد و ردیف ها درجه آزادی را برای پراکندگی کوچکتر (در درون گروه) نشان می دهد. مقدار F در تقاطع ستون و ردیف درجات آزادی تغییرات مربوطه یافت می شود.

بنابراین، در مثال ما، F f = 21.3/3.8 = 5.6. مقدار جدول بندی شده جدول F برای احتمال 0.95 و درجه آزادی به ترتیب برابر با 3 و 28، جدول F = 2.95 است.

مقدار F f به‌دست‌آمده از نظر تجربی حتی برای احتمال 0.99 از مقدار نظری فراتر می‌رود. در نتیجه، تجربه با احتمال بیش از 0.99 تأثیر عامل مورد مطالعه بر عملکرد را ثابت می کند، یعنی تجربه را می توان قابل اعتماد، اثبات شده دانست و بنابراین زمان کاشت تأثیر بسزایی بر عملکرد گندم دارد. دوره کاشت بهینه را باید دوره 10 تا 15 اردیبهشت در نظر گرفت، زیرا در این دوره کاشت بود که بهترین نتایج عملکرد حاصل شد.

ما روش تحلیل واریانس را هنگام گروه بندی بر اساس یک مشخصه و توزیع تصادفی تکرارها در گروه بررسی کردیم. با این حال، اغلب اتفاق می‌افتد که کرت آزمایشی دارای تفاوت‌هایی در حاصلخیزی خاک و غیره باشد. بنابراین ممکن است شرایطی پیش بیاید که تعداد بیشتری از کرت‌های یکی از گزینه‌ها بر روی بهترین قسمت قرار گیرد و شاخص‌های آن بیش از حد برآورد شود. از گزینه دیگر - در بدترین بخش، و نتایج در این مورد به طور طبیعی بدتر خواهد بود، یعنی دست کم گرفته می شود.

برای حذف تغییرات ناشی از دلایل غیر مرتبط با آزمایش، لازم است واریانس محاسبه‌شده از تکرارها (بلوک‌ها) از واریانس درون گروهی (باقیمانده) جدا شود.

مجموع مجذور انحرافات در این حالت به 3 جزء تقسیم می شود:

D o = D m + D تکرار + D استراحت. (1.33)

برای مثال ما، مجموع مجذور انحرافات ناشی از تکرار برابر با:

بنابراین، مجموع تصادفی واقعی مجذور انحراف برابر با:

D استراحت = D در – D تکرار; D استراحت = 106 – 44 = 62.

برای پراکندگی باقیمانده، تعداد درجات آزادی برابر با 28 - 7 = 21 خواهد بود. نتایج تحلیل واریانس در جدول ارائه شده است. 9.

جدول 9

از آنجایی که مقادیر واقعی معیار F برای احتمال 0.95 از مقادیر جدول شده بیشتر است، تأثیر تاریخ کاشت و تکرارها بر عملکرد گندم باید قابل توجه در نظر گرفته شود. روش در نظر گرفته شده برای ساخت یک آزمایش، زمانی که سایت به طور مقدماتی به بلوک هایی با شرایط نسبتاً هم تراز تقسیم می شود و گزینه های آزمایش شده در داخل بلوک به ترتیب تصادفی توزیع می شوند، روش بلوک های تصادفی نامیده می شود.

با استفاده از تحلیل واریانس، می توانید تأثیر نه تنها یک عامل، بلکه دو یا چند عامل را بر روی نتیجه مطالعه کنید. آنالیز واریانس در این مورد نامیده می شود تحلیل واریانس چند متغیره .

ANOVA دو طرفه از این جهت با دو تک عاملی متفاوت است می تواند به سوالات زیر پاسخ دهد:

1. 1 تأثیر هر دو عامل با هم چیست؟

2. نقش ترکیب این عوامل چیست؟

بیایید تحلیل واریانس آزمایش را در نظر بگیریم، که در آن لازم است تأثیر نه تنها تاریخ کاشت، بلکه واریته ها بر عملکرد گندم نیز شناسایی شود (جدول 10).

جدول 10. داده های تجربی در مورد تأثیر تاریخ کاشت و ارقام بر عملکرد گندم

مجموع انحرافات مجذور مقادیر فردی از میانگین کلی است.

تغییر در تأثیر مشترک زمان کاشت و رقم

مجموع مجذور انحراف میانگین های زیرگروه از میانگین کلی است که با تعداد تکرارها، یعنی 4 وزن دارد.

محاسبه تغییرات فقط بر اساس تأثیر زمان کاشت:

تغییر باقیمانده به عنوان تفاوت بین تغییرات کل و تغییر در تأثیر مشترک عوامل مورد مطالعه تعریف می شود:

D استراحت = D o – D ps = 170 – 96 = 74.

کلیه محاسبات را می توان در قالب یک جدول ارائه کرد (جدول 11).

جدول 11. نتایج تحلیل واریانس

نتایج تحلیل واریانس نشان می‌دهد که تأثیر عوامل مورد مطالعه یعنی زمان کاشت و رقم بر عملکرد گندم معنی‌دار است، زیرا معیارهای F واقعی برای هر یک از عوامل به‌طور معنی‌داری از معیارهای جدول‌شده برای درجات مربوطه بیشتر است. آزادی، و در عین حال با احتمال نسبتاً بالا (p = 0.99). تأثیر ترکیبی از عوامل در این مورد وجود ندارد، زیرا عوامل مستقل از یکدیگر هستند.

تجزیه و تحلیل تأثیر سه عامل بر نتیجه بر اساس همان اصل برای دو عامل انجام می شود، فقط در این حالت سه واریانس برای عوامل و چهار واریانس برای ترکیب عوامل وجود خواهد داشت. با افزایش تعداد فاکتورها، حجم کار محاسباتی به شدت افزایش می یابد و علاوه بر این، مرتب کردن اطلاعات اولیه در یک جدول ترکیبی دشوار می شود. بنابراین، مطالعه تأثیر بسیاری از عوامل بر نتیجه با استفاده از تحلیل واریانس به سختی توصیه می شود. بهتر است تعداد کمتری در نظر گرفته شود، اما مهم ترین عوامل را از نظر تحلیل اقتصادی انتخاب کنید.

اغلب محقق باید با کمپلکس‌های به اصطلاح پراکندگی نامتناسب، یعنی آن‌هایی که تناسب تعداد واریانت‌ها در آن‌ها رعایت نمی‌شود، سروکار داشته باشد.

در چنین مجتمع هایی، تغییر در اثر کل عوامل با مجموع تغییرات بین عوامل و تغییرات در ترکیب عوامل برابر نیست. بسته به میزان ارتباط بین عوامل فردی که در نتیجه نقض تناسب ایجاد می شود، مقداری متفاوت است.

در این مورد، مشکلاتی در تعیین میزان تأثیر هر عامل ایجاد می شود، زیرا مجموع تأثیرات فردی برابر با تأثیر کل نیست.

یکی از راه‌های کاهش یک کمپلکس نامتناسب به یک ساختار واحد، جایگزینی آن با یک کمپلکس متناسب است که در آن فرکانس‌ها در گروه‌ها میانگین می‌شوند. هنگامی که چنین جایگزینی انجام می شود، مشکل با توجه به اصول مجتمع های متناسب حل می شود.

تحلیل واریانس مجموعه‌ای از روش‌های آماری است که برای آزمون فرضیه‌های مربوط به رابطه بین ویژگی‌های خاص و عوامل مورد مطالعه که توصیف کمی ندارند و همچنین برای تعیین میزان تأثیر عوامل و تأثیر متقابل آنها طراحی شده‌اند. در ادبیات تخصصی اغلب ANOVA (از نام انگلیسی Analysis of Variations) نامیده می شود. این روش برای اولین بار توسط R. Fischer در سال 1925 توسعه یافت.

انواع و معیارهای تحلیل واریانس

از این روش برای بررسی رابطه بین ویژگی های کیفی (اسمی) و متغیر کمی (مستمر) استفاده می شود. در اصل، این فرضیه در مورد برابری میانگین های حسابی چند نمونه را آزمایش می کند. بنابراین می توان آن را به عنوان یک معیار پارامتریک برای مقایسه مرکز چند نمونه به طور همزمان در نظر گرفت. اگر از این روش برای دو نمونه استفاده شود، نتایج آنالیز واریانس با نتایج آزمون تی دانشجویی یکسان خواهد بود. با این حال، بر خلاف معیارهای دیگر، این مطالعه به ما اجازه می دهد تا مشکل را با جزئیات بیشتری بررسی کنیم.

تجزیه و تحلیل پراکندگی در آمار بر اساس قانون است: مجموع مجذور انحرافات نمونه ترکیبی برابر با مجذور انحرافات درون گروهی و مجذور انحرافات بین گروهی است. این مطالعه از آزمون فیشر برای تعیین اهمیت تفاوت بین واریانس های بین گروهی و واریانس های درون گروهی استفاده می کند. با این حال، پیش نیازهای لازم برای این امر، نرمال بودن توزیع و همسانی (برابری واریانس ها) نمونه ها است. تحلیل واریانس تک متغیره (تک عاملی) و چند متغیره (چند عاملی) وجود دارد. اولی وابستگی ارزش مورد مطالعه را به یک ویژگی در نظر می گیرد، دومی - به طور همزمان به بسیاری از آنها، و همچنین به ما امکان می دهد ارتباط بین آنها را شناسایی کنیم.

عوامل

عوامل شرایط کنترل شده ای هستند که بر نتیجه نهایی تأثیر می گذارند. سطح یا روش پردازش آن مقداری است که تجلی خاصی از این شرایط را مشخص می کند. این اعداد معمولاً در مقیاس اندازه گیری اسمی یا ترتیبی ارائه می شوند. اغلب مقادیر خروجی در مقیاس های کمی یا ترتیبی اندازه گیری می شوند. سپس مشکل گروه بندی داده های خروجی در تعدادی از مشاهدات که تقریباً با مقادیر عددی مشابهی مطابقت دارند، ایجاد می شود. اگر تعداد گروه ها بیش از حد زیاد در نظر گرفته شود، ممکن است تعداد مشاهدات در آنها برای به دست آوردن نتایج قابل اعتماد کافی نباشد. اگر تعداد را خیلی کوچک در نظر بگیرید، این می تواند منجر به از دست دادن ویژگی های قابل توجه تأثیر بر سیستم شود. روش خاص گروه بندی داده ها به مقدار و ماهیت تغییرات در مقادیر بستگی دارد. تعداد و اندازه بازه ها در تحلیل تک متغیره اغلب با اصل فواصل مساوی یا اصل فرکانس های برابر تعیین می شود.

تجزیه و تحلیل مشکلات واریانس

بنابراین، مواردی وجود دارد که شما نیاز به مقایسه دو یا چند نمونه دارید. پس از آن است که توصیه می شود از تجزیه و تحلیل واریانس استفاده کنید. نام روش نشان می دهد که نتیجه گیری بر اساس مطالعه مولفه های واریانس است. ماهیت مطالعه این است که تغییر کلی در شاخص به اجزای مؤلفه ای تقسیم می شود که با عملکرد هر عامل جداگانه مطابقت دارد. بیایید تعدادی از مسائل را در نظر بگیریم که با تحلیل واریانس معمولی حل می شوند.

مثال 1

این کارگاه دارای تعدادی دستگاه اتوماتیک است که قطعه خاصی را تولید می کند. اندازه هر قطعه یک متغیر تصادفی است که به تنظیمات هر دستگاه و انحرافات تصادفی که در طول فرآیند ساخت قطعات رخ می دهد بستگی دارد. لازم است بر اساس داده های اندازه گیری ابعاد قطعات مشخص شود که آیا ماشین ها به همین ترتیب پیکربندی شده اند یا خیر.

مثال 2

در ساخت یک دستگاه الکتریکی از انواع کاغذهای عایق خازن، برق و غیره استفاده می شود. دستگاه را می توان با مواد مختلفی آغشته کرد: رزین اپوکسی، لاک، رزین ML-2 و غیره. فشار بالا، با گرمایش. آغشته کردن را می توان با غوطه وری در لاک، زیر یک جریان مداوم لاک و غیره انجام داد. دستگاه الکتریکی به طور کلی با یک ترکیب خاص پر شده است که گزینه های مختلفی وجود دارد. شاخص های کیفیت عبارتند از استحکام الکتریکی عایق، دمای بیش از حد گرم شدن سیم پیچ در حالت کار، و تعدادی دیگر. در طول توسعه فرآیند فن آوری ساخت دستگاه ها، لازم است مشخص شود که هر یک از عوامل ذکر شده چگونه بر عملکرد دستگاه تأثیر می گذارد.

مثال 3

دپوی ترولی‌بوس چندین مسیر ترولی‌بوس را ارائه می‌کند. آنها از انواع مختلف ترولی بوس استفاده می کنند و 125 بازرس کرایه ها را جمع آوری می کنند. مدیریت انبار به این سوال علاقه مند است: چگونه می توان شاخص های اقتصادی کار هر کنترل کننده (درآمد) را با در نظر گرفتن مسیرهای مختلف و انواع مختلف ترولی بوس مقایسه کرد؟ چگونه می توان امکان سنجی اقتصادی تولید واگن برقی از یک نوع خاص در یک مسیر خاص را تعیین کرد؟ چگونه می توان الزامات معقولی را برای میزان درآمدی که یک هادی در هر مسیر در انواع مختلف ترولی بوس به ارمغان می آورد ایجاد کرد؟

وظیفه انتخاب یک روش چگونگی به دست آوردن حداکثر اطلاعات در مورد تأثیر هر عامل بر نتیجه نهایی، تعیین ویژگی های عددی چنین تأثیری، قابلیت اطمینان آنها با حداقل هزینه و در کوتاه ترین زمان ممکن است. روش های تحلیل واریانس امکان حل چنین مسائلی را فراهم می کند.

تحلیل تک متغیره

هدف از این مطالعه ارزیابی میزان تأثیر یک مورد خاص بر بررسی تحلیل شده است. هدف دیگر تحلیل تک متغیره ممکن است مقایسه دو یا چند موقعیت با یکدیگر برای تعیین تفاوت در تأثیر آنها بر یادآوری باشد. اگر فرضیه صفر رد شود، مرحله بعدی کمی سازی و ایجاد فاصله اطمینان برای ویژگی های به دست آمده است. در مواردی که نمی توان فرضیه صفر را رد کرد، معمولاً آن را پذیرفته و در مورد ماهیت تأثیر نتیجه گیری می شود.

تجزیه و تحلیل واریانس یک طرفه می تواند به یک آنالوگ ناپارامتری روش رتبه بندی کروسکال-والیس تبدیل شود. این معیار توسط ریاضیدان آمریکایی ویلیام کروسکال و اقتصاددان ویلسون والیس در سال 1952 ایجاد شد. این معیار برای آزمایش فرضیه صفر برابری اثرات بر روی نمونه های مورد مطالعه با مقادیر میانگین ناشناخته اما برابر طراحی شده است. در این حالت تعداد نمونه ها باید بیشتر از دو باشد.

معیار Jonckheere-Terpstra به طور مستقل توسط ریاضیدان هلندی T. J. Terpstra در سال 1952 و روانشناس بریتانیایی E. R. Jonckheere در سال 1954 پیشنهاد شد. این معیار زمانی استفاده می شود که از قبل مشخص شود که گروه های موجود نتایج بر اساس رشد تأثیرات مرتب شده اند. عامل مورد مطالعه که در مقیاس ترتیبی اندازه گیری می شود.

M - آزمون بارتلت، که توسط آماردان بریتانیایی موریس استیونسون بارتلت در سال 1937 ارائه شد، برای آزمون فرضیه صفر در مورد برابری واریانس چند جمعیت نرمال که نمونه های مورد مطالعه از آنها گرفته شده است استفاده می شود که معمولاً دارای اندازه های متفاوت هستند (تعداد هر یک). نمونه باید حداقل چهار باشد).

ز - آزمون کوکران که توسط ویلیام جمل کوکران آمریکایی در سال 1941 کشف شد. برای آزمون فرضیه صفر در مورد برابری واریانس جمعیت های نرمال در نمونه های مستقل با اندازه مساوی استفاده می شود.

آزمون ناپارامتری لوین که توسط ریاضیدان آمریکایی هاوارد لوین در سال 1960 پیشنهاد شد، جایگزینی برای آزمون بارتلت در شرایطی است که اطمینانی وجود ندارد که نمونه های مورد مطالعه مشمول توزیع نرمال هستند.

در سال 1974، آماردانان آمریکایی مورتون بی براون و آلن بی. فورسایت آزمونی (آزمون براون-فورسایث) را پیشنهاد کردند که کمی با آزمون لوین متفاوت است.

تحلیل دو عاملی

آنالیز واریانس دو طرفه برای نمونه‌های توزیع شده نرمال استفاده می‌شود. در عمل، جداول پیچیده این روش اغلب استفاده می شود، به ویژه آنهایی که در آنها هر سلول حاوی مجموعه ای از داده ها (اندازه گیری های مکرر) مربوط به مقادیر سطح ثابت است. اگر مفروضات مورد نیاز برای اعمال تحلیل واریانس دو طرفه برآورده نشدند، از آزمون ناپارامتریک رتبه فریدمن (فریدمن، کندال و اسمیت) استفاده کنید که توسط اقتصاددان آمریکایی میلتون فریدمن در اواخر سال 1930 ایجاد شد. این آزمون به نوع آن بستگی ندارد. توزیع

تنها فرض بر این است که توزیع مقادیر یکسان و پیوسته است و خود آنها مستقل از یکدیگر هستند. هنگام آزمایش فرضیه صفر، داده های خروجی به صورت یک ماتریس مستطیل شکل ارائه می شود که در آن ردیف ها با سطوح عامل B و ستون ها مربوط به سطوح A هستند. هر خانه از جدول (بلوک) می تواند باشد. نتیجه اندازه گیری پارامترها روی یک شی یا گروهی از اشیاء با مقادیر ثابت سطوح هر دو عامل. در این مورد، داده های مربوطه به عنوان مقادیر متوسط ​​یک پارامتر خاص برای تمام ابعاد یا اشیاء نمونه مورد مطالعه ارائه می شود. برای اعمال معیار خروجی باید از نتایج مستقیم اندازه گیری ها به رتبه آنها حرکت کرد. رتبه بندی برای هر ردیف به طور جداگانه انجام می شود، یعنی مقادیر برای هر مقدار ثابت مرتب می شوند.

آزمون پیج (آزمون L) که توسط آماردان آمریکایی E. B. Page در سال 1963 ارائه شد، برای آزمون فرضیه صفر طراحی شده است. برای نمونه های بزرگ، از تقریب Page استفاده می شود. آنها با توجه به واقعیت فرضیه های صفر مربوطه، از توزیع نرمال استاندارد تبعیت می کنند. در مواردی که سطرهای جدول منبع دارای مقادیر یکسانی هستند، لازم است از رتبه های متوسط ​​استفاده شود. در این صورت، دقت نتیجه گیری بدتر خواهد بود، هر چه تعداد چنین مسابقاتی بیشتر باشد.

س - معیار کوکران، پیشنهاد شده توسط دبلیو کوکران در سال 1937. این معیار در مواردی استفاده می‌شود که گروه‌هایی از افراد همگن در معرض تأثیراتی قرار می‌گیرند که تعداد آنها بیش از دو نفر است و برای آنها دو گزینه برای بازخورد ممکن است - مشروط منفی (0) و مشروط مثبت (1) . فرضیه صفر شامل برابری اثرات درمان است. تجزیه و تحلیل واریانس دو طرفه امکان تعیین وجود اثرات درمانی را فراهم می کند، اما تعیین اینکه این اثر برای کدام ستون های خاص وجود دارد را ممکن نمی سازد. برای حل این مشکل از روش معادلات چندگانه شفه برای نمونه های مرتبط استفاده شده است.

تحلیل چند متغیره

مشکل تحلیل واریانس چند متغیره زمانی به وجود می آید که شما نیاز به تعیین اثر دو یا چند شرط بر روی یک متغیر تصادفی خاص دارید. این مطالعه شامل وجود یک متغیر تصادفی وابسته است که در مقیاس تفاوت یا نسبت اندازه‌گیری می‌شود، و چندین متغیر مستقل که هر کدام در مقیاس نامگذاری یا رتبه‌بندی بیان می‌شوند. تجزیه و تحلیل واریانس داده ها بخش نسبتاً توسعه یافته ای از آمار ریاضی است که گزینه های زیادی دارد. مفهوم تحقیق برای هر دو تک عاملی و چند عاملی مشترک است. ماهیت آن در این واقعیت نهفته است که واریانس کل به اجزایی تقسیم می شود که مربوط به گروه بندی خاصی از داده ها است. هر گروه بندی داده مدل خاص خود را دارد. در اینجا ما فقط مقررات اساسی لازم برای درک و استفاده عملی از پرکاربردترین گزینه های آن را در نظر خواهیم گرفت.

تجزیه و تحلیل واریانس عوامل مستلزم یک نگرش نسبتاً دقیق به جمع آوری و ارائه داده های ورودی و به ویژه در تفسیر نتایج است. برخلاف آزمون تک عاملی که نتایج آن را می توان به صورت مشروط در یک توالی مشخص قرار داد، نتایج یک آزمون دو عاملی به ارائه پیچیده تری نیاز دارد. وقتی سه، چهار یا بیشتر شرایط وجود داشته باشد، وضعیت پیچیده‌تر می‌شود. به همین دلیل، گنجاندن بیش از سه (چهار) شرایط در یک مدل بسیار نادر است. به عنوان مثال، وقوع تشدید در مقدار مشخصی از خازن و اندوکتانس یک دایره الکتریکی است. تجلی یک واکنش شیمیایی با مجموعه خاصی از عناصر که سیستم از آن ساخته شده است. وقوع اثرات غیرعادی در سیستم های پیچیده تحت یک تصادف خاص از شرایط. وجود تعامل می تواند مدل سیستم را به طور اساسی تغییر دهد و گاهی منجر به تجدید نظر در ماهیت پدیده هایی شود که آزمایشگر با آنها سر و کار دارد.

تحلیل واریانس چند متغیره با آزمایش های مکرر

داده‌های اندازه‌گیری را اغلب می‌توان نه بر اساس دو، بلکه بر اساس تعداد بیشتری از عوامل گروه‌بندی کرد. بنابراین، اگر با در نظر گرفتن شرایط (کارخانه تولید و مسیری که لاستیک ها در آن کار می کنند)، تجزیه و تحلیل پراکندگی عمر مفید لاستیک های چرخ ترالی باس را در نظر بگیریم، می توانیم فصلی را که طی آن لاستیک ها در آن کار می کنند، به عنوان یک شرط جداگانه مشخص کنیم. تایرها کار می کنند (یعنی: کارکرد زمستانی و تابستانی). در نتیجه از روش سه عاملی مشکل خواهیم داشت.

در صورت وجود شرایط بیشتر، رویکرد همانند تحلیل دو عاملی است. در همه موارد سعی می کنند مدل را ساده کنند. پدیده تأثیر متقابل دو عامل چندان ظاهر نمی شود و تعامل سه گانه فقط در موارد استثنایی رخ می دهد. آن تعاملاتی را که اطلاعات قبلی و دلایل خوبی برای در نظر گرفتن آن در مدل وجود دارد، بگنجانید. فرآیند شناسایی عوامل فردی و در نظر گرفتن آنها نسبتاً ساده است. بنابراین، اغلب تمایل به برجسته کردن شرایط بیشتر وجود دارد. شما نباید از این موضوع غافل شوید. هر چه شرایط بیشتر باشد، مدل قابل اعتماد کمتر می شود و احتمال خطا بیشتر می شود. خود مدل که شامل تعداد زیادی متغیر مستقل است، برای تفسیر بسیار پیچیده و برای استفاده عملی ناخوشایند می شود.

ایده کلی تحلیل واریانس

تجزیه و تحلیل واریانس در آمار روشی برای به دست آوردن نتایج مشاهداتی وابسته به شرایط مختلف عملیاتی به طور همزمان و ارزیابی تأثیر آنها است. متغیر کنترل شده ای که با روش تأثیرگذاری بر موضوع مطالعه مطابقت دارد و در یک بازه زمانی معین مقدار معینی به دست می آورد، عامل نامیده می شود. آنها می توانند کیفی و کمی باشند. سطوح شرایط کمی معنای خاصی در مقیاس عددی به دست می آورند. مثلا دما، فشار فشار، مقدار ماده. عوامل کیفی مواد مختلف، روش های مختلف تکنولوژیکی، دستگاه ها، پرکننده ها هستند. سطوح آنها با مقیاسی از نام ها مطابقت دارد.

کیفیت همچنین می تواند شامل نوع مواد بسته بندی و شرایط نگهداری فرم دوز باشد. همچنین منطقی است که درجه آسیاب مواد خام، ترکیب کسری گرانول ها را نیز لحاظ کنیم، که اهمیت کمی دارند، اما در صورت استفاده از مقیاس کمی، تنظیم آن دشوار است. تعداد عوامل کیفی به نوع شکل دارویی و همچنین خواص فیزیکی و تکنولوژیکی مواد دارویی بستگی دارد. به عنوان مثال، قرص ها را می توان از مواد کریستالی با فشرده سازی مستقیم به دست آورد. در این مورد، کافی است مواد کشویی و روان کننده را انتخاب کنید.

نمونه هایی از فاکتورهای کیفیت برای انواع مختلف اشکال دارویی

  • تنتور.ترکیب عصاره گیری، نوع استخراج، روش تهیه مواد اولیه، روش تولید، روش فیلتراسیون.
  • عصاره ها (مایع، غلیظ، خشک).ترکیب استخراج کننده، روش استخراج، نوع نصب، روش حذف مواد استخراج کننده و بالاست.
  • قرص.ترکیبات کمکی، پرکننده ها، مواد تجزیه کننده، چسباننده ها، روان کننده ها و روان کننده ها. روش تهیه تبلت، نوع تجهیزات فناورانه. نوع پوسته و اجزای آن، فیلم سازها، رنگدانه ها، رنگ ها، نرم کننده ها، حلال ها.
  • محلول های تزریقینوع حلال، روش فیلتراسیون، ماهیت تثبیت کننده ها و نگهدارنده ها، شرایط استریلیزاسیون، روش پرکردن آمپول.
  • شیاف.ترکیب پایه شیاف، روش تولید شیاف، پرکننده، بسته بندی.
  • پمادها.ترکیب پایه، اجزای ساختاری، روش تهیه پماد، نوع تجهیزات، بسته بندی.
  • کپسول.نوع مواد پوسته، روش تولید کپسول، نوع نرم کننده، نگهدارنده، رنگ.
  • لمینت هاروش تهیه، ترکیب، نوع تجهیزات، نوع امولسیفایر.
  • سیستم های تعلیق.نوع حلال، نوع تثبیت کننده، روش پراکندگی.

نمونه هایی از فاکتورهای کیفیت و سطوح آنها در طول فرآیند تولید تبلت مورد مطالعه قرار گرفت

  • پودر خمیرمایه.نشاسته سیب زمینی، خاک رس سفید، مخلوطی از بی کربنات سدیم با اسید سیتریک، کربنات منیزیم بازی.
  • محلول اتصال.آب، خمیر نشاسته، شربت قند، محلول متیل سلولز، محلول هیدروکسی پروپیل متیل سلولز، محلول پلی وینیل پیرولیدون، محلول پلی وینیل الکل.
  • ماده کشویی.آئروسیل، نشاسته، تالک.
  • پرکننده.قند، گلوکز، لاکتوز، کلرید سدیم، فسفات کلسیم.
  • روان کننده.اسید استئاریک، پلی اتیلن گلیکول، پارافین.

مدل های تحلیل واریانس در مطالعه سطح رقابت پذیری دولت

یکی از مهمترین معیارهای ارزیابی وضعیت یک دولت که بر اساس آن سطح رفاه و توسعه اجتماعی-اقتصادی آن ارزیابی می شود، رقابت پذیری است، یعنی مجموعه ای از ویژگی های ذاتی اقتصاد ملی که تعیین کننده وضعیت دولت است. توانایی رقابت با سایر کشورها با تعیین مکان و نقش دولت در بازار جهانی، می توان یک استراتژی روشن برای تضمین امنیت اقتصادی در مقیاس بین المللی ایجاد کرد، زیرا این کلید روابط مثبت بین روسیه و همه بازیگران در بازار جهانی است: سرمایه گذاران. ، طلبکاران و دولت ها.

برای مقایسه سطح رقابت پذیری کشورها، کشورها با استفاده از شاخص های پیچیده ای که شامل شاخص های وزنی مختلف است، رتبه بندی می شوند. این شاخص ها بر اساس عوامل کلیدی موثر بر وضعیت اقتصادی، سیاسی و ... است. مجموعه ای از مدل ها برای مطالعه رقابت پذیری دولت شامل استفاده از روش های تحلیل آماری چند متغیره (به ویژه، تحلیل واریانس (آمار)، مدل سازی اقتصادسنجی، تصمیم گیری) و شامل مراحل اصلی زیر است:

  1. تشکیل یک سیستم شاخص.
  2. ارزیابی و پیش بینی شاخص های رقابت پذیری دولت.
  3. مقایسه شاخص های رقابت پذیری کشورها.

حال بیایید نگاهی به محتوای مدل های هر یک از مراحل این مجموعه داشته باشیم.

در مرحله اولبا استفاده از روش های مطالعه کارشناسی، مجموعه ای مستدل از شاخص های اقتصادی برای ارزیابی رقابت پذیری دولت با در نظر گرفتن ویژگی های توسعه آن بر اساس رتبه بندی های بین المللی و داده های بخش های آماری شکل می گیرد که وضعیت سیستم را به طور کلی منعکس می کند. و فرآیندهای آن انتخاب این شاخص ها با نیاز به انتخاب مواردی توجیه می شود که به طور کامل از نقطه نظر عملی به ما امکان می دهد سطح دولت ، جذابیت سرمایه گذاری آن و امکان بومی سازی نسبی تهدیدات بالقوه و بالفعل موجود را تعیین کنیم.

شاخص های اصلی سیستم های رتبه بندی بین المللی شاخص ها هستند:

  1. رقابت جهانی (GC).
  2. آزادی اقتصادی (IES).
  3. توسعه انسانی (HDI).
  4. تصورات فساد (CPC).
  5. تهدیدات داخلی و خارجی (IETH).
  6. پتانسیل نفوذ بین المللی (IPIP).

فاز دومارزیابی و پیش‌بینی شاخص‌های رقابت‌پذیری دولت بر اساس رتبه‌بندی‌های بین‌المللی برای 139 کشور جهان مورد مطالعه را فراهم می‌کند.

مرحله سوممقایسه شرایط رقابتی دولت ها با استفاده از روش های همبستگی و تحلیل رگرسیون فراهم می کند.

با استفاده از نتایج مطالعه، می توان ماهیت فرآیندها را به طور کلی و برای اجزای فردی رقابت پذیری دولت تعیین کرد. فرضیه تأثیر عوامل و روابط آنها را در سطح مناسبی از اهمیت آزمایش کنید.

اجرای مجموعه مدل های پیشنهادی نه تنها امکان ارزیابی وضعیت فعلی سطح رقابت پذیری و جذابیت سرمایه گذاری دولت ها را فراهم می کند، بلکه به تجزیه و تحلیل کاستی های مدیریتی، جلوگیری از اشتباهات تصمیمات اشتباه و جلوگیری از توسعه بحران در کشور می پردازد. حالت.

تحلیل واریانس یک طرفه.

مفهوم و مدل های تحلیل واریانس.

مبحث 13. تحلیل واریانس

سخنرانی 1. سوالات:

تجزیه و تحلیل واریانس، به عنوان یک روش تحقیق، در آثار R. Fischer (1918-1935) در ارتباط با تحقیقات در کشاورزی برای شناسایی شرایطی که تحت آن گونه آزمایش شده محصول کشاورزی حداکثر عملکرد را تولید می کند، ظاهر شد. تجزیه و تحلیل واریانس بیشتر در آثار ییتس توسعه یافت. تجزیه و تحلیل واریانس به ما امکان می دهد به این سؤال پاسخ دهیم که آیا عوامل خاصی تأثیر قابل توجهی بر تغییرپذیری یک عامل دارند که مقادیر آن را می توان در نتیجه تجربه به دست آورد. هنگام آزمون فرضیه های آماری، تغییرات تصادفی در عوامل مورد مطالعه فرض می شود. در تحلیل واریانس، یک یا چند عامل به صورت مشخص تغییر می‌کنند و این تغییرات می‌تواند بر نتایج مشاهدات تأثیر بگذارد. مطالعه چنین تأثیری هدف تحلیل واریانس است.

در حال حاضر، به طور فزاینده ای از تحلیل واریانس در اقتصاد، جامعه شناسی، زیست شناسی و غیره استفاده می شود، به ویژه پس از ظهور نرم افزاری که مشکلات دست و پا گیر بودن محاسبات آماری را از بین برد.

در فعالیت‌های عملی، در زمینه‌های مختلف علمی، اغلب با نیاز به ارزیابی تأثیر عوامل مختلف بر برخی شاخص‌ها مواجه هستیم. اغلب این عوامل ماهیت کیفی دارند (به عنوان مثال، یک عامل کیفی مؤثر بر اثر اقتصادی ممکن است معرفی یک سیستم مدیریت تولید جدید باشد) و سپس تحلیل واریانس ارزش خاصی پیدا می کند، زیرا تنها روش آماری تحقیق است که چنین می دهد. ارزیابی.

تجزیه و تحلیل واریانس تعیین اینکه آیا یکی از عوامل مورد بررسی تأثیر قابل توجهی بر تغییرپذیری یک صفت دارد یا خیر و همچنین کمی کردن "وزن ویژه" هر منبع تغییرپذیری در کلیت آنها را ممکن می سازد. اما تجزیه و تحلیل واریانس به ما امکان می دهد فقط در مورد وجود تأثیر قابل توجه پاسخ مثبت بدهیم، در غیر این صورت سؤال باز می ماند و به تحقیقات اضافی نیاز دارد (اغلب افزایش تعداد آزمایش ها).

از اصطلاحات زیر در تحلیل واریانس استفاده می شود.

عامل (X) چیزی است که ما معتقدیم باید بر نتیجه (ویژگی نتیجه) Y تأثیر بگذارد.

سطح عامل (یا روش پردازش، گاهی اوقات به معنای واقعی کلمه، به عنوان مثال، روش کشت خاک) - مقادیر (X، i = 1.2، ... I) که عامل می تواند بگیرد.

پاسخ - مقدار مشخصه اندازه گیری شده (مقدار نتیجه Y).

تکنیک ANOVA بسته به تعداد عوامل مستقل مورد مطالعه متفاوت است. اگر عوامل ایجاد تغییر در مقدار متوسط ​​یک مشخصه متعلق به یک منبع باشد، در این صورت یک گروه بندی ساده یا تحلیل واریانس تک عاملی و سپس گروه بندی دوگانه - تحلیل واریانس دو عاملی، سه عاملی خواهیم داشت. تحلیل واریانس، ...، ضریب m. عوامل در تحلیل چند متغیره معمولا با حروف لاتین نشان داده می شوند: A، B، C و غیره.



وظیفه تحلیل واریانس مطالعه تأثیر برخی عوامل (یا سطوح عوامل) بر تغییرپذیری میانگین مقادیر متغیرهای تصادفی مشاهده شده است.

ماهیت تحلیل واریانس. تجزیه و تحلیل واریانس شامل جداسازی و ارزیابی عوامل فردی است که باعث تغییرپذیری می شود. برای این منظور، واریانس کل جمعیت جزئی مشاهده شده (واریانس کل صفت)، ناشی از همه منابع تنوع، به اجزای واریانس تولید شده توسط عوامل مستقل تجزیه می شود. هر یک از این مؤلفه ها تخمینی از واریانس، ...، ناشی از منبع خاصی از تنوع، در کل جمعیت را ارائه می دهد. برای آزمون اهمیت این تخمین‌های واریانس مؤلفه‌ها، آنها با واریانس کل در جامعه مقایسه می‌شوند (آزمون فیشر).

به عنوان مثال، در تجزیه و تحلیل دو عاملی، ما تجزیه شکل را دریافت می کنیم:

واریانس کل صفت مورد مطالعه C;

سهم واریانس ناشی از تأثیر عامل A.

سهم واریانس ناشی از تأثیر عامل B.

نسبت واریانس ناشی از اثر متقابل عوامل A و B.

سهم واریانس ناشی از علل تصادفی حساب نشده (واریانس تصادفی)؛

در تحلیل واریانس این فرضیه در نظر گرفته می شود: H 0 - هیچ یک از عوامل مورد بررسی بر تغییرپذیری صفت تأثیری ندارد. اهمیت هر تخمین واریانس با مقدار نسبت آن به تخمین واریانس تصادفی بررسی شده و با مقدار بحرانی مربوطه، در سطح معناداری a، با استفاده از جداول مقادیر بحرانی توزیع F Fisher-Snedecor مقایسه می شود (پیوست 4) . اگر F محاسبه شود، فرضیه H 0 در رابطه با این یا آن منبع تغییرپذیری رد می شود. > F cr. (به عنوان مثال، برای عامل B: S B 2 / S ε 2 > F cr.).

تحلیل واریانس آزمایش‌ها را از 3 نوع در نظر می‌گیرد:

الف) آزمایش هایی که در آن همه عوامل دارای سطوح سیستماتیک (ثابت) هستند.

ب) آزمایش هایی که در آنها همه عوامل دارای سطوح تصادفی هستند.

ج) آزمایشاتی که در آن عواملی دارای سطوح تصادفی و همچنین عواملی دارای سطوح ثابت هستند.

موارد الف)، ب)، ج) مربوط به سه مدل است که در تحلیل واریانس در نظر گرفته می شود.

داده های ورودی برای تحلیل واریانس معمولاً به شکل جدول زیر ارائه می شود:

مشاهده شماره j سطوح عاملی
الف 1 الف 2 A r
X 11 X 21 X p1
X 12 X 22 Xp2
X 13 X 23 X p3
. . .
. . .
. . .
n X 1n X2n Xpn
نتایج

یک عامل واحد را در نظر بگیرید که p سطوح مختلف را می گیرد، و فرض کنید که در هر سطح n مشاهده انجام شده است، N=np مشاهدات. (ما خود را به در نظر گرفتن اولین مدل تحلیل واریانس محدود می کنیم - همه عوامل دارای سطوح ثابت هستند.)

اجازه دهید نتایج به شکل X ij (i=1,2…,р; j=1,2,…,n) ارائه شود.

فرض بر این است که برای هر سطح از n مشاهده یک میانگین وجود دارد که برابر است با مجموع میانگین کلی و تغییرات آن به دلیل سطح انتخاب شده:

جایی که m میانگین کلی است.

A i - اثر ناشی از سطح i – m عامل.

e ij - تنوع نتایج در سطح عامل فردی. اصطلاح e ij تمام عوامل غیر قابل کنترل را در نظر می گیرد.

اجازه دهید مشاهدات در سطح عامل ثابت به طور معمول حول میانگین m + A i با واریانس مشترک s 2 توزیع شوند.

سپس (نقطه به جای شاخص نشان دهنده میانگین مشاهدات مربوطه بر روی این شاخص است):

A.X ij – X.. = (X i . – X..) + (X ij – X i .). (12.3)

پس از دو طرف معادله و جمع کردن i و j، به دست می آید:

از زمان، اما

در غیر این صورت، مجموع مربع ها را می توان نوشت: S = S 1 + S 2. مقدار S 1 از انحراف میانگین های p از میانگین کلی X محاسبه می شود، بنابراین S 1 دارای (p-1) درجه آزادی است. مقدار S 2 از انحراف مشاهدات N از میانگین p نمونه محاسبه می شود و بنابراین دارای درجه آزادی N-р = np - p=p(n-1) است. S دارای درجه آزادی (N-1) است. بر اساس نتایج محاسباتی، جدول تحلیل واریانس ساخته شده است.

جدول ANOVA

اگر این فرضیه که تأثیر همه سطوح برابر است درست باشد، هر دو M 1 و M 2 (میانگین مربعات) تخمین های بی طرفانه s 2 خواهند بود. این بدان معناست که با محاسبه نسبت (M 1 / M 2) و مقایسه آن با F cr می توان این فرضیه را آزمایش کرد. با ν 1 = (p-1) و ν 2 = (N-p) درجه آزادی.

اگر F محاسبه شود > F cr. ، پس فرضیه تاثیر ناچیز عامل A بر نتیجه مشاهدات پذیرفته نمی شود.

برای ارزیابی اهمیت تفاوت در F calc. میز اف محاسبه:

الف) خطای آزمایشی

ب) خطای اختلاف میانگین ها

ج) کوچکترین تفاوت معنی دار

با مقایسه تفاوت در مقادیر میانگین برای گزینه ها با NSR، آنها به این نتیجه رسیدند که تفاوت در سطح میانگین ها قابل توجه است.

اظهار نظر. استفاده از تحلیل واریانس فرض می کند که:

2) D(ε ij) = σ 2 = ثابت،

3) ε ij → N (0، σ) یا x ij → N (a، σ).

کارشناس آمار تحلیلی

7.1 تجزیه و تحلیل واریانس. 2

در این نسخه از روش، نمونه های مختلفی از موضوعات در معرض تأثیر هر یک از درجه بندی ها قرار می گیرند. حداقل باید درجه بندی فاکتور وجود داشته باشد سه.

مثال 1.به سه گروه مختلف از شش آزمودنی فهرستهای ده کلمه ای داده شد. کلمات به گروه اول با سرعت کم - 1 کلمه در 5 ثانیه، به گروه دوم با سرعت متوسط ​​- 1 کلمه در 2 ثانیه و به گروه سوم با سرعت بالا - 1 کلمه در ثانیه ارائه شد. عملکرد بازتولید به سرعت ارائه کلمه بستگی دارد. نتایج در جدول ارائه شده است. 1.

جدول 1. تعداد کلمات بازتولید شده (براساسجی. Greene, M D "Olivera, 1989, p. 99)

موضوع شماره

سرعت کم گروه 1

گروه 2 سرعت متوسط

گروه 3 سرعت بالا

مقادیر

میانگین

7,17

6,17

4,00

مبلغ کل

تجزیه و تحلیل واریانس تک متغیره به شما امکان می دهد فرضیه های زیر را آزمایش کنید:

H 0 : تفاوت در حجم تولید کلمه بینگروه ها بیشتر از تفاوت های تصادفی مشخص نیستند داخلهر گروه

H 1 : تفاوت در حجم تولید کلمه بینگروه ها بیشتر از تفاوت های تصادفی هستند داخلهر گروه

دنباله عملیات در تحلیل واریانس یک طرفه برای نمونه های نامرتبط:

1. بیایید بشماریم واقعیت اس اس- تغییرپذیری صفت به دلیل عمل عامل مورد مطالعه. نامگذاری مشترکاس اس - مخفف "مجموع مربعات" (مجموع مربعات ). این مخفف اغلب در منابع ترجمه شده استفاده می شود (برای مثال نگاه کنید به: Glass J., Stanley J., 1976).

,(1)

که در آن Tc مجموع مقادیر جداگانه برای هر شرط است. برای مثال ما، 43، 37، 24 (جدول 1 را ببینید).

c - تعداد شرایط (درجه بندی) عامل (=3)؛

n - تعداد افراد در هر گروه (=6)؛

ن - تعداد کل مقادیر فردی (=18)؛

مربع مجموع مجموع مقادیر فردی (=104 2 =10816)

به تفاوت بین، که در آن همه مقادیر فردی ابتدا مجذور و سپس جمع می شوند، و در جایی که مقادیر فردی ابتدا جمع می شوند تا مجموع کل به دست آید، و سپس این مجموع مجذور می شود، توجه کنید.

با استفاده از فرمول (1)، پس از محاسبه تغییرپذیری واقعی صفت، به دست می آوریم:

2. بیایید بشماریم ژنرال اس اس– تنوع کلی صفت:


(2)

3. مقدار تصادفی (باقیمانده) را محاسبه کنیدSS sl، ناشی از عوامل نامشخص:

(3)

4.تعداد درجات آزادیبرابر است با:

=3-1=2(4)

5."مربع وسط"یا مقدار متوسط ​​مجموع مربع های مربوطه SS برابر است با:

(5)

6. معنی آمار معیار F emمحاسبه با استفاده از فرمول:

(6)

برای مثال ما داریم : F em =15.72/2.11=7.45

7. تعریف کنید F critطبق جداول آماری برنامه های کاربردی 3برای df 1 = k 1 = 2 و df 2 = k 2 = 15 مقدار جدول آمار 3.68 است

8. اگر F em< F بحرانی است، سپس فرضیه صفر پذیرفته می شود، در غیر این صورت فرضیه جایگزین پذیرفته می شود. برای مثال ما F em> F crit (7.45>3.68)، بنابراین ص

نتیجه:تفاوت در یادآوری کلمات بین گروه ها بیشتر از تفاوت های تصادفی در هر گروه است (ص<0,05). Т.о. скорость предъявления слов влияет на объем их воспроизведения.

7.1.2 آنالیز واریانس برای نمونه های مرتبط

روش تحلیل واریانس برای نمونه های مرتبط در مواردی استفاده می شود که تأثیر درجه بندی های مختلف یک عامل یا شرایط مختلف بر همان نمونه موضوعاتحداقل باید درجه بندی فاکتور وجود داشته باشد سه.

در این مورد، تفاوت بین موضوعات منبع مستقل احتمالی تفاوت ها است. ANOVA یک طرفه برای نمونه های مرتبطبه ما این امکان را می دهد که تعیین کنیم چه چیزی بیشتر است - تمایل بیان شده توسط منحنی تغییر عامل یا تفاوت های فردی بین افراد. عامل تفاوت های فردی ممکن است بیشتر از عامل تغییرات در شرایط تجربی باشد.

مثال 2.گروهی متشکل از 5 آزمودنی با استفاده از سه کار آزمایشی با هدف مطالعه پشتکار فکری مورد بررسی قرار گرفتند (Sidorenko E.V., 1984). هر موضوع به طور جداگانه با سه آنگرام یکسان به صورت متوالی ارائه شد: یک چهار حرفی، یک پنج حرفی و یک حرف شش حرفی. آیا می توان فرض کرد که ضریب طول آنگرام بر مدت زمان تلاش برای حل آن تأثیر می گذارد؟

جدول 2. مدت زمان حل آناگرام ها (ثانیه)

کد موضوع

شرط 1. آنگرام چهار حرفی

شرط 2. آناگرام پنج حرفی

شرط 3. آناگرام شش حرفی

مبالغ بر اساس موضوعات

مقادیر

1244

1342

بیایید فرضیه ها را تدوین کنیم. در این مورد دو مجموعه فرضیه وجود دارد.

مجموعه A.

H 0 (A): تفاوت در طول مدت تلاش برای حل آناگرام های با طول های مختلف به دلایل تصادفی بیشتر از تفاوت ها نیست.

H 1 (A): تفاوت در طول مدت تلاش برای حل آناگرام های با طول های مختلف بیشتر از تفاوت ها به دلایل تصادفی است.

مجموعه B.

N در مورد (B): تفاوت های فردی بین آزمودنی ها بیشتر از تفاوت های ناشی از علل تصادفی نیست.

H 1 (B): تفاوت های فردی بین آزمودنی ها بیشتر از تفاوت ها به دلایل تصادفی است.

دنباله عملیات در تحلیل واریانس یک طرفه برای نمونه های مرتبط:

1. بیایید بشماریم واقعیت اس اس- تغییرپذیری صفت ناشی از عمل عامل مورد مطالعه طبق فرمول (1).

که در آن Tc مجموع مقادیر جداگانه برای هر یک از شرایط (ستون ها) است. برای مثال ما، 51، 1244، 47 (به جدول 2 مراجعه کنید). c - تعداد شرایط (درجه بندی) عامل (=3)؛ n - تعداد افراد در هر گروه (=5)؛ن - تعداد کل مقادیر فردی (=15)؛ - مربع مجموع مجموع مقادیر فردی (=1342 2)

2. بیایید بشماریم SS isp- تغییرپذیری علامت به دلیل ارزش های فردی افراد.

جایی که T و مجموع مقادیر فردی برای هر موضوع است. برای مثال ما، 247، 631، 100، 181، 183 (به جدول 2 مراجعه کنید). c - تعداد شرایط (درجه بندی) عامل (=3)؛ن - تعداد کل مقادیر فردی (=15)؛

3. بیایید بشماریم ژنرال اس اس– تنوع کلی صفت طبق فرمول (2):


4. مقدار تصادفی (باقیمانده) را محاسبه کنیدSS slناشی از عوامل نامشخص طبق فرمول (3):

5. تعداد درجات آزادیبرابر با (4):

; ; ;

6. "مربع وسط"یا انتظارات ریاضی از مجموع مربع ها،مقدار متوسط ​​مجموع مربع های SS برابر با (5) است:

;

7. ارزش آماری معیار F emبا استفاده از فرمول (6) محاسبه کنید:

;

8. بیایید F کریت را از جداول آماری پیوست 3 برای df 1 =k 1 = 2 و df 2 = k 2 = 8 مقدار جدول آمار F crit_fact = 4.46 و برای df 3 = k 3 = 4 و df 2 = k تعیین کنیم. 2 = 8 F crit_exp = 3.84

9. F em_fact> F Critical_fact (6.872>4.46)، بنابراین ص یک فرضیه جایگزین پذیرفته می شود.

10. F em_use < F крит_исп (1,054<3,84), следовательно пفرضیه صفر پذیرفته می شود.

نتیجه:تفاوت در حجم بازتولید کلمه در شرایط مختلف بیشتر از تفاوت های ناشی از دلایل تصادفی است (p<0,05).Индивидуальные различия между испытуе­мыми являются не более выраженными, чем различия, обусловленные случайными причинами.

7.2 تجزیه و تحلیل همبستگی

7.2.1 مفهوم همبستگی

یک محقق اغلب به چگونگی ارتباط دو یا چند متغیر با یکدیگر در یک یا چند نمونه مورد مطالعه علاقه مند است. به عنوان مثال، آیا دانش‌آموزان با سطوح بالای اضطراب می‌توانند موفقیت‌های تحصیلی ثابتی از خود نشان دهند، یا مدت زمانی که معلم در مدرسه کار می‌کند به میزان حقوق او مرتبط است، یا آنچه بیشتر به سطح رشد ذهنی دانش‌آموزان مربوط می‌شود. عملکرد در ریاضی یا ادبیات و غیره.

به این نوع وابستگی بین متغیرها همبستگی یا همبستگی می گویند. همبستگی ارتباط- این یک تغییر هماهنگ در دو ویژگی است که نشان دهنده این واقعیت است که تغییرپذیری یک مشخصه مطابق با تغییرپذیری دیگری است.

به عنوان مثال مشخص است که به طور متوسط ​​بین قد افراد و وزن آنها رابطه مثبت وجود دارد و به این ترتیب که هر چه قد بیشتر باشد وزن فرد نیز بیشتر می شود. با این حال، استثناهایی از این قاعده وجود دارد، زمانی که افراد نسبتاً کوتاه قد اضافه وزن دارند و برعکس، افراد آستنیک با قد بلند وزن کم دارند. دلیل چنین استثناهایی این است که هر علامت بیولوژیکی، فیزیولوژیکی یا روانی تحت تأثیر عوامل بسیاری تعیین می شود: محیطی، ژنتیکی، اجتماعی، محیطی و غیره.

اتصالات همبستگی تغییرات احتمالی هستند که فقط بر روی نمونه های نماینده با استفاده از روش های آمار ریاضی قابل مطالعه هستند. E.V می نویسد: «هر دو اصطلاح. سیدورنکو، - ارتباط همبستگی و وابستگی همبستگی- اغلب به عنوان مترادف استفاده می شود. وابستگی مستلزم نفوذ، ارتباط است - هر تغییر هماهنگی که می تواند با صدها دلیل توضیح داده شود. پیوندهای همبستگی را نمی توان به عنوان شاهدی بر یک رابطه علت و معلولی در نظر گرفت، آنها فقط نشان می دهند که تغییرات در یک ویژگی معمولاً با تغییرات خاصی در ویژگی دیگر همراه است.

وابستگی همبستگی - اینها تغییراتی هستند که مقادیر یک مشخصه را به احتمال ظهور مقادیر مختلف مشخصه دیگر وارد می کنند (E.V. Sidorenko, 2000).

وظیفه تحلیل همبستگی به تعیین جهت (مثبت یا منفی) و شکل (خطی، غیرخطی) رابطه بین ویژگی های مختلف، اندازه گیری نزدیکی آن، و در نهایت، بررسی سطح اهمیت ضرایب همبستگی به دست آمده می رسد.

همبستگی ها متفاوت است در شکل، جهت و درجه (قدرت).

بر اساس شکلرابطه همبستگی می تواند خطی یا منحنی باشد. به عنوان مثال، ارتباط بین تعداد جلسات آموزشی در شبیه ساز و تعداد مسائل به درستی حل شده در جلسه کنترل ممکن است ساده باشد. برای مثال، رابطه بین سطح انگیزه و اثربخشی یک کار ممکن است منحنی باشد (شکل 1 را ببینید). با افزایش انگیزه، ابتدا اثربخشی انجام یک کار افزایش می یابد، سپس سطح بهینه انگیزه به دست می آید که با حداکثر اثربخشی انجام کار مطابقت دارد. افزایش بیشتر انگیزه با کاهش کارایی همراه است.

عکس. 1. رابطه بین اثربخشی حل یک مشکل

و قدرت گرایش انگیزشی (طبق نظر J. W. A t k in son، 1974، p 200)

به سمتهمبستگی می تواند مثبت ("مستقیم") و منفی ("معکوس") باشد. با یک همبستگی خطی مثبت، مقادیر بالاتر یک مشخصه با مقادیر بالاتر مشخصه دیگر و مقادیر پایین تر یک مشخصه با مقادیر پایین مشخصه دیگر مطابقت دارد. با یک همبستگی منفی، روابط معکوس می شوند. با همبستگی مثبت، مثلاً ضریب همبستگی علامت مثبت داردr = 0.207، با یک همبستگی منفی - برای مثال یک علامت منفیr = -0.207.

درجه، قدرت یا سفتی ارتباط همبستگی با مقدار ضریب همبستگی تعیین می شود.

قدرت اتصال به جهت آن بستگی ندارد و با مقدار مطلق ضریب همبستگی تعیین می شود.

حداکثر مقدار مطلق ممکن ضریب همبستگیr = 1.00; کمترین r = 0.00.

طبقه بندی کلی همبستگی ها (طبق نظر ایوانتر E.V.، Korosov A.V.، 1992):

قوی، یا تنگبا ضریب همبستگیr > 0.70;

میانگیندر 0,50< r<0,69 ;

در حد متوسطدر 0,30< r<0,49 ;

ضعیفدر 0,20< r<0,29 ;

خیلی ضعیفدر r<0,19 .

متغیرهای X و Y را می توان در مقیاس های مختلف اندازه گیری کرد، این چیزی است که انتخاب ضریب همبستگی مناسب را تعیین می کند (جدول 3 را ببینید):

جدول 3. استفاده از ضریب همبستگی بسته به نوع متغیرها

نوع مقیاس

اندازه گیری اتصال

متغیر X

متغیر Y

فاصله یا رابطه

فاصله یا رابطه

ضریب پیرسون

رتبه، فاصله یا نسبت

ضریب اسپیرمن

رتبه بندی شده است

رتبه بندی شده است

ضریب کندال

دوگانه

دوگانه

ضریب "j"

دوگانه

رتبه بندی شده است

رتبه دو سریال

دوگانه

فاصله یا رابطه

بیسریال

7.2.2 ضریب همبستگی پیرسون

اصطلاح "همبستگی" توسط طبیعت شناس برجسته انگلیسی فرانسیس گالتون در سال 1886 وارد علم شد. با این حال، فرمول دقیق برای محاسبه ضریب همبستگی توسط شاگرد او کارل پیرسون ایجاد شد.

ضریب تنها وجود یک رابطه خطی بین ویژگی ها را مشخص می کند که معمولاً با نمادهای X و Y نشان داده می شود. فرمول محاسبه ضریب همبستگی به گونه ای ساخته شده است که اگر رابطه بین ویژگی ها خطی باشد، ضریب پیرسون به طور دقیق ضریب همبستگی را تعیین می کند. نزدیکی این رابطه بنابراین به آن ضریب همبستگی خطی پیرسون نیز می گویند. اگر ارتباط بین متغیرهای X و Y خطی نیست، پس پیرسون به اصطلاح رابطه همبستگی را برای ارزیابی نزدیکی این ارتباط پیشنهاد کرد.

مقدار ضریب همبستگی خطی پیرسون نمی تواند از 1+ تجاوز کند و کمتر از 1- باشد. این دو عدد 1+ و 1- مرزهای ضریب همبستگی هستند. هنگامی که محاسبه به مقداری بزرگتر از 1+ یا کمتر از 1- منجر می شود، در نتیجه یک خطا در محاسبات رخ داده است.

علامت ضریب همبستگی برای تفسیر رابطه حاصل بسیار مهم است. اجازه دهید یک بار دیگر تأکید کنیم که اگر علامت ضریب همبستگی خطی مثبت باشد، رابطه بین ویژگی های همبسته به گونه ای است که مقدار بزرگتر یک ویژگی (متغیر) با مقدار بزرگتر ویژگی دیگر (متغیر دیگر) مطابقت دارد. به عبارت دیگر، اگر یک شاخص (متغیر) افزایش یابد، شاخص دیگر (متغیر) متناسب با آن افزایش می یابد. این وابستگی را وابستگی مستقیم می نامند.

اگر علامت منفی دریافت شود، مقدار بزرگتر یک مشخصه با مقدار کوچکتر دیگری مطابقت دارد. به عبارت دیگر، اگر علامت منفی وجود داشته باشد، افزایش یک متغیر (علامت، مقدار) با کاهش در متغیر دیگر مطابقت دارد. این وابستگی را وابستگی با نسبت معکوس می نامند.

به طور کلی فرمول محاسبه ضریب همبستگی به صورت زیر است:

(7)

جایی که ایکس من- مقادیر گرفته شده در نمونه X،

y من- مقادیر پذیرفته شده در نمونه Y؛

میانگین برای X، - میانگین برای Y.

محاسبه ضریب همبستگی پیرسون فرض می کند که متغیرهای X و Y توزیع شده اند. خوب.

فرمول (7) حاوی مقدار است وقتی تقسیم بر n (تعداد مقادیر متغیر X یا Y) نامیده می شود کوواریانس. فرمول (7) همچنین فرض می کند که هنگام محاسبه ضرایب همبستگی، تعداد مقادیر متغیر X برابر با تعداد مقادیر متغیر است. Y.

تعداد درجات آزادی k = n -2.

مثال 3.از 10 دانش آموز آزمون تفکر تصویری-تصویری و کلامی داده شد. میانگین زمان برای حل تکالیف آزمون بر حسب ثانیه اندازه گیری شد. محقق به این سوال علاقه مند است که آیا رابطه ای بین زمان لازم برای حل این مشکلات وجود دارد؟ متغیر X نشان‌دهنده میانگین زمان برای حل تکالیف تصویری-تصویری و متغیر Y نشان‌دهنده میانگین زمان برای حل تکالیف تست کلامی است.

راه حل. اجازه دهید داده های اولیه را در قالب جدول 4 ارائه کنیم که حاوی ستون های اضافی لازم برای محاسبه با استفاده از فرمول (7) است.

جدول 4

تعداد موضوعات

ایکس

x i -

(x i - ) 2

y من -

(y i -) 2

16,7

278,89

51,84

120,24

13,69

17,2

295,84

63,64

7,29

51,84

19,44

68,89

14,44

31,54

59,29

7,84

21,56

0,49

46,24

4,76

10,89

17,64

13,86

10,89

51,84

23,76

68,89

10,8

116,64

89,64

68,89

18,8

353,44

156,04

مجموع

357

242

588,1

1007,6

416,6

میانگین

35,7

24,2

مقدار تجربی ضریب همبستگی را با استفاده از فرمول (7) محاسبه می کنیم:

مقادیر بحرانی ضریب همبستگی به دست آمده را مطابق جدول ضمیمه 3 تعیین می کنیم. هنگام یافتن مقادیر بحرانی برای ضریب همبستگی خطی پیرسون محاسبه شده، تعداد درجات آزادی به صورت k = محاسبه می شود. n – 2 = 8.

k crit = 0.72 > 0.54، بنابراین، فرضیه H 1 رد شده و فرضیه پذیرفته می شود. H 0 به عبارت دیگر ارتباط زمان حل تکالیف تست تصویری-تصویری و کلامی ثابت نشده است.

7.3 تجزیه و تحلیل رگرسیون

این گروهی از روش‌ها با هدف شناسایی و بیان ریاضی آن تغییرات و وابستگی‌هایی است که در سیستمی از متغیرهای تصادفی رخ می‌دهند. اگر چنین سیستمی یک سیستم آموزشی را الگوبرداری کند، در نتیجه، از طریق تحلیل رگرسیون، پدیده‌های روان‌شناختی و تربیتی و وابستگی‌های بین آنها شناسایی و به صورت ریاضی بیان می‌شوند. ویژگی‌های این پدیده‌ها در مقیاس‌های مختلف سنجیده می‌شود که محدودیت‌هایی را بر روش‌های بیان ریاضی تغییرات و وابستگی‌هایی که توسط معلم پژوهشگر مطالعه می‌شود، تحمیل می‌کند.

روش‌های تحلیل رگرسیون عمدتاً برای مورد توزیع نرمال پایدار طراحی شده‌اند که در آن تغییرات از کارآزمایی به کارآزمایی فقط در قالب کارآزمایی‌های مستقل ظاهر می‌شوند.

مشکلات رسمی مختلف تحلیل رگرسیون شناسایی می شوند. آنها می توانند از نظر فرمولاسیون، ابزارهای ریاضی و شدت کار ساده یا پیچیده باشند. اجازه دهید مواردی را که به نظر می رسد اصلی هستند فهرست کرده و با مثال در نظر بگیریم.

اولین وظیفه این است شناسایی واقعیت تغییرپذیری پدیده ای که تحت شرایط خاص، اما نه همیشه به وضوح ثابت، مورد مطالعه قرار می گیرد. در سخنرانی قبلی، ما قبلا این مشکل را با استفاده از معیارهای پارامتری و ناپارامتریک حل کردیم.

وظیفه دوم - یک روند را شناسایی کنید به عنوان یک تغییر دوره ای در یک ویژگی. این ویژگی خود ممکن است وابسته به متغیر شرط باشد یا نباشد (ممکن است به شرایط ناشناخته یا غیرقابل کنترل توسط محقق بستگی داشته باشد). اما این برای کار مورد بررسی که فقط به شناسایی روند و ویژگی های آن محدود می شود، مهم نیست.

آزمون فرضیه های مربوط به عدم وجود یا وجود یک روند را می توان با استفاده از معیار Abbe انجام داد . معیار آبهطراحی شده برای آزمون فرضیه های برابری مقادیر میانگین ایجاد شده برای 4

مقدار تجربی معیار Abbe با فرمول محاسبه می شود:

(8)

میانگین حسابی نمونه کجاست.

پ- تعداد مقادیر در نمونه

با توجه به این معیار، فرضیه برابری میانگین ها رد می شود (فرضیه جایگزین پذیرفته می شود) اگر مقدار آماره باشد. ارزش جدولی (بحرانی) آمار از جدول معیار q Abbe تعیین می شود، که با اختصارات، از کتاب L.N. بولیشوا و N.V. اسمیرنوا (به پیوست 3 مراجعه کنید).

چنین مقادیری که معیار Abbe برای آنها قابل اعمال است، می توانند سهم نمونه یا درصد، میانگین حسابی و سایر آمارهای توزیع نمونه باشند، اگر نزدیک به نرمال باشند (یا قبلاً نرمال شده باشند). بنابراین، معیار Abbe می تواند کاربرد گسترده ای در تحقیقات روانشناختی و تربیتی پیدا کند. بیایید نمونه ای از شناسایی روند با استفاده از معیار Abbe را در نظر بگیریم.

مثال 4.روی میز شکل 5 پویایی درصد دانش آموزان را نشان می دهد IV دوره ای که در طی 10 سال کار در یکی از دانشکده های دانشگاه در جلسات زمستانی با "ممتاز" امتحان داده اند، لازم است مشخص شود که آیا تمایل به افزایش عملکرد تحصیلی وجود دارد یا خیر.

جدول 5. پویایی درصد دانشجویان ممتاز سال چهارم بیش از 10 سال کار دانشکده

سال تحصیلی

1995-96

10,8

1996-97

16,4

1997-98

17,4

1998-99

22,0

1999-00

23,0

2000-01

21,5

2001-02

26,1

2002-03

17,2

2003-04

27,5

2004-05

33,0

مانند خالیما فرضیه عدم وجود روند، یعنی در مورد برابری درصدها را آزمایش می کنیم.

درصدهای داده شده در جدول را میانگین می گیریم. 5، متوجه می شویم که = 21.5. ما تفاوت بین مقادیر بعدی و قبلی را در نمونه محاسبه می کنیم، آنها را مربع می کنیم و آنها را جمع می کنیم:

به طور مشابه، مخرج در فرمول (8) را محاسبه می کند، مجذور اختلاف بین هر اندازه گیری و میانگین حسابی را جمع می کند:

حال با استفاده از فرمول (8) دریافت می کنیم:

در جدول معیار Abbe از پیوست 3، متوجه می شویم که با n = 10 و سطح معنی داری 0.05، مقدار بحرانی بزرگتر از 0.41 به دست آمده است، بنابراین فرضیه برابری درصد "دانش آموزان ممتاز" باید باشد. رد شد و می‌توانیم فرضیه جایگزین در مورد وجود یک روند را بپذیریم.

وظیفه سوم این است شناسایی الگوی بیان شده در قالب یک معادله همبستگی (رگرسیون).

مثال 5.محقق استونیایی J. Mikk، با مطالعه مشکلات درک متن، "فرمول خوانایی" را ایجاد کرد که یک رگرسیون خطی چندگانه است:

ارزیابی دشواری درک متن،

که در آن x 1 طول جملات مستقل در تعداد کاراکترهای چاپ شده است،

x 2 - درصد کلمات مختلف ناآشنا،

x 3 - انتزاع بودن مفاهيم مكرر كه با اسم ها بيان مي شود .

با مقایسه ضرایب رگرسیون بیانگر میزان تأثیر عوامل، می توان دریافت که دشواری درک یک متن در درجه اول به دلیل انتزاعی بودن آن تعیین می شود. دشواری درک متن به نصف (0.27) به تعداد کلمات ناآشنا بستگی دارد و عملاً اصلاً به طول جمله بستگی ندارد.