Како проценити статистичку значајност

Аутор: Randy Alexander
Датум Стварања: 2 Април 2021
Ажурирати Датум: 26 Јуни 2024
Anonim
Шесть сигма.  Бережливое производство.  Управление изменениями
Видео: Шесть сигма. Бережливое производство. Управление изменениями

Садржај

Испитивање хипотезе се води статистичком анализом. Статистички значајно поверење израчунава се помоћу вредности п - што указује на вероватноћу посматраног резултата када је одређена (нулта хипотеза) тачна. Ако је п-вредност мања од нивоа значајности (обично 0,05), експериментатор може закључити да постоји довољно доказа да се побије нулта хипотеза и призна инверзна хипотеза. Помоћу једноставног т-теста можете израчунати п-вредност и утврдити значај између две различите групе података.

Кораци

1. део од 3: Поставите експерименте

  1. Утврдите своју хипотезу. Први корак у процени статистичке значајности је идентификовање питања на која треба одговорити и изјашњавање о вашој хипотези. Хипотеза је исказ емпиријских података и могућих одступања у популацији. Сваки експеримент има нулту и инверзну хипотезу. Генерално, упоредићете две групе да бисте видели да ли су исте или различите.
    • Генерално, хипотеза није (Х.0) потврђују да не постоји разлика између две групе података. Пример: Ученици који су материјал прочитали пре наставе не добијају боље завршне оцене.
    • Инверзна хипотеза (Х.а) је супротно нултој хипотези и изјава је коју покушавате да поткријепите својим емпиријским подацима. На пример: Студенти који су материјал прочитали пре наставе заправо добијају боље завршне оцене.

  2. Изаберите ниво значајности да бисте утврдили степен разлике која се у подацима може видети као значајна. Ниво значајности (познат и као алфа) је праг који сте одабрали за одређивање значења. Ако је вредност п мања или једнака датом нивоу значајности, подаци се сматрају статистички значајним.
    • Као опште правило, ниво значајности (или алфа) обично се бира на нивоу 0,05 - што значи да је шанса за уочавање разлике која се види у подацима случајна само 5%.
    • Што је већи ниво поузданости (и самим тим, што је нижа п-вредност), то су резултати значајнији.
    • Ако је потребно више поверења, спустите вредност п на 0,01. Ниска вредност п често се користи у производњи за откривање недостатака на производу. Висок степен поузданости је пресудан за прихватање да ће сваки део функционисати како треба.
    • За већину експеримената заснованих на хипотезама прихватљив је ниво значајности од 0,05.

  3. Одлучите да ли ћете користити једнострани или двострани тест. Једна од претпоставки т-теста је да су ваши подаци у нормалној дистрибуцији. Нормална расподела формираће звонасту кривуљу са већином посматрања усредсређеним. Т-тест је математички тест који проверава да ли ваши подаци падају на спољну страну нормалне расподеле, изнад или испод, у „горњи“ део криве.
    • Ако нисте сигурни да ли су подаци изнад или испод контролне групе, користите двострани тест. Омогућава вам да проверите значај у оба смера.
    • Ако знате какав је очекивани правац ваших података, користите једнострани тест. У горњем примеру очекујете да ће се резултати ученика побољшати. Због тога користите једнострани тест.

  4. Анализом силе одредити величину узорка. Снага теста је способност посматрања очекиваног резултата са датом величином узорка. Уобичајени праг силе (или β) је 80%. Анализа силе може бити прилично компликована без неких прелиминарних података, јер су вам потребне неке информације о очекиваној средњој вредности између група и њиховим стандардним одступањима. Помоћу мрежне анализе силе одредите оптималну величину узорка за своје податке.
    • Истраживачи често изводе малу премису како би информисали анализу силе и одлучили величину узорка потребну за велику и свеобухватну студију.
    • Ако не постоји начин за спровођење сложених премиса, процените могућу средину на основу читања чланака и истраживања које су можда урадили други појединци. Може вам дати добар почетак у одређивању величина узорка.
    реклама

2. део од 3: Израчунати стандардну девијацију

  1. Одредити формулу за стандардну девијацију. Стандардна девијација мери дисперзију података. Даје вам информације о идентитету сваке тачке података у узорку. Када први пут започну, једначине могу изгледати прилично сложено. Међутим, кораци у наставку помоћи ће вам да лакше разумете поступак израчунавања. Формула је с = √∑ ((ки - µ) / (Н - 1)).
    • с је стандардна девијација.
    • ∑ означава да ћете морати сабрати сва прикупљена запажања.
    • Икси сваки представља вашу вредност података.
    • µ је средња вредност података за сваку групу.
    • Н је укупан број посматрања.
  2. Просек броја посматрања у свакој групи. Да бисте израчунали стандардну девијацију, прво морате израчунати средњу вредност посматрања за сваку појединачну групу. Ова вредност је симболизована грчким словом му или µ. Да бисте то урадили, једноставно додајте запажања и поделите са укупним бројем запажања.
    • На пример, да бисмо пронашли просечну оцену групе која је читала документ пре наставе, погледајмо неке податке.Ради једноставности користићемо скуп података од 5 тачака: 90, 91, 85, 83 и 94 (на скали од 100 тачака).
    • Сабери сва запажања: 90 + 91 + 85 + 83 + 94 = 443.
    • Поделите горњи збир бројем посматрања Н (Н = 5): 443/5 = 88,6.
    • Просечна оцена за ову групу је 88,6.
  3. Одузмите просек од сваке посматране вредности. Следећи корак укључује део (ки - µ) једначине. Одузмите просечну вредност од сваке посматране вредности. Са горњим примером имамо пет одузимања.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) и (94 - 88,6).
    • Израчуната вредност је 1,4; 2.4; -3,6; -5,6 и 5,4.
  4. Горе наведене разлике поравнајте и збројите. Свака нова вредност која је управо израчуната сада ће бити на квадрат. Овде ће негативни знак такође бити уклоњен. Ако се након овог корака или на крају израчуна појави негативни знак, можда сте заборавили да урадите горњи корак.
    • У нашем примеру ћемо сада радити са 1,96; 5.76; 12.96; 31.36 и 29.16.
    • Саберите ове квадрате: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Поделити са укупним бројем посматрања минус 1. Дељење са Н - 1 помаже у надокнађивању израчуна који се не врши на популацији у целини, већ се заснива на узорку популације свих ученика.
    • Одузми: Н - 1 = 5 - 1 = 4
    • Подјела: 81,2 / 4 = 20,3
  6. Добити квадратни корен. Једном подељено са бројем посматрања минус 1, узмите квадратни корен добијене вредности. Ово је последњи корак у израчунавању стандардне девијације. Неки статистички програми ће вам помоћи да извршите овај прорачун након увоза оригиналних података.
    • Са горњим примером, стандардна девијација оцене на крају семестра ученика који читају документ пре наставе је: с = √20,3 = 4,51.
    реклама

Део 3 од 3: Одређивање статистичке значајности

  1. Израчунајте варијансу између ваше две групе посматрања. До овог тренутка, пример се бавио само једном групом запажања. Да бисте упоредили две групе, очигледно су вам потребни подаци из обе. Израчунајте стандардну девијацију друге групе посматрања и помоћу ње израчунајте варијансу између две експерименталне групе. Формула за израчунавање варијансе је: сд = √ ((с1/ Н1) + (с2/ Н2)).
    • С.д је варијанса између група.
    • С.1 је стандардна девијација група 1 и Н.1 је величина групе 1.
    • С.2 је стандардна девијација група 2 и Н.2 је величина групе 2.
    • У нашем примеру рецимо да подаци из групе 2 (ученици који текст нису читали пре наставе) имају величину 5 и стандардну девијацију 5,81. Одступање је:
      • С.д = √ ((с1) / Н1) + ((с2) / Н2))
      • С.д = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Израчунајте т-скор података. Т-статистика вам омогућава претварање података у облик који је упоредив са осталим подацима. Т-вредност такође вам омогућава да извршите т-тест, тест који вам омогућава да израчунате вероватноћу статистички значајне разлике између две групе. Формула за израчунавање т-статистике је: т = (µ1 – µ2) / С.д.
    • µ1 је просек прве групе.
    • µ2 је просек друге групе.
    • С.д је варијанса између посматрања.
    • Користите већу средину као µ1 како не би дошло до негативне т-статистике.
    • За наш пример, претпоставимо да је примећена средња вредност за групу 2 (која није прочитала претходни чланак) 80. Т-оцена је: т = (µ1 – µ2) / С.д = (88,6 – 80)/3,29 = 2,61.
  3. Одредити степен слободе узорка. Када се користи т-статистика, степени слободе одређују се на основу величине узорка. Збројите број посматрања за сваку групу, а затим одузмите два. У горњем примеру, степен слободе (д.ф.) је 8, јер у првој групи има 5 узорака, а у другој 5 узорака ((5 + 5) - 2 = 8).
  4. Користите табелу т за процену значаја. Табеле т-вредности и степена слободе могу се наћи у стандардној статистици или на мрежи. Пронађите ред који садржи степене слободе података и п-вредност која одговара т-статистици коју имате.
    • Са степеном слободе 8 и т = 2,61, вредност п за једнострани тест је између 0,01 и 0,025. Будући да је изабрани ниво значајности мањи или једнак 0,05, наши подаци су статистички значајни. Овим подацима одбацујемо нулту хипотезу и прихватамо обрнуту хипотезу: ученици који су материјал прочитали пре наставе имају веће коначне оцене.
  5. Размислите о спровођењу даљег истраживања. Многи истраживачи изводе премисе са неколико показатеља како би разумели како да дизајнирају већу студију. Спровођење других истраживања са више показатеља повећаће ваше поверење у ваше закључке. реклама

Савет

  • Статистика је велико и сложено поље. Похађајте курс за испитивање статистичких хипотеза у средњој школи или на универзитету (или вишем) да бисте разумели статистичку значајност.

Упозорење

  • Ова анализа се фокусира на т-тест за проверу разлике између две нормалне популације дистрибуције. У зависности од сложености података, можда ће вам требати још један статистички тест.