Начини израчунавања варијансе

Аутор: Robert Simon
Датум Стварања: 21 Јуни 2021
Ажурирати Датум: 1 Јули 2024
Anonim
17. Analiza varijanse u nacrtima sa ponovljenim merenjima u programu SPSS
Видео: 17. Analiza varijanse u nacrtima sa ponovljenim merenjima u programu SPSS

Садржај

Варијанса мери дисперзију скупа података. Веома је корисно у изградњи статистичких модела: мала варијанса може бити показатељ да описујете случајну грешку или шум уместо основне везе у подацима. Овим чланком викиХов вас учи како израчунати варијансу.

Кораци

Метод 1 од 2: Израчунајте варијансу узорка

  1. Напишите свој узорак скупа података. У већини случајева статистичари имају информације само на узорку или подскупини популације коју проучавају. На пример, уместо опште анализе „трошкова свих аутомобила у Немачкој“, статистичар би могао пронаћи трошак случајног узорка од неколико хиљада аутомобила. Статистичар може да користи овај узорак да би добио добру процену трошкова аутомобила у Немачкој. Међутим, вероватније је да се неће у потпуности подударати са стварним бројевима.
    • На пример: Анализирајући број муффина проданих дневно у кафићу, узели сте случајни шестодневни узорак и добили следеће резултате: 38, 37, 36, 28, 18, 14, 12, 11, 10,7, 9,9. Ово је узорак, а не популација, јер немате податке за сваки дан када је продавница отворена.
    • Ако сваки Тачке података у мастеру, идите на доњу методу.

  2. Запишите формулу варијансе варијансе. Одступање скупа података указује на степен дисперзије тачака података. Што је варијанса ближа нули, то су тачке података ближе груписане. Када радите са узорцима скупова података, користите следећу формулу за израчунавање одступања:
    • = /(н - 1)
    • је варијанса. Варијанса се увек израчунава у квадратним јединицама.
    • представља вредност у вашем скупу података.
    • ∑, што значи „зброј“, говори вам да израчунате следеће параметре за сваку вредност, а затим их саберете.
    • к је средња вредност узорка.
    • н је број тачака података.

  3. Израчунати средњу вредност узорка. Симбол к или „к-хоризонтал“ се користи за означавање средње вредности узорка. Израчунајте као било који просек: збројите све тачке података и поделите их са бројем бодова.
    • На пример: Прво збројите своје податке: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Затим поделите резултат са бројем тачака података, у овом случају шест: 84 ÷ 6 = 14.
      Средња вредност узорка = к = 14.
    • Средњу вредност можете сматрати „средишњом тачком“ података. Ако су подаци усредсређени на средњу вредност, варијанса је мала. Ако су расејани далеко од средње вредности, варијанса је велика.

  4. Одузмите средњу вредност из сваке тачке података. Сада је време да израчунате - к, где је свака тачка у вашем скупу података.Сваки резултат ће указивати на одступање од средње вредности сваке одговарајуће тачке, или једноставније речено, на удаљеност од ње до средње вредности.
    • На пример:
      - к = 17 - 14 = 3
      - к = 15 - 14 = 1
      - к = 23 - 14 = 9
      - к = 7 - 14 = -7
      - к = 9 - 14 = -5
      - к = 13 - 14 = -1
    • Веома је лако проверити своје прорачуне, јер се резултати морају збројити на нулу, јер су то средњи негативни резултати (удаљеност од средње вредности до малих бројева). позитивни резултати (удаљеност од средње вредности до већих бројева) потпуно се елиминишу.
  5. Поравнајте све резултате Као што је горе напоменуто, тренутна листа одступања (- к) има збир нула, што значи да ће „просечно одступање“ такође увек бити нула и да се ништа не може рећи о распршивању података. Да бисмо решили овај проблем, проналазимо квадрат сваког одступања. Захваљујући томе, сви су позитивни бројеви, негативне вредности и позитивне вредности више се не поништавају и зуму дају нулу.
    • На пример:
      (- Икс)
      - Икс)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Сада имате (- к) за сваку тачку података у узорку.
  6. Пронађите збир квадрата вредности. Сада је време за израчунавање целокупног бројила формуле: ∑. Велики цикло, ∑, захтева да за сваку вредност додате следећу вредност елемента. Израчунали сте (- к) за сваку вредност у узорку, па све што треба да урадите је само да збрајате резултате.
    • На пример: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Поделити са н - 1, где је н број тачака података. Давно, приликом израчунавања варијансе узорка, статистичари су делили само н. Та подела ће вам дати средњу вредност квадратног одступања, која се тачно подудара са варијансом тог узорка. Међутим, имајте на уму да је узорак само процена веће популације. Ако узмете још један случајни узорак и направите исти прорачун, добићете другачији резултат. Испоставило се да подела са н-1 уместо са н даје бољу процену варијансе веће популације - до које вам је заиста стало. Ова корекција је толико честа да је сада прихваћена дефиниција варијансе узорка.
    • На пример: У узорку постоји шест тачака података, па је н = 6.
      Одступање узорка = 33,2
  8. Разумевање варијансе и стандардне девијације. Имајте на уму да се, с обзиром да у формули постоје потенцијали, одступање мери у квадрату јединица изворних података. Ово је визуелно збуњујуће. Уместо тога, често је стандардно одступање врло корисно. Али нема смисла губити напор, јер се стандардна девијација одређује квадратним кореном варијансе. Због тога је варијанса узорка написана као, а стандардна девијација узорка је.
    • На пример, стандардна девијација горњег узорка = с = √33,2 = 5,76.
    реклама

Метод 2 од 2: Израчунајте варијансу популације

  1. Почевши од скупа матичних података. Термин „становништво“ користи се за означавање свих релевантних запажања. На пример, ако истражујете старост становника Ханоја, ваша укупна популација ће обухватити старост свих појединаца који живе у Ханоју. Обично бисте креирали прорачунску табелу за велики скуп података попут овог, али ево мањег примера скупа података:
    • На пример: У соби акваријума налази се тачно шест акваријума. Ових шест цистерни садржи следећи број риба:





  2. Запишите формулу за укупну варијансу. С обзиром да популација садржи све податке који су нам потребни, ова формула нам даје тачну варијансу популације. Да би је разликовали од варијансе узорка (која је само процена), статистичари користе друге променљиве:
    • σ = /н
    • σ = варијанса узорка. Ово је нормално квадратна кобасица. Варијанса се мери у квадратним јединицама.
    • представља елемент у вашем скупу података.
    • Елемент у ∑ израчунава се за сваку вредност, а затим се сабира.
    • μ је укупна средња вредност.
    • н је број тачака података у популацији.
  3. Пронађите средњу вредност становништва. Када се анализира популација, симбол μ („му“) представља аритметичку средину. Да бисте пронашли средњу вредност, саберите све тачке података, а затим поделите са бројем тачака.
    • О средњем значите као о „просечном“, али будите опрезни, јер реч има много математичких дефиниција.
    • На пример: средња вредност = μ = = 10,5
  4. Одузмите средњу вредност из сваке тачке података. Тачке података ближе средњој вредности имају разлику ближу нули. Поновите проблем одузимања за све тачке података и вероватно ћете почети да осећате распршеност података.
    • На пример:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Квадрирајте сваки знак. У овом тренутку, неки резултати добијени у претходном кораку биће негативни, а неки позитивни. Ако визуализујете податке на изоморфној линији, ове две ставке представљају бројеве лево и десно од средње вредности. Ово не би користило израчунавању одступања, јер би се ове две групе међусобно поништиле. Уместо тога, квадрат их све, тако да су сви позитивни.
    • На пример:
      (- μ) за сваку вредност од и траје од 1 до 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Пронађите просек резултата. Сада имате вредност за сваку тачку података, повезану (не директно) са удаљеношћу те тачке података од средње вредности. Просек тако што ћете их сабрати и поделити са бројем вредности које имате.
    • На пример:
      Укупна варијанса = 24,25
  7. Контакт рецепт. Ако нисте сигурни како се ово уклапа у формулу наведену на почетку методе, запишите цео проблем ручно и не скраћујте:
    • Након проналаска разлике од средње вредности и израчунавања квадрата, добићете (- μ), (- μ) и тако даље до (- μ), где је последња тачка података. у скупу података.
    • Да бисте пронашли просек ових вредности, саберите их и поделите са н: ((- μ) + (- μ) + ... + (- μ)) / н
    • Након што сте преписали бројилац са сигмоидним записом, имате /н, варијанса формуле.
    реклама

Савет

  • Будући да је варијансу тешко протумачити, ова вредност се често израчунава као полазна тачка за проналажење стандардне девијације.
  • Коришћење „н-1“ уместо „н“ у имениоцу је техника која се назива Бесселова корекција. Узорак је само процена комплетне популације, а средња вредност узорка има одређену пристрасност која одговара тој процени. Ова корекција елиминише горњу пристрасност. То се тиче чињенице да је једном набројано н - 1 тачака података, последња тачка н била константа, јер су за израчунавање средње вредности узорка (к) у формули варијансе коришћене само одређене вредности.