Одредити коефицијент корелације

Аутор: Morris Wright
Датум Стварања: 28 Април 2021
Ажурирати Датум: 19 Јуни 2024
Anonim
Koeficijent korelacije 01 Pearsonov koeficijent korelacije
Видео: Koeficijent korelacije 01 Pearsonov koeficijent korelacije

Садржај

Коефицијент корелације, означен са р или ρ, је мера линеарне корелације (односа и снаге и смера) између две променљиве. Креће се од -1 до +1, користећи знакове плус и минус за представљање позитивне и негативне корелације. Ако је коефицијент корелације тачно -1, онда је однос између две променљиве потпуно негативан; ако је коефицијент корелације тачно +1, онда је однос потпуно позитиван. Две променљиве могу имати позитивну, негативну или никакву корелацију. Корелацију можете израчунати ручно, користећи неке од бесплатних калкулација корелације доступне на мрежи, или користећи статистичке функције доброг графичког калкулатора.

На корак

Метод 1 од 4: Израчунајте коефицијент корелације ручно

  1. Прво сакупите своје податке. Да бисте започели израчунавање ефикасне корелације, прво испитајте парове података. Корисно је ставити их у табелу и вертикално и хоризонтално. Означите сваки ред или колону к и и.
    • На пример, претпоставимо да имате четири пара података за Икс и г.. Табела тада може изгледати овако:
      • к || г.
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Израчунај средњу вредност Икс. Да бисте израчунали средњу вредност, требате све вредности од Икс сабрати, а затим поделити са бројем вредности.
    • Користећи горњи пример, приметите да имате четири вредности за Икс. Да бисте израчунали средњу вредност, збрајате све вредности Икс и поделите са 4. Израчун изгледа овако:
    • μИкс=(1+2+4+5)/4{ дисплаистиле му _ {к} = (1 + 2 + 4 + 5) / 4}Пронађите средњу вредност г.. У просеку од г. Да бисте га пронашли, следите исте кораке, додајући све вредности и заједно, а затим поделивши их са бројем вредности.
      • У горњем примеру такође имате четири вредности за г.. Саберите све ове вредности, а затим их поделите са 4. Израчуни ће изгледати овако:
      • μг.=(1+3+5+7)/4{ дисплаистиле му _ {и} = (1 + 3 + 5 + 7) / 4}Одредити стандардну девијацију од Икс. Једном када имате средства, можете израчунати стандардно одступање. Да бисте то урадили, користите формулу:
        • σИкс=1н1Σ(ИксμИкс)2{ дисплаистиле сигма _ {к} = { скрт {{ фрац {1} {н-1}} Сигма (к- му _ {к}) ^ {2}}}}Израчунати стандардну девијацију од г.. Користећи исте основне кораке, пронађите стандардно одступање од г.. Користићете исту формулу, користећи тачке података за и.
          • Са узорцима података, ваши прорачуни ће изгледати овако:
          • σг.=141((14)2+(34)2+(54)2+(74)2){ дисплаистиле сигма _ {и} = { скрт {{ фрац {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Прегледајте основну формулу за одређивање коефицијента корелације. Формула за израчунавање коефицијента корелације користи средства, стандардна одступања и број парова у скупу података (представљен са н). Сам коефицијент корелације представљен је малим словом р или грчким словом ρ (рхо). За овај чланак користићемо формулу познату као Пеарсонов коефицијент корелације како је приказано доле:
            • ρ=(1н1)Σ(ИксμИксσИкс)(г.μг.σг.){ дисплаистиле рхо = лево ({ фрац {1} {н-1}} десно) Сигма лево ({ фрац {к- му _ {к}} { сигма _ {к}} } десно) * лево ({ фрац {и- му _ {и}} { сигма _ {и}}} десно)}Одредити коефицијент корелације. Сада имате средства и стандардна одступања за своје променљиве, тако да можете прећи на формулу коефицијента корелације. Запамтите да н представља број вредности које имате. Остале релевантне информације сте већ разрадили у горњим корацима.
              • Користећи узорке података, податке можете унети у формулу коефицијента корелације и израчунати на следећи начин:
              • ρ=(1н1)Σ(ИксμИксσИкс)(г.μг.σг.){ дисплаистиле рхо = лево ({ фрац {1} {н-1}} десно) Сигма лево ({ фрац {к- му _ {к}} { сигма _ {к}} } десно) * лево ({ фрац {и- му _ {и}} { сигма _ {и}}} десно)}Протумачите резултат. За овај скуп података коефицијент корелације је 0,988. Овај број вам говори две ствари о подацима. Погледајте знак броја и величину броја.
                • Пошто је коефицијент корелације позитиван, можете рећи да постоји позитивна корелација између к података и и података. То значи да ако се повећају вредности к, очекујете и пораст вредности и.
                • С обзиром да је коефицијент корелације веома близу +1, подаци к и и су веома уско повезани. Ако бисте графички приказали ове тачке, видели бисте да су врло добар приближавање правој линији.

Метод 2 од 4: Коришћење калкулатора на мрежи

  1. Потражите калкулаторе корелације на мрежи. Мерење корелације прилично је стандардни прорачун за статистичаре. Израчун може постати врло досадан за велике скупове података ако се ради ручно. Стога су многи извори учинили заједничке прорачуне корелације доступним на мрежи. Користите било који претраживач и унесите термин за претрагу „корелациони калкулатор“.
  2. Унесите податке. Пажљиво прочитајте упутства на веб локацији како бисте могли правилно да унесете податке. Важно је да се парови података држе у реду или ћете добити нетачан резултат корелације. Различите веб локације користе различите формате за унос података.
    • На пример, на веб локацији хттп://нцалцулаторс.цом/статистицс/цоррелатион-цоеффициент-цалцулатор.хтм пронаћи ћете хоризонтални оквир за унос к вредности и други хоризонтални оквир за унос и вредности. Унесете услове, одвојене само зарезима. Дакле, к скуп података израчунат раније у овом чланку треба унети као 1,2,4,5. И скуп података унесен је као 1,3,5,7.
    • На другој веб локацији, хттп://ввв.алцула.цом/цалцулаторс/статистицс/цоррелатион-цоеффициент/, можете уносити податке хоризонтално или вертикално, све док држите тачке података у реду.
  3. Израчунајте резултате. Ове веб локације за израчунавање су популарне, јер након уноса података обично треба само да кликнете на дугме „Израчунај“ - резултат ће се аутоматски појавити.

Метод 3 од 4: Коришћење графичког калкулатора

  1. Унесите своје податке. На графичком калкулатору омогућите функцију статистике, а затим изаберите наредбу „Уреди“.
    • Сваки калкулатор има мало другачије команде тастера. Овај чланак даје специфична упутства за Текас Инструментс ТИ-86.
    • Да бисте приступили функцији Стат, притисните [2нд] -Стат (изнад тастера "+"), а затим притисните Ф2-Едит.
  2. Избришите све старе сачуване податке. Већина калкулатора чуваће статистичке податке док се не обришу. Да бисте били сигурни да не бркате старе податке са новим подацима, прво треба да избришете све претходно сачуване информације.
    • Помоћу тастера са стрелицама померите курсор да бисте истакли категорију „кСтат“. Затим притисните „Цлеар“ и „Ентер“. Ово би требало да обрише све вредности у колони кСтат.
    • Помоћу тастера са стрелицама означите категорију „иСтат“. Притисните „Обриши“ и „Унеси“ да бисте такође обрисали податке за ту колону.
  3. Унесите вредности података. Помоћу тастера са стрелицама померите курсор на први простор испод кСтат заглавља. Унесите прву вредност података, а затим притисните тастер Ентер. Требали бисте видети простор на дну екрана „кСтат (1) = __“, где ваша вредност попуњава празан простор. Када притиснете Ентер, подаци ће попунити табелу, курсор ће се померити у следећи ред, а линија на дну екрана сада треба да гласи „кСтат (2) = __“.
    • Наставите са уносом свих к вредности.
    • Када унесете к вредности, помоћу тастера са стрелицама пређите на колону иСтат и унесите и вредности.
    • Када су сви подаци унети, притисните Екит да бисте очистили екран и изашли из менија Стат.
  4. Израчунајте статистику линеарне регресије. Коефицијент корелације је мера колико се подаци приближавају правој линији. Графички калкулатор са статистичким функцијама може врло брзо да израчуна најприкладнију линију и коефицијент корелације.
    • Уђите у функцију Стат, а затим притисните дугме Цалц. На ТИ-86, ово је [2.] [Стат] [Ф1].
    • Изаберите Линеарни регресиони прорачун. На ТИ-86, ово је [Ф3], са ознаком „ЛинР.“ Графички приказ ће затим приказати линију „ЛинР _“ трепћућим курсором.
    • Сада морате да унесете имена две променљиве које желите да израчунате. То су кСтат и иСтат.
      • На ТИ-86 одаберите листу имена („Имена“) притиском на [2нд] [Лист] [Ф3].
      • Доњи ред екрана би сада требао приказивати доступне променљиве. Изаберите [кСтат] (ово је вероватно дугме Ф1 или Ф2), затим унесите зарез, а затим [иСтат].
      • Притисните Ентер да бисте израчунали податке
  5. Тумачите резултате. Када притиснете Ентер, калкулатор ће одмах израчунати следеће информације за податке које сте унели:
    • г.=а+бИкс{ дисплаистиле и = а + бк}Разумети концепт корелације. Корелација се односи на статистички однос између две величине. Коефицијент корелације је један број који можете израчунати за два скупа тачака података. Број је увек нешто између -1 и +1 и показује колико су блиска та два скупа података.
      • На пример, ако сте мерили висину и старост деце до око 12 година, очекивали бисте да ћете наћи снажну позитивну корелацију. Како деца постају старија, она постају виша.
      • Пример негативне корелације је упоређивање времена које неко проводи вежбајући голф са голф резултатом те особе. Како пракса напредује, резултат би требао опадати.
      • На крају, очекивали бисте малу корелацију, позитивну или негативну, између величине ципела особе, на пример, и оцене испита.
    • Израчунај средњу вредност. Аритметичка средина или „средња вредност“ скупа података израчунава се додавањем свих вредности података, а затим дељењем са бројем вредности у скупу. Да бисте одредили коефицијент корелације за своје податке, треба да израчунате просек сваког скупа података.
      • Средњу вредност променљиве означава променљива хоризонталном линијом изнад ње. Ово се често назива „к-бар“ или „и-бар“ за скупове података к и и. Алтернативно, средња вредност може се означити малим грчким словом μ (му). На пример, да бисте означили средину тачака података од к, могли бисте да користите μИкс или μ (к).
      • На пример, ако имате скуп к (1,2,5,6,9,10), просек ових података израчунава се на следећи начин:
        • μИкс=(1+2+5+6+9+10)/6{ дисплаистиле му _ {к} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Знати важност стандардне девијације. У статистикама, стандардна девијација мери варијацију, показујући дисперзију бројева од средње вредности. Група бројева са ниском стандардном девијацијом прилично је близу једна другој. Група бројева са високом стандардном девијацијом је раштрканија.
          • Као симбол, стандардна девијација изражава се малим словом с или грчким словом σ (сигма). Дакле, стандардна девијација к података се записује као сИкс или σИкс.
        • Препознајте запис сумације. Оператор збрајања је један од најчешћих оператора у математици и указује на збир вредности. Представља се грчким великим словом, сигмом или ∑.
          • На пример, ако имате збирку тачака података к (1,2,5,6,9,10), тада ∑к значи:
            • 1+2+5+6+9+10 = 33

Савети

  • Коефицијент корелације се понекад назива и „Пеарсоновим коефицијентом корелације производа и тренутка“ у част Карла Пеарсона, његовог програмера.
  • Генерално, коефицијент корелације већи од 0,8 (позитиван или негативан) представља снажну корелацију; коефицијент корелације нижи од 0,5 (поново позитиван или негативан) представља слаб коефицијент корелације.

Упозорења

  • Корелација показује да су два скупа података на неки начин повезана. Међутим, припазите да ово не протумачите као узрочно-последичну везу. На пример, ако упоредите величине ципела и висину људи, вероватно ћете пронаћи снажну позитивну корелацију. Већи људи углавном имају већа стопала. Међутим, то не значи да ће вам висока стопа расти или да ће вам велика стопала нарасти. Једноставно се дешавају заједно.