Како израчунати емисије

Аутор: Janice Evans
Датум Стварања: 23 Јули 2021
Ажурирати Датум: 1 Јули 2024
Anonim
PRE I POSLE: Totalna transformacija stana na Bežanijskoj kosi
Видео: PRE I POSLE: Totalna transformacija stana na Bežanijskoj kosi

Садржај

У статистици, истицања су вредности које се оштро разликују од других вредности у прикупљеном скупу података. Одступање може указивати на аномалије у дистрибуцији података или грешке при мјерењу, па се одступања често искључују из скупа података. Уклањањем истицања из скупа података можете доћи до неочекиваних или тачнијих закључака. Стога је потребно бити у стању израчунати и процијенити одступања како би се осигурало правилно разумијевање статистике.

Кораци

  1. 1 Научите препознати потенцијалне издвојене стране. Потенцијалне одступања треба идентификовати пре него што се искључе из збирке података. Одступања су вредности које се веома разликују од већине вредности у скупу података; другим речима, истицања су ван тренда већине вредности. Ово је лако пронаћи у табелама вредности или (нарочито) у графиконима. Ако су вредности у скупу података исцртане, одступања ће лежати далеко од већине других вредности. На пример, ако већина вредности пада на равну линију, онда испади леже са обе стране такве праве линије.
    • На пример, размотрите скуп података који представља температуре 12 различитих објеката у просторији. Ако је 11 објеката приближно 70 степени, али је дванаести предмет (вероватно пећ) 300 степени, онда брз поглед на вредности може указати да је пећ вероватно издувавање.
  2. 2 Сортирајте податке по растућем редоследу. Први корак у одређивању одступања је израчунавање медијане скупа података. Овај задатак је знатно поједностављен ако су вредности у скупу података распоређене у растућем редоследу (од најмањег до највећег).
    • Настављајући са горњим примером, размотрите следећи скуп података који представља температуре више објеката: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Овај скуп треба наручити на следећи начин: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Израчунајте медијану скупа података. Медијана скупа података је вредност у средини скупа података. Ако скуп података садржи непаран број вредности, медијана је вредност пре и после које у скупу података постоји исти број вредности. Али ако скуп података садржи паран број вредности, онда морате пронаћи аритметичку средину две средине. Имајте на уму да се при израчунавању истицања медијана обично назива К2, јер се налази између К1 и К3, доњег и горњег квартила, што ћемо касније дефинисати.
    • Не бојте се радити са скуповима података који имају паран број вредности- аритметичка средина ове две вредности биће број који се не налази у скупу података; То је нормално. Али ако су две средње вредности исти број, онда је аритметичка средина једнака овом броју; ово је такође у поретку ствари.
    • У горњем примеру, средње 2 вредности су 70 и 71, па је медијана ((70 + 71) / 2) = 70,5.
  4. 4 Израчунајте доњи квартил. Ова вредност, која се назива К1, је испод које лежи 25% вредности скупа података. Другим речима, то је половина вредности до медијане. Ако постоји парни број вредности из скупа података пре медијане, потребно је да пронађете аритметичку средину две средине да бисте израчунали К1 (ово је слично израчунавању медијане).
    • У нашем примеру, 6 вредности се налазе иза медијане и 6 вредности- испред ње. То значи да за израчунавање доњег квартила морамо пронаћи аритметичку средину две средине од шест вредности које леже испред медијане. Овде су просечне вредности 70 и 70. Дакле, К1 = ((70 + 70) / 2) = 70.
  5. 5 Израчунај горњи квартил. Ова вредност, која се назива К3, је изнад које лежи 25% вредности скупа података. Процес израчунавања К3 сличан је процесу израчунавања К1, али овде се узимају у обзир вредности након медијане.
    • У горњем примеру, два просека шест после медијане су 71 и 72. Дакле, К3 = ((71 + 72) / 2) = 71,5.
  6. 6 Израчунајте интерквартилни распон. Израчунавајући К1 и К3, потребно је пронаћи растојање између ових вредности. Да бисте то урадили, одузмите К1 од К3. Вредност интерквартилног распона је изузетно важна за одређивање граница вредности које нису одступања.
    • У нашем примеру, К1 = 70 и К3 = 71,5. Интерквартилни распон је 71,5 - 70 = 1,5.
    • Имајте на уму да се ово односи и на негативне вредности К1 и К3. На пример, ако је К1 = -70, онда је интерквартилни распон 71,5 -(-70) = 141,5.
  7. 7 Пронађите "унутрашње границе" вредности у скупу података. Одступања се одређују анализом вредности- без обзира да ли спадају у такозване "унутрашње границе" и "спољне границе". Вредност изван "унутрашњих граница" класификована је као "мањи вањски", док је вредност изван "спољних граница" класификована као "значајан вањски". Да бисте пронашли унутрашње границе, морате помножити интерквартилни распон са 1,5; резултат се мора додати у К3 и одузети од К1. Два пронађена броја су унутрашње границе скупа података.
    • У нашем примеру, интерквартилни опсег је (71,5 - 70) = 1,5. Даље: 1,5 * 1,5 = 2,25. Овај број се мора додати К3 и одузети од К1 да би се пронашле унутрашње границе:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Дакле, унутрашње границе су 67,75 и 73,75.
    • У нашем примеру, само температура пећи - 300 степени - лежи изван ових граница и може се сматрати безначајном емисијом. Али немојте журити са закључцима - морамо утврдити да ли је ова температура значајан испад.
  8. 8 Пронађите "спољне границе" скупа података. Ово се ради на исти начин као и за унутрашње границе, само што се интерквартилни распон множи са 3 уместо са 1,5. Резултат се мора додати у К3 и одузети од К1. Два пронађена броја су спољне границе скупа података.
    • У нашем примеру, помножите интерквартилни опсег са 3: 1,5 * 3 = 4,5. Израчунајте спољне границе:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Дакле, спољне границе су 65,5 и 76.
    • Све вредности које превазилазе спољне границе сматрају се значајним емисијама. У нашем примеру, температура пећи од 300 степени се сматра значајним издувавањем.
  9. 9 Користите квалитативну процену да бисте утврдили да ли одступања треба искључити из скупа података. Горе описана метода вам омогућава да утврдите да ли су неке вредности истурене (мање или значајне). Ипак, не грешите - вредност која је класификована као истицање само је „кандидат“ за изузетак, што значи да је не морате искључити. Узрок истицања је главни фактор који утиче на одлуку о искључењу истицања. По правилу су искључени испади који настају услед грешака (у мерењима, снимцима итд.). С друге стране, издвојености повезане не са грешкама, већ са новим информацијама или трендом обично се остављају у скупу података.
    • Једнако је важно процијенити ефекат истицања на медијану скупа података (без обзира да ли га искривљују или не). Ово је посебно важно када доносите закључке из медијане скупа података.
    • У нашем примеру, изузетно је мало вероватно да ће се пећница загрејати на температуру од 300 степени (осим ако не узмемо у обзир природне аномалије). Стога се може закључити (са високим степеном сигурности) да је таква температура грешка у мерењу коју је потребно искључити из скупа података. Штавише, ако не искључите истицање, медијана скупа података биће (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 степени, али ако искључите истицање, медијана ће бити (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 степени.
      • Одступања су обично резултат људске грешке, па их је потребно искључити из скупова података.
  10. 10 Схватите важност (понекад) истицања преосталих у скупу података. Неке одступања треба искључити из скупа података јер су настали због грешака и техничких проблема; остале изузетке треба оставити у скупу података. На пример, ако истицање није резултат грешке и / или пружа ново разумевање феномена који се тестира, онда га треба оставити у скупу података. Научни експерименти су посебно осетљиви на истицање - грешком елиминишући истицање, можда ћете пропустити неки нови тренд или откриће.
    • На пример, развијамо нови лек за повећање величине рибе у рибарству. Користићемо стари скуп података ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), али овај пут ће свака вредност представљати тежину рибе (у грамима) након гутања експериментални лек. Другим речима, први лек доводи до повећања тежине рибе до 71 г, други лек - до 70 г, и тако даље. У овој ситуацији, 300 је значајан изузетак, али га не смемо искључити; ако претпоставимо да није било грешака у мерењу, онда је такав испад значајан успех у експерименту. Лек, који је повећао тежину рибе на 300 грама, делује много боље од других лекова; стога је 300 најважнија вредност у скупу података.

Савјети

  • Када се пронађу одступања, покушајте да објасните њихово присуство пре него што их искључите из скупа података. Они могу указивати на грешке мерења или аномалије дистрибуције.

Шта ти треба

  • Калкулатор