Варијанса је мера дисперзије која представља променљивост низа података у односу на његову средњу вредност. Формално се израчунава као збир квадратних остатака подељен укупним бројем посматрања.
Такође се може израчунати као квадрат стандардне девијације. Иначе, резидуални схватамо као разлику између вредности променљиве у одређеном тренутку и средње вредности целе променљиве.
Погледајте све мере дисперзијеПре него што погледамо формулу варијансе, морамо рећи да је варијанса у статистици веома важна. Иако је то једноставна мера, она може пружити пуно информација о одређеној променљивој.
Формула за израчунавање варијансе
Мјерна јединица варијансе увијек ће бити мјерна јединица која одговара подацима, али на квадрат. Одступање је увек веће или једнако нули. Како су резидуали на квадрат, математички је немогуће да варијанса изађе негативна. И на тај начин не може бити мање од нуле.
Где
- ИКС: променљива на основу које треба израчунати варијансу
- Икси: број посматрања и променљиве Кс. могу узимати вредности између 1 и н.
- н: број запажања.
- Икс: То је средња вредност променљиве Кс.
Или шта је исто:
Зашто су остаци на квадрат?
Разлог зашто су остаци на квадрат је једноставан. Да нису на квадрат, зброј остатака био би нула. То је својство отпада. Да би се то избегло, као и код стандардне девијације, они су у квадрату. Резултат је мерна јединица у којој се подаци мере, али на квадрат.
На пример, ако бисмо имали податке о зарадама скупа људи у еврима, подаци који дају варијансу били би у квадратним еврима. Да би тумачење имало смисла, израчунали бисмо стандардну девијацију и податке пребацили у евре.
- Одступање -> (2-3) = -1
- Одступање -> (4-3) = 1
- Одступање -> (2-3) = -1
- Одступање -> (4-3) = 1
- Одступање -> (2-3) = -1
- Одступање -> (4-3) = 1
Ако саберемо сва одступања, резултат је нула.
РанкКоја је разлика између варијансе и стандардне девијације?
Једно питање које би се могло поставити и са добрим разлогом била би разлика између варијансе и стандардне девијације. У стварности долазе да мере исто. Варијанса је стандардна девијација на квадрат. Или обрнуто, стандардна девијација је квадратни корен варијансе.
Стандардна девијација направљена је да би се могло радити у почетним јединицама мере. Наравно, као што је нормално, неко се може запитати, каква је корист од тога што се одступа као концепт? Па, иако нам тумачење вредности коју враћа не даје пуно информација, њен прорачун је неопходан да бисмо добили вредност осталих параметара.
За израчунавање коваријансе потребна нам је варијанса, а не стандардна девијација, за израчунавање неких економетријских матрица користи се варијанса, а не стандардна девијација. Ствар је комфора када се ради са подацима према којим прорачунима.
Пример израчунавања варијансе
Коваћемо низ података о зарадама. Имамо пет људи, сваки са различитом платом:
Хуан: 1.500 евра
Пепе: 1.200 евра
Хосе: 1.700 евра
Мигел: 1.300 евра
Матео: 1.800 евра
Просечна зарада, која нам је потребна за израчун, је ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) / 5) 1.500 евра.
Будући да је формула варијансе у свом рашчлањеном облику формулисана на следећи начин:
Добит ћемо да се мора рачунати тако да:
Резултат је 52.000 евра на квадрат. Важно је запамтити да кад год израчунамо варијансу имамо мерне јединице на квадрат. Да бисмо га прерачунали у евре, у овом случају бисмо морали да изведемо стандардну девијацију. Приближан резултат био би 228 евра. То значи да ће у просеку разлика између плата различитих људи бити 228 евра.