Откривање изванредних вредности помоћу нормалне дистрибуције
Откривање одступања кроз нормалну дистрибуцију је процес који укључује дефинисање прага стандардне девијације и помоћу којег се жели наћи екстремне вредности узорка.
Другим речима, откривање одступања кроз нормалну дистрибуцију значи проналажење екстремних вредности скупа података кроз стандардизовану нормалну формулу.
- Вредности крајности се зове оутлиерс на енглеском.
- Вредности унутрашње се зове инсајдери на енглеском.
Визуелно откривање одступања може бити опција када имате врло мало података. Када радите са базама података, врло је непрактично ручно тражити одступања. Да бисмо решили овај проблем, можемо израчунати које се вредности сматрају екстремним упоређивањем са прагом одступања.
У случају нормалне расподеле, вредност се сматра екстремном када је 3 стандардне девијације удаљена од средње вредности. Будући да нормална дистрибуција има два репа, морамо узети у обзир да се она може умањити и на негативној и на позитивној страни.
Формула за откривање одступања користећи нормалну дистрибуцију

Скуп запажања може се изразити на претходни начин, где је к средња вредност преко које вредности осцилирају, а сигма дисперзија осциловања поменутих вредности. Другим речима, сигма је удаљеност посматрања од средње вредности.
Мултипликативни фактор одређује да ли је ванземаљац или инсајдер. Ако з заузме вредности 3 или -3, тада ће, према нормалној расподели, посматрање и бити одступање.
Да се зна вредност з користимо претходну једначину:

- Ако је з> = 3 или з = <-3, онда, према нормалној расподели, то можемо рећи И. то је екстремна вредност или одступање.
- Ако је з <3 или з <-3, онда, према нормалној расподели, то можемо рећи И. је интерна вредност или инсајдер.
Нормалан стандард
Да ли је горња једначина позната?
Тачно, то је израз запажања које прати нормалну расподелу једном стандардизовано или типизирано. Назива се тако јер се при дељењу са стандардном или стандардном девијацијом разлика бројилаца изражава у терминима одступања.
Из тог разлога вредности одступања можемо повезати са з и тако моћи да га купи са прагом од 3 одступања.
Пример
Нађите екстремне вредности следећих запажања према нормалној расподели:

Запажања представљамо на графикону:

Од самог почетка већ видимо да је вредност која је најудаљенија од осталих највероватније одступање.
Прво израчунавамо средњу вредност и стандардну девијацију:
к = средње = 5,8
сигма = стандардна девијација = 10,51
Затим супституишемо вредности у формулу и израчунамо вредност з за свако посматрање:

Горе наведене вредности су мултипликативни фактори сигме, тј. з. Све што је веће од 3 или мање од -3 биће екстремна вредност.

Видимо да је вредност з која прелази 3 стандардне девијације је она која одговара посматрању 49.
Стога би крајња или изванредна вредност скупа података била 49.