Коефицијент утврђивања (Р на квадрат)

Преглед садржаја:

Коефицијент утврђивања (Р на квадрат)
Коефицијент утврђивања (Р на квадрат)
Anonim

Коефицијент утврђености је проценат укупне варијансе променљиве објашњене регресијом. Коефицијент утврђености, који се назива и Р на квадрат, одражава добро прилагођавање модела променљивој коју намерава да објасни.

Важно је знати да резултат коефицијента одређивања осцилира између 0 и 1. Што је његова вредност ближа 1, то је модел већи у складу са променљивом коју покушавамо да објаснимо. Супротно томе, што је ближе нули, то ће модел бити мање чврст и, према томе, мање поуздан.

У претходном изразу имамо разломак. Па, идемо по деловима. Прво ћемо анализирати бројилац, односно горњи део.

За оне који не знају израз варијансе, препоручујем вам да прочитате чланак о томе. Они који то знају могу схватити да је то израз варијансе, али са две основне разлике.

Прва разлика је у томе што И има циркумфлекс или оно што наставници дидактички зову „шешир“. Оно што детаљно описује је да је И процена модела онога што према објашњеним променљивим вреди И, али то није стварна вредност И, већ процена И.

Друго, било би неопходно поделити са Т. Што се, у другим случајевима, бележи као Н или број запажања. Међутим, с обзиром да би га носила и формула називника, уклањамо називнике (дно) из обе формуле да бисмо поједноставили израз. На овај начин је лакше радити с њим.

Затим ћемо извршити исту анализу са делом називника (доњи део).

У овом случају, једина разлика у односу на оригиналну формулу варијансе је одсуство њеног називника. Односно, не делимо са Т или Н. На овај начин, након што се објасне два дела генеричког израза Р квадрата или коефицијента утврђености, видећемо пример.

Коефицијент варијацијеКоефицијент линеарне корелацијеРегресиона анализа

Тумачење коефицијента детерминације

Претпоставимо да желимо да објаснимо број голова које постигне Цристиано Роналдо на основу броја утакмица које игра. Претпостављамо да ће што више одиграних утакмица постићи више голова. Подаци се односе на последњих 8 сезона. Дакле, након издвајања података, модел даје следећу процену:

Као што видимо из графикона, однос је позитиван. Што више одиграних утакмица, наравно, више голова постигне у сезони. Уклапање, на основу израчунавања Р-квадрата, је 0,835. То значи да се ради о моделу чије процене прилично добро одговарају стварној променљивој. Иако технички то не би било тачно, могли бисмо рећи тако нешто, модел објашњава 83,5% стварне променљиве.

Коефицијент проблема утврђивања

Проблем коефицијента детерминације и разлог због којег настаје прилагођени коефицијент детерминације је тај што он не кажњава укључивање незначајних променљивих објашњења. Односно, ако се моделу дода пет променљивих објашњења које имају мало везе са циљевима које Кристијано Роналдо постигне у сезони, квадрат Р ће се повећати. Због тога се многи економетријски, статистички и математички стручњаци противе употреби квадрата Р као репрезентативне мере доброте стварног уклапања.

Прилагођени коефицијент утврђености

Прилагођени коефицијент детерминације (прилагођени Р на квадрат) је мера која дефинише проценат објашњен варијансом регресије у односу на варијансу објашњене променљиве. Односно, исто као и Р на квадрат, али са разликом: Прилагођени коефицијент детерминације кажњава укључивање променљивих.

Као што смо раније рекли, коефицијент утврђености модела се повећава чак и ако променљиве које смо укључили нису релевантне. Пошто је ово проблем, да бисмо га покушали решити, прилагођени Р на квадрат је такав да:

У формули је Н величина узорка, а к број променљивих објашњења. Математичким одбијањем, што су веће вредности к, то ће даље прилагођени Р-квадрат бити од нормалног Р-квадрата. Супротно томе, при нижим вредностима к, централна фракција ће бити ближа 1 и, према томе, прилагођени Р на квадрат и нормални Р на квадрат ће бити сличнији.

Сећајући се да је к број променљивих објашњења, закључујемо да ово не може бити нула. Да је нула, не би било модела. У најмању руку, једну варијаблу ћемо морати објаснити у смислу друге променљиве. С обзиром да к мора бити најмање 1, прилагођени Р-квадрат и нормални Р-квадрат не могу имати исту вредност. Даље, прилагођени Р-квадрат увек ће бити мањи од нормалног Р-квадрата.