Довољна статистика за параметар Θ је она способна да прикупи или сумира све информације које садржи узорак случајне променљиве Кс.
Знамо да је статистика стварна функција узорка. Односно, узима стварне вредности садржане у узорку. Одатле, као што смо видели у чланку у којем је дефинисан концепт статистике, морамо осигурати да статистичар има одређена својства. Зашто тражити такву имовину? Да бисмо били сигурни да је статистика корисна за наше сврхе.
Довољност је једно од тих својстава. На много једноставнији начин рећи ћемо да је статистика довољна ако користи све информације садржане у узорку.
Како знати да ли је статистика довољна?
Логично, поставља се питање: Како могу знати да ли Т статистика испуњава својство довољности? Или Како могу да пронађем, ако постоји, статистику која испуњава својство довољности. Одговор на ова два питања налази се у две теореме:
- Фисхер-Неиманов критеријум за факторизацију: Овај критеријум наводи да ће дата статистика Т, ако испуњава одређене услове, бити довољна статистика.
- Дармоисова теорема: Ова теорема даје одговор на друго питање. Односно, омогућава нам да кроз низ поступака пронађемо довољну статистику.
Пример довољне статистике
Претпоставимо да желимо да израчунамо просечни годишњи приход породица које живе у Чилеу. Да бисмо то урадили, пратићемо следећи поступак:
- Прикупљање података (узорак): Како не можемо да питамо сваку породицу која живи у Чилеу колико годишње зарађују, узећемо репрезентативни узорак од, на пример, 1.000 породица.
- Идентификујте случајну променљиву која се проучава: Случајна променљива која се проучава је породични приход. Тако: Кс → Породични приход
- Изаберите праву статистику: Одговарајућа статистика за израчунавање средњег дохотка није ништа друго до очекивање Кс. Другим речима, узорак средње вредности Кс.
- Како могу да знам да ли је статистика узорка довољна? Како већ имамо математички израз статистике, послужићемо се Фисхер-Неимановим факторинг критеријумом. Или, Дармоисова теорема. То су формуле створене у ту сврху.
Након примене правилних прорачуна, закључујемо да статистика узорка средњих вредности испуњава захтев или својство довољности. Осигуравајући да испуњава овај захтев, обезбеђујемо да ова (статистичка) функција, која нам омогућава синтезу информација (средњи приход), користи све информације садржане у узорку (1.000 породица).
Зашто је важно да користим све информације у узорку?
Сад кад знамо да је средња вредност узорка довољна статистика, претпоставимо случај. Какав би смисао имао израчун просечног дохотка на основу тих 1.000 чилеанских породица и да користимо податке само 500 породица?
Наравно, то не би имало никаквог смисла. Желимо сажетак свих информација. Односно, оно што смо дефинисали као довољну статистику.