Logo ro.boatexistence.com

Care sunt defectele imputarii valorilor lipsă cu medie?

Cuprins:

Care sunt defectele imputarii valorilor lipsă cu medie?
Care sunt defectele imputarii valorilor lipsă cu medie?

Video: Care sunt defectele imputarii valorilor lipsă cu medie?

Video: Care sunt defectele imputarii valorilor lipsă cu medie?
Video: How To Handle Missing Values in Categorical Features 2024, Mai
Anonim

Imputarea medie distorsionează relațiile dintre variabile Dar imputarea medie denaturează și relațiile multivariate și afectează statistici precum corelația. De exemplu, următorul apel către PROC CORR calculează corelația dintre variabila Orig_Height și variabilele Greutate și Vârstă.

De ce folosirea unui mijloc pentru datele lipsă este o idee proastă?

Media reduce o varianță a datelor Aprofundând în matematică, o varianță mai mică duce la un interval de încredere mai îngust în distribuția probabilității[3]. Acest lucru nu duce la nimic altceva decât introducerea unei părtiniri în modelul nostru.

De ce sunt valorile lipsă o problemă?

Datele lipsă prezintă diverse probleme. În primul rând, absența datelor reduce puterea statistică, care se referă la probabilitatea ca testul să respingă ipoteza nulă atunci când aceasta este falsă. În al doilea rând, datele pierdute pot provoca părtinire în estimarea parametrilor. În al treilea rând, poate reduce reprezentativitatea eșantioanelor.

De ce este rea imputarea medie?

Problema 1: imputarea mediei nu păstrează relațiile dintre variabile. Adevărat, imputarea mediei păstrează media datelor observate. Deci, dacă datele lipsesc complet la întâmplare, estimarea mediei rămâne nepărtinitoare.

Ar trebui să înlocuiți datele lipsă cu media?

Punctele de date Outliers vor avea un impact semnificativ asupra mediei și, prin urmare, în astfel de cazuri, nu este recomandat să folosiți media pentru înlocuirea valorilor lipsă. Utilizarea valorilor medii pentru înlocuirea valorilor lipsă poate să nu creeze un model excelent și, prin urmare, este exclusă.

Recomandat: