sql >> Databáze >  >> RDS >> Mysql

VIF vracející aliasované koeficienty v R

Použijte funkci 'alias' v R, abyste viděli, které proměnné jsou lineárně závislé. Odstraňte závislé proměnné a funkce vif by měla fungovat správně.

formula <- as.formula(Spring_Autumn ~ Oct + Nov + Dec + Jan + Feb + Mar + Apr + May + Jun + Jul + Aug + Sep + X1min + X3min +   X7min + X30min + X90min + X1max + X3max + X7max + X30max + X90max + BF + Dmin + Dmax+ LP + LPD + HP + HPD + RR + FR + Rev, data = IHA_stats)
fit <-lm(formula)

#the linearly dependent variables
ld.vars <- attributes(alias(fit)$Complete)$dimnames[[1]]

#remove the linearly dependent variables variables
formula.new <- as.formula(
    paste(
        paste(deparse(formula), collapse=""), 
        paste(ld.vars, collapse="-"),
        sep="-"
    )
)

#run model again
fit.new <-lm(formula.new)
vif(fit.new)

POZNÁMKA:Toto nebude fungovat v případě, že máte automaticky generované fiktivní proměnné, které jsou identické s jinými proměnnými. Názvy proměnných jsou zmatené. Můžete si vytvořit svůj vlastní hack, jak to obejít.




  1. Příklady DATEPART() v SQL Server

  2. Vyhledávání pomocí zástupných znaků ve fulltextovém vyhledávání MySQL

  3. Oracle - Jak udělit uživateli práva k objektům jiného uživatele

  4. Jak omezit slova, ale ne definice pomocí mysql