Výpočet MSE: proč jsou tyto dva způsoby, jak dávat odlišné výsledky?

hlasů
2

Mám určité pochybnosti, pokud jde o výpočet MSE v R.

Zkoušel jsem dva různé způsoby a já jen dvě odlišné výsledky. Chtěl vědět, který z nich je ten správný způsob, jak najít MSE.

První:

model1 <- lm(data=d, x ~ y)
rmse_model1 <- mean((d - predict(model1))^2)

Druhý:

mean(model1$residuals^2)
Položena 02/04/2017 v 02:44
zdroj uživatelem
V jiných jazycích...                            


1 odpovědí

hlasů
3

V zásadě by měly dát stejný výsledek. Ale v první možnosti byste měli používat d$x. Pokud jste právě použít d, pravidlo recyklaci v oblasti výzkumu se bude opakovat predict(model1)dvakrát (jak dmá dva sloupce) a výpočet bude také zahrnovat d$y.

Všimněte si, že je vhodné zařadit na.rm = TRUEdo meana newdata = daby predictv první volbě. To dělá váš kód robustní, aby chybějící hodnoty v datech. Na druhou stranu se nemusíte bát, NAv druhé možnosti, jak lmse automaticky sníží NApřípady. Můžete se podívat na toto vlákno pro potenciálního vlivu této funkce: rámem Vyrovnání dat s chybějícími hodnotami .

Odpovězeno 02/04/2017 v 02:56
zdroj uživatelem

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more