broom resume as principais informações sobre os modelos em Tidy tibble() s. broom fornece três verbos para tornar conveniente interagir com objetos modelo:
tidy() resume as informações sobre componentes do modeloglance() relata informações sobre todo o modeloaugment() adiciona informações sobre observações a um conjunto de dados Para uma introdução detalhada, consulte vignette("broom") .
A vassoura broom 100 mais de modelos de pacotes de modelagem populares e quase todos os objetos de modelo no pacote stats que acompanha a base R. vignette("available-methods") listas a disponibilidade do método.
Se você não conhece as estruturas de dados arrumadas e deseja saber como elas podem facilitar sua vida, recomendamos a leitura dos dados arrumados de Hadley Wickham.
# we recommend installing the entire tidyverse
# modeling set, which includes broom:
install.packages( " tidymodels " )
# alternatively, to install just broom:
install.packages( " broom " )
# to get the development version from GitHub:
install.packages( " pak " )
pak :: pak( " tidymodels/broom " )Se você encontrar um bug, registre um exemplo reproduzível mínimo nos problemas.
tidy() produz um tibble() em que cada linha contém informações sobre um componente importante do modelo. Para modelos de regressão, isso geralmente corresponde a coeficientes de regressão. Isso pode ser útil se você deseja inspecionar um modelo ou criar visualizações personalizadas.
library( broom )
fit <- lm( Volume ~ Girth + Height , trees )
tidy( fit )
# > # A tibble: 3 x 5
# > term estimate std.error statistic p.value
# > <chr> <dbl> <dbl> <dbl> <dbl>
# > 1 (Intercept) -58.0 8.64 -6.71 2.75e- 7
# > 2 Girth 4.71 0.264 17.8 8.22e-17
# > 3 Height 0.339 0.130 2.61 1.45e- 2 glance() retorna um Tibble com exatamente uma fileira de medidas de condicionamento físico e estatísticas relacionadas. Isso é útil para verificar a especificação do modelo e comparar muitos modelos.
glance( fit )
# > # A tibble: 1 x 12
# > r.squared adj.r.squared sigma statistic p.value df logLik AIC BIC
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 0.948 0.944 3.88 255. 1.07e-18 2 -84.5 177. 183.
# > # … with 3 more variables: deviance <dbl>, df.residual <int>, nobs <int> augment adiciona colunas a um conjunto de dados, contendo informações como valores ajustados, resíduos ou atribuições de cluster. Todas as colunas adicionadas a um conjunto de dados têm . Prefixo para impedir que as colunas existentes sejam substituídas.
augment( fit , data = trees )
# > # A tibble: 31 x 9
# > Girth Height Volume .fitted .resid .std.resid .hat .sigma .cooksd
# > <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
# > 1 8.3 70 10.3 4.84 5.46 1.50 0.116 3.79 0.0978
# > 2 8.6 65 10.3 4.55 5.75 1.60 0.147 3.77 0.148
# > 3 8.8 63 10.2 4.82 5.38 1.53 0.177 3.78 0.167
# > 4 10.5 72 16.4 15.9 0.526 0.140 0.0592 3.95 0.000409
# > 5 10.7 81 18.8 19.9 -1.07 -0.294 0.121 3.95 0.00394
# > 6 10.8 83 19.7 21.0 -1.32 -0.370 0.156 3.94 0.00840
# > 7 11 66 15.6 16.2 -0.593 -0.162 0.115 3.95 0.00114
# > 8 11 75 18.2 19.2 -1.05 -0.277 0.0515 3.95 0.00138
# > 9 11.1 80 22.6 21.4 1.19 0.321 0.0920 3.95 0.00348
# > 10 11.2 75 19.9 20.2 -0.288 -0.0759 0.0480 3.95 0.0000968
# > # … with 21 more rowsCongratulamo -nos com contribuições de todos os tipos!
Para perguntas e discussões sobre pacotes de TidyModels, modelagem e aprendizado de máquina, publique na comunidade Posit. Se você acha que encontrou um bug, envie um problema. De qualquer forma, aprenda a criar e compartilhar um REPREX (um exemplo mínimo e reproduzível), para se comunicar claramente sobre seu código. Confira mais detalhes sobre as diretrizes contribuintes para os pacotes de TidyModels e como obter ajuda.
Se você nunca contribuiu diretamente para um pacote R antes, broom é um excelente lugar para começar. Encontre um problema com a etiqueta amigável para iniciantes e comente que você gostaria de aceitar e ajudaremos você a começar.
Geralmente, também incentivamos correções de digitação, relatórios de bugs, correções de bugs e solicitações de recursos. O feedback sobre a clareza da documentação é especialmente valioso!
Se você estiver interessado em adicionar métodos mais arrumados para novos objetos de modelo, leia este artigo no site da TidyModels.
Temos um código de conduta contribuinte. Ao participar da broom , você concorda em cumprir seus termos.