wake-up-neo.com

dplyr zählt Nicht-NA-Wert in Gruppe nach

Hier ist mein Beispiel

mydf<-data.frame('col_1'=c('A','A','B','B'), 'col_2'=c(100,NA, 90,30))

Ich möchte nach col_1 gruppieren und nicht-NA-Elemente in col_2 zählen

Ich würde es gerne mit dplyr machen.

Folgendes habe ich versucht, nachdem ich SO gesucht hatte:

mydf %>% group_by(col_1) %>% summarise_each(funs(!is.na(col_2)))
mydf %>% group_by(col_1) %>% mutate(non_na_count = length(col_2, na.rm=TRUE))
mydf %>% group_by(col_1) %>% mutate(non_na_count = count(col_2, na.rm=TRUE))

Nichts hat geklappt. Irgendwelche Vorschläge?

7
user1700890

Sie können dies verwenden

mydf %>% group_by(col_1) %>% summarise(non_na_count = sum(!is.na(col_2)))

# A tibble: 2 x 2
   col_1 non_na_count
  <fctr>        <int>
1      A            1
2      B            2
21
Richard Telford

Wir können die NA-Elemente in 'col_2' filter und dann eine count von 'col_1' ausführen.

mydf %>%
     filter(!is.na(col_2))  %>%
      count(col_1)
# A tibble: 2 x 2
#   col_1     n
#  <fctr> <int>
#1      A     1
#2      B     2

oder mit data.table

library(data.table)
setDT(mydf)[, .(non_na_count = sum(!is.na(col_2))), col_1]

Oder mit aggregate aus base R

aggregate(cbind(col_2 = !is.na(col_2))~col_1, mydf, sum)
#  col_1 col_2
#1     A     1
#2     B     2

Oder mit table

table(mydf$col_1[!is.na(mydf$col_2)])
3
akrun
  library(knitr)
    library(dplyr)

mydf<-data.frame('col_1'=c('A','A','B','B'), 'col_2'=c(100,NA, 90,30))

    mydf %>% 
      group_by(col_1) %>%)
      select_if(function(x) any(is.na(x))) %>% 
      summarise_all(funs(sum(is.na(.)))) -> NA_mydf

 kable(NA_mydf)
2
Anya Sti