Kann jemand bitte helfen, eine Liste der eingebauten Datensätze und ihrer Abhängigkeitspakete zu erhalten?
Es gibt verschiedene Möglichkeiten, die enthaltenen Datensätze in R zu finden:
1: Mit data()
erhalten Sie eine Liste der Datensätze aller geladenen Pakete (und nicht nur der aus dem datasets
-Paket). Die Datensätze werden nach Paket geordnet
2: Mit data(package = .packages(all.available = TRUE))
erhalten Sie eine Liste aller Datensätze in den verfügbaren Paketen auf Ihrem Computer (d. H. Auch die nicht geladenen).
3: Wenn Sie data(package = "packagename")
verwenden, erhalten Sie die Datensätze dieses bestimmten Pakets. data(package = "plyr")
gibt die Datensätze im Paket plyr
an
Wenn Sie wissen möchten, in welchem Paket sich ein Dataset befindet (z. B. das Dataset acme
), können Sie Folgendes tun:
dat <- as.data.frame(data(package = .packages(all.available = TRUE))$results)
dat[dat$Item=="acme", c(1,3,4)]
was gibt:
Package Item Title
107 boot acme Monthly Excess Returns
Oft muss ich auch wissen, welche Struktur von Datensätzen verfügbar ist. Deshalb habe ich dataStr
in meinem misc-Paket erstellt.
dataStr <- function(package="datasets", ...)
{
d <- data(package=package, envir=new.env(), ...)$results[,"Item"]
d <- sapply(strsplit(d, split=" ", fixed=TRUE), "[", 1)
d <- d[order(tolower(d))]
for(x in d){ message(x, ": ", class(get(x))); message(str(get(x)))}
}
dataStr()
Bitte beachten Sie, dass die Ausgabe in der Konsole ziemlich lang ist.
Dies ist die Art der Ausgabe:
[...]
warpbreaks: data.frame
'data.frame': 54 obs. of 3 variables:
$ breaks : num 26 30 54 25 70 52 51 26 67 18 ...
$ wool : Factor w/ 2 levels "A","B": 1 1 1 1 1 1 1 1 1 1 ...
$ tension: Factor w/ 3 levels "L","M","H": 1 1 1 1 1 1 1 1 1 2 ...
WorldPhones: matrix
num [1:7, 1:7] 45939 60423 64721 68484 71799 ...
- attr(*, "dimnames")=List of 2
..$ : chr [1:7] "1951" "1956" "1957" "1958" ...
..$ : chr [1:7] "N.Amer" "Europe" "Asia" "S.Amer" ...
WWWusage: ts
Time-Series [1:100] from 1 to 100: 88 84 85 85 84 85 83 85 88 89 ...
Edit: Um eine informativere Ausgabe zu erhalten und sie für entladene Pakete oder alle Pakete im Suchpfad zu verwenden, verwenden Sie bitte die überarbeitete Online-Version mit
source("https://raw.githubusercontent.com/brry/berryFunctions/master/R/dataStr.R")
Hier ist eine umfassende Liste mit Datensätzen für R-Pakete, die von Prof. Vincent Arel-Bundock gepflegt wird . https://vincentarelbundock.github.io/Rdatasets/
Rdatasets ist eine Sammlung von über 1200 Datensätzen, die ursprünglich .__ waren. zusammen mit der statistischen Softwareumgebung R und einigen seiner Zusatzpakete. Ziel ist es, diese Daten breiter zu machen zugänglich für Unterricht und statistische Softwareentwicklung.
Lauf
help(package = "datasets")
in der R Studio-Konsole erhalten Sie alle verfügbaren Datensätze in der Registerkarte "Hilfe" auf der rechten Seite.