Wer Twitter-Daten in R einliest, stößt auf Datumsvariablen ("created_at" und "user_created_at").
Diese Daten landen dann als character in R
stackoverflow
Hier ist die Lösung:
Ein häufiges Ergebenis ist dann allerdings NA.
Dies liegt daran, dass in R-Environment eingestellt ist, dass Zeiten und Daten "German" formatiert sind und R deshalb "Tue" nicht als Wochentag erkennt. Diese Einstellung lässt sich so ändern:
Interessant ist eventuell noch folgendes:
Angenommen, ich habe einen data.frame df mit einer Spalte d, in der Daten im obigen Format gespeichert sind. Dann kann ich den folgenden Befehl nutzen, um die gesamte Spalte in Datumswerte umzuwandeln:
Wenn ich die Zahl wieder als Datum formatiert haben will, ist das kein Problem:
Diese Daten landen dann als character in R
Offenbar habe nicht nur ich Probleme damit, die Daten als Datum zu formartieren:
"Tue Apr 08 04:51:44 +0000 2014"
stackoverflow
Hier ist die Lösung:
d = "Tue Apr 08 04:51:44 +0000 2014"
d = as.Date(d, format = "%a %b %d %H:%M:%S %z %Y", tz="")
Ein häufiges Ergebenis ist dann allerdings NA.
Dies liegt daran, dass in R-Environment eingestellt ist, dass Zeiten und Daten "German" formatiert sind und R deshalb "Tue" nicht als Wochentag erkennt. Diese Einstellung lässt sich so ändern:
Sys.setlocale("LC_TIME", "English")
Interessant ist eventuell noch folgendes:
Angenommen, ich habe einen data.frame df mit einer Spalte d, in der Daten im obigen Format gespeichert sind. Dann kann ich den folgenden Befehl nutzen, um die gesamte Spalte in Datumswerte umzuwandeln:
df$d = sapply(df$d, function(x) as.Date(x, format = "%a %b %d %H:%M:%S %z %Y", tz=""))
class(df$d)Numeric? Ja. Es wird die Anzahl der Tage seit einem definiertem Datum 0 gespeichert. Das ist sehr praktisch, weil sich so allerhand sinnvolle Berechnungen anstellen lassen.
[1] "numeric"
Wenn ich die Zahl wieder als Datum formatiert haben will, ist das kein Problem:
as.Date(df$d, origin = "1970-01-01")
Kommentare
Kommentar veröffentlichen