2016-10-14 12 views

答えて

0

movies.datはreadmeファイルで説明したようにようdelimを::を持つだけでtxtファイルです。あなたを与える

txt <- readLines("./ml-1m/movies.dat", encoding = "latin1") 
txt_split <- lapply(strsplit(txt, "::"), function(x) as.data.frame(t(x), stringsAsFactors=FALSE)) 
dat <- do.call(rbind, txt_split) 
names(dat) <- c("MovieID", "Title", "Genres") 

dim(dat) # 3883 3 

dim(dat) # 3883 3 
head(dat) 

    MovieID        Title      Genres 
1  1     Toy Story (1995) Animation|Children's|Comedy 
2  2      Jumanji (1995) Adventure|Children's|Fantasy 
3  3   Grumpier Old Men (1995)    Comedy|Romance 
4  4   Waiting to Exhale (1995)     Comedy|Drama 
5  5 Father of the Bride Part II (1995)      Comedy 
6  6      Heat (1995)  Action|Crime|Thriller 

PS:私は彼らとread.tablereadr::read_delimdata.table::freadのような "標準" R-読みメソッドを使用する方法を見つけ出すcouldntのだから、次の操作を行うことができます1バイトの分離が必要です。たとえば::を他のものに切り替えることができます。 sed CLI

関連する問題