R語言處理Excel文件
Microsoft Excel是使用最廣泛的電子表格程序,其存儲數據在 .xls 或 .xlsx 格式。R能夠直接使用一些 excel 特定的軟件包,來從文件中讀取數據。很少有這樣的包 - XLConnect,XLSX,GDATA等。我們將使用XLSX包。 - R語言也可以使用該軟件包寫入 Excel 文件。
安裝XLSX包
可以使用下麵的命令在R控製台來安裝“XLSX”包。 它可能會要求安裝一些額外的軟件包此程序包依賴。按照所需的軟件包名稱的相同的命令來安裝額外的軟件包。
install.packages("xlsx")
驗證並載入“XLSX”包
使用以下命令來驗證並加載“XLSX”包。
# Verify the package is installed. any(grepl("xlsx",installed.packages())) # Load the library into R workspace. library("xlsx")
當腳本運行,我們得到如下輸出。
[1] TRUE Loading required package: rJava Loading required package: methods Loading required package: xlsxjars
輸入為XLSX文件
打開Microsoft Excel中。複製並粘貼以下數據到名為工作表Sheet1工作表中。
id name salary start_date dept 1 Rick 623.3 1/1/2012 IT 2 Dan 515.2 9/23/2013 Operations 3 Michelle 611 11/15/2014 IT 4 Ryan 729 5/11/2014 HR 5 Gary 843.25 3/27/2015 Finance 6 Nina 578 5/21/2013 IT 7 Simon 632.8 7/30/2013 Operations 8 Guru 722.5 6/17/2014 Finance
下麵的數據也複製並粘貼到另一個工作表,並重新命名該工作表為:“city”。
name city Rick Seattle Dan Tampa Michelle Chicago Ryan Seattle Gary Houston Nina Boston Simon Mumbai Guru Dallas
Excel 文件保存為“input.xlsx”。應該將其保存在R工作空間的當前工作目錄。
讀取Excel文件
所述 input.xlsx 通過使用 read.xlsx()函數來讀取,如下所示。結果被存為數據幀。
# Read the first worksheet in the file input.xlsx. data <- read.xlsx("input.xlsx", sheetIndex = 1) print(data)
當我們上麵的代碼執行時,它產生以下結果:
id name salary start_date dept 1 1 Rick 623.30 2012-01-01 IT 2 2 Dan 515.20 2013-09-23 Operations 3 3 Michelle 611.00 2014-11-15 IT 4 4 Ryan 729.00 2014-05-11 HR 5 NA Gary 843.25 2015-03-27 Finance 6 6 Nina 578.00 2013-05-21 IT 7 7 Simon 632.80 2013-07-30 Operations 8 8 Guru 722.50 2014-06-17 Finance