位置:首頁 > 大數據教學 > R語言教學 > R語言處理Excel文件

R語言處理Excel文件

Microsoft Excel是使用最廣泛的電子表格程序,其存儲數據在 .xls 或 .xlsx 格式。R能夠直接使用一些 excel 特定的軟件包,來從文件中讀取數據。很少有這樣的包 - XLConnect,XLSX,GDATA等。我們將使用XLSX包。 - R語言也可以使用該軟件包寫入 Excel 文件。

安裝XLSX包

可以使用下麵的命令在R控製台來安裝“XLSX”包。 它可能會要求安裝一些額外的軟件包此程序包依賴。按照所需的軟件包名稱的相同的命令來安裝額外的軟件包。

install.packages("xlsx")

驗證並載入“XLSX”包

使用以下命令來驗證並加載“XLSX”包。

# Verify the package is installed.
any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.
library("xlsx")

當腳本運行,我們得到如下輸出。

[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars

輸入為XLSX文件

打開Microsoft Excel中。複製並粘貼以下數據到名為工作表Sheet1工作表中。

id	name      salary    start_date	dept
1	Rick	  623.3	    1/1/2012	IT
2	Dan	  515.2	    9/23/2013	Operations
3	Michelle  611	    11/15/2014	IT
4	Ryan	  729	    5/11/2014	HR
5	Gary	  843.25    3/27/2015	Finance
6	Nina	  578       5/21/2013	IT
7	Simon	  632.8	    7/30/2013	Operations
8	Guru	  722.5	    6/17/2014	Finance

下麵的數據也複製並粘貼到另一個工作表,並重新命名該工作表為:“city”。

name	 city
Rick	 Seattle
Dan	 Tampa
Michelle Chicago
Ryan	 Seattle
Gary	 Houston
Nina	 Boston
Simon	 Mumbai
Guru	 Dallas

Excel 文件保存為“input.xlsx”。應該將其保存在R工作空間的當前工作目錄。

讀取Excel文件

所述 input.xlsx 通過使用 read.xlsx()函數來讀取,如下所示。結果被存為數據幀。

# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)

當我們上麵的代碼執行時,它產生以下結果:

  id     name salary start_date       dept
1  1     Rick 623.30 2012-01-01         IT
2  2      Dan 515.20 2013-09-23 Operations
3  3 Michelle 611.00 2014-11-15         IT
4  4     Ryan 729.00 2014-05-11         HR
5 NA     Gary 843.25 2015-03-27    Finance
6  6     Nina 578.00 2013-05-21         IT
7  7    Simon 632.80 2013-07-30 Operations
8  8     Guru 722.50 2014-06-17    Finance