TIKA圖形界麵/GUI
圖形用戶界麵(GUI)
-
Tika 提供了一個jar文件連同下麵的鏈接它的源代碼: http://tika.apache.org/download.htmll.
-
下載文件,並設置JAR類文件路徑。
-
提取源代碼zip文件夾,打開tika-app文件夾。
-
在解壓縮文件夾“tika-1.6\tika-app\src\main\java\org\apache\Tika\gui” 後,會看到兩個類文件:ParsingTransferHandler.java 和TikaGUI.java。
-
編譯這兩個類文件並執行TikaGUI.java類文件,它會打開下麵的窗口。
現在讓我們看看如何利用Tika的GUI。
在GUI上,點擊open打開,瀏覽並選擇一個文件,該文件將被提取,或將其拖動到窗口的空白。
Tika 提取的文件的內容,並在五個不同的格式顯示出來,即。元數據,格式化文本,純文本,主要內容和結構化文本。可以選擇任何想要的格式。
以同樣的方式,會發現在“tika-1.6\tika-app\src\main\java\org\apache\tika\cliI”文件夾中的CLI類。
下圖顯示了Tika能做到。當我們把圖像托放在圖形用戶界麵上,Tika提取並顯示其元數據。