- 軟件大小:28.79M
- 軟件語言(yán):中文
- 軟件類型:國產軟件
- 軟件類別:免費軟件 / 編(biān)程工具
- 更新時間:2017-07-24 13:57
- 運(yùn)行環境:WinAll, WinXP, Win7, Win8, Win10
- 軟件等級:
- 軟件(jiàn)廠商:
- 官方網站:暫無
頂好評:50%
踩壞評:50
1.23M/中文/5.0
10.15M/中文/2.0
1.52M/中文/10.0
643KB/中文/5.0
0KB/中文(wén)/10.0
tikaapp.jar包是(shì)一款可以(yǐ)輕(qīng)鬆提取文本正文工具(jù),它集成了POI, Pdfbox 並且(qiě)為文本抽取工作提供了一個統(tǒng)一的界麵,提(tí)供了便利的擴展API,用來豐富其對第三方文件格式的支持,感興(xìng)趣的朋友(yǒu)可以下載使用!
Tika是一個用於(yú)文本解釋的框架,其本身並(bìng)不提供任何的庫用於解釋文本,而是調用各種各樣的庫(kù),如POI,PDFBox等。使用Tika,可以提取文件(jiàn)中的作者、標題、創建時間、正文等內容,相比於(yú)Java.io自帶的一些功能。
1.進入Tika所有的目錄,運行(háng)以下命令:java -jar "tika-app-1.5 (1).jar" -g
2.Tika的圖形界麵被打開,然後找(zhǎo)開File-openURL:
3.點擊確認(rèn)後,即返回解釋結果(guǒ)。默認情況下顯(xiǎn)示(shì)的是文本(běn)的元(yuán)信息
4.可以通過view菜單中的選項,分別查看 metadata, formatted text, plain text, main content, stuctured text等信息。
請描述您所遇到(dào)的錯誤,我們將盡快予以(yǐ)修正,謝謝!
*必填項(xiàng),請輸入(rù)內容