iOS上好用的PDF全文檢索App
先寫在前頭,在花了數天認真搜尋之後,我找到了在iOS上PDF執行全文檢索最理想的解決方案是這個App:PDF search。覺得好用的話我建議直接買PDF search pro,這是終身使用的版本。
因為工作的關係,會在iPad/iPhone上放很多PDF。有些時候我會需要跨多個檔案搜尋關鍵字,來來回回要開好幾個檔案才能找完,花費了我許多時間。
根據我自己使用的情境,我大致上列出我的需求:
1. 必須要是iOS app,因為我的檔案都放在iPad上閱覽。
2. 搜尋速度要非常快,在數十個檔案共約莫6000頁的資料間搜尋能低於10秒最好。
3. 搜尋結果必須包含:在哪個檔案,在哪一頁。最好能顯示前後文,方便確認是不是要找的資料。
4. 最好要能離線使用,在沒有網路服務的狀況下也能搜尋!
5. 儘量不傳資料到外部服務例如Google等,文件是自己的,只有自己能看到搜尋結果最好。
談一下我在找到App滿足以上情境前,我在PDF間搜尋資料的方式:
方法1: 打開PDF資料夾 -> 開啟一個檔案 -> 在搜尋框內打關鍵字 -> 等待App跑出搜尋結果
方法2:打開PDF資料夾 -> 直接搜尋關鍵字 -> 等待App一個一個打開資料夾內的PDF檔案搜尋
上面的方法有的缺點:
1. 我們必須等待很長的時間,尤其是檔案很大或者內容很多頁的時候,有時甚至要等上一兩分鐘。
2.你需要知道你要找的那個東西在哪個檔案裡面,這樣才能減少開檔搜尋的動作來加快你搜尋的速度。
3. 我們必須很小心地操作App,如果不小心關閉一個 PDF檔案,或者跳到別的App。那麼先前花了很長時間等待的搜尋結果可能會不見,必須重新執行一次搜尋。
因為我先前的老本行是寫網站的,我很清楚我目前需求是一套能夠執行全文檢索(full text search, FTS)的搜尋引擎。大致上搜尋了網路上的解決方案,大部分都是需要依賴網路(Adobe Reader DC),或者只能在Windows平台下運作(dtSearch / Agent Ransack),Andriod才能用(DocSearch),甚至必須自己架設搜尋引擎的方案(例如 Solr / Elasticsearch /Qsirch / ownCloud...等)。
在花了數天認真搜尋之後,我找到了在iOS上最理想的解決方案:PDF search
根據網站的說明,這個App有以下幾個特點:
1. AI人工智慧搜尋:利用AI來找出最相關的搜尋結果。
2. Text Recognition (OCR) 光學文字辨識:可以辨識圖片上的文字,也就是説透過掃描機產生的PDF也能搜尋。
3. 自然語言處理:系統會辨認搜尋關鍵字的詞性,關鍵字基數偶數的變體等(例如mouse / mice)來輔助搜尋,並可以透過設定自動忽略介系詞。
4. 可以將搜尋結果匯出成PDF,可以參考官網上的這個範例檔案。
5. 不只支援PDF,還能支援Word / PowerPoint / Pages / Keynote / RTF / TXT等檔案格式,甚至是程式碼檔案(其實也算是純文字檔案的一種嘛)。
6. PDF search有出macOS版本,支援macOS到iOS同步功能(iOS裝置間同步不支援),你可以先在算力比較強的電腦上建立索引之後再把資料同步到iPad或者是iPhone上。
7. 這套App也用了搜尋引擎上常用的技術和例如Page Rank...等來優化搜尋結果。
至於這個App怎麼使用呢,下面根據我自己的使用流程簡單的跟分享,大家可以參考使用手冊來了解更多這App的功能。或者是看由Youtuber - Edge Mac製作的影片看看怎麼用。
打開App之後的第一步,就是把你想建立索引的PDF檔案丟進來。因為我的PDF檔案都放在原本PDF閱讀App裡面,所以我會先選Local App Folder之後再按右上角的 + 號來把檔案放進來。
把PDF檔案放進來之後,App就會開始建立索引,這時候會有一個像是螢幕保護程式的畫面跑出來,請等待索引建立完成之後再關閉。
接著就是搜尋你要找的資料啦,最簡單的方式就是在主畫面的左上角打上你要找的關鍵字。接著就是等待搜尋結果,大概不到一秒就顯示出來了。
這是我在馬特市第二篇文章,之前太懶一直都沒寫,而且怕文章寫太爛就一直默默潛水。終於找到了一個好題目來分享,這個App解決了我在iPad上搜尋資料的問題,我也希望這個App能解決大家的問題!
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!