投影式掃描器體驗

因為常常利用圖書館資源,長久以來都是使用攜帶型的手滑式掃瞄棒(一般說「手持式」易造成誤解,其使用時實際上是推著滑動才是正確姿勢)蒐集資料,也摸索出一些使用心得。但是手滑棒在處理比較多頁的資料時,速度不盡理想,一直想找個更方便的機私。

在臉書的電子書社群看到不少人拆書自炊。也曾經拆過幾本絕版老書,用家裡的 Brother 多功能掃描印表機掃過;因有自動送紙功能,一次可以掃50頁(單面),速度相當快。但是我個人對拆書一直是心裡有疙瘩,所以只炊了兩三本就放棄了。

倒是在大約十多年前,在 eBay 上看到有人在賣日本富士通的投影式書本掃描器,應該是圖書館退下來的東東,號稱自動把書頁影像按曲度拉平。但是單單機器本身就要價八千鷹洋,還不含操控處理的工作站(天曉得是哪一年的富士通電腦),這當然是屬於只能流口水的那一級了。

兩年前在亞瑪遜上看到有便宜的投影式掃描器,就開始關注。當然對這種電子產品,買第一代試吃螃蟹通常是會被毒得上吐下洩,總是等到二、三代才比較保險。最近看到有第二代產品出現,評價也還不錯,就訂了一台Czur Aura(應該不是電池型)。

這台掃描器是中國成者科技(Czur,他們唸成si-ser,跟凱撒 Caesar 同音)第二代產品這裡有詳細的評估介紹:

Czur Aura 評價

貨到拆箱後,到目前為止掃了三本書,整體使用感覺還不錯,下面是比較詳細的心得。

外觀上黑色現代化造型。掃瞄頭可以折疊,收回至台座支柱之內;如果不折疊,還可以當檯燈來用。黑色人造皮墊捲起收藏,不佔空間。顯然在產品設計上有下功夫。

黑色皮墊提供反差背景,方便捕捉影像。
Aura 的架構是軟硬體配合。前面硬體機台有照明燈光、新力 7.2 百萬像素鏡頭、還有三道雷射光源提供紙面曲度(curvature)量測,用一個 32-bit MIPS 處理器控制。這機台只負責抓取影像和曲度資料,然後用USB送到電腦上的軟體,由軟體進行切割、分頁、拉平紙頁的處理。但是我發現影像的色彩格式(如彩色、黑白、灰階)等,可能在機台上的 ISP 就轉換了;因為若選用黑白格式的話,抓取的紙頁影像歪斜程度較高,但用其它色彩格式則軟體分頁拉平結果比較正確。

掃描器自己提供光源,背景(房間)光源越暗越少越好。
掃描時,把書本攤開在黑色皮墊中間,調整書本位置讓分頁處位於電腦螢幕上橘色區域之間,跟虛線大致對齊。

然後用廠家提供的壓頁器(套在手指上的黃色塑膠環)壓住書頁,讓其不會翹起;壓頁器上的黑底白圈和黑底白紋估計是提供軟體參考點(說明手冊稱最好與頁邊平行),方便切頁;另外軟體會自動把這黃色壓頁器在最後的書頁影像上抹除。如果有一邊書頁不會翹起,可以只用一邊。

掃描時從軟體看到照相機影像(螢幕截圖)
當一切就緒,踩一下腳踏按鈕,取得影像,同時也會有三道紅色雷色光掃過左右書頁,取得曲率資料,然後影像會傳送到軟體上,切割左右頁(可設定右先左後或左先右後)、拉平影像。這軟體處理速度以我五年新的 Core i5 - 2300 大概要花8秒鐘。在這段期間,可以翻頁、壓頁,踩鈕抓取下一頁。整個流程熟悉後十分流暢,只需要偶爾注意一下分頁處是不是還在中間虛線附近。我掃一本694頁的書花了約55分鐘,平均一頁5.54秒(因一次掃描兩頁),大約是手滑棒的2.5 - 3倍速度。因為前述的黑白影像容易歪斜的問題,選擇灰階影像會比較好。

有了分割並拉平後的影像,接著就要做後製。建議不要使用 Aura 的軟體做後製,在功能和方便性方面都不是很理想。底下是我做後製的流程:
  1. 快速檢視並重掃不良影像。
    • 使用 XnView 將所有影像檔快速瀏覽一遍,如果有太差的就刪除(左右兩頁一起),重新掃描後,把新檔改為舊檔名。
  2. 檢查是否有多頁或缺頁
    • Aura 用 images00xxx 做為檔名儲存,不利於檢查頁數。
    • 使用XnView的Batch Rename功能,將封面、目錄、序言等更名為A群(例:a_00xxx),將所有內容頁包括書尾版權頁更名為B群(例:b_00xxx),並以內容頁第一頁影像中的頁數為開始(例:第一頁所印頁數是第五頁,那檔名就從 b_00005開始)。
    • 從最後一頁向前檢查,如果頁數和檔名吻合,表示沒有缺漏或多餘頁數。但是也有可能前面有漏有多,正好湊齊,所以還是要快速瀏覽一遍。
    • 有少就補(例:若漏122、123頁,則補掃成b_00121_1、b_00121_2),有多就刪除。
    • 確定無多無缺後,將全部AB群一起排序,然後全部更改檔名回 images00xxx (從1開始)。
  3. 用 Scan Tailor Advanced 整理書頁影像。
    • Scan Tailor 是免費軟體,多年來零零星星有幾個功能加強版,我用的是 Advanced,可以在這裡找到:Scan Tailor Advanced
    • Scan Tailor Advanced 最後會生成 TIFF 格式的黑白書頁影像,所以前面用灰階沒有關係,不會讓最後 PDF 檔的尺寸過大。
  4. 最後,用免費小程式 FreePic2PDF 產生最後的 PDF 檔。
    • 這種小程式到處都有,可以自己選用。

前面那本 694頁的書,花了大約一小時左右做後製,生成的 PDF 檔約 36.5 MB。整個作業時間(掃描 + 後製)大約兩個小時。

這裡提一下有關 Scan Tailor Advanced (STA) 的幾個心得:

因為是平放掃描,不用倒轉影像,所以直接從第二步 Split Pages 開始。STA 沒有 Crop 的功能,其設計理念是找到內文,再把內文外面加白框輸出,所以不用 Crop。而這個  Split Pages 本來是用於左右分頁,但我的影像已經分過了,正好用來把左右多的空白──如此處右邊空白是書攤開時下面各頁的頁邊──給切掉。此頁我右邊不動,用滑鼠把左邊藍線拉到書頁最左邊。

Scan Tailor Advanced 切頁功能
下一步可以讓STA自動修正歪斜度,如果有太過歪斜或者它無法判定者,它會在右邊視窗用一紅色米字表示。此時就要選擇該頁,用滑鼠手動(點住影像兩側藍色圓球)來調整。

調整歪斜度(deskew)
下一步讓其自動選擇內文部分。一樣地,要快速瀏覽檢查一下,確定選擇的內文區域夠大,下一步輸出時才能放在正確位置。

自動選擇內文部分。
最後讓其輸出,我設成 400 DPI。看起來效果還不錯。

最後輸出頁影像。
同頁細節部分

結論:掃描的速度自然不如裁書掃描的速度,而且因為是用軟體克服曲度的問題,字型和版面美觀度是也不如裁書掃描的那些神器。但是不毀書而能得到這樣的品質,已經可以滿意了。

張貼留言

0 留言