PALMisLIFE 討論區

標題: 適合作為書籍電子化的軟硬體 [列印本頁]

作者: garychang    時間: 2008-8-26 12:20
標題: 適合作為書籍電子化的軟硬體
由於一個月前購入了PRS-505,期間帶去旅行及出差非常的方便。
所以起了想把手邊還沒看完的書電子化的衝動。

但是在工具的選擇上遇到些難題。
我的想法如下:
1)自動雙面掃描,但是我的書可以用裁紙器切開(內容比較重要)
2)正體中文直書辨識
3)如果能辦識雜誌類的橫書+圖文切割更佳
4)輸出格式可以是PDF或是TXT、html、圖片檔等

預算當然愈低愈好
有找到幾台,昨天在fnac看到的scansnap似乎不錯,不過OCR軟體不佳。

還想請問大家有什麼建議的選擇/搭配。
作者: tako    時間: 2008-8-26 13:23
標題: Re: 適合作為書籍電子化的軟硬體
硬體的話不清楚,不過軟體的話,
圖片可以直接交給Adobe Acrobat處理,
先將圖檔轉成PDF,接著直接用Acrobat做OCR,
之後看你要再輸出成什麼就都可以了。

[ 本文最後由 tako 於 2008-8-26 13:26 編輯 ]
作者: wind-1    時間: 2008-8-26 14:55
標題: Re: Re: 適合作為書籍電子化的軟硬體
挖,太感謝了,還不知道Acrobat可以做OCR說,找了一下文件,還真的有這種功能,謝謝
原文由 tako 於 2008-8-26 13:23 發表
接著直接用Acrobat做OCR,

作者: ysj    時間: 2008-8-26 15:22
標題: Re: 適合作為書籍電子化的軟硬體
剛剛看了一下,好像Acrobat Reader沒這個功能,

我是習慣用JOCR這套軟體,不管是PDF還是圖檔都可以用,

不過我是覺得辨視率還好而已。
作者: tako    時間: 2008-8-26 15:57
標題: Re: Re: Re: 適合作為書籍電子化的軟硬體
原文由 wind-1 於 2008-8-26 14:55 發表
挖,太感謝了,還不知道Acrobat可以做OCR說,找了一下文件,還真的有這種功能,謝謝


啊,忘了講,在ocr之前要先破保護,不然那功能會不能使用。
我用的是「PDF Password Remover v3.0」。

以上~
作者: garychang    時間: 2008-8-26 17:00
標題: Re: 適合作為書籍電子化的軟硬體
這樣就蠻有意思的了,雖然昨天看到scansnap(S510)所附的ocr只能辨識英文,但是卻有附Acrobat 8 standard版…值得研究一下。

另外有看到的幾台,如HP 的scanjet 7800貴了一點,但是有附IRIS的OCR軟體似乎也是不錯的選擇
作者: Elison    時間: 2008-8-26 22:13
標題: Re: 適合作為書籍電子化的軟硬體
我們單位的圖書館有裝一台SHARP的掃瞄影印雙用機。自動進紙,雙面掃瞄,速度每分鐘30面。掃瞄後,用圖檔的方式存檔為PDF格式,再從主機COPY出來即可。推薦你到大學圖書館找看看。
作者: gcvincent    時間: 2008-8-27 00:10
標題: Re: 適合作為書籍電子化的軟硬體
離開教育單位很久了,重新搜尋一下,好像沒有太多新的機私頭。
學習一下舊知識,反正看看不買不用錢。

書籍電子化的軟硬體一次攻頂的目標(至少今年還是吧?!)

看來最佳(可能也最貴)的機器大概還是美國Kirtas公司產品
APT BookScan 1212/ APT BookScan 1600/ APT BOOKSCAN 2400RA
台灣代理商三年如一日的網頁

另外一家則是4digitalbooks
DL 1500/ DL 1800/ DL3000
強調瑞士製造(大家來研究一下瑞士在哪裡?)
十年壽命(可是MTBF只有6500hr?!)
(可是網路上有人寫說是瑞典公司,莫非是開在瑞士的瑞典公司?)

網路上除了吉米的電子報有實作照片外,其他大概都是新聞稿
抄來抄去。
          
自動翻頁書本掃瞄(一)
【中國】微軟公司全面實施數字圖書館計畫
書籍網路化 市場壟斷令人擔憂

apt最慢那台幾年前代理商報700多萬,七億只能買到100台。

民間營利機構最大隻的就是google跟微軟的計畫,不過根據上面2008/08破報消息指出:微軟退出了。

不如跟政府建議,把瑞士的七億充公跟kirtas 談判殺價買最高階的100台好了。
從此不管是永樂大典還是四褲全輸還是央圖藏書,善本殘本一次搞定。
世界第一的電子書大國噹噹誕生了~


[ 本文最後由 gcvincent 於 2008-8-27 00:17 編輯 ]
作者: garychang    時間: 2008-8-27 09:07
標題: Re: 適合作為書籍電子化的軟硬體
其實也不是從沒考慮過,只是價格還是個未知數
像這家做的東西就有考慮過
http://booksnap.atiz.com/

之前google到的資料
http://25togo.blogs.com/mymy/2006/03/post_1.html
這台自動書本翻頁,像印表機size的機器,上面的聯結說低於1000美金。
但是上atiz又沒找到實際的型號與價格…

所以只能暫當一個選項。因為我偶爾會去圖書館借書,但是有小小孩在家,很難能在家時好好的看一段書,如果有這種機器能把想看的內容數位化又不用拆書、不用一頁頁的翻拍,那應該是個最棒的選擇
作者: andy2000a    時間: 2008-8-27 12:04
標題: Re: 適合作為書籍電子化的軟硬體
有隨身的 scanner  ??   這樣配 umpc  
就可以 去 圖書館查資料時  直接 scan

不必 copy 完後 ,  還得再輸入一次

但是現在好像都沒有 掌上型 scanner . 至於 ocr
以前try 過  丹青 .. 覺得辯認很差 . 一些小字體 完全認不出來
花在 修正時間  不如直接人 keyin 資料  .
作者: gcvincent    時間: 2008-8-27 13:50
標題: Re: 適合作為書籍電子化的軟硬體
有規模的圖書館應該會有專門房間放翻拍架,
帶一台有腳架孔的隨身機DC去拍最快。
(最好是lcd可以反轉還有遙控器就更方便。)
作者: garychang    時間: 2008-10-23 12:30
標題: Re: 適合作為書籍電子化的軟硬體
更新一下目前的進度:
假出差之便,入手一台fujitsu scansnap s510
1)難以致信的其與台灣的價差:
這裏如果算上rebate($50)的話可以低至369.99,而台灣的fnac及其它網路商店的賣價可以高至23900!近一萬元的價差真的有點誇張了。

2)軟體及手冊:
在美國買東西只是怕軟體僅有單一/拉丁語系(英/西)的版本,可是這台所附的多國語系,也包含了正體中文,簡單來說,所有的軟體(包含本身程式、acrobat 8、card minder(名片辨識及管理)甚至紙本的操作手冊,全部都有正體中文的,我想跟台灣買到的應該是一樣吧。

3)掃描速度:
真的是很快,連續的雙面掃描,中英文字辨識(含名片及收據)用起來的感覺就是舒服,完全就是一個快(與平台式相比),每分鐘號稱18張的速度還真不是騙人的。

4)掃描品質:
還ok,畢竟是掃文書為主,不期待照片掃描效果,也許有機會可以試試。

缺點:
如果要掃書,就得拆,不過我個人是可以接受這種破壞性的手段(內容重於書皮),且真的要還原,我想也許可以拿去影印店膠合回去?




歡迎光臨 PALMisLIFE 討論區 (http://f.pil.tw/) Powered by Discuz! X2.5