上周末我由祖父母住过。我的祖母拿出了这本巨大的家族史书(约1400页),可追溯到1630年左右。我是个巨型书呆子,我认为将所有信息存储在数据库中并可以从Web上获取信息会很麻烦。我可以处理所有的Web编程和正则表达式,但不可以,但是我不知道的是将文本从书本转移到计算机的最佳方法。
从我所做的少量研究中,我知道某种OCR是必要的,似乎我的选择是:
- 用相机拍摄每页的图片,然后使用OCR软件处理图片
- 使用扫描仪扫描每页,然后使用OCR软件进行处理
- 使用某种类型的手持设备,像这样。
是否有人对解决此问题的最佳方法有任何想法?我不想销毁这本书,因为据我所知,它不能被替换。这可能是我唯一一次要扫描一本大书,所以我不希望在任何设备上花费超过250美元。我不介意在此进行任何人工操作(我意识到这很可能需要几个月的时间),但是我想找到最有效的方法。
关于这本书的注意事项:它只有大约20年的历史,所以它的状态还不错。它是单色的,页面尚未开始泛黄。由于它太大,所以我担心当文本接近装订时可能会有阴影。