拍摄文字的最佳相机设置?


11

我正在使用S95拍摄OCR的文本文档(纸质和缩微胶卷)。我已经问过如何最好地拍摄缩微胶片的计算机屏幕的问题,但是我一直在考虑拍摄文本的最佳方法,以使文本清晰明了。这是我目前的想法,但我想听听任何摄影经验超过我的人说的话:

  1. 我使用的是较小的百万像素(大约6-7MP,而不是S95的最大值,即10MP),因此当我实际滚动浏览它们时,生成的PDF文件不会杀死我的计算机

  2. 光圈-较低(例如f / 6.3),因此,如果相机与页面不完全平行,则文字将保持焦点

  3. 快门速度-在这里需要权衡,因为图书馆通常是较弱的光线,所以我想降低快门速度以增加曝光,但是如果没有三脚架,相机可能会晃动

  4. ISO-我不太确定这会如何影响它。

  5. 白平衡-同样,不是很确定。

我一直在尝试在相机上使用不同的设置,但是我只是在学习摄影,并且想知道是否有人对如何最好地从书籍或文档中拍摄文字有任何建议,这很容易阅读。


3
为什么不只是使用正确的工具完成工作并使用扫描仪呢?
ahockley

7
“为什么不仅仅使用正确的工具来完成工作并使用扫描仪?” -因为我处理的许多文档都是无法扫描的。它们非常脆弱,或者库不允许您扫描,或者库收取高昂的费用,每页扫描成本超过$ 0.50。
杰森

2
我希望有人这样说:我希望您的使用在适当的情况下适当尊重版权。:)假设如此,希望您能找到答案!
林德斯2011年

3
“我希望您的使用适当尊重版权”-是的,我的作品使用的是不受版权限制的文件(我是一名历史学家,主要研究19世纪末的欧洲)
杰森

2
@ahockley:不扫描的另一个原因是它需要很长时间。使用DSLR,我可以在桌面上每分钟处理大约20页,但是扫描仪使用文档进纸器的速度很快,而且成本很高。

Answers:


7

如果您的相机具有黑白模式,请尝试这样做以减少后期处理时间。另外,我曾经使用过的许多OCR程序在B&W方面都做得更好。

您需要尽可能与页面平行,因为为了减少手持时相机的晃动,您可能需要最大的光圈以最大程度地提高快门速度。s95上的小型传感器应将DOF增加到足以使我将光圈打开得尽可能宽的程度。

考虑到您只是要通过OCR进行此操作,请将ISO调整到可以使您获得适当曝光且震动最小的程度。与模糊字母相比,OCR抱怨额外噪声的可能性要小得多。

如果您只是在谈论文字,白平衡应该适合您相机的“室内”设置-但坦率地说,不要太担心它。

仅当您的文档文本非常小并且您需要清楚地解决该细节级别时,才可能具有百万像素的大小,但是我想对于大多数情况来说6-7就可以了。


1
您可能的意思是“垂直于页面”。如果您是平行的,将很难阅读文本。;-)
Craig Walker

@Craig Walker-他在页面上使用了“平行”一词,我理解他的意思,所以我没有试图混淆他。更不用说传感器本身和取景器都是平行的。这仅取决于您引用的摄像机的哪一部分。这个词是故意的。
rfusca 2011年

只要使用最大的百万像素,OCR的文档就很重要,而且它们会相对较小,并且只要来源是纯文本,就不受照相机分辨率的影响。我使用Abbyy FineReader,它在较高分辨率的图像(例如21MP而不是10MP)上效果更好。因此,以10MP拍摄。

很公平。
Craig Walker

黑白模式为+1。用于文本处理的RGB浪费了像素。
格雷格,

2

您似乎已经很好地掌握了设置。相机晃动将破坏文本的可读性,因此我将首先对其进行优化。如果您不能使用三脚架,请确保您的快门速度在焦距(相当于35mm)上至少为1。缩小将使此操作更容易。如果有,请使用图像稳定器。

可以将Aperture设置得相当宽,只需确保与页面平行即可。较大的光圈将有助于提高快门速度,与由于相机运动造成的模糊相比,由于较大的光圈而造成的模糊再也没有了!

ISO,无论您需要获得良好的曝光。噪声在变得非常糟糕之前不会影响可读性。

基于纸张本身拍摄自定义白平衡将是更好的选择,但是OCR软件应能够应对白色背景。


1
  1. 我假设您正在将JPEG转换为PDF。我建议捕获最大值,并使用程序将尺寸缩小到6-7 MP,并在缩小之后和转换为PDF之前应用锐化。

  2. 为了明确起见,您需要使用较小的光圈来获得更宽的景深,即更高的光圈值。(例如,您想要f / 8而不是f / 2)。为了使文本更具可读性,请尝试使相机指向尽可能垂直的位置,以便您不必担心景深。最好停止大开以减少像CA之类的像差,您会在白底黑字看到它。您离纸张越近,景深就越浅。

  3. 如果您手持,这可能会对可读性产生最大影响。如果是手持式,则希望选择一个快门速度,使其快于1 /(相当于35mm焦距),甚至更快。这取决于您在P&S上使用的缩放设置。如果使用广角端,则可以使用更长的快门速度,但可能会导致镜筒失真。如果您正在拍摄文本文档而不是计算机屏幕,则建议尝试使用闪光灯。

    如果可以的话,将文档支撑起来(胶纸或平坦的东西),以便将相机放在物体上,并获得所需的尽可能长的快门速度。您还可以使用豆子袋或小物体使相机静止不动。另外,您还可以获取用于P&S的水瓶三角架适配器。

  4. 光圈,快门速度和ISO形成一个曝光三角形。在这里阅读。ISO越高,可以使用的光圈越窄且快门速度越短,但是图像噪点更大。对于带文字的P&S,我建议使用较低的ISO(400或更小)。

  5. 为您的照明情况选择白平衡。如果您有荧光,请使用它。如果使用闪光灯,请使用闪光灯白平衡。


我不认为f / 8对于在室内拍摄手持设备是不现实的(除非使用闪光灯,否则您需要先征得图书馆的许可),再加上f / 8会使传感器变小而干扰,清晰度增益极小与所需的快门时间/ ISO增加相比。
Matt Grum

@Matt f / 8是一个示例,表明他希望使用更大的数字来增加景深(并减少可能可见的CA等像差)。我没有给他指导,因为我不确定他有多少光。分心?你是说衍射?
Eruditass 2011年

是的,我的意思是绕射-我正在手机上写这字,这有个令人讨厌的习惯,即使我拼写正确,它们也会自动更正我的单词。CA不会是一个主要问题(与相机抖动相比),如果光线是一个大问题,我认为最好还是从大开停下来……
Matt Grum

您不喜欢技术吗?是的,我想一口之门是一个很好的指导原则,并同意相机抖动将是关键。
2011年

拍摄最大MP,然后在计算机上进行降采样是一个非常好的建议。我可以想象,锐化+额外的对比度会导致文本更清晰,更易于阅读。
杰森

1

我同意在计算机中以最高分辨率进行拍摄并缩小尺寸的建议。另外,选择可以从相机中获得的最高质量的jpeg,或者在相机允许的情况下甚至进行原始拍摄,然后转换为tiff或png。jpeg中的有损压缩会在墨水/纸张边界周围产生伪影,这可能会使ocr软件感到困惑。

通常,您要使用的设置将获得最清晰的图像。诸如对比度,白平衡等之类的东西都可以在计算机中更改。实际上,在Photoshop或GIMP中使用级别工具或对比度/亮度工具增加对比度可以为您带来很多帮助。

另外,转换为灰度格式将大大减少文件的大小。而且,如果您这样做并提高对比度,则不必担心白平衡。您可以尝试白平衡,但是某些设置可能会产生比其他设置更好的对比度(这取决于您的照明)。

如果您的计算机可以处理,请在缩小尺寸之前进行所有调整(灰度,对比度,亮度),并在缩小尺寸之后,对图像应用一些锐化滤镜。


1

我在其他地方没有注意到的一些想法会加进混合:

  • 如果您拍摄 “放大”(更多远摄),它将使您从页面上进一步拍摄,这将为您提供关于文本大小的更一致的图像(角落中的单词将更靠近与中间的单词大小相同;如果是广角,则可能会对此产生失真)。我不确定这里的“理想”设置是什么,但这是对所需快门速度的一种权衡,这可能只是需要考虑的问题。

  • 您可能想要“ 过度曝光 ”与默认情况下相机可能认为正确的图像(除非足够聪明地猜测这是纸质文件-我将其用引号引起来,因为您真的不想过度曝光,只是根据白页上的测光而曝光过度),因为主要色调(纸张本身)将是相机试图曝光的主要内容,如果将纸张曝光为中间灰色,您将拥有泥泞的起点。如果您将曝光过度“停止”了一个半到两个停止点(只是不要转到突出显示的剪裁点),则文本仍然应该是漂亮和深色的,但是纸张将是漂亮和明亮的,从而使对比度分开(因此OCR)更容易。

  • 尝试使光线均匀 -如果页面的一个角落比另一个角落更亮或更暗,这将使将它们分成最可能用于OCR的纯黑色和纯白色变得更加困难。

  • “笔架”对于诸如此类的项目非常理想,尽管我认为这超出了您可以轻松地在库中获得的内容。但是,根据库的配置方式,可能存在某处(也许是一个架子)桌子,还是保持照明或类似功能的杆?),您可以放置一个带球头的超级夹具这是一个,但任何带有适当大小(取决于头部)的“螺柱”和某种三脚架的超级夹具头就可以了),然后将相机安装在桌子(或其他任何表面)上,这样您就可以保持一致的位置和稳定性,以防需要更长的曝光时间。基本上,这相当于“穷人”的广告位。

    您可能还想使用短时间的自拍或遥控器(我想您的相机具有2秒的自拍模式,也许是自定义模式,可能会更短),以避免按下按钮而使相机震动。

这就是我目前想的全部。希望这会有所帮助。


1

我和你的土地工照片有相同的工作,并且已经做了很多年了。大多数人不知道他们在说什么,相信我!

  1. M或手动上的相机

  2. Iso 100-200越高#越亮,但是在照片中它会得到更多的颗粒或噪点

  3. 快门速度1/100到1/160(通常最好是1/125,亮度越低越好,但您会被掩埋或重拍)

  4. 光圈或f2.7(为什么需要较深的视野,它是平坦的页面)

  5. 以6到10兆像素的彩色进行拍摄,查看您的白平衡设置,通常为荧光1或2,如果您不确定是否关闭,则关闭大多数铃声和哨子

  6. 使用ACDC在comp上公开图片


0

一些小建议,但我认为您的设置看起来不错

  1. 使用三脚架。这样可以消除相机抖动的任何问题,并允许您根据需要使用尽可能长的曝光时间。

  2. 避免以一定角度的光线直接入射到纸张上,该角度可以直接反射到镜头上,并在不需要的地方产生高光。这通常意味着确保光线来自侧面。

  3. ISO:根据经验,您应该偏向较低的值,但是我相信任何实质性差异都会很快变得明显。

除此之外,我想不出任何方法来改善您的设置。老实说,我想你已经明白了。


您能建议一个好用(且相对便宜)的三脚架,该三脚架会很有用,并允许我将相机翻转过来,使其与我正在拍摄的页面平行吗?我已经看过Joby三脚架,它们看起来很有前途,但是我听说它们在您按下快门时经常移动。
杰森

@杰森,公平点。我有一个喜欢的Joby,但是要在按下快门时停止它的移动,只需使用远程快门释放按钮或使用自拍定时器即可。对于您使用慢快门速度的任何时间,这实际上都是一个不错的提示。坏消息是,任何足够重的三脚架都不会便宜。对于那个很抱歉!(如果您发现不同,请告诉我!);)
AJ Finch

0

听起来您已经有了大多数答案:-P我仅对您的观点添加一些评论:

  1. 分辨率:是的,这里不需要很多分辨率,特别是如果您只是要在屏幕上查看图像时。我自己可能会将其上限设置为最大典型屏幕分辨率的两倍。

  2. 光圈:选择较小的光圈以获得一定的景深摆动空间是正确的。但是,您可能不需要太多。使用景深计算器计算您的焦距,计算出合理的景深,然后使用可能的最大光圈。(但是,请确保在最大光圈下保持一两个光圈,以获得最佳的清晰度。)您想要最大的光圈,以便在使用快门和ISO时可以有更大的空间玩;见下文。

  3. 快门:显然,您希望此操作尽可能快地减少抖动,同时又要获得足够的光线。我听说各种消息来源声称“快门速度等于焦距”是为了避免抖动。有些声称加倍。因此,如果您使用的是50mm镜头,请尝试将快门速度保持在1/50和1/100之间。一旦有了,就尝试以最慢的速度最大化光线。

  4. ISO:您应该能够将其提高得很高。噪点可能会降低图片的外观,但可能不会过多地降低其可读性。什么是“高ISO”和“太吵”取决于您的相机。实验。与光圈和快门相比,这可能是您在弱光下获得正确曝光的最佳方法。

  5. 白平衡:对您来说,不要紧。如果您的照相纸看上去是白色的,这有关系吗?(当然,如果您要拍摄带有全彩图片的书籍,则故事会有所不同)。如果您想在事后更正它,您将有一个相对轻松的时间,因为您可以使用许多中性色的纸张。我可能会将您的相机留在“自动白平衡”上,而不必理会。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.