哪些照片共享网站公开了相机的序列号?


26

哪些网站公开了原始图像EXIF中的相机机身序列号?

Flickr是一个照片共享网站,该网站公开了许多照片元数据(来自EXIF数据),并且借助Flickr API甚至使其易于访问。Google的Picasaweb还提供了EXIF的一些信息,但不提供序列号。

还有其他网站可以帮助我吗?

作为我正在做的事情的背景,我试图整理一个相机序列号数据库以及找到它们的图像URL。这只是我免费做的事情,希望我们能抓住一些偷走我们珍贵相机的人!我希望这不会太离题,因为我不打算出售任何东西,只是想做点事!

免责声明:我是stolencamerafinder的作者;)


更新 -根据fbuchinger的要求,以下是对项目状态的快速更新:

许多网站(不幸的是包括Facebook)将makernotes排除在EXIF之外。到目前为止,我发现最丰富的序列号来源是Flickr。我想这是因为人们经常上传全尺寸(读取“未编辑”)图像。在我的网站(stolencamerafinder.com)上,我提供了一个Java Webstart应用程序,该应用程序通过其API收集flickr数据。由于对API调用的速率有上限,因此我编写了它,以便在Web启动客户端的数量之间共享工作,从而减少了运行它的人员,从而减少了客户端的带宽和CPU。如果您正在阅读本文,并且说,例如,您对工作量不大的服务器具有管理员访问权限,为什么不让它在那儿运行;)

我还编写了一个Google Chrome浏览器插件,该插件可以监视嵌入了序列号的网站上的图像。我不希望这个应用程序带来很高的收益,主要的想法是发现哪些网站可能是编写定制的爬虫工具然后抓取它们的良好来源。

我已经公开了用于stolencamerafinder的API,并且正在寻找其他程序员来帮助我编写可用作网络爬虫的程序。

在执行此项目时,我收集了许多有趣的数据,这些数据将很快在网站上发布,例如哪些相机型号可以编写和不编写有用的序列号。例如,尼康D50只需将“ D50”写为序列号!

对于您对我的项目的任何反馈(好或坏!),我将深表感谢。

-马特


8
可能更有用,更可销售的是将提供一种服务来跟踪“(您)”照片的使用位置(重新),而可能没有许可证。
罗兰·肖

我更新了我的答案
fbuchinger

Answers:


6

我喜欢捕麦的想法。;)

我注意到DeviantArt.com似乎“捕获”了所有上传图像中嵌入的所有EXIF元数据。它并没有显示全部内容,但是网站的某些部分(其中许多仅用于付费会员)显示了有关上载图像的更多详细信息,并且我看到了完整的标签数据。

从技术上讲,我想您是否可以做类似于TinEye.com(反向图像搜索)的工作,该索引可以按内容相似性对图像进行索引和搜索。TinEye很方便,因为它可以按内容匹配图像,但是有其局限性。用某人的受版权保护的照片创建的照片操作很难识别。按序列号搜索将提供另一种补充方法。

从技术上讲,您可以获取嵌入到上载到Internet的图像中的任何exif数据。如果摄像机的序列号是嵌入式的,那么您将找到所需的内容。您需要从建立索引的站点上刮取每张图像的副本,从建立索引的图像中提取任何EXIF(或其他标签数据),并通过链接返回源来跟踪信息。您可能还可以使用Bing和Google等主要搜索引擎来查找要建立索引的图像(基本的关键字图像搜索,例如摄影师名称,位置等,可能就足够了。)您可能不需要保留图像(并且这样做可能会涉及法律问题),但至少您将拥有EXIF / IPTC标签数据的索引(可能是序列号)和源链接。


1
一个陷阱是,如果以任何方式处理照片,则很可能会删除或缩小EXIF。在照片共享站点和常规图像搜索中EXIF数据的可用性完全取决于上载的图像元内容。然而,寻找可用于搜索被盗相机的元数据本身就是一个好主意。
2010年

@nik:是的,无论上传什么内容,您都将受到摆布……太糟糕了,以至于大多数工具(例如Photoshop,Lightroom等)中的工作流都不会在保存和修改时保留标签数据。
jrista

感谢您指出Tineye。它们最多有16亿张图像,这使我的30万人看上去很垃圾!但是,如果他们能做到,我也可以!我将继续编写更通用的网络爬虫以蜘蛛所有网站……
马特·

@matt:的确,他们有16亿,但没有按序列号搜索。如果您既可以按内容又可以按序列号进行搜索,那么它们将占据优势。; P
jrista

请注意,在许多站点上,除非您具有某些成员资格状态或与上载该文件的用户的连接,否则您无法访问该文件。因此,您可能只能下载最常带有EXIF条带化的缩小版本。上载工具有时也会这样做,仅发送带有版权信息的文件。子注:Facebook剥夺了所有内容,甚至剥夺了EXIF的版权,为此而受到了摄影师的热烈欢迎。
伊泰

6

更新:

感谢项目状态更新!首先,使用Java Webstart应用程序的方法很有趣-您是否为每个Webstart实例使用了不同的flickr api密钥,还是flickr根据api密钥/ ip地址组合来限制api请求?

我运行了您的webstart应用,扫描50张照片后,它产生了0个序列号。我没有看过您的源代码,但是您应该知道,只有极少数的cam(主要是dslrs)将序列号写入exif元数据。

我建议从Phil Harvey的Meta Information Repository下载示例图像,并在其上运行exiftool来查看哪些模型实际产生序列号。然后,您可以将Webstart应用程序搜索范围缩小到这些模型,从而大大提高成功率。


当我刚开始探索photo.stackexchange.com时,我偶然发现了您的问题。

2年前,我有一个与stolencamerafinder非常相似的想法,并实际上开始在python中实现它。但是由于各种原因,我停止了它:

  • 存储在EXIF数据中的大多数摄像机序列号是可编辑的,因此是伪造的(至少使用exiftool)->出现错误警报或“序列号垃圾邮件”的风险(至少在服务开始流行时)

  • 大多数人使用图像上传器来调整其图像大小,从而经常丢弃EXIF数据的全部或许多部分(请记住,序列号始终存储在某些专有的exif标记中,在图像转换期间经常会丢失)->检查图像的比例低:提取的序列号。

但是我很好奇您的项目是如何开发的...您能给出一个简短的状态摘要吗?


你好 我刚刚在上面的主要问题中添加了更新。如果您有任何疑问/建议,我想听听他们的意见。
马特

我仅使用一个API密钥,但是每个Webstart实例都通过网站进行通信以对工作进行负载平衡,从而不会超出配额。
马特

我担心为什么Webstart应用程序对您不起作用。它应该在扫描的所有照片的约1/4中找到序列。Java控制台日志中是否有任何消息?我下载了这些样本图像,并编写了一个python脚本以生成一些统计数据。我会尽快将它们发布在网上,以备其他人感兴趣。
马特

6

由于我的第一个答案更侧重于技术细节,因此我决定打开第二个答案,以概述我最初称为“ CATT”(“相机防盗工具”)的“ camerafinder”创意。随意使用我的想法,但请认真地相信我...

与偷来的相机取景器相反,CATT采用的是“选择购买”。作为摄像机的所有者,您可以在CATT站点上注册,创建用户个人资料,然后注册您的摄像机。

为此,您需要对屏幕上显示的一些随机生成的QRCode拍照。然后,您将未修改的照片上传到CATT站点。上传完成后,服务器将读取照片的元数据并检查嵌入的序列号。它还尝试从图片中解码QRCode并将其与存储的哈希值进行比较。这是为了防止有人通过仅上传用该相机拍摄的任意照片来注册您的相机。

相机被盗后,您可以在CATT网站上登录并将该设备标记为被盗。为了追踪被盗的相机,我们计划在javascript中使用客户端exif序列号解析器作为mozilla oilmonkey脚本(类似于您的chrome扩展名)。它只应在包含原始图像的flickr页面上执行(这要感谢油脂猴子的url模式支持),以免降低浏览器的速度。该脚本会定期与CATT服务器联系,以获取被盗凸轮序列的列表。如果当前显示图像的序列显示匹配,它将显示警报。

我看到您的chrome扩展程序采用了类似的方法(尽管似乎只是收集序列号)。在您的情况下,我可以将扩展名与W3C File Api(当前为Firefox和Chrome)结合使用,以便用户还可以检查本地存储的照片,而不仅仅是检查嵌入在网页中的照片。这肯定会增加您的“序列号收获”,因为不会有“中间人”(flickr facebook等)删除exif数据。

这是有关使用W3C File API进行Exif提取的有趣的Mozilla演示


非常感谢您,提供一些很棒的信息和想法。QRCode很聪明。我不确定我是否理解File API对您所说的方式有什么帮助(谁会允许本地文件访问并从被盗的相机中获取图像),但这正是我想要编写一个简单的方法我网站主页的串行提取工具。代替“输入您的序列号”,我只能允许人们使用他们已有的图像进行搜索(这还可以防止出错)。另一个优点是,有时我必须使用内部序列号作为ID,而不是相机盒上的ID。
马特

顺便说一句,该演示页面仅适用于firefox,不适用于Chrome。我也开始认为此页面不是讨论所有这些内容的理想选择,但现在就可以了!ps。我目前正在亚洲旅行,因此,如果我花几天(/周)进行答复,请不要感到冒犯,谢谢您的评论。
马特

如果exif阅读器演示程序在chrome> 5中运行,则错误是由非必需的日志记录功能引起的(请在chrome控制台中检查并将其重新定义为空func)。旅行愉快!
fbuchinger 2011年

关于本地文件用例:我想我们的意思是相同的-本地文件的js cam串行提取是您stolencamerafinder网站的一部分,而不一定是扩展名的一部分。它可以用于根据一些示例照片确定凸轮状态(例如,在购买使用过的凸轮过程中拍摄的照片,以确保未从他人那里偷走过)。顺便说一句:您是自己扩展Jacob Seidelin的Exif解析器还是序列号提取了他的工作?
fbuchinger 2011年

我本人扩展了他的解析器,但到目前为止只能阅读佳能和松下makernote部分的内容。(我对IFD格式的了解充其量是不好的)。我需要对他在我网站上的工作给予应有的评价,因为这主要是他的工作。当我对自己的编辑感到满意时,我会将其作为可能的改进/替代版本发送回给他。
马特
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.