留下证据：如何存档开源材料？

IYP
Sep 2, 2018
8 min read

证据很重要。不论您是做调查、写报告还是新闻稿，都需要切实的证据。但是删除很讨厌，不论是发布者自己删除的还是审查者移除的，所以您应该有个办法能证实相关内容切实存在过。别提截图，图片太容易被修改了，你完全有口难辩……

不论您是做在线调研，还是职业媒体，都存在一个证据收集的问题。您需要不停地保存您发现的材料。但如何在您发布调查之后用户删除了帖子、或者被审查者移除了内容，比如 YouTube 上，关于叙利亚战争罪行的视频就会被谷歌移除，根据谷歌的所谓规矩，但是您依旧需要证实您的调查和报道中索引材料的真实性。

存档您使用调查的所有数字证据的主要原因有两个：如果原始来源被删除了，您依然可以保留它，并向您的受众证明材料确实存在；屏幕截图可以很容易被伪造，那些用截图做证据的都不是专业人士，想做一个无可辩驳的专业人士您就必须找到一种方法来保留材料，以表明您没有机会修改内容，也就是它的可证实性。

第三方存档平台

对于大多数内容，包括社交媒体帖子，新闻报道和其他网页，通常有两种服务可用：Archive.today 和 Archive.org。这两个站点将网页保存在自己的服务器上，任何拥有 URL 的人都可以访问它们。更有利的是，这两个站点都会随着时间的推移保存页面的快照，因此您可以观察每次存档时的更改痕迹，例如在编辑新闻文章之前和之后。

我们通常建议在两个站点上保存材料，以便最大化存档内容的数量。我们将总结每个网站的工作方式，以及它们在多个最受欢迎的社交网站上捕获网页的效果。一般来说，Archive.today 在保存社交网络页面方面更加通用，因为它们通过为这些网站创建帐户以保存页面，同时存档。

Archive.today

在两个主要档案网站中，Archive.is 是功能最多、更友好的网站。然而，它几乎与 Archive.org 差不多，应该被视为不太稳定。此外，由于极端主义内容有时会通过 Archive.today 链接共享，因此该网站在许多国家/地区已被禁止。该站点有备用 URL（Archive.is，Archive.li，Archive.ch ...），可以让您绕过一些（但不是全部）国家的审查，例如俄罗斯、中国和芬兰。

Archive.today 上保存的页面完全来自用户提交的请求，而不是像 Archive.org 那样的自动检索。要在此站点上保存页面，只需在红色框中输入要保存的 URL 即可。

您还可以通过将书签保存到浏览器的书签栏来存档页面，创建一键式路径以保存当前所在页面的快照。要执行此操作，请使用以下 URL 在书签（或收藏夹）栏中保存新页面：javascript:void(open(‘https://archive.today/?run=1&url=’+encodeURIComponent(document.location)))

只需单击新创建的书签，即可在浏览器的选项卡中保存您打开的任何页面。

或者，您可以单击 Archive.today 首页上的按钮并将其拖动到书签栏，从而无需手动创建书签。

要检查 URL 是否已保存，请将其放入蓝色框中。

如果您不确定确切的 URL，有更多高级方法可以搜索已保存的页面。例如，如果您要查找所有已归档的 MENA（中东北非）标记的 Bellingcat 新闻文章，请搜索：

URL 末尾的星号表示 Bellingcat 网站上所有文章的 URL 都以“/ news / mena”开头。

结果是由输入 URL 的用户手动保存的文章和交叉引用 Archive.org 的已保存页面数据库的混合结果。在某些情况下，您可以访问同一页面的多个版本，因为随着时间的推移可能会对文章进行更改。

Archive.today 的另一个有用功能是将整个页面保存为图像的功能，即使它很长也没问题。但是，这不应该替代生成的实际存档链接，因为屏幕截图可以在保存后进行修改，你很难自证。

Archive.today 在归档社交媒体页面方面相对称职，但它远非完美。下面列出了各种社交网络中的一系列存档页面。一般的经验法则是，如果您试图存档任何需要绕过隐私设置的社交媒体页面 —— 例如“Facebook上的只有朋友可见”、“Twitter 上的锁推” —— 几乎不可能将页面保存到第三方存档网站，如 Archive.today 或 Archive.org。

在以下示例中，单击每个社交网络的超链接以查看 Archive.today 上的页面。

Facebook：

工作得相当好，对帖子中嵌入的照片和视频有限制。

Instagram：

不起作用。

Twitter：

效果很好，限制了推文中的嵌入内容，例如照片、视频和链接。

VKontakte（VK）

效果很好，对嵌入式照片和视频有限制。

Odnoklassniki （OK）

效果很好，对嵌入式照片和视频有限制。

YouTube

只能保存元数据和文字，而不能保存实际视频。

Archive.org

互联网档案馆成立于 1996 年，已经保存了 20 多年的网页快照，并且预算相当可观，确保了可能无法从 Archive.today 中获得的稳定性。虽然 Archive.org 有许多引人入胜的项目，但我们最感兴趣的是他们的 Internet Archive Wayback Machine （web.archive.org），它允许用户存档特定的网页并查看其他人拍摄的快照。

与 Archive.today 一样，查找和保存网页的过程很简单。在页面顶部搜索 URL 以找到结果，并在右下角输入要保存的 URL：

Archive.today 依赖于用户提交要保存的页面，但 Archive.org 使用用户请求和脚本来自动保存页面。

为了保存普通网页和新闻文章，Archive.org 通常优于 Archive.today，因为它允许您点击存档的其他页面。例如，使用 Internet Archive Wayback Machine，您可以像在2014年一样浏览一个网站的大部分内容，所有页面都在四年前保存。在 Archive.today 上，归档页面有很多可用性。

Archive.org 与社交网站的斗争比 Archive.today 更多，但仍有其用途。

Facebook

适用于完全公共页面，但与 Archive.today 不同，无法访问需要 Facebook 帐户的页面。

Instagram

不起作用。

推特

效果很好，限制了推文中的嵌入内容，例如照片，视频和链接。

VKontakte（VK）

适用于完全公共页面，但与 Archive.today 不同，无法访问需要 VK 帐户的页面。

Odnoklassniki（OK）

适用于完全公共页面，但与 Archive.today 不同，无法访问需要 OK 帐户的页面。

YouTube

在 Wayback Machine 主站点上运行效果不佳，甚至难以保存视频中的元数据和文本。

但是，Archive.org 有一个名为 YouTube Crawl 的独立项目，该项目存档来自 YouTube 的视频，其元数据完好无损。您可以在此处查看有关如何参与其项目的详细信息，它比在 web.archive.org 和 archive.today 上找到的简单一键式解决方案更具参与性。

保存照片和视频

很明显 Archive.org 和 Archive.today 都无法保存来自 Instagram 和 YouTube 的照片和视频，并且在从 Facebook，VK 和其他网站保存照片方面存在问题。对于这些网站，创建一个托管媒体的第三方“中立”平台要困难得多。相反，我们需要单独下载这些材料，然后提供补充材料（例如显示元数据的屏幕截图，材料的镜像版本等），以证明图像和视频是真实的。

YouTube

有很多网站可以从 YouTube 中提取视频，例如 KeepVid，Y2Mate 和其他网站。只要您有足够的硬盘或云存储空间来存储来自 YouTube 的视频并不困难。请务必截取元数据并将页面保存在Archive.today上，以便保留标题、上传日期和说明，即使视频未保存在页面上也是如此。

Instagram

不幸的是，归档 Instagram 页面非常困难。通常情况下，所能做的最好的事就是希望帖子已经反映在另一个网站上了（有许多信誉不佳的网站“借用”Instagram的内容自己托管），并手动以完整的分辨率保存图像。

要以全分辨率访问 Instagram 上的照片，请使用以下方法：

在 Instagram 上查找照片的 URL 并删除 ID 号后面的任何内容。例如，URL 为 instagram.com/p/ BfZJzBphUr1 / 的照片的 ID 为 BfZJzBphUr1。如果此 ID 之后有任何内容（例如“take-by = username”），请将其删除。
在 URL 末尾键入 / media /？size = l（小写L）。对于 URL instagram.com/p/BfZJzBphUr1/ ，将是 instagram.com/p/BfZJzBphUr1/media /？size = l
您可以在 Instagram 上访问的最高分辨率照片现在将显示为 JPG 文件。对于前面提到的帖子，可以在此处找到 URL 。

要保存 Instagram 中的视频，您可以使用许多类似于 KeepVid 的网站，例如 Gramblast 和 DreDown。

Facebook

在 Facebook 上以高分辨率下载照片比使用 Instagram 更容易，因为它内置于网站的用户界面中。只需单击“选项”，然后单击照片上的“下载”即可将其从 Facebook 的服务器中取出。图像可能不是相机上的原始分辨率，但它是您从 Facebook 本身可以获得的最佳分辨率。

从 Facebook 提取视频有点麻烦，但仍然相对容易。观看视频时，右键单击该视频并选择“显示视频 URL”，以便您可以复制粘贴第三方网站的直接链接以下载视频。

与 YouTube 和 Instagram 一样，您可以使用多个第三方网站从 Facebook 服务器获取视频，以防上传材料的用户将其删除。FBDown.net 工作得非常好，几乎没有广告或弹出窗口。粘贴从原始来源复制的视频 URL 后，您可以从下面红色框中的链接下载具有最高可用质量的视频。

在 Vkontakte 上以完整分辨率保存照片非常简单：只需在照片上选择“查看原始照片”，即可以最大可用分辨率访问它。实际上，即使用户从其页面中删除了照片，托管全分辨率图像的 VK 的 URL 也将无限期保留。

从 VK 下载视频比 YouTube 有点棘手，但可以使用许多免费（和付费）工具。例如，GetVideo.org将允许您以原始分辨率下载上传到 VK 的视频。要获取视频网址，请右键点击视频，然后选择“复制视频链接”。

请注意，您不应该在此 GetVideo 上单击“最佳质量”，而是选择最高的特定分辨率（例如720p）。请注意，此站点的下载速度非常慢。

以完整或接近全屏的分辨率抓取照片的最佳方法是选择“全屏”，然后保存图像或截取图像。

从 Odnoklassniki 获取视频的网站数量少于其他社交网络，但还是可能的，例如 Video-Download.co。

其他归档解决方案

通常，您不能使用之前讨论过的服务来下载网页或视频，因为它们落后于隐私设置（限制对 Archive.today 这样的网站的访问），或者他们使用像 KeepVid 这样的网站无法吸引的模糊视频播放平台。本指南前面提到的所有解决方案都是免费的; 但是，还有一些其他服务需要一些付款或试用期限制。

有些软件解决方案可以从大多数视频网站中获取材料，即使他们不使用 YouTube 或其他流行平台。尽管需要付费才能完全使用，但 Apowersoft 的视频下载捕获功能对于几乎所有嵌入式视频、包括直播视频，效果都非常出色。该软件能够检测您的浏览器中正在播放的视频，然后（通常）能够从其原始源下载它。如果您有想要下载的特定视频但无法找到任何其他解决方案，则可能需要尝试免费试用此软件。

对于躲在隐私设置背后的网页，很难找到任何创建该网站的受信任的第三方存档副本的解决方案。将页面保存为 HTML 格式是非常混乱的。另一种解决方案可能是将页面保存为 PDF 文件，方法是将其打印为 PDF（文件 - >打印 - >打印到 PDF），或者使用 Adobe Create 将网页转换为 PDF。

也就是说，仍然可以在 PDF 中修改这些页面的内容。目前，显示隐私锁定页面内容的最可信但仍然不完美的方式是，在访问页面时记录您的屏幕（请参阅此处执行此操作的简单解决方案列表）。

最后，如果你进行了大量的在线研究，并希望有一个自动跟踪解决方案，以便可以顺着自己的步骤，那么可以考虑 Hunch.ly。此插件在激活后会自动存储您在进行调查时访问的每个网页。如果以后删除了其中一个页面并且您没有将其归档，Hunch.ly 将为您提供保护。

您是否拥有用于存档网页、图像和视频的任何其他网站或资源？请在评论中告诉我们，我们可以将它们添加到本指南中。◾️

感谢帮助 iYouPort！

PayPal 捐赠渠道已开通 https://paypal.me/iyouport

留下证据：如何存档开源材料？

Recent Posts

Comments