什么是元数据?(元数据能获取什么资源信息)

自 20 世纪后期以来,元数据一词就被广泛使用。但在过去几年里,它占据了科技头条的大部分,凸显了了解这一概念对您的个人数据、隐私和安全意味着什么的重要性。在决定元数据是否值得得到所有关注之前,您首先需要了解它的含义以及它如何影响您的数字生活。那是什么?元数据可以揭示关于您的哪些信息?你能做些什么呢?

什么是元数据?

元数据这个词的直译是“关于数据”。虽然元数据本身很少被归类为有用的数据,但它通常是一个更大的数据集的摘要——从音频文件和通信到图像和视频。但是元数据不仅仅是对已经完整的信息集的无用补充。

您可以将元数据视为书籍外部的信息以及目录。他们不会破坏整本书;它们允许您对它进行正确分类,而无需阅读整个内容。

至于类型,元数据通常根据它揭示的有关源文件的信息类型进行分类。单个文件可以包含不止一种类型的元数据,以允许电子系统和用户更好地组织和分类文件。

描述性元数据

顾名思义,描述性元数据描述了相关文件的内容。描述性元数据中的信息通常用于过滤和搜索大型文件库——通常是相同类型的文件。

它是最常用的元数据类型。描述性元数据通常包括文件创建者的姓名、创建日期和其他重要信息,如流派、专辑,甚至是封面图片(如果是音频文件)以及 ISBN 和作者姓名的书籍。

结构元数据

结构元数据提供有关特定文件中数据的组成和布局的信息。虽然此信息可用于过滤,但它通常专用于更深入地探索和分类文件。

结构元数据有多种类型,例如音频文件的长度、书中的页数、目录和章节标题。

行政元数据

管理元数据本质上是技术性的。它包含有关如何打开和运行文件的信息,包括文件格式等信息。这种类型的元数据几乎存在于所有文件中,并由您的设备和用于运行文件的软件或应用程序读取。

在某些情况下,管理元数据也被归类为权利元数据,涵盖有关文件知识产权以及谁有权访问文件的信息。

法律元数据

法律元数据严格提供有关文件法律状态的信息。这包括文件的版权属于谁或什么版权属于它所包含的公共或私人许可类型,以及任何附加的、具有法律约束力的协议。

为什么元数据很重要?

无论您使用什么文件格式,无论您是创建文件、从朋友那里获取文件还是下载文件,元数据在您的日常数字生活中都扮演着重要角色。虽然元数据所包含的信息本身可能很简短,而且大多无关紧要,但它可以被操纵和修补在一起以破坏您的隐私和安全。

如果您的一个或多个文件的元数据被暴露,它不会透露文件的内容。相反,它回答了基本问题,例如:

这个文件属于谁?

它包含什么类型的信息?

它是在哪里创建和保存的?

它是什么时候创建的,是否由当前所有者编辑?

但是所有这些问题的答案加起来仍然意义不大。这些表面信息可以揭示一个人的多少信息?

元数据可以揭示您的哪些信息?

就其本身而言,从少数文件和网络操作中收集的信息是微不足道的。

然而,当在很长一段时间内从数千个来源收集关于一个人的元数据时,就会出现问题。这包括您最常通过电话和电子邮件聊天的人,即使他们无权访问您的对话内容。

随着对新类型信息(例如图像)的元数据跟踪的引入,有关您的更多信息会暴露出来。上传到 Twitter 和 Instagram 的定期自拍和晚餐照片可以显示您最常去的位置,即使您没有标记它们 – 这就是您的相机应用程序请求访问您的位置的原因。

就其本身而言,暴露的元数据是一种隐私侵犯。它允许任何有权访问它的人跟踪您的动作和通信模式。但是有了足够的信息和制作精良的 AI 系统,他们甚至可以开始预测您即将进行的动作和活动。

虽然您可能会发现在与朋友和家人交谈时进行跟踪,但高级分析系统得出的结论可能更具侵入性。毕竟,跟踪您的公司现在知道您何时联系您的医疗保健和保险提供商,以及您在网上搜索的信息类型。

Security.org 的一项调查调查了互联网上最大的网站收集的数据类型,即使它们不是必须的。调查包括 Facebook 和 Twitter 等社交媒体网站,甚至谷歌,发现他们中的大多数保留了他们不需要的用户信息。

数据包括唯一标识符、个人信息、位置和用户活动。通常情况下,即使您只允许严格必要的跟踪和 cookie,您也无法选择退出此类数据收集。

你如何保护自己?

屏蔽您可能留在网上的任何标识符,在访问任何网站时接受尽可能少的 cookie 和跟踪器,以及反跟踪浏览器扩展。至于更多的个人信息,请确保在将任何文件上传到互联网甚至将其发送给朋友之前从任何文件中删除元数据。

虽然几乎不可能完全避免将数据跟踪在线,尤其是在您拥有帐户的网站上,但您可以最大限度地减少他们拥有的关于您的信息。

相关推荐

发表评论

路人甲 表情
Ctrl+Enter快速提交

网友评论(0)