元数据

维基百科,自由的百科全书
跳转至: 导航搜索

元資料Metadata),又稱元數據詮釋資料中繼資料後設資料等,為描述其他資料資訊的資料[1]。目前總共有三種類型的元資料,分別是結構性元資料描述性元資料管理性元資料[2]

結構性元資料是描述一個資料容器的資料的元資料。舉例來說,如果把書本當成是一種資料容器,那麼描述這本書本資訊的資料就是結構性元資料。

描述性元資料使用應用程式資料或資料內容的單一實例[3]

在許多國家,有關於電子郵件、電話、網頁、IP連結與手機位置的元資料是固定由國家來儲存的。

定義[编辑]

元資料是指「描述資料的資料」。雖然說源自於希臘介詞前綴 μετά- 的英文前綴「meta」代表「之後」或「之下」的意思,在此處實際上是使用知識論中「關於」的意思。元資料被定義為提供某些資料單方面或多方面資訊的資料;它被用來概述資料的基礎資訊,以簡化查找過程與方便使用[4]。例如:

  • 創建資料的方法
  • 資料的用途
  • 建立的時間與日期
  • 資料的建立者或作者
  • 資料被建立在電腦網路的何處
  • 用作標準
  • 檔案大小

舉例,一個數位影像檔案可能會包括描述圖片大小、色彩深度、圖片解析度、圖片建立時間、快門速度等資料的元資料[5]。一份文檔的元資料可能會包含文檔長度、作者、建立時間、文檔概述等資訊。網頁中的元資料也可以包含葉面內容的描述,以及有關於內容的關鍵字等等[6]。這些東西常被稱作「元標籤」(Metatags),其在1990年代後期以前被用來當作決定搜尋引擎結果順序的主要因素[6]。在1990年代後期,由於「關鍵字堆砌英语keyword stuffing」的出現,對於元標籤的倚賴程度逐漸降低[6]。元標籤的濫用導致許多搜尋引擎會誤認某些結果的關聯性高於實際值[6]

元資料可以在被稱作元資料註冊系統元資料儲存庫資料庫中儲存和管理[7]。不過,如果沒有文字和參考點的話,單純看是很難辨認這些元資料的[8]。舉例來說:一個資料庫本身會包含一些數字,但是這些數字代表的涵義可能是某些計算後的結果,或者是書籍的ISBN碼──這就需要參考才能知道,而無法直接由資料容器內部得知。菲利普·巴格利在1968年在他的著作《Extension of Programming Language Concepts》中發明了「metadata」這個詞,當時的意思為「描述資料容器的資料」,也就是結構性元資料,而非描述性元資料或常用於圖書館目錄的元內容(metacontent)[9][10]。自那時起,資訊管理、資訊科學、資訊技術、圖書館學與地理資訊系統等領域廣泛接受了這個詞彙。在這些領域中,元資料的定義為「描述資料的資料」[11]。儘管這是最廣為接受的定義,許多學科也為了自用而採用了特殊的解釋或定義。

類型[编辑]

雖然元資料的應用層面很廣,涵蓋各式各樣的領域,有專門和公認的方法來決定元資料的類型。弗朗西斯·布雷瑟頓英语Francis Bretherton和辛格利(1994)將元資料分成兩類:結構性/控制性元資料和指南性元資料[12]結構性元資料描述了諸如表格、欄、金鑰和索引等資料庫物件的結構。指南性元資料幫助人們找到特定的物品,而且經常被壓縮為一系列自然語言中的關鍵字。根據拉爾夫金博爾英语Ralph Kimball,元資料可以分成兩個相似的類別:技術性元資料和商業性元資料。技術性元資料等同內部性元資料,而商業性元資料則為外部性元資料。金博爾加入了第三種類別,過程性元資料。另一方面,美國國家資訊標準組織將元資料分成三種:描述性、結構性和管理性[11]

描述性元資料通常用於發現和識別,作為搜尋和定位物件的資訊,例如標題、作者、科目、關鍵字、出版商等等。結構性元資料描述物件的構成物是如何組織起來的,舉例來說,書頁是如何組成一本書中的章節的這種資料,就是結構性元資料。最後,管理性元資料給予有助於管理資源的資訊。管理性元資料參考技術資訊,包括檔案類型、檔案建立時間和檔案建立方式。管理性元資料之下還有兩個小分類,權限性元資料和保存性元資料。權限性元資料解釋了智慧財產權,而保存性元資料則包含保存和儲存資源的資訊[13]

內容[编辑]

主要是描述資料屬性(property)的資訊,用來支持如指示儲存位置、歷史資料、資源尋找、文件记錄等功能。元資料算是一種電子式目錄,為了達到編製目錄的目的,必須在描述並收藏資料的內容或特色,進而達成協助資料檢索的目的。

該名詞起源於1969年,由Jack E. Myers所提出的.metadata即關於資料的資料(data-about-data),可以說是一種標準,是為支援互通性的資料描述,所取得一致的準則。其基本定義出自OCLC與NCSA所主辦的「Metadata Workshop」研討會。它將Metadata定義為「描述資料的資料」(Data about data)。此後各種有關Metadata的定義紛紛的出現。現存很多metadata的定義,主要端視特定社群或使用情境而不同。如有有關資料的資料(data about data),有關資訊物件之結構的資訊(structured information about an information object),描述資源屬性的資料(Data describes attributes of resources)等。

都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元資料的一種應用,是1995年2月由國際圖書館電腦中心(OCLC)和美國國家超級計算應用中心(National Center for Supercomputing Applications,NCSA)所聯合贊助的研討會,在邀請52位來自圖書館員電腦專家,共同制定規格,建立一套描述網路上電子文件之特徵。

註釋與參考文獻[编辑]

  1. ^ http://www.merriam-webster.com/dictionary/metadata
  2. ^ Zeng, Marcia. Metadata Types and Functions. NISO. 2004 [5 October 2016]. 
  3. ^ National Information Standards Organization (NISO). Understanding Metadata (PDF). NISO Press. 2001. ISBN 1-880124-62-9. 
  4. ^ A Guardian Guide to your Metadata. theguardian.com. Guardian News and Media Limited. 12 June 2013. 
  5. ^ ADEO Imaging: TIFF Metadata. [2013-05-20]. 
  6. ^ 6.0 6.1 6.2 6.3 Rouse, Margaret. Metadata. WhatIs. TechTarget. July 2014. 
  7. ^ Hüner, K.; Otto, B.; Österle, H.: Collaborative management of business metadata, in: International Journal of Information Management, 2011
  8. ^ Metadata Standards And Metadata Registries: An Overview (PDF). [2011-12-23]. 
  9. ^ Philip Bagley. Extension of programming language concepts (PDF). Philadelphia: University City Science Center. November 1968. 
  10. ^ "The notion of "metadata" introduced by Bagley". Solntseff, N+1; Yezerski, A. A survey of extensible programming languages. Annual Review in Automatic Programming 7. Elsevier Science Ltd: 267–307. 1974. doi:10.1016/0066-4138(74)90001-9. 
  11. ^ 11.0 11.1 NISO. Understanding Metadata (PDF). NISO Press. [5 January 2010]. ISBN 1-880124-62-9. 
  12. ^ Bretherton, F. P.; Singley, P.T. Metadata: A User's View, Proceedings of the International Conference on Very Large Data Bases (VLDB): 1091–1094. 1994. 
  13. ^ National Information Standards Organization; Rebecca Guenther; Jaqueline Radebaugh. Understanding Metadata (PDF). Bethesda, MD: NISO Press. 2004 [2 April 2014]. ISBN 1-880124-62-9. 

参见[编辑]