開放資料


開放資料指的是經過挑選和許可、可以被任何人自由使用、再利用和再分發的資料[1]。這類資料不受著作權、專利權以及其他管理機制的限制,其開放性使得資料能夠被廣泛共享和應用。開放資料運動與開放原始碼、內容開放以及開放取得等其他「開放」運動有著共同的核心理念,即促進資訊共享、協同合作和創新發展。
定義
[編輯]- 可取得性與可訪問性:資料應當可以完整取得,並且取得成本不高,理想情況下能夠通過網路下載。資料需以易於修改和再利用的格式(如CSV、TSV、JSON等機器可讀格式)提供。
- 再利用與再分發:資料應當在允許再利用和再分發的許可協定下發布,且該許可協定不得對使用主體或用途設定限制。例如,禁止商業用途或限定特定領域使用的協定均不符合開放資料的要求。
- 普遍參與性:所有人都應有平等機會使用、再利用和再分發這些資料,不允許存在任何人為限制。
開放資料還強調互用性,即不同來源、不同格式的資料能夠相互整合和協同工作,從而支援建立更大規模和複雜度的資訊系統[1]。
概論
[編輯]一般來說,Open Data 的應用主要為非文字的資料素材,像是地圖、基因體、聯結體、化學分子、數學以及科學公式、醫學資料與應用,生命科學以及生物多樣性。開放這些資料時常常會因為這些資料本身具有的商業價值,或是經過彙整後可以成為有價值的產品,而引發出不同聲音的意見。資料的讀取,再次使用等,一般都由特定組織所監管,這些組織可能為私人或是公家機關。資料的讀取和再次使用的監管方法可能為,資料讀取的限制,透過著作權與授權,專利的申請,或是付費要求等。Open Data 的倡議者們認為,這些限制都有違公眾的利益同時這些資料都應該能自由取得,沒有限制也不該索取費用。除此之外,資料的再次使用也不該需要其他的許可,雖然依照再次使用的不同性質(例如延伸性的創作)可以經由授權來控管。
一個典型關於為何我們需要資料開放的說法:
“ | 許多科學家都曾經指出,在這歷史的一刻,正當我們擁有技術能力將科學資料以全球性的層次來發佈和送出,加強彼此之間的合作關係和加快加深新科技的發明時,很諷刺的看到我們忙著將資料封閉起來,並嚴禁使用更先進的技術在這些知識上 | ” |
——John Wilbanks, 執行長,出處Science Commons |
資料的創造者通常不會考量到資料應該標注的擁用者、授權方式以及再次使用的限制等資訊。舉例來說,對很多科學家來說, 他們不會把因為工作而公佈刊出的資料看成是屬於他們所有而設限,並把這些資料在期刊上的刊出視為將資料釋放到公眾領域的方法。但是,因為沒有確切的授權聲明讓人無法清楚知曉該資料集(data set)的狀態並可能對這些在開放的精神下釋出的資料在使用範圍上造成限制。因為這些不確定性也造成公眾或是私人組織與機構例如 IEEE有機會匯集這些資料,然後使用著作權宣告來限制資料的使用授權或是進而販賣這些資料。
在 "Toward Open Data" (邁向資料開放)一書中,Connolly (2005, v.i.) 列出兩句引言:
- I want my data back. - 我要拿回我的資料(Jon Bosak circa 1997)
- I've long believed that customers of any application own the data they enter into it. 長久以來,我一直相信客戶擁有他們輸入於任何一個應用程式內的資料的完整所有權.[4](這句引言指的是關於 Veen 自己的心律資料)
歷史背景與發展
[編輯]開放資料的理念已存在多年[5],但「開放資料」這一術語是在網際網路崛起後逐漸獲得廣泛關注的。自2009年以來,美國、英國、加拿大、紐西蘭等國家陸續推出公眾資訊開放計劃,使得開放資料成為主流媒體討論的焦點[5]。與此同時,開放政府資料作為開放資料的重要組成部分,由於其資料種類繁多、量大且大部分受到法律規定必須公開,成為推動資料開放的重要力量。
在科學界,開放資料的理念可追溯到20世紀中期的默頓規範傳統,旨在通過資訊共享促進學術合作和技術創新;而在政府領域,各國政府陸續建立了資料目錄和線上平台,如美國的Data.gov、英國的Data.gov.uk、加拿大的Data.gc.ca等,推動政府資訊透明化和社會監督。
開放科學資料
[編輯]關於 科學資料的開放獲取 概念的制度化主要源自為了準備在 1957-1958 年間舉辦的 International Geophysical Year[6] 所建構的 World Data Center 系統。 The International Council of Scientific Unions (現在改名為 International Council for Science) 建立了數個 World Data Centers 以求盡可能降低資料減損的可能性,並盡可能擴大資料的獲取性,並在 1955 年提出新的建議,要求資料必須以「機器可讀取」的格式來儲存[7]。
雖然開放-科學-資料運動的發起是在網際網路出現之前就已經展開,但是一個快速,遍佈更廣的網路系統的出現,徹底改變了開放科學資料的環境,因為將資料的刊出與取得的代價都不像前那般昂貴,也不用花那麼大的精力。
在 2004,所有 經濟合作與發展組織 (Organisation for Economic Co-operation and Development, OECD) 會員國的科技長官,這包含了世界上大多數「已開發」國家,簽署了一份共同聲明主要內容為,所有由公家機關出資收集的資料都必需要公開釋出。[8] 緊隨著對會員國內各資料產出機構發出的要求和激烈的爭辯,OECD 在 2007 發佈了 經濟合作暨發展組織公帑贊助研究資料之近用原則與基準 (OECD Principles and Guidelines for Access to Research Data from Public Funding) 的軟性約定 (soft-law)建議。[9]
開放政府資料
[編輯]開放政府資料特指政府收集和管理的資訊資料,通常受到法律規定必須公開。這類資料因其數量龐大、種類豐富以及資料品質較高而備受關注。開放政府資料的開放可以促進政府效能提升、降低運作成本,並為公眾、企業和研究者提供資料支援,從而推動社會經濟發展。[10]
有些國家及地區政府已經建立了網站,來發布他們收集的部分數據。
- 聯合國世界銀行統計數據下載 http://data.worldbank.org.cn/ (頁面存檔備份,存於網際網路檔案館)
- Data.gov - 美國政府的 open-data 網站,2009 年 5 月啟用。2013年,時任美國總統歐巴馬簽署要求「聯邦政府資訊應具有開放性和機器可讀性」的行政命令,要求聯邦政府機關在網路上開放發布其非敏感性資料時應具有機器可讀性。2018年12月美國國會通過《開放、公開、電子化與必要的政府資料法》將該行政命令法律化,2019年1月經過川普總統簽字後生效[11]。
- Data.gov.uk - 英國政府的 open-data 網站,2009 年9 月啟用。
- Data.gov.au - 澳大利亞政府的 open-data 網站,2011 年 3 月啟用。
- Data.gc.ca - 加拿大政府的 open-data 網站,2011 年 3 月啟用。
- opendata.go.ke - 肯亞政府的 open-data 網站,2011 年 7 月啟用。
- data.norge.no (頁面存檔備份,存於網際網路檔案館) - 挪威政府的 open-data 網站,2010 年 4 月啟用。
- data.overheid.nl (頁面存檔備份,存於網際網路檔案館) - 荷蘭政府的 open-data 網站。
- data.gov.tw (頁面存檔備份,存於網際網路檔案館) - 臺灣的政府開放資料平臺,2013年4月29日啟用。
- data.gov.in - 印度的政府資料開放平台,2013年5月啟用。
- data.gov.hk - 香港政府資料一線通,2011 年 3 月 31 日啟用。
台灣再2010年由「青平台」開始推動「臺灣開放資料計畫[12]」,並註冊 opendata.tw / opendata.org.tw 兩個網址。2011年臺北市政府成立台灣第一個政府的開放資料平台[13]2015年4月,行政院宣布制定「政府資料開放諮詢小組設定要點」,廣邀民間公(協)會、社會團體代表、學者專家與各機關代表等參與,在政院層級由時任行政院副院長張善政擔任召集人,於同年6月1日召開首次會議,中央各二級機關也分別設定諮詢小組,推動開放資料工作。[14]
實施與挑戰
[編輯]實施開放資料的過程通常是一個迭代過程,主要包括以下幾個環節[15]:
- 資料集選取:初期常從小規模、簡單的資料集開始,以便積累經驗。
- 開放許可協定的應用:在法律上確保資料開放,使資料的使用、再利用和再分發不受不合理限制。
- 資料的技術開放:保證資料能夠整批取得,並以開放、機器可讀的格式發布。常見的技術手段包括線上下載、API、FTP伺服器、BitTorrent等。
- 資料的發現與傳播:利用資料目錄、第三方平台和社群參與,使資料易於被目標使用者找到和利用。
儘管開放資料帶來諸多優勢,但在實際操作過程中也面臨一些挑戰[15]:
- 資料品質與標準化:不同來源的資料格式不一、更新不及時以及缺乏標準化處理,可能影響資料整合和再利用效果。
- 隱私與安全問題:確保開放資料不包含個人敏感資訊和涉及國家安全的內容,是資料開放必須解決的問題。
- 搭便車問題:由於資料收集和維護往往需耗費大量資源,如何平衡公共投入與資料免費開放之間的關係,始終是爭論的焦點。
- 技術與成本:資料的開放不僅涉及技術實現,還需要長期投入維護費用,特別是通過API提供即時更新服務時,成本壓力較大。
與其他開放運動的關係
[編輯]開放資料運動與開放原始碼、開放內容、開放取得等運動具有相似的目標,即促進創用CC和公共利益最大化。開放資料強調的是資料本身的共享與再利用,而開放取得則主要關注學術論文及科研成果的免費訪問。
推廣 Open Data 概念的組織
[編輯]- 漢斯·羅斯林 Gapminder基金會 http://www.gapminder.org http (頁面存檔備份,存於網際網路檔案館)://www.facebook.com/gapminder.org (頁面存檔備份,存於網際網路檔案館) http://www.gapminder.org/downloads (頁面存檔備份,存於網際網路檔案館)
- d8taplex (頁面存檔備份,存於網際網路檔案館)
- Scholarly Publishing and Academic Resources Coalition
- "Free our data" (頁面存檔備份,存於網際網路檔案館) (The Guardian technology section)
- The Open Knowledge Foundation
- Talis
- Linking Open Data on the Semantic Web (頁面存檔備份,存於網際網路檔案館)
- Blue Obelisk
- Infochimps.org (頁面存檔備份,存於網際網路檔案館)
- Freebase
- Factual
- Information Retrieval Facility
- Open Data Network - Germany (頁面存檔備份,存於網際網路檔案館)
- OpenSourceApi
- Socrata (頁面存檔備份,存於網際網路檔案館)
- Regards Citoyens - France (頁面存檔備份,存於網際網路檔案館)
- Open Data Day, December 4th, 2010 - International Hackathon (頁面存檔備份,存於網際網路檔案館)
- International Development Research Centre
參見
[編輯]參考文獻與連結
[編輯]- ^ 1.0 1.1 1.2 什么是开放数据?. Open Data Handbook. [2025-02-05].
- ^ Open Definition 2.1. Open Definition. [2025-02-05].
- ^ Science Commons. [2011-09-10]. (原始內容存檔於2011-01-02).
- ^ Jeffrey Veen. [2011-09-10]. (原始內容存檔於2020-08-06).
- ^ 5.0 5.1 引言. Open Data Handbook. [2025-02-05].
- ^ Committee on Scientific Accomplishments of Earth Observations from Space, National Research Council. Earth Observations from Space: The First 50 Years of Scientific Achievements. The National Academies Press. 2008: 6 [2010-11-24]. ISBN 0309110955. (原始內容存檔於2014-07-30).
- ^ World Data Center System. About the World Data Center System. NOAA, National Geophysical Data Center. 2009-09-18 [2010-11-24]. (原始內容存檔於2011-08-08).
- ^ OECD Declaration on Open Access to publicly-funded data 網際網路檔案館的存檔,存檔日期2010-04-20.
- ^ OECD Principles and Guidelines for Access to Research Data from Public Funding. [2011-09-10]. (原始內容存檔於2015-09-24).
- ^ 为什么要开放数据?. Open Data Handbook. [2025-02-05].
- ^ 美國通過「開放、公開、電子化與必要的政府資料法」(Open, Public, Electronic, and Necessary Government Data Act). 科技法律研究所. 2019 [2022-05-18]. (原始內容存檔於2021-03-01).
- ^ 輔大生命力新聞. 青平台 Open Data 計畫 開放新生活. [2017-08-07]. (原始內容存檔於2019-12-19).
- ^ 陳瑞霖. 回顧台北市政府的開放資料集和開放資料. 科技新報 TechNews. 2016-04-12 [2017-08-07]. (原始內容存檔於2019-10-24).
- ^ 莊明芬、陳怡君. 行政院召開首次院級政府資料開放諮詢小組會議,加速推動資料開放. 國家發展委員會. 2015-06-01 [2018-12-11]. (原始內容存檔於2018-12-11).
- ^ 15.0 15.1 如何将数据开放?. Open Data Handbook. [2025-02-05].
外部連結
[編輯]- 開放資料定義
- 開放資料問答 (頁面存檔備份,存於網際網路檔案館)(英文)
- 開放資料的五星級 (頁面存檔備份,存於網際網路檔案館)(英文)
- OpenPSI the (OpenPSI project (頁面存檔備份,存於網際網路檔案館)) is a community effort to create UK government linked data service that supports research. It is a collaboration between the University of Southampton and the UK government, led by OPSI at the National Archive and is supported by JISC funding.
- Talis Community License
- Open Data Commons Database Licence (an update to the Talis Community License) (頁面存檔備份,存於網際網路檔案館)
- Open Data Commons (頁面存檔備份,存於網際網路檔案館) - legal tools for open data
- CKAN - a registry of open data from the Open Knowledge Foundation
- Tim Berners-Lee 在 2009 TED大會 的關於 "Raw Data Now" 演說影片 (頁面存檔備份,存於網際網路檔案館)
- Six minute Video of Tim Berners-Lee at TED 大會 2010 showing examples of open data (頁面存檔備份,存於網際網路檔案館)
- 臺灣青平台基金會 Open Data 計畫 (頁面存檔備份,存於網際網路檔案館)
- Open Data Handbook