177期
2017 年 1 月 25 日
  北美智權官網 歷期電子報 / 電子報訂閱管理  
 
大數據與著作權之合理使用
葉雲卿╱世新大學智慧財產研究所 副教授

數據革命,使得各行各業透過大數據分析,得以開發新科技、新設備和並提供新服務。根據歐盟的研究,數據(Data)已成為人類社會的重要資產,其重要性已與傳統人力和財政資源不相上下,而依照Wikibon公佈資料,2014年全球大數據商品與服務市場約有183億,且持續在增加中,由於大數據市場活絡,也產生數據相關智慧財產權、資訊安全、個人資料保護等相關法律相關問題,備受國際社會關注。因此,本文將針對大數據分析有關著作權相關問題進行探討。

大數據商品與服務市場成長引發各種相關法律問題

數據蒐集和分析長期被用來評估各項政策與商業計畫的績效。不僅如此,資料蒐集與分析,也被大量運用在公共衛生、人口、醫學、天文等領域之統計與分析,以探討科學與社會現象,並提供問題解決方式。然而,在數據時代,我們強調的大數據(Big Data)分析已不同於過去,由於電腦與網路科技進步,資料處理能力加強,雲端計算與儲存的成本下降,以及設備感測器科技大幅成長,數據產生、蒐集、分析、存儲、與應用已有不同之面貌,產生不同應用方式,對於社會與企業造成不同程度之影響。

依照Wikibon公佈資料,全球大數據市場將以14.4%年複合成長率增長,到2026年預估全球大數據機市場將增長為928億美元[1]。自2014年起至2016年,美國白宮連續三年以大數據主題發表有關對隱私權、平等權、價格差異之研究報告[2]。2015年美國學術研究與圖書館協會,也針對資料探勘與合理使用提出報告[3]。2015年12月歐洲委員會,發佈著作權改革提案,增加資料探勘為合理使用之類型[4]。2016年1月6日,美國聯邦貿易委員會(FTC)發佈「大資料:瞭解議題:包容性或排斥性工具 」的報告,該報告檢討公司使用大資料涉及三個與FTC主管之法規「公平信用報告法(FCRA)」、「 平等機會法」、「聯邦貿易委員會法」[5]。這些政策與法規相關之白皮書與評估報告,反映國際社會對於迎接大數據科技時代來臨,所衍生社會問題與法律適用之關切。

何謂大數據? 3Vs特徵

究竟何謂大數據,其實目前尚未有統一特定的解釋,不同領域專業對於大數據有不同定義[6]。歐洲委員會將「大數據」定義為不同來源快速產生的大量數據[7];此種數據可以由人類所創建或由機器生成,例如蒐集氣候資料,衛星圖像,數位化圖片和影音,購買交易記錄,感測器的GPS信號,其所包含領域相關廣泛,包括從醫療保健,運輸和能源領域等數據之蒐集。

2014年美國白宮有關大數據的報告,則指出雖然目前對於大數據尚無統一定義,但是,大多數定義反映目前的大數據在獲取(capture)、累積(aggregate)、處理(processing)方面,相較過去數據處理在數量、數度、以及多樣性方面,有大幅提高之現象。換言之,大數據相對於過去數據而言,「數據」取得更快速、涵蓋範圍更為廣泛,且提供新類型的觀察和過去未能提供的計算數據。更精確地說,之所以稱之為「大數據」,係因為數據產生來自儀器,感測器,網路交易,電子郵件,影音檔案,網路點擊流量以及所有目前或未來可能提供所有數位化資料。故此,大數據具有大量、多樣性、複雜性、縱向或分佈式等數據特性。2014年美國白宮的研究報告認為與其執著於大數據之定義,應該由大數據與傳統數據的差異去定義大數據,因而提出數量(Volume)、多樣性(Variety)與快速性(Velocity)等3Vs特徵定位大數據。所謂數量,係指大數據處理數據量遠遠大於傳統數據;快速性,是指在生成速度上較傳統數據快速;多樣性則指大數據的類型多樣化,且可由各種來源取得,涵蓋各種數位格式。

數據的法律地位?

討論大數據法律關係的前提,必須先對資訊與數據加以定位。資訊(information)是指通知、被表達(expressed)或傳達(conveyed)或透過一般觀察產生(common observation)的資訊(message)之內容(content)。數據(data)是數位化資訊(digital information)。依照國際標準化組織(the International Organization of Standardization, ISO)第2382號標準[8],將標準定義為格式化的資訊(information)以適於溝通(communication)、詮釋(interpretation)與處理(processing)。所謂資訊處理包括人為或自動化機械處理。資訊和數據,這二個名詞,雖然國際標準部不同的內涵,但是在一般性文章這兩個詞語經常性混用,都是一種表達與溝通內容,不同於不動產與動產有形資產,權利範圍有一定範圍,無法定義其界限。資訊與數據與有形資產財產權內容亦不相容,因此包括所有權權能、占有觀念之適用有其困難。況且,數位資訊產生係因對於IT投資,而不像智慧財產權為人類心智活動,因此與智慧財產權理論亦有些為區別。那麼資訊或數據本身是否是一種財產權?是否或可以用智慧財產權保護?值得檢討。各國對於數據或資訊保護,有不同做法。英國在1979年刑法,立法說明提到資訊並非財產,因此對於秘密資訊「無體財產」提告,因為資訊不是被偷竊的物件[9]。在美國,單純事實或新聞的資訊非智慧財產權保護標的[10],但資訊本身如果符合著作權保護要件、或營業秘密保護要件,則可以著作權或營業秘密保護。國際智慧財產權公約,對於公開資料保護並未有相關規定,雖然1996年3月11日歐洲議會及理事會通過編號96/9/EC「歐聯資料庫法律保護指令」,要求所有歐聯會員國於1998年1月1日前必須於內國法令內落實資料庫指令之條款,然而並非資料本身提供保護,且僅適用於歐盟會員國。

由於既有的有體財產權架構,與現行資訊保護內含並不相容,一般探討數據或資訊保護與使用人之相關之權利與義務,仍然透過智慧財產權架構、授權合約條款與行政法管制3個面向進行檢討。2014年英國有學者將企業資料法律管控架構分為六個層面[11],為分析資料提供法律管理法規,對於數據保護概念形成,具有實義,此六層關係,分別為:第六層:資訊管理與資訊安全管理架構:設定政策、策略,適用的標準包括: PCI DSS, ISO 27001/2, SSAE 16, ISAE 3402。第五層:管制法規,包括個資法的遵循、競爭法對於資料相關規定遵循。第四層:資料有關之合約。第三層:智慧財產權法,包括資料相關之專利、商標、著作權、營業秘密。第二層:資料架構、資料結構、設計架構等。第一層:基礎設施平臺。

雖然與大數據相關的智慧財產權法,包括專利與商標,與處理數據的流程與電腦軟體可以透過專利保護,但是並非保護資料本身。又有關大數據相關的商品與服務可以商標保護,但也非資料本身保護。因此,有關資料本身的保護仍以著作權為主。

著作權與資料保護

以資料為例,傳統著作權所保護語文著作標的,可以涵蓋文字研究、股票市場分析、統計分析等相關的出版物,與電腦軟體與資訊結構有關的技術和使用者文件。與數據有關電腦程式和電腦程式設計亦可以語文作品保護。著作權保護標的,包括軟體、資料庫、語文著作、音樂,電影,視聽和廣播,均可為電子資料格式。但著作權保護資訊的格式(forms)或表達(expression),而不是資訊本身內含。在採著作權自動保護主義的國家,當著作完成時,符合著作原創性的保護要件,由著作人取得著作權。因此,如果進行大數據蒐集與分析的過程或結果,涉及這些數據內容表現則與著作權有關。

另外,資料庫保護與數據、或資料處理軟體之保護,均與資料或數據有關,但保護程度不同。例如:資料處理軟體是著作權保護標的,但著作權保護資料的表現形式而非資料本身。而資料庫在歐盟,倘符合「歐聯資料庫法律保護指令」即受保護。在2012年歐洲法院(ECJ)審理英國高等法院(UK high Court)Football Dataco Ltd v. Brittens Pools Ltd/Yahoo UK Ltd乙案[12],ECJ認為「歐聯資料庫法律保護指令」立法背後的政策目標是為刺激和保護「資料儲存和處理系統」,並非保護資料庫中所收集的材料或建立的材料。 因此,因此在資料庫中的資料,僅有資料的選擇或安排才受到資料保護。

大數據、資料探勘與合理使用

大數據(Big Data)指大量數聚集(data set),資料探勘(data mining)則是在探討用以解析大數據的方法,也就是透過大資料集查尋找與資料相關資訊的活動[13]。因此,資料探勘與大數據雖然指兩件事,但是彼此相關。研究人員透過大規模的計算分析相關研究資料(big data),可以分析研究結果的模式,此稱為資料探勘(Text Data Mining),資料探勘的技術為研究人員節省大量資料時間。所以,大數據分析需要透過資料探勘的分析過程,才能呈現大數據的價值與意義,而加以應用。

目前大數據的分析,經常利用資料探勘進行大量的研究或數據之分析,分析過程中藉由電腦程式爬取(crawl)數百萬個文章或其他數位形式的內容,而由文本或資料的資訊產生衍生性資料。資料探勘使研究人員可由現有知識中發現新的知識,並可以大量分析資訊,識別資料模式和趨勢,並理解個別檔案之間的聯繫。資料探勘可以達到過去單靠人力研究所無法達成分析,並取得過去無法取得的新知識。在多數資料探勘的案例中,如果被分析的著作其使用方式並未受到限制,只要使用的著作在合理範圍,分析結果具有其他的功能,且與原著作物的商業市場並不相同,對於無利用方式限制的文章執行資料探勘是一種合理使用。

資料探勘過程依照資料分析的方式與所呈現的結果,必須視個案利用情況,因此未必構成重製。例如,在資料探勘的過程中,如果所使用的分析資料僅是暫時性重製,且所產生的分析結果亦僅有文獻中的內容的事實而不涉及資料的表現,則資料探勘過程並無著作權問題。因為,有關重製權的侵害,必須產生「超過短暫持續時間的期間」(period of more than a transitory duration.)之副本,如果僅是持續很短時間的臨時副本(temporal copy)[14],不屬於著作權法重製的範圍。

然而,資料探勘過程中,如果利用方式,會保留文章的永久性副本以作為驗證其分析結果之參考資料,此時因為涉及永久性副本之重製,將可能涉及著作權重製權之侵害。許多情況,資料探勘的輸出也可能涉及著作權侵害,例如分析結果呈現原始圖像,此時涉及著作權重製。以上這二種情況,需要透過授權,或主張合理使用,以排除著作權侵害之法律爭議。美國聯邦法院近年來陸續審理有關大數據分析與資料探勘案件,有助於判斷資料探勘是否符合合理使用之要件,例如,2014年White v. West案[15],涉及引用文本資料進行資料分析,法院認為構成合理使用。

在White v. West乙案,原告Edward White and Kenneth Elan二位律師,控告Westlaw 與LexisNexis兩間法律資料庫的出版商,在Pacer資料庫中下載White律師所遞交法院的檔案,並於資料庫中重製其法律著作,使得使用者得以使用。但Westlaw and LexisNexis針對White律師的著作權侵權控告,主張合理使用,被告認為雖藉有重製法律文件,但已加上Metadata(中繼資料)以描述所儲存的法律檔案,[16]這種利用行為同時創造了一個法律研究的互動工具,讓使用者可以透過Metadata資料,可與法律資料庫其他資料互動,搜尋其他相關檔案,這是一種轉換性合理使用。法院適用美國著作權107條合理使用分析,並強調Westlaw與LexisNexis重製White的資料,但其增加其他中繼資料以創建法律研究互動工具,已經構成轉換性使用之合理使用。

結論

對於著作權人提供著作權保護其作品,其目的在促進科學進步、文化創新,以及著作之散佈。但是,創新研究與知識散佈,必須藉由利用既有文學藝術科學作品方能達成,這些利用行為包括對於既有受保護著作之重製、改作、公開播送、散步等各種著作利用。因此,按照社會契約理論,國家提供著作權之合理化原因,係社會藉由給予創作人有限期間獨佔權,以鼓勵他們進行科學和文化創作;同時,以交換所有的受保護之作品,於著作權期間消滅後成為公共財產的一部分;並在有限保護期間內,社會同時會給予其他創作人或使用人在某些特別情況下,得不經許可、且不需支付任何費用就可使用受著作權保護的作品的機會,也就是所謂合理使用權利[17]

社會契約說兼顧創作人權益以及使用人權利,在合理使用的架構下,使用我們一方面照顧著作權的利益,確保著作權人無法壟斷他人針對其作品的轉化性使用,使重要的新發現不因著作權存在而產生障礙並具有使與公眾文化逐漸豐富化功能。

90年代初至今,美國法院審理有關著作權合理使用的案件中可以看出,合理使用判斷,不一定非要以受著作權保護作品進行了修改或重新設計,才會認為該次使用是具有轉化性的。實際上,為了新的目的、透過重新設置作品用途和作品使用情景、而有新的展現給讀者,都可以是被認為符合「轉化性」要求。

在大數據時代,許多資料分析必須透過電腦複製原有文本或資料,呈現上也有可能利用受保護著作。大數據分析所使用軟體、或程式,或必需因為資料格式相容性關係都有可能涉及著作權相關問題。雖然,由過去美國法院判決可知主張轉換性使用主體,如果對受原著作權保護作品被使用的方式和原因,可以解釋得越清晰以及越連貫,該次使用越有可能被認為是轉化性的目的。然而,具體有關大數據資料蒐集、處理、資料探勘等資料分析技術均可能涉及著作權保護議題,仍必須視個案情況,判斷分析、儲存、蒐集方式,是否涉及重製、與存在合理使用的可能性。

 

註釋

 

【本文僅反映專家作者意見,不代表本報立場。】

作者: 葉雲卿
現任: 世新大學 智慧財產權研究所 副教授
台灣科技大學 專利所 兼任助理教授
學歷: 美國舊金山金門大學 法律博士(SJD)
美國華盛頓大學 法律碩士(LLM)
國立政治大學 法律碩士
國立台灣大學環境工程所 工程碩士
經歷: 台灣科技大學專利所 助理教授
美國舊金山 Suzan See Law Office法務
美國矽谷 Vivian Lu Law Office法務
台灣建業律師聯合事務所律師
台灣環宇律師事務所律師
產學合作計畫: 美國訴訟管理產學合作計畫
代表著作: 營業秘密刑事責任
中小企業智慧財產權管理制度建置
專利意見書在訴訟上之運用
證照: 律師、台灣專利代理人、環境工程技師、仲裁人、ISO14000管理師

 

Facebook 在北美智權報粉絲團上追踪我們       

 





感謝您閱讀「北美智權報」,歡迎分享智權報連結。如果您對北美智權電子報內容有任何建議或欲獲得授權,請洽:Editorial@naipo.com
本電子報所登載之文章皆受著作權保護,未經本公司授權, 請勿轉載!
© 北美智權股份有限公司 & 北美聯合專利商標事務所 版權所有     234新北市永和區福和路389號五樓 TEL:+886-2-8923-7350