時間:2018-04-16 10:05:03
來源:光明網-時評頻道 作者:張田勘
當地時間4月10日、11日臉書(Facebook)首席執行官扎克伯格分別在美國參議院司法和商務委員會、美國眾議院能源和商務委員會的兩場聽證會中,圍繞用戶數據隱私等問題接受了議員們的質詢。
議員們在質詢中使用得最多的詞匯也是最擔心的問題就是隱私(該詞共出現了84次),也即用戶的個人數據是否被泄漏。扎克伯格除了表示其公司在阻止網絡信息被濫用方面做得不夠好,“這是我的錯,我很抱歉”外,從頭到尾堅持臉書并沒有銷售用戶數據,而是廣告會針對某些具體類別的用戶進行投放。
事實上,要弄清臉書上的哪些用戶信息或數據被泄漏,以及如何處置這類數據泄漏問題,扎克伯格和議員、公眾,對臉書事件的看法并不一致,前者不認為是泄密,至多是被濫用;后者則認為個人數據被不當分享就是泄密。
如果按規范的大數據分類、收集和利用來看,社交網站或軟件用戶的信息(數據)主要有兩類:一是用戶選擇向大家自愿分享的內容,二是讓廣告更具相關性的數據。在臉書上,前者指的是用戶自愿發布到臉書上公開分享的個人信息,包括姓名、個人簡介等;后者則指的是臉書收集的個人信息,包括個人喜好等,從而對用戶投放相關性廣告。
臉書上的第一類信息,其實不算隱私,因為在頁面上已經公布,但即便如此,個人信息被第三方采用仍需獲得用戶的知情和同意。第二類信息,即臉書或其他公司收集的個人用戶數據,無論是商業公司還是政府,對個人數據的收集和使用首先要進行數據匿名化。
歐盟數據保護條例(GDPR)對于匿名化的定義是:匿名化是指將個人數據移除可識別個人信息的部分,并且通過這一方法,數據主體不會再被識別。匿名化數據不屬于個人數據,因此無須適用條例的相關要求,機構可以自由地處理匿名化數據。美國的《健康保險可轉移及責任法案》(HIPAA)是以去身份化來定義匿名化,“通過處理使得數據不能識別特定個人,或者沒有合理的基礎能夠認為該數據可以被用來識別特定個人。”
因此,數據匿名化至少要滿足兩個標準,一是僅從該數據本身無法識別特定個人,二是即使結合其他數據也無法識別特定個人。
如果臉書等公司嚴格按這樣的法律要求來做,8700萬名臉書用戶的個人信息是由用戶自己提供的,而不是由臉書收集的,人們并不會通過匿名化的數據知道誰是誰,做了什么、喜歡和討厭什么。匿名后的用戶個人數據,也同樣可以用來進行分析,為決策作依據。
所謂依據,首先就是無數個人數據匯集成的大數據(匿名數據)只是提供了某種現象,并呈現為事物A與B的某種關聯性。例如,臉書用戶中在一段時間很多人買過香蕉,而且買的是產自馬來西亞的香蕉,就能提示,在某段時間美國人喜歡吃馬來西亞產的香蕉,這是一種相關性。
其次,根據大數據的分析只能是預測而非得出肯定結論,即美國人在某一段時間愛買香蕉的行為,只能預測在來年相同的時間段內可能香蕉消費在美國有一定市場,但不能得出美國人會大量消費香蕉的結論。
順理成章地,大數據信息和分析只能對決策起輔助作用,或者只是決策的一個變量或要素。還從香蕉的例子來講,大數據的信息和分析,可以成為美國進口商是否在來年進口馬來西亞香蕉或者馬來西亞蕉農是否需要大量種植香蕉提供依據。
擔心臉書用戶個人匿名信息泄露影響了美國大選,也至多是從大數據的相關性、預測和輔助決策上幫助了競選團隊。但是,這種信息的收集和利用,所有網絡公司都可以收集到。任何具有信息技術背景的個人、公司、機構和政府,都可以通過不同的社交媒體、網站、論壇、網絡實時通訊工具、網上交易、電子郵件等收集到大量的文字、圖片、音頻、視頻、等數據,并且是以“4V+O”為特征的大數據或個人信息,即數據容量大(volume)、數據的快速獲得性(velocity)、數據的多樣化(variety)、數據的準確性(veracity)和數據的實時性(online),然后對這些數據進行分析、算法學習和獲得相應的分析結果等。
因此,只要臉書是按美國法律對個人數據的收集進行了規范,其泄密也不過是間接泄密,是經過處理后的匿名信息的泄漏,能接觸到這些信息的人是無法解讀出更多數據隱含信息的。
當然,這并不意味著臉書沒有責任。臉書必須通過這次事件進一步規范個人信息的收集和利用,例如知情同意權等。
就臉書而言,已經提供了一些改進措施,讓用戶能方便地更改隱私設定,阻止自己的信息被濫用;對立法和社會而言,美國國會可能會推動新的立法,嚴格監管互聯網和信息技術公司,并限制政治廣告的準入和投放等。通過這些方法,既能保證個人信息受到保護,也讓無數個人信息匯集成的大數據得到合理和有效使用。