去識別

雖然通常可以從直接拍攝的照片中輕易地識別一個人,但根據有限的任務確定他們的任務數據更難,但有時可能。

去識別是用於防止某人的過程個人身份從被揭示。例如,數據在期間生產人類主題研究可能被識別以保存研究參與者的隱私。生物數據可能會被識別,以遵守hipaa定義和規定患者隱私法的法規。[1]

應用於元數據或有關識別的一般數據,該過程也稱為數據匿名。常見策略包括刪除或掩蓋個人標識符, 如個人名字,壓製或概括準標識符,例如出生日期。使用去識別數據識別個體的反向過程稱為數據重新識別。成功重新識別[2][3][4][5]對DE-IDENIFICY的有效性產生懷疑。對14次不同重新識別攻擊的系統評價發現,“高識別率[…]由小規模研究主導的數據,這些數據未根據現有標準否定識別”。[6]

去識別被用作數據的主要方法之一隱私保護.[7]它通常用於通信領域,多媒體,生物識別技術,大數據, 雲計算,數據挖掘,互聯網,社交網絡和音頻視頻監視。[8]

例子

在設計調查中

進行調查時,例如人口普查,他們收集有關特定人群的信息。為了鼓勵參與並保護調查受訪者的隱私,研究人員試圖以某種方式設計調查,即當人們參加調查時,就無法將任何參與者的個人響應與發布的任何數據匹配。

使用信息之前

當在線購物網站想知道其用戶的偏好和購物習慣時,它決定從其數據庫中檢索客戶的數據並對其進行分析。個人數據信息包括個人標識符客戶創建帳戶時直接收集。該網站需要在分析數據記錄之前通過去識別技術來預先處理數據,以避免侵犯客戶的隱私。

匿名化

匿名化指在研究中不可逆轉地將數據集從數據貢獻者的身份中切斷,以防止將來的重新識別,即使是在任何情況下研究組織者也是如此。[9][10]去識別還可以包括保留識別信息,這些信息只能在某些情況下被信任的一方重新連接。[9][10][11]技術界有一場爭論,就可以被認為是否可以被視為可以被視為識別的數據是否可以重新鏈接。

技術

識別的常見策略是掩蓋個人標識符並概括準標識符.假名是用於掩蓋的主要技術個人標識符從數據記錄和K-匿名化通常用於概括準標識符.

假名

假名是通過用臨時ID替換真實名稱來執行的。它刪除或掩蓋個人標識符,使個人身份不明。這種方法使得即使記錄將更新,也可以隨著時間的推移跟踪個人記錄。但是,如果數據記錄中的某些特定屬性組合間接地識別個人,則無法阻止個人被識別。[12]

K匿名化

K匿名化定義間接指向個人身份的屬性準標識符(QIS)並通過製作至少來處理數據k個體具有相同的氣值組合。[12]Qi值按照特定標準處理。例如,K匿名化以新的範圍值替換了記錄中的一些原始數據,並使一些值保持不變。 QI值的新組合可阻止個人被識別,並且避免破壞數據記錄。

申請

去識別的研究主要是為了保護健康信息.[13]一些庫採用了醫療保健行業保留讀者的隱私。[13]

大數據,去識別被個人和組織廣泛採用。[8]隨著社交媒體,電子商務和大數據的發展,有時需要取消識別,並且經常用於數據隱私當用戶的個人數據由公司或第三方組織收集時,他們將以自己的個人用途進行分析。

聰明的城市,可能需要去識別來保護居民,工人和遊客的隱私。如果沒有嚴格的法規,則可能很難去識別,因為傳感器仍然可以未經同意而收集信息。[14]

極限

每當一個人參加遺傳學研究,生物標本的捐贈通常會導致創建大量個性化數據。這樣的數據很難識別。[15]

遺傳數據的匿名化特別困難,因為生物測量中有大量的基因型信息,[15]標本通常必須與病史的聯繫,[16]以及現代生物信息學工具的出現數據挖掘.[16]有證明是,基因型數據集的匯總集合中的個體數據可以與標本供體的身份相關聯。[17]

一些研究人員認為,從來沒有合理地向遺傳學研究的參與者保留他們可以保留匿名性的參與者,但是,應該教導這樣的參與者在去識別過程中使用編碼標識符的限制。[10]

美國的識別法

2014年5月,美國科學技術顧問委員會發現識別“有點有用,可以作為額外的保障”,但不是“政策的有用基礎”,因為“它不適合近期未來的重新識別方法”。[18]

hipaa隱私規則提供了不需要患者同意而負責任地使用和披露健康數據的機制。這些機制以兩種HIPAA去識別標準為中心 - 避風港和專家確定方法。安全港依賴於刪除特定的患者標識符(例如名稱,電話號碼,電子郵件地址等),而專家確定方法則需要知識和經驗,並具有公認的統計和科學原則和方法,以使信息變得不可識別。[19]

避風港

避風港方法使用列表方法去識別,並有兩個要求:

  1. 從數據中刪除或概括了18個元素。
  2. 涵蓋的實體或業務夥伴沒有實際的知識,即可以單獨使用數據中的剩餘信息,也可以與其他信息結合使用以識別個人。安全港是一種高度規定的去識別方法。在這種方法下,所有日期必須概括為年,而郵政編碼降低到三位數。無論上下文如何,數據都使用相同的方法。即使要與希望分析急性呼吸系統季節性變化數據的可信賴的研究人員共享信息,因此無法提供該信息,也無法提供該信息;僅保留入學年。

專家決心

專家確定採用基於風險的方法來識別,該方法採用了研究當前標準和研究的最佳實踐來確定可能性可以從受保護的人身上識別一個人健康信息。這種方法要求一個適當的人知識具有公認的統計和科學原理和方法的經驗和經驗使信息無法單獨識別。這個需要:

  1. 預期的接收者可以單獨使用信息,或與其他合理可用的信息結合使用這些信息很小,以識別信息的個人;
  2. 記錄證明這種確定合理性的分析的方法和結果。

對死者的研究

關於研究的關鍵定律電子健康記錄數據是hipaa隱私規則。該法律允許使用已故受試者的電子健康記錄進行研究(HIPAA隱私規則(第164.512(i)(1)(iii)節))。[20]

也可以看看

參考

  1. ^權利(OCR),民事辦公室(2012-09-07)。“去識別PHI的方法”.hhs.gov。檢索2020-11-08.
  2. ^Sweeney,L。(2000)。 “簡單的人口統計經常以獨特的身份識別人”。數據隱私工作文件.3.
  3. ^De Montjoye,Y.-A。 (2013)。“人群中的獨特之處:人類流動的隱私範圍”.科學報告.3:1376。Bibcode2013NATSR ... 3E1376D.doi10.1038/srep01376.PMC3607247.PMID23524645.
  4. ^De Montjoye,Y.-A。; Radaelli,L。; Singh,V。K。; Pentland,A。S.(2015年1月29日)。“在購物中心的獨特:信用卡元數據的重新確定性”.科學.347(6221):536–539。Bibcode2015Sci ... 347..536d.doi10.1126/Science.1256297.PMID25635097.
  5. ^Narayanan,A。(2006)。 “如何打破Netflix獎數據集的匿名性”。arxivCS/0610105.
  6. ^El Emam,Khaled(2011)。“對健康數據的重新識別攻擊的系統審查”.PLOS ONE.10(4):E28071。Bibcode2011 Ploso ... 628071E.doi10.1371/journal.pone.0028071.PMC3229505.PMID22164229.
  7. ^Simson。,Garfinkel。識別個人信息:過渡使用加密算法和關鍵長度的建議.OCLC933741839.
  8. ^一個bRibaric,Slobodan;阿里亞尼亞(Ariyaeeinia),阿拉丁(Aladdin);尼古拉(2016年9月)。“多媒體內容中的隱私保護識別:調查”.信號處理:圖像通信.47:131–151。doi10.1016/j.image.2016.05.020.
  9. ^一個bGodard,B。A。; Schmidtke,J.R。; Cassiman,J.J。; Aymé,S。G. N.(2003)。“生物醫學研究的數據存儲和DNA銀行業務:知情同意,機密性,質量問題,所有權,福利回報。專業視角”.歐洲人類遺傳學雜誌.11:S88–122。doi10.1038/sj.ejhg.5201114.PMID14718939.
  10. ^一個bc富勒頓,S。M。;安德森(N. R.) Guzauskas,G。; Freeman,D。; Fryer-Edwards,K。(2010)。“應對下一代生物措施研究的治理挑戰”.科學翻譯醫學.2(15):15cm3。doi10.1126/scitranslmed.3000361.PMC3038212.PMID20371468.
  11. ^McMurry,AJ;加利福尼亞州吉爾伯特; Reis,由Chueh,HC; Kohane,IS; Mandl,KD(2007)。“公共衛生,研究和臨床護理的自我縮放,分佈式信息體系結構”.J Am Med Infors Assoc.14(4):527–33。doi10.1197/jamia.m2371.PMC2244902.PMID17460129.
  12. ^一個bIto,Koichi; Kogure,Jun; Shimoyama,Takeshi; Tsuda,Hiroshi(2016)。“識別和加密技術以保護個人信息”(PDF).富士通科學技術雜誌.52(3):28–36。
  13. ^一個b尼科爾森(Nicholson) Smith,C。A.(2006)。“使用醫療保健的教訓來保護圖書館用戶的隱私:基於HIPAA的圖書館數據的指南”(PDF).美國信息科學與技術學會論文集.42:n/a。doi10.1002/Meet.1450420106.
  14. ^庫普,亞歷克斯。其前顧問說:“人行道實驗室決定將關於隱私的艱難決定違反第三方是錯誤的。”.它是加拿大世界。檢索6月27日2019.
  15. ^一個bMcGuire,A。L。; Gibbs,R。A.(2006)。“遺傳學:不再識別”.科學.312(5772):370–371。doi10.1126/Science.11​​25339.PMID16627725.
  16. ^一個bThorisson,G。A。; Muilu,J。; Brookes,A。J.(2009)。“基因型 - 光學數據庫:後基因組時代的挑戰和解決方案”.自然評論遺傳學.10(1):9–18。doi10.1038/nrg2483.HDL2381/4584.PMID19065136.S2CID5964522.
  17. ^荷馬,N。 Szelinger,s。;雷德曼(M。) Duggan,d。; Tembe,W。; Muehling,J。; Pearson,J.V。; Stephan,D。A。; Nelson,S.F。; Craig,D。W.(2008)。 Visscher,Peter M.(編輯)。“解決使用高密度SNP基因分型微陣列為高度複雜混合物貢獻痕量DNA的個體”.PLOS遺傳學.4(8):E1000167。doi10.1371/journal.pgen.1000167.PMC2516199.PMID18769715.
  18. ^pcast。“向總統報告 - 大數據和隱私:技術觀點”(PDF).科學技術政策辦公室。檢索3月28日2016- 通過國家檔案館.
  19. ^“ DE-INDICE 201”.隱私分析。 2015。
  20. ^45 CFR164.512)

外部鏈接