編輯過的文件並不像您​​想像的那麼安全


“即使你進行了編輯,假設是正確的,即使你刪除了文本,仍有很多潛在信息依賴於被編輯的內容,甚至可能洩露信息,”Levchenko 說。 “如果你在 PDF 中編輯一個名字,如果攻擊者有任何上下文——他們知道這是一個美國人——他們將很有可能恢復該名字或將其縮小到一個非常小的候選人名單。 ”

Edact-Ray 專注於大小 字形 (廣義上,字符或字母)及其定位。 “很多人都清楚字母‘L’比字母‘M’更瘦,如果你只編輯字母‘L’,那麼你可能會說它與用只是字母 ‘M’,”Bland 說。 該工具基本上能夠自動將編輯的大小和字母的位置與預定義的單詞“詞典”進行比較,以估計已被替換的內容。

該軟件是通過推斷原始文檔是如何生成的——例如,在 Microsoft Word 中——然後對文檔的細節進行逆向工程來構建。 “這告訴我們文本是如何佈局的,”列夫琴科說。 “一旦我們知道了這一點,我們就有了一個模型來說明該工具如何佈置文本以及它如何以及在整個文檔的其餘部分中存儲了哪些信息。” 從這裡開始,最終有可能模擬原始文本可能是什麼,並產生一系列潛在的或可能的匹配。 在測試期間,該團隊每秒能夠消除 80,000 次猜測。

“例如,我們發現,使用 10 點 Calibri 從 Microsoft Word 集生成的 PDF 中編輯姓氏會留下足夠的剩餘信息,以在所有案例中的 14% 中唯一地識別姓名,”該團隊的研究論文總結道,並補充說這很可能是“易受攻擊的編輯程度的下限”。

研究編輯技術的利哈伊大學計算機科學教授丹尼爾·洛普雷斯蒂 (Daniel Lopresti) 表示,這項研究令人印象深刻。 它“對編輯工具及其破壞方式進行了全面研究,包括利用文檔排版中幾乎不可見的方面,”洛普雷斯蒂說,他沒有參與這項研究。 “它描繪的畫面很可怕; 編輯往往做得很糟糕。”

絕大多數受到研究中強調的現實世界編輯失敗影響的組織——包括美國司法部、美國法院系統、監察長辦公室和 Adob​​e——沒有回應《連線》雜誌的評論請求。 布蘭德和研究論文說,許多組織都參與了該團隊的研究。

微軟沒有解決從轉換為 PDF 的 Word 文檔中洩露的數據。 “客戶可以將文檔另存為 PDF,但審查或隱藏信息是編輯工具的作用,”微軟高級主管傑夫瓊斯說。 Jones 補充說,人們應該在將數據和文件轉換為將要共享的格式之前“檢查”數據和文件。

發佈留言