データ最小化
2013年12月12日
「Datensparsamkeit」は、英語に適切に翻訳するのが難しいドイツ語です。これは、私たちがデータをどのように取得し保存するかについての考え方であり、本当に必要なデータのみを扱うべきだという考えです。

最近では、ビッグデータという概念をめぐる誇大宣伝が盛んであり、それとともに、入手できるすべてのデータを取得して保存すべきだという考えがあります。ユーザーがアドレス帳に保存している連絡先をすぐに使用する予定がなくても、後で役に立つかもしれないのでとにかく要求します。ウェブサイトのすべてのクリックを記録し、後で検索できるように保存します。スマートフォンアプリを設定して位置情報を要求し、後でそのデータを使用する方法を思いついた場合に備えます。結局のところ、ストレージは安価なので、なぜそうしないのでしょうか?
「すべてをキャプチャする」というアプローチの問題点は、プライバシーに関する重大な問題を提起することです。収集したデータを悪用しないと自分たちを信頼していたとしても、各データストアは犯罪者や政府の監視機関の標的になります。この問題は、政府が市民を支配するために広範囲な監視を行ってきた歴史を持つドイツで特に深刻です。その結果、ドイツには強力なデータプライバシー法があります。
Datensparsamkeit [1] は、これらのプライバシー法から生まれた概念であり、「すべてをキャプチャする」という哲学とは対照的なものです。翻訳は簡単ではありません(そのためドイツ語をそのまま使用しました)が、大まかに「データ緊縮」「データ最小化」「データ節約」などと訳すことができます [2]。それは、データを取得または保存する理由を常に自問自答し、目的に必要な最小限のデータのみを処理することを意味します。
その例として、ウェブサイトのユーザーを追跡して、ユニーク訪問者数を把握することが挙げられます。同じ人が数時間以内に複数のページにアクセスした場合、それを1回の訪問としてカウントしたいと考えます。月に数回訪問した場合でも、それらを1人の訪問者としてのみカウントしたいと考えます。これを実現する方法の1つは、IPアドレスをログに記録することであり、各IPアドレスを1人の人物としてカウントします [3]。しかし、IPアドレスは非常に多くのことを明らかにすることができ、訪問者をカウントする以上の目的に使用される可能性があります。Datensparsamkeitは、IPアドレスを直接保存するのではなく、ハッシュ化してハッシュのみを保存することを提案します。
IPアドレスに関する同様の例は、IPアドレスを使用して地域や国などの人口統計情報を推測することです。この情報のほとんどを取得し、IPアドレスの最初の3オクテットのみを記録することで、データ最小化を実践できます。
Datensparsamkeitは、悪人がデータを盗むことだけを問題にしているのではなく、主要な企業自身との関係についても問題にしています。現状のデフォルトの考え方では、生成したデータはキャプチャした人が自由に利用できるだけでなく、さらにその貴重な商業資産になると考えられています。私を含めたプライバシー擁護派は、この前提を変更する必要があると考えています。企業は必要なものだけをキャプチャする必要があり、必要性を示す責任は企業にあります。さらに、キャプチャするもの、保存するもの、データを共有する相手について完全に透明でなければなりません。データセキュリティ侵害は、現在デフォルトとなっている隠蔽ではなく、直ちに公表する必要があります。
私たち自身のデータの個人的な管理についての私の見解に同意しないとしても、セキュリティ侵害のリスクは、データ最小化が賢明な行動であることを意味します。不要なデータを保持しており、誰かがそれを盗んで損害を与えた場合、その損害に対して責任を負うべきではないでしょうか?法的責任がないとしても、広報活動は深刻な結果を招くでしょう。したがって、データ最小化を実践しない人にはリスクが伴います。
謝辞
Erik Dörnenburg が Datensparsamkeit を教えてくれました。「…すべてのもの」というミームは、ずっと前から(少なくとも10年間)存在しているように思われるため、2010年に始まったことを Korny Sietsma から教えてもらえて嬉しかったです。注
1: 発音のヘルプはこちらです
2: 私が最初にこの記事を書いたときから、特に欧州連合のGPDR規則の導入に伴い、この原則はより多くの注目を集めています。この文脈では、「データ最小化」として言及されることがますます多くなっています。このページは、当面は元の名前のままにしておきます。
3: ネットワークアドレス変換では、状況がこれよりも複雑になっていることは認識していますが、単純な例を示したかったのです。