「個人情報を含まないビッグデータ」×「個人情報を含むビッグデータ」=個人情報ダダ漏れ

大綱の原案では、企業の負担などを考慮して「個人が特定されないようデータを加工した場合は同意を得なくても第三者に提供できる」としています。

ビッグデータ「同意なしで提供も可能に」 NHKニュース

まあ何をもって個人が特定されない加工とするかは難しい問題としても、この「第三者」ってやつ、自分たちのデータとくっつけて活用したいから欲しがっているわけですから、当然ながら自分たちもビッグデータ持っているわけですよ。もしかしたらビッグデータどころかもっとセンシティブな素データかもしれませんけどね。そこに「個人が特定されない」ビッグデータくっつけるわけですから、当然ですけど場合によってはくっつきまくりの個人特定しまくりなわけじゃないですか。

そもそもだけど、例えば行動追跡系の素データであれば、匿名であってもIDがあった時点で個人って実質特定されているわけじゃないですか。習慣的に同じ行動をする特徴が抽出できたら後はそれが誰かを「観察」するだけでいいわけです。ストーカー御用達ですなあ。だから、個人を特定しないような加工というのは素データでは実現しえず、相当な丸め方をしないといけないわけですね。でも例えば「XX駅の年代別利用者」なんて丸め方をしても「XX駅の乗降客は日に3人」みたいな場合は…

この話、仮にやるのであれば「何を」提供して良いのかをきちんと決めるべきだと思いますね。「個人が特定されない加工」なんて決めはほぼ無意味です。