TSUTAYA図書館とリコメンドシステムの問題点は誤解されている

なんどか言及していますが、CCCが図書館業務をアウトソースされること自体は大きな問題がないと思っています。一般的に言って、CCCという企業が悪徳を是とする企業と見做されており、明らかに法的な問題を無視して事を進めるという認識でもない限り、CCCであることによって危惧される問題を考えるのはちょっと先に行きすぎです(少なくとも過去の問題事例や現在の企業体質みたいなものとセットで語れないとアンフェア)。

今回の件は例の市長が暴走していることであえて問題化している部分はあり、CCCなんてどっちかというと被害者じゃないかと思います。担当者は内容をわきまえているように(会見の時は)見えていたし、実際市長の暴走発言について言葉尻を濁していました。

さて、そういう状況はさておき、リコメンドシステムと個人情報保護があまりにセットで語られているので少しちゃんと考えておきたい。

リコメンドシステムは個人情報がなくても構築可能である

ここで個人情報と考えるのは、個人が特定できる状態で、その個人の行動・嗜好・思想についての具体的な内容がわかるものとします。その中には当然図書館の貸出履歴は含まれます。
おおよそ、リコメンドシステムに当たるものは、傾向分析といって差し支えないと思います。いくつかの属性を分類し、その傾向によって、類似性を導き出すもの。
つまり、大雑把な部分では「個人」のデータは必要ありません。年齢層、性別、職業等々、「特定できる個人情報」である、名前や住所がなくても傾向分析はできるわけです。これによってリコメンドシステムは構築可能です。
ただ、これだとできないことがいくつかあります。一番できなさそうなのは、「もうすでに持っている/借りたことのある本を推奨しない」ことですね。
これを実現するためにはどうしても購入・貸出履歴の個人データが必要です。
もっとも、貸出履歴がある程度保持されている状態であれば、図書館のシステム側に傾向分析データを流し込むことで(つまり、図書館が持っている履歴データの外部提供なしに)、そちら側でのリコメンドシステムを作ることが可能です。貸出履歴は外部流出を防ぐために一定期間(書籍返却後まもなく)消去します、という場合はダメですが…

傾向分析とプライバシー

さて、この話は、実は図書館の問題だけではありません。昨今のバズワードである「ビッグデータ」に絡んだことのある人は、ここが人道的・仁義的・マナー的問題として大きなものであることを理解されていると思います。つまり、分析データから「個人」を捨てることができるか、ということが大きな問題です。これは海外でも問題になっており、まさにこの「個人の行動追跡・思想分析」につながらないかどうかが問われています。
このため、ビッグデータを扱うマナーとして、統計的な解析は行うけど、個人の行動分析はしない、というのが暗黙の了解と捉えられています。

しかし、なんでもかんでも参入してくるフェーズになると、こういう暗黙の了解を知らない、あるいは無視する人達がどうしても出てきてしまいます。ウェブサービスの隆盛時に詐欺まがいのサービスがたくさん出てきたようなものです。そして、それらを運営する人たちは、例の市長ばりに物事の優先順位を勘違いしているのですね。

なので、曲がりなりにも大企業であるCCCを非難している人が日々のウェブサイトの利用や、ICカードなどを利用するときに、自分がどのような情報を渡していて、それがどのように使われているかに無頓着なのであれば、それは単にわかりやすい市長を叩いて楽しんでいるだけなんじゃないかと思ったりします。