データの「匿名性」を考える

デジタル化を私たちの暮らしに役立てる上では、爆発的に増加するデジタルデータの活用が鍵となります。同時に、データの多くは人々のプライバシーに関わっています。この両者の関係について、山岡浩巳が解説します。

自動運転のための人工知能(AI)を賢くするには、質の良いデータをたくさん学習させる必要があります。近年では、GPSやドライビングレコーダーの発達が示すように、自動車自体がセンサーとなって飛躍的に多くのデータを取集できるようになっています。「人類が歴史上生み出したデータの9割以上は最近2年間だけで生み出されている」(SINTEF、2013)(注)と言われるように、デジタル媒体の発達がデジタルデータを増やし、これがデジタル技術のさらなる発達に結び付くという、プラスの循環が期待できるわけです。

フィンランドの自動運転車
注:https://www.sintef.no/en/publications/publication/1031676/

「パーソナルデータ」の問題

一方で、画像として収集する現実の路上データには、個人の顔や自動車のナンバープレートが映り込むことは避けられません。そういった画像がAIの学習に一切使えなければ、「渋滞の中でも安全な自動運転車」を作ることも難しくなります。

このような問題は他の分野でも共通しています。例えば、医療の発達や感染症対策には数多くの患者のデータを集める必要があります。しかし、それぞれの人々にとって、健康データは極めてプライバシー性の高いものです。

データの中には、天候・気象などの自然データに代表されるように、プライバシーと関わりのないものももちろんあります。しかし、最近急増しているデータの多くは機器としてはスマートフォンやドライビングレコーダー、活動としてはSNSやeコマースなど、人間の行動の中から生み出されています。このような「パーソナルデータ」を、プライバシーに配慮しながらどう活用できるかは、人権を尊重する民主主義国がデジタル時代にも繁栄を続けられるかを大きく左右します。

Suicaを巡る出来事と「匿名加工情報」

前回の連載でも紹介したように、個人のプライバシーの問題にとりわけ敏感な日本では、データのプライバシーは大きな論点となり続けてきました。その象徴的な出来事が、2013年に生じた、JR東日本による電子マネー「Suica」のデータの日立製作所への提供を巡る出来事でした。

Suicaなどの「交通系電子マネー」は、切符売り場や改札の混雑緩和などに大きな貢献を果たしていますが、何よりもその大きな可能性はデータにあります。例えば、Suicaの定期券を購入する場合、購入者は性別や年齢などのデータを入力します。このことは逆に言えば、JR東日本はSuicaを通じて、「何歳の人がどの駅の改札を何時に通過した」といったデータを収集できるわけです。このようなデータは「駅ナカ」開発などだけではなく、地域活性化への貢献など幅広い活用が可能と考えられます。

2013年7月、JR東日本がこのようなSuicaデータを日立製作所に提供しようとしたところ、多くの利用者からプライバシー保護などについて不安視する声が上がり、結局、提供が断念されるという出来事が起こりました。JR東日本は、提供しようとしたSuicaのデータからあらかじめ氏名や電話番号を削除するなどの措置を講じていましたが、この点に関する説明が十分でなかったこともあり、利用者の不安が払拭されませんでした。

この出来事がきっかけとなり、2015年に「個人情報保護法」の大きな改正(2015年9月公布)が行われました。この改正の中核は、新たに、個人を識別できないように加工された「匿名加工情報」というカテゴリーを設け、その流通や利活用を促進する点にありました。

資料:個人情報保護委員会

個人情報保護委員会は、このような「匿名加工情報」を作る方法についてのガイドラインを示し、明確化を図っています。この中で、匿名加工情報を作るためには、単にパーソナルデータから名前や顔写真、指紋などを消去しただけでは不十分であり、例えば「年齢116歳」といった、個人を類推可能なデータも消さなければならないことなどが記載されています。

その後、個人情報保護法はさらに改正され、現在では企業内部での利用を想定した、パーソナルデータと匿名加工情報との中間にある「仮名加工情報」というカテゴリーも設けられています。

期待されるビッグデータの利活用

このようにデータの匿名性確保を巡る法律が整備されるもとで、さまざまなデータ活用の取り組みも進みつつあります。例えば、前述のJR東日本は、Suicaのデータを活用した「駅カルテ」などのサービスを開始しているほか、数多くの興味深い分析を公表するようになっています。

通勤利用者数と新型コロナウィルス感染者数の推移出所:JR東日本 https://www.jreast.co.jp/press/2021/20211104_ho04.pdf

急速に増加するパーソナルデータをどのように活用できるかは、デジタル時代における人々の幸福や経済の発展を大きく左右します。この中で留意すべきは、人権やプライバシーへの配慮が大きくない国々の方が、パーソナルデータの活用が短期的には急速に進み得ることです。

しかし、人々は中長期的には、生活が一見便利になっても、その背景で自分のプライバシーが危機に晒されているような国には住みたがらないでしょう。

日本を含む先進国としては、個人のプライバシーを守り、データの利用に関する信頼を確保ながら、パーソナルデータの利活用を進めていくことが求められます。

◎本稿は、「ヒューモニー」ウェブサイトに掲載された記事を転載したものです。

記事一覧へ戻る
このエントリーをはてなブックマークに追加