LayerX Labs Newsletter 【特別号】LayerX、プライバシー保護技術に関する共同研究をリクルートと実施
〜数学的に証明可能なプライバシー保証を提供する「差分プライバシー」を応用した研究成果を記事として公開〜
LayerXではPrivacy Tech事業として、セキュリティ・プライバシー保護技術の研究開発を進めており、「Anonify」というブランド名のもとにモジュール/ソリューション化を目指している。
昨今、個人のプライバシーへの関心の高まりや、GDPR違反による巨額の制裁金が課されることなどの背景から、データ分析に利用されるデータにも十分なプライバシー保護が求められるようになってきている。日本においても、令和2年 改正個人情報保護法が2022年4月1日に全面施行されます。具体的に改正法では、データ利活用に関する施策の在り方として仮名加工情報が創設されるなど※1、イノベーション促進のためデータを利活用することと個人のプライバシー配慮の両立が求められている。
しかしながら、「具体的にどのような処置を行えば、プライバシーを保護したことになると言えるのかよく分からない」という声も上がっている。
そのため、LayerXとリクルートは、プライバシーとして守るべき「要件」の学術的なデファクトスタンダードになっている「差分プライバシー」※2を共同研究対象として取り上げ、ユースケースに基づく実装を通じて、実際の分析を想定した適用例として整理した。
<共同研究成果の概要>
テキスト分析というユースケースを例に、差分プライバシーを適用する実装を行った。対象データとしては、株式会社リクルートが運営する旅行サイト『じゃらんnet』のクチコミデータを用いて、以下に示す2つのケースを想定したテキスト分析を行った。
まず分析ケース①として、記述統計への差分プライバシー適用を考えた。これは、positive・negative・neutralなクチコミそれぞれに対して、登場頻度が上位の単語の出現数を算出し、各単語の出現頻度に対して、差分プライバシー保護を実現するものだ。
そして分析ケース②では、機械学習アルゴリズムへの差分プライバシー適用を考えた。具体的には、positiveなクチコミを投稿したユーザは「リピートする」、negative・neutralなクチコミを投稿したユーザは「リピートしない」と仮定した上で、クチコミから「リピートする」「リピートしない」を予測する分類問題を解くものである。
<共同研究成果の公開記事>
共同研究成果の一端を整理した記事を、リクルート アドバンスドテクノロジーラボのブログでご覧いただける。
https://atl.recruit.co.jp/blog/5337/
記事においては、差分プライバシーについて、実際に利用されている事例を紹介した上で、その概要と定義についても簡単に述べている。上記のテキスト分析のケース(①記述統計や、②機械学習アルゴリズム)それぞれに対して、差分プライバシー技術を適用することによってプライバシー保護を図るイメージについて、実際のコードベースで紹介している。
実際にテキストの分析業務を行われている方にも馴染み深いケースに対して差分プライバシーを適用する例を紹介しており、少しでも差分プライバシーを理解する助けになることを期待したい。
※1 仮名加工情報の創設について
令和2年 改正個人情報保護法において、「個人情報」と「匿名加工情報」の中間的に位置付けられる情報として、氏名等を削除することによって、他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工した個人に関する情報である「仮名加工情報」が設けられた。
仮名加工情報を利用する上では、過去に個人情報を取得した際の利用目的に縛られずに別目的でも利用できるなど規制が一部緩和される一方で、第三者提供は禁止され、事業者内部での利用が想定されている点がポイントとなっている。
※2 差分プライバシーについて
機密データに基づく統計データに、プライバシーを保護するノイズを注入することによって、統計的有用性を維持したまま、統計データにおける数学的に証明可能なプライバシー保証を提供するものである。
2006年に、Microsoft ResearchのDworkらによって、機密データに基づく統計データの公表に対して数学的に証明可能なプライバシー保証を提供するアプローチとして考案された。2017年には、コンピュータサイエンス分野の最高峰である「ゲーデル賞」を受賞している。
アメリカ合衆国国勢調査局は、2020年国勢調査において差分プライバシーを活用することによって、国民の匿名性を担保したまま、所得や学歴などの国勢調査結果を全世界に公表している。
■ 「Anonify」について
データ利活用におけるプライバシー保護を実現するために、プライバシー保護技術や秘匿化技術、データの信頼性に関する研究・事業化を目指す、LayerX 3つ目の事業です。「Anonify」というブランド名のもとモジュール/ソリューション化を目指しています。
公式サイト:https://www.anonify.layerx.co.jp/