米国国勢調査の差分プライバシー/治験におけるコンフィデンシャル・コンピューティング
LayerX Labs Newsletter for Biz (2021/07/28-08/03) Issue #117
今週の注目トピック
Takahiro Hatajima(@th_sat)より
大詰めを迎えた、米国国勢調査局における差分プライバシーパラメータ調整を受けた区割りデータ発表の概況について紹介します。あわせて、治験におけるコンフィデンシャル・コンピューティングのユースケースを紹介します。
Section1: PickUp
●米国国勢調査局における差分プライバシーパラメータ調整を受けた区割りデータ発表が大詰め
米国では、2020年の国勢調査のデータである選挙区割りのデータの作成が進められている。本稿では、米国国勢調査局の発表(記事1・記事2)をもとに、概況を俯瞰したい。これらのデータには、過去10年間の国の地域的・人口的構成の変化を明らかにすべく、国勢調査で得られた人口数および人口統計学的特徴が含まれている。各州はこれらを用いて、地区再編成(人口の増減に基づいて選挙区の境界線を再編成するプロセス)に使用する(日本における国勢調査結果も、衆議院議員選挙区画定審議会設置法第3条に基づき衆議院小選挙区改定案の作成に用いたり、地方交付税法第12条に基づき地方交付税の交付額算定に用いることが定められている:出所)。
国勢調査局はこのプロセスにおいて、州が再編成に使用できる質の高いデータを提供する役割を担っていると言える。2020年の国勢調査の再編成データを発表するにあたり、非常に小さな地域の人口統計学的特徴が含まれていることから、公表される統計において、報告データを保護する措置を講じることが不可欠である。
最近の研究では、優れた計算技術によって、2010年およびそれ以前の国勢調査で使用されていた方法は、再識別攻撃に対して効果がないことが確認されているとされる。そのため、今回の再編成データは、個人情報を保護しつつ、コミュニティに関する重要な統計情報を共有するため、差分プライバシーを用いて保護される。データの保護と精度のバランスをとるために、個々のデータの回答を不明瞭にするよう、慎重に調整された統計的な「ノイズ」を注入している。どの程度の「ノイズ」を加えるかは慎重に調整される。(動画:国勢調査における差分プライバシー)
これに対して、2021年4月の実証データについて、ステークホルダーからは、部族地域などのデータの精度が低下しているという指摘がなされていた。国勢調査局でこれらフィードバックを検討した結果、地名・市民区分・アメリカインディアンおよびアラスカ先住民の部族地域、および人種・民族統計のための人口カウントの精度を大きく改善し、地区再編成や投票権法の施行に必要なデータの精度を確保するアルゴリズムに修正された。
具体的には、ギリシャ文字の「ε」で表されるのプライバシーバジェットの合計がε=19.61となっており、2021年4月の実証実験データ(ε=12.2)よりもノイズの注入量が少なくなったことで、主にブロックグループレベル以上の総人口と人種・民族別のクエリに割り当てられるように改善された。これについて米国国勢調査局は、「今回の決定は、2020年の国勢調査で得られた詳細で有用な統計データを公表する必要性と、個人のデータのプライバシーを保護するという法的責任との間で、最適なバランスをとったもの」としている。
なお、これらのパラメータを使用すると、データ上では機密性が守られている一方、国勢調査ブロックのような小さな領域では、特定のブロックのデータが正しくないように見えることがある。具体的には、「住宅ユニットがすべて占有されているにも関わらず人口数はゼロ」であったり、「逆に住宅が空室であるが、人口数がゼロよりも多い」場合であったり、「子供が一人暮らしをしている」場合であったり、「人口が45人のブロックでも、住宅が3戸しかない世帯数が異常に多く見える」場合などだ。このように、ブロックレベルのデータにはノイズが含まれるため、データユーザーは国勢調査データを利用する際のアプローチ方法を変えることが必要となる。国勢調査局も、データユーザーに対して「個々のブロックの正確さを求めるのではなく、ブロックをまとめて集計することを強く勧める」としている。
地区再編成の区割りデータは、8月16日までに発表される予定とされており、その動向に注目が集まっている。(文責・畑島)
●治験におけるコンフィデンシャル・コンピューティングのユースケース
コンフィデンシャル・コンピューティングの実用化を推進するスイスのスタートアップであるDecentriqのブログから、治験における3つのユースケースについてご紹介する。
一つ目は治験における対照群(プラセボ投与など)の選択における機密性を担保したRandom Oracleの実現である。
治験では二つのグループ分けがされ、一方のグループには実際に治験の対象となる薬を投与し、もう一方のグループには標準的な治療法またはプラセボを投与するという設定が用いられる。
患者のグループ分けは、有効な試験をデザインするために不可欠であるだけでなく、患者の人生を変えることもある。そのため、治験の主催者は、倫理的な問題から技術的な問題まで多くの課題を抱えている。
グループ分けには「無作為化」がよく用いられる。人間の脳は無作為化を行うのに十分な機能を備えていないため、アルゴリズムがその作業を代行している。
AvatoのConfidential Random Oracleにより、コンフィデンシャル・コンピューティングを活用することで、偏りを排除し、関係者がグループ割り当てを変更する可能性を排除することが可能となる。
以下の図は、治験においてAvatoプラットフォームがConfidential Random Oracleとしてどのように使用されるかを説明している。
治験の主催者がパートナーに治験への参加を呼びかける。
パートナーが治験に参加する患者を募集する。
Avatoが各参加パートナーに暗号化キーを送付する。
各パートナーのインフラ上でデータをローカルに暗号化する。
様々なパートナーが、暗号化されたデータをAvatoプラットフォームに送り返す。生データはローカルシステムに残る。
Avato が Confidential Random Oracleを計算し、各エントリを薬剤群または対照群のいずれかに割り当てる。
各パートナーは、自分の患者が各グループに割り当てられた暗号化された結果を受け取る。
参照:https://blog.Decentriq.com/data-collaboration-made-simple-and-safe-applications-in-the-health-care-sector/
Avatoプラットフォームを利用してConfidential Random Oracleを行うメリット
1つまたは複数のデータセットに対してConfidential Random Oracleの計算が可能
どの段階でも個人データを明らかにする必要がないため、パートナー側での匿名化の必要性が軽減される
柔軟性と拡張性
ブラウザベースのシンプルなインターフェースにより、迅速かつ容易に利用可能
Decentriq社が提供するConfidential Random Oracle機能
二つ目のユースケースは上述のConfidential Random Oracleで重要となるモデル検証におけるコンフィデンシャル・コンピューティングの活用である。
一般に、モデル検証は、あるモデルや計算方法があるデータセットに適用されたことを証明するために使用される。
モデル検証は、モデルの所有者がデータの所有者にモデルの詳細を明かせない、または明かしたくない場合に有効である。
Avatoプラットフォームでは、2つの方法でモデル検証を行うことができる。1つ目は、モデルのアイデンティティを証明すること、2つ目は、モデルの所有権を確認することである。ここでは1つ目の検証に焦点を当てる。
avato を使用する前に、当事者はどのモデルを確認したいかを決定する。
avato は、特定の暗号化キーを両当事者に送信する。
モデルの当事者とデータの当事者は、それぞれの固有の暗号鍵を使って、データとモデルをローカルで暗号化する。
両当事者はそれぞれ、暗号化されたモデルと暗号化されたデータをAvatoプラットフォームに送り返す。
Avato は、データに対するモデルのモデル検証を行う。
Avato はモデル検証の暗号化された結果をデータの当事者に送り返す。
治験のグループ分けを行うモデル検証にavatoのプラットフォームを使用する利点。
無作為のグループ選択であることが証明、検証可能。
Decentriqを含むいかなる当事者に対してもデータやモデルを明らかにすることなく検証が可能。
データ提供者のみがモデルの証明と保証を受け取る。
治験は非常に豊富なデータを提供するため、このデータを統計的に分析することで、新薬の有効性と対照治療との違いが明らかになる。
前述のように、avato プラットフォームでは、ランダムに選別された患者群のそれぞれのデータに対して、検証されたモデルを適用することが可能となる。
この際、インプットデータを完全に秘匿化したまま解析を行うのが三つ目のユースケースである。
Avatoでは以下のような流れで、治験データの統計解析を行う。
治験の終了時点で、主催者はパートナーとDecentriqに通知する。
Avato は、関係者全員に個別の暗号鍵を送信する。
解析担当者を含む各関係者は、提供された鍵を用いて、データとモデルをローカルに暗号化する。
すべての関係者は、暗号化されたデータを avato プラットフォームに送る。生データは各パートナーのローカルに残る。
Avatoプラットフォーム内では、データやモデルをDecentriqを含むいかなる関係者にも開示することなく、統計分析が計算される。
結果は個別に暗号化され、対象となる関係者に送られて検討される。
治験の統計解析にAvatoプラットフォームを使用する利点。
Avatoは、データに対してほぼすべての検定や統計モデルを実行可能。
AvatoはDecentriq を含むいかなる関係者にもデータやモデルを公開しない。
Avato は暗号化を用いて、結果を見る資格のない人から結果を保護する。
Confidential Random Oracle と Model Verification を組み合わせることで、Avatoは治験における機密性を担保する。
治験におけるコンフィデンシャル・コンピューティングの活用については、IntelやFortanixも取り組みを開始しており、プライバシーと透明性を両立した治験の実現が期待される。(文責:野畑)
LayerX Labsでは、次世代プライバシー保護・セキュリティ技術Anonifyの正式提供に向けトライアルパートナーの募集を開始、合わせて公式ウェブサイトを公開しました。
「Anonify」の公式ウェブサイトはこちら
「Anonify for Insurance」ホワイトペーパーはこちら
LayerXではエンタープライズ向けブロックチェーン基盤を基本設計、プライバシーの観点から比較したレポートを執筆し、公開しています。
基本編のダウンロードはこちら
プライバシー編ダウンロードはこちら
Section2: ListUp
1. プライバシー・セキュリティ
●EUがAmazonに過去最大約971億円の罰金、ターゲット広告目的で顧客データを使用
●NTTデータがテレビ視聴者反応予測サービスの商用化検討、脳科学など活用
●個人情報保護法の令和2年改正に関する各ガイドライン(案)のパブコメ結果が公表
●次世代医療データプラットフォーム推進に向けて九州大学と電通が産学連携協定
●令和2年改正個人情報保護法ガイドラインのパブコメ結果を読んでみた-貸出履歴・閲覧履歴・プロファイリング
●令和2年改正個人情報保護法に関するガイドラインのパブコメ結果に続き、令和3年改正に関する政令・規則・ガイドラインのパブコメが開始
2. デジタルガバメント・スマートシティ
●<石川県加賀市は、市長の強力なリーダーシップで「スマートシティ」化をどんどん進めているユニークな都市となりつつある>
3. デジタル化へむけた政策議論
●総務省|マイナンバーカードの機能のスマートフォン搭載等に関する検討会(第7回)
4. 中銀デジタル通貨
●デジタル人民元における商銀のビジネスモデルについての考察コラム
●北京人民政府、グローバルデジタルエコノミーベンチマーク都市にむけた実施計画を発表
●デジタル人民元、北京の地下鉄24路線428駅での支払・残高補充を完全サポート
5. デジタル金融
●東京海上HDとSAPジャパン、中堅・中小製造業のDX支援で協業
●三井住友海上「中古車のユニコーン」に出資した訳〜豊富なデータとデジタル技術を活用できるか
●米チェース銀行のデザインストラテジストに転職します|Masaki.I Flag of United States NYのデザイナー|note
6. デジタル証券
●Figure Technologies、米住宅ローンレンダー大手のHomebridge Financial Servicesを合併
7.今週のLayerX
●三津澤 サルバドール 将司さんと「アセマネ会社で金融サービスを開発するエンジニアは実際何をやっているのか?」について話しませんか?
松本淳さんと「行動指針を感じる瞬間 = eveyday」について話しませんか?
●8月最新の状況です。Sales&マーケが増えつつあります。CSも絶賛大募集中です。もちろんエンジニアも開発力の源泉ですので大募集中です。中長期の接点でもOKです。気軽にご連絡お待ちしています〜
●『LayerX NOW!』 #19では、広報と経理を兼務する経営管理部の木村さんをゲストにお迎えしています!
●「LayerX ワークフロー」徹底解説セミナー|LayerXオンラインセミナー。LayerX ワークフローの製品概要や導入によるメリット、実際の操作画面などを紹介します!
●EnterpriseZineでのコンフィデンシャルコンピューティング連載、第二回が公開されました!Anonifyの実現する「秘匿性」「監査性・透明性」を、“王様と妖精達のものがたり”から紐解いています
●Autifyさん、10Xさん、LayerXでプロダクト開発&品質のイベントやります!3社のCEO&CTOが一気に出るイベントはなかなかレアでは?ぜひぜひご登録ください〜
●福島良典さんと「新卒、第二新卒、インターンの方めちゃくちゃ募集してます」について話しませんか?
●経理・財務業務のデジタル化/リモート化を促進する注目サービスを紹介するオンラインイベント「経理DX DAY」を2021年8月20日(金)に開催します!
●35歳限界説を吹っ飛ばせ。大企業からスタートアップへ転身したLayerX・石黒卓弥、考えを改めた「早くやろうよ!」の一言
●LayerX、興味はあるんだけどハードルが高そう・・・って思っている方、ぜひカジュアルにお話しましょう!松本福太郎さんと「LayerXにエントリーしようか迷っている人、お話しましょう!」について話しませんか?
●宮崎怜さんと「【雑談歓迎】 LayerXの人に聞いてみたいこと」について話しませんか?
製品紹介・デモのご依頼に向けたお問い合わせは、こちらの「お問い合わせフォーム」よりお願いします
Disclaimers
This newsletter is not financial advice. So do your own research and due diligence.