つくば市で始まった「インターネット投票」、プライバシー保護技術「合成データ」の手法とメリット
LayerX Labs Newsletter for Biz (2021/09/15-09/21) Issue #123
今週の注目トピック
Takahiro Hatajima(@th_sat)より
つくば市で始まった「インターネット投票」による科学技術振興にむけた市民意見募集について紹介しています。あわせて、プライバシー保護技術「合成データ」の手法とメリットを紹介します。
Section1: PickUp
●つくば市、科学技術振興にむけた市民意見を「インターネット投票」で募集中
つくば市で、「つくば市科学技術・イノベーション振興指針」の策定にあたり、科学技術に対する市民の関心や期待、市が実施する事業や情報発信の方法に対して市民が感じていることなどを調査するウェブアンケートを実施されている。(つくば市のアンケートページ)
この取り組みは、インターネット投票システムへの応用を視野に入れた市民意見収集システムを用いたものであり、VOTE FOR社とLayerXがシステムを構築した上で、つくば市と共同研究を行うものだ。VOTE FOR社は、2018年から2020年にかけて、つくば市にインターネット投票システムを提供し、実証を重ねてきており、この取り組みもその一環となる。
本調査は、9月21日から10月11日まで行われており、つくば市民および市内在学・在勤者はPCやスマホなどから回答が可能となっている(アンケートフォームはこちら)。
出典:https://www.city.tsukuba.lg.jp/_res/projects/default_project/_page_/001/015/751/flyer.pdf
この取り組みの特徴の1つが、公職選挙への応用をみすえた「投票の秘密」と回答データの「非改ざん性」を実証することを目的として、LayerXから「Anonify(データ利活用とプライバシー保護の両立をはかる秘匿化ソリューション)」を提供していることだ。
具体的には、「Anonify」を活用して、集計機能を実装している。これにより、回答データを暗号化したまま正確に集計することができる。本取り組みは、Anonifyとして、自治体職員に閉じた実験に留まらない、一般市民の皆様に使って頂くシステムへの適用第1号となる。
出典:https://prtimes.jp/main/html/rd/p/000000083.000036528.html
ここで、Anonifyの概要についてみておきたい。
Anonifyでは、CPUのセキュリティ機能であるTrusted Execution Environment(TEE)を用いて、データを秘匿化したまま処理します。データを初めから平文で持たないため、機密性の高い情報の漏洩リスクや、プライバシーに関する懸念を最小化することが可能だ。
具体的には、Intel SGX (Software Guard Extensions) というTEEを用いている。Intel SGXでは、コンピュータ内部の隔離保護された領域(Enclave)でデータを秘匿化したまま処理することができる。
Enclave内のデータ(例:回答データ)は、CPUに搭載されたMemory Encryption Engineという機構により、メモリ上で暗号化されている。また、クライアントがAnonifyにデータを送るときには、Intel SGXではなくAnonify独自の機能として、公開鍵暗号を使って暗号化する。
そして、Enclave内でプログラムやデータを復号した上で、アプリケーションのビジネスロジック(例:回答の集計処理)が実行され、結果だけが出力される。このとき、EnclaveにはOSすらアクセスできないため、システム管理者も元データにアクセスすることは不可能であり、「データの秘匿性」向上をはかる仕組みになっている。
出典:https://prtimes.jp/main/html/rd/p/000000083.000036528.html
なお、つくば市では、茨城県立並木中等教育学校が、生徒会選挙でのインターネット投票を今年7月に行ったことが話題になったばかりだ。先日も日テレで取り組みの様子が紹介されている。並木中等教育学校の生徒会選挙では、スマホと投票アプリを用いて、生徒が校内の好きな場所から投票が行われた。対象となる4年次(一般の高校一年生にあたる)160名が参加し、ログインできないなどのトラブルが発生した生徒を除く130名がインターネット投票を行った。他の学年は従来通り紙での投票を行っている。投票終了後、開票作業が始まると、紙投票の開票作業が続くのを横目に、ネット投票の開票結果は瞬時に完了していたのが印象的だった。
インターネット投票の実現にむけては、前回号で紹介したように、投票の秘匿性や、集計の透明性などといった、ユーザーの感じる不安や心配をひとつずつ解消していくことが欠かせない。つくば市の取り組みが、この実現にむけて大きな一歩となることを期待したい。(文責・畑島)
●プライバシー保護技術「合成データ」の手法とメリット
昨今、プライバシー保護とデータ利活用の両立を実現するプライバシー保護技術(PETs)として、「合成データ」と呼ばれる手法が注目を浴びている。
本稿では合成データスタートアップであるReplica AnalyticsCEOのハレッド・エル・エマム博士が、プライバシー、サイバーセキュリティのリーダー向けのニュース、洞察を提供するCPO Magazine(Chief Privacy Officer Magazine)に寄稿した、合成データに関する記事を紹介する。
ハレッド・エル・エマム博士は、東部オンタリオ小児病院(CHEO)研究所のシニアサイエンティストであり、電子健康情報研究所の所長として、データ合成、健康情報の識別可能性とその測定方法に関する応用研究を行っているほか、オタワ大学医学部の教授も務めている。
また、データ管理やデータ分析に関わる複数の企業を設立または共同設立し、現在はReplica Analytics社を率いて、ヘルスケア・ライフサイエンス分野の合成データ生成技術の開発に取り組んでいる。
合成データは、個人を特定できないデータセットを生成することで、個人情報とはみなされなず、法的に追加の同意を必要とせずに利用・開示することができるため、実用的なプライバシー強化技術(PET)として急速に普及している。
合成データは、元のデータセットの統計的特性やパターンを忠実に再現しており、個人への1対1のマッピングがされないため、個人を特定できないデータとみなされ、管理上および技術上の制約が少なく、自由に共有することができる。
これにより匿名化/プライバシーの専門家にしかできなかった従来の匿名化手法に比べ、簡単に導入が可能になる。
合成データは何年も前から存在していたが、機械学習やディープラーニングの進歩により、生成されるデータセットの質が向上したことで、本格的に盛り上がりを見せている。加えて、データの需要も増え続けている。
現在、合成データは医療や金融の分野で多く利用されているが、通信、小売、自動車などの分野でも利用が推進されている。
主なユースケースの一つは、AIや機械学習プロジェクトのためのデータセットの提供である。
例えば、Deloitte社が最近行った調査では、AIプロジェクトを成功させるための課題として、データアクセスとプライバシーの問題が上位にランクインしている。
AIへの取り組みにおける上位の課題。1~3のランクで、1が最大の課題
出典:State of AI in the Enterprise, 2nd Edition
上記の様な社内外のデータセットにアクセスする際の摩擦のために、データサイエンスチームがその能力を十分に発揮できないということは、実際によく見られる課題である。
これらのデータセットの合成データを利用することで、チームはデータに素早くアクセスし、煩雑な業務から解放される。
もう一つの一般的な使用例は、ソフトウェアテストである。
これは、特にテストにおいても実際に近いデータを必要とする様なソフトウェアの開発において重要な問題となる。
実データを使用すると、プライバシーに関する問題に直面し、多くの組織で課題となっている。
そこで、本番データから生成された大量のテストデータを提供する合成データが必要となる。
この分野は非常に急速に進んでおり、ガートナー社は、2024年までに、AIや分析ソリューションの開発に使用されるデータの60%が合成的に生成されるようになり、合成データの使用により、機械学習に必要な実データの量が半減すると予測している。(出典)
合成データの信頼性(どのくらい本物に近いものなのか)について、COVID-19の合成症例データの有用性を評価した論文や臨床研究における合成データの有用性に関する論文によれば、合成データが実データのパターンを非常によくモデル化することが示されている(一般的に、予測精度は元のデータの2%から5%以内に収まる傾向がある)
出典:Can synthetic data be a proxy for real clinical trial data? A validation study
出典:Evaluating the utility of synthetic COVID-19 case data
プライバシー規制については、合成データは原則としてプライバシー規制の対象外であることが示唆されている。一部の国では明示的に、他の国では暗黙的に、あるいは実際に許容されると考えられている。
例えば、フランスのデータ保護局(CNIL:Commission des informations et libertés)は、合成データを匿名化の許容範囲として承認した。
合成データは、国境を越えてデータを共有する際に、現行の規制の下で存在するプライバシーに関する問題の多くを回避することが可能となる。
また、従来の非識別化手法よりも多くの点で容易であり、高度に自動化されているため、特別なスキルセットに依存せず、よりアクセスしやすくなっている。
以上の様に、合成データはデータへのアクセスを民主化する可能性を秘めており、様々な分野における活用が進むことが期待される。(文責:野畑)
LayerX Labsでは、次世代プライバシー保護・セキュリティ技術Anonifyの正式提供に向けトライアルパートナーの募集を開始、合わせて公式ウェブサイトを公開しました。
「Anonify」の公式ウェブサイトはこちら
「Anonify for Insurance」ホワイトペーパーはこちら
LayerXではエンタープライズ向けブロックチェーン基盤を基本設計、プライバシーの観点から比較したレポートを執筆し、公開しています。
基本編のダウンロードはこちら
プライバシー編ダウンロードはこちら
Section2: ListUp
1. プライバシー・セキュリティ
●ヤフー・データソリューション、検索ビッグデータから“次のヒット商品の種”を見つける「商品ブレイクマップ」レポートを公開
https://www.excite.co.jp/news/article/Prtimes_2021-09-16-81771-10/
●IETF111 RATS: Remote Attestation ProcedureS 報告
https://www.slideshare.net/suzaki/ietf111-rats-remote-attestation-procedures
●プライバシー保護コンピューティングの登場でデジタルアセット付加価値高まる―中国
https://www.recordchina.co.jp/b882357-s6-c20-d0189.html
●第22回情報セキュリティ・シンポジウムの模様
https://www.imes.boj.or.jp/jp/conference/citecs/22sec_sympo.html
●出所者の「顔」検知、JR東が取りやめ…「社会の合意不十分」と方針転換
https://news.yahoo.co.jp/articles/ca398d0562cd919332403b9b9009a06cd0f0ff0f
●米FTC、プライバシー保護関連の新部門設立に現実味:「より広範な課題解決に向けて」
●戦略的なデータガバナンス・マネジメントとプライバシーガバナンス|PwCあらた有限責任監査法人
https://www.pwc.com/jp/ja/knowledge/prmagazine/pwcs-view/202109/34-03.html
2. デジタルガバメント・スマートシティ
●"スマホで投票"実現は...生徒が新たな試み
https://www.news24.jp/articles/2021/09/18/07941789.html
3. デジタル証券
●独当局BaFin、オルタナアセットマーケットプレイスSTOKRによる、BitcoinサイドチェーンLiquid NetworkベースのSTOを初めて承認
SF MMO「Infinite Fleet」のパブリッシャーであるExordium社のEXOeuがSTOKR上で提供され、最低投資額100ドルから参加することができるもの。
これまで独BaFinは、Ethereum上で発行されるSTOのみを承認しており、BitcoinのサイドチェーンLiquid Network上のSTO承認は初めてとなる。
https://stokr.io/stoke-post/stokr-bafin
4. 今週のLayerX
●来週9月30日(木)10:00-12:00、「LayerX 秋のコーポレートDX祭り」を開催します。
120分でコーポレート業務のデジタル化・テレワークを促進する注目サービスをまるっと知れるイベントです!
https://www.layerx.jp/invoice/event/210930-corporate-dx
●つくば市内在住・在勤者の皆様、市の科学技術振興に関するウェブアンケートにご協力をお願いします。こちらのQRコードから簡単にアクセスできます!
https://www.city.tsukuba.lg.jp/shisei/oshirase/1015751.html
●本日発表されたつくば市の市民意見アンケート調査において、LayerXの秘匿化ソリューションAnonifyが導入されています。回答はインターネット投票の形で、本日より3週間にわたって行われます。つくば市に在住・在勤・在学の方、ぜひご回答への参加をいただけると有難いです!
https://prtimes.jp/main/html/rd/p/000000083.000036528.html
●SaaSのリリース前後1年におけるMA・SFAのアレコレ - LayerX インボイスの場合
https://note.com/35_mki/n/ne7420577d073
製品紹介・デモのご依頼に向けたお問い合わせは、こちらの「お問い合わせフォーム」よりお願いします
Disclaimers
This newsletter is not financial advice. So do your own research and due diligence.