分析データが個人情報にあたる?
こんにちは。NRIでデータガバナンスを専門に活動しています南島と申します。
皆さんが普段分析対象としているデータに関して、これって個人情報にあたるのかな?と疑問に思われたことはありませんか。もし個人情報に該当する場合は、分析環境や分析者の方に対して、様々な制約を設ける必要が出てきます。
今回はデータサイエンティストの方向けにどのような情報が個人情報に該当するのか解説していきたいと思います。
個人情報に該当するか判定するための3つの条件
個人情報保護法*1では、以下の通り個人情報を定義しています。
個人情報保護法第 2 条(第 1 項)
1 この法律において「個人情報」とは、生存する個人に関する情報であって、次の各号のいずれかに該当するものをいう。
(1) 当該情報に含まれる氏名、生年月日その他の記述等(文書、図画若しくは電磁的記録(電磁的方式(電子的方式、磁気的方式その他人の知覚によっては認識することができない方式をいう。次項第 2 号において同じ。)で作られる記録をいう。第18 条第 2 項において同じ。)に記載され、若しくは記録され、又は音声、動作その他の方法を用いて表された一切の事項(個人識別符号を除く。)をいう。以下同じ。)により特定の個人を識別することができるもの(他の情報と容易に照合することができ、それにより特定の個人を識別することができることとなるものを含む。)
(2) 個人識別符号が含まれるもの
カッコ書きも多く、初見では中々意味が分かりづらいですよね。上の定義をフローチャート的に図示したものがこちらになります。
条件は3つです。それぞれについて解説していきます。
条件1:生存する個人に関する情報である
個人に関する情報とは、氏名や住所に限られず、その人に関する事実、判断、評価を表す全ての情報を指します。映像や音声による情報も含まれ、暗号化・ハッシュ化*2等によって秘匿化されているかどうかを問いません。
要するに生きている人が生み出すあらゆる情報ということなのですが、少しでも怪しいなと思ったら、他の条件にも該当しないか、確認するようにしましょう。
条件2:個人識別符号を含む
個人識別符号に該当する情報は法令により限定されています。代表的な例は以下の通りです。条件1と2がYESであれば個人情報に該当します。
- 身体的特徴を変換した文字や番号等*3
- DNAの配列
- 顔の骨格や各部位の位置及び形状によって定まる容貌
- 虹彩の模様
- 発声の際の声帯の振動
- 歩行の態様
- 静脈の形状
- 指紋又は掌紋
- パスポート番号
- 基礎年金番号
- 運転免許証番号
- 住民票コード
- 健康保険証の保険者番号、被保険者記号・番号
条件3:含まれる記述等により特定の個人を識別することができる (他の情報と容易に照合することで、特定の個人を識別することができる)
私たちが普段、個人情報と認識している情報の多くは条件1と3に該当するものです。代表的な例は以下の通りです。
- 氏名
- 住所
- 電話番号
- メールアドレス
- SNSのアカウント
- クレジットカード番号
- 銀行口座番号
- 会員番号/ログインID
- 本人の顔が識別できる画像・動画
- 本人とのやり取りの音声記録(会話の相手方を特定できるもの)
例えばメールアドレスなどは、厳密には個別のアドレスごとに条件3に該当するか否かの判定が必要になりますが、実務上はそうした判定を都度行うことは現実的ではないため、メールアドレスを含むカラムやデータセット全体を一律に個人情報として取り扱うことが多いです。
他の情報と容易に照合することで、 特定の個人を識別することができる情報も「個人情報」に該当
ここで条件3のカッコ書きの中を振り返りましょう。
(他の情報と容易に照合することで、特定の個人を識別することができる)
どのような意味でしょうか。具体例を用いて解説していきます。
会員サイトを運営する企業があったとします。上のイメージ右側の会員管理システムに含まれるデータセットは条件1と3に該当するため、個人情報にあたると判定されます。
イメージ左側のマイページ管理システムに目を移しましょう。このシステムでは会員番号ごとにサイトのログイン履歴をログとして保有しています。この場合、「会員番号」をキーとして、マイページ管理システムのログデータは会員管理システムの登録データと一意に紐づくことが可能となります。こうした紐づけが可能である場合、マイページ管理システムも個人情報を含むデータベースとして認識する必要があります。
分析プロジェクトにおいて、マイページ管理システムのログデータのみを取り扱う場合、会員管理システムとの紐づけに気づかず、個人情報には該当しないと判定してしまわないか留意が必要です。
個人情報に該当する情報の考え方をご理解いただけたでしょうか。一見して個人情報に該当しないと判定されるデータセットであっても、元データとの紐づけまでを確認して判定するようにしましょう。