荒川豊先生インタビュー(その2)

センシング技術の難しさ

【ーー】  今までのいろいろな研究の中で、実際にセンシングして、データ分析して、やろうと思っていたことがうまくできる場合と、なかなかやりたいことがうまくできないことがあるかと思うのですけれども、特にこういう場合は難しいという事例はありますか。
【荒川】  あります。我々、教師あり機械学習を使うことが多いんですね。人工知能ブームのおかげで、その人工知能の専門家ではない我々も簡単に使えるようになって、教師ありの正解データ付きのデータがあれば学習させることができて、ある程度パターンが出せる。これは恩恵にあずかっているのですけれども、問題は、その正解付きのデータをどう揃えるかというところです。
 単純な作業であれば、何回もデータ計測をすればいいのですが、以前、苦労したのは、ゴルフのスイングの解析です。ウェアラブルセンサをつけて、スイングをしてデータを集めるわけですが、例えばナイスショットを100回打ってくださいと言っても打てません。言われて打てたらプロですよね。打てないのでデータが集まらない。例えば、左に曲がるのを100回打ってください。右に曲がるのを100回打ってくださいといろいろなデータが欲しいのですが、失敗ショットを含めて、すべて狙ったとおりにできるものではないため、データが作れませんでした。
 しかも、人間には結構、微調整機能があることがわかりました。上記のプロジェクトは、最終的に、プロゴルフの試合をやっている会場にブースを用意し、プロゴルファーからもデータを計測しました。当然、良いショットを連発されるわけですが、ボールは毎回微妙に違う場所に置くことになるため、プロゴルファーでも、スイングは毎回一緒ではなく、打つ瞬間にコントロールされていることがわかりました。つまり、学習のためのラベルが同じであっても、センサデータ(体の動き)が違うと言うことは往々にしてあり、それらが混じってしまうと、うまく学習することができないという問題に陥りました。その経験をした後は、実はこの手の再現性が難しいデータ計測は避けるようにしています。
【ーー】  なるほど。そういう意味では、日常的にやることで、よい何々とか、悪い何々というものの中には、そういうものは結構多いかもしれないですね。
【荒川】  結構、多いです。別の例だと、IoT醤油差しの研究があります。デバイスとしてはできるだけ正確に量を計測するように作るのですが、味で見たときに、多少しょうゆの量が違っても変わらないという問題がありました。プロの料理人すら、ぴったり合わせていないので、やる必要ないねみたいな感じになりました。
【ーー】  なるほど。そういう意味では、例えば医療関連のデータだとか、交通関連だとか、購買行動だとか、そういうのは比較的はっきりしているわけですね。
【荒川】  そうですね。ログのように、データとして勝手にどんどんたまっていくものは楽という感じですね。
【ーー】  買う買わないとか、行く行かないとか、結果も比較的明確に分類できますね。
【荒川】 スマホでアンケート等であれば、数千人とかに一気に聞けるので、統計的に見てどうだというふうに決着をつけられるのですが、物理的動作など、例えば先ほどのプロゴルファーのデータなど、100人からデータを取るとか全然無理となります。それでもデータを取るために、確かGoogleかどこかはロボットを導入してデータ計測をするなど、データを取るための何か工夫を結構みんなフィジカルなものはやっていかないといけないという状況ですね。
【ーー】  そういう意味では、先ほど少しメンタルヘルスに関するデータという話もされていましたけれども、そういうのも難しいかもしれませんね。生理的なデータ自体はいろいろ取れるとは思いますが。
【荒川】  それもおっしゃるとおりで、主観値が全然違って、例えばエンゲージメントを10段階で答えてくださいといったときに、いつも低めに答える方、ベースラインが個人によって違う。ベースというのが、要するに絶対値としてのベースというよりは、10件法の選択肢を見たときにどこを選ぶかというベースがやっぱり個人で違っていて、とりあえず5でスタートして、上がったらプラス・マイナスとかってやっていく方もいれば、とりあえずの選択が7になっている人もいる。その場合、数値だけ見ると常に調子がいいということになる。データを見たときに明らかにベースラインが個人によって違うので、個人の平均を取り、その値からの相対的な高低を推定するといったことをしています。

データ作成の難しさ

【ーー】  次に、事前にお送りした2つ目と3つ目の質問に関係するお話を、荒川先生御自身の研究との関連でもう少し伺いたいのですけれども、今はかなり多くのデータが集まるので、機械学習で分析してというのが中心的なやり方になると思います。そのような手法でやっていて限界だとか、問題点だとか、そういうことを感じられることはありますでしょうか。
【荒川】  データ収集は楽になったのですが、次はデータに対するアノテーションが必要となり、その作業はいまだ大変な作業です。前述したミーティング分析に関する研究ですが、録画自体はとても楽になったのでデータは大量に集まるのですが、その動画に対して、うなずき、発話、笑顔といったラベルを秒単位でアノテーションしていく作業は非常に負担が重く、5分の動画に対して40分くらいかかるんですよ。200本も動画があると、気の遠くなる作業となります。その作業のために、専任の方を雇用して、毎日、朝から晩まで動画にラベルをつけてもらっているですけれども、その人ももう飽き飽きしてノイローゼになりそうみたいな感じです。恐らく今後は、教師ラベルがなくても何らか推論していけるようなモデルというのを作っていかなければ、もう成り立たないなという感じはしてきていますね。
【ーー】  現状では、そういったアノテーションはまだ人力でやらざるを得ないわけですね。
【荒川】  今年度は、アノテーションを自動化するAIを開発して、まず、そのAIがアノテーションを行い、あとから人間が修正するという作業にしました。しかし、まだAIの判定能力が低いため、人による修正箇所が多く、場合によっては時間が余計にかかっていたりします。今後、こうして作ったデータを再度学習させることで、AIの精度を改善することで、アノテーションの自動化が近づいてくると考えています。
【ーー】  なるほど。うなずき認識AIとか、瞬き認識AIとかというのを、まずはまさに教師あり学習で教えてやるという。
【荒川】  はい。世の中には、静止画に対する笑顔認識は多数の研究がありますが、動きを伴う仕草を対象にしたものはあまりありません。笑顔は静止画から顔部分を抜き出し、口角が上がっている等で簡単に判別可能です。一方、うなずきなどの動作はデータもなければ、ラベル付けも大変という状況です。
【ーー】  そういう意味では、欲しいデータがちゃんとそろえば話は簡単なのだけれども、むしろ、その欲しいデータをきちんとそろえるところまでが、むしろかなり大変だと。
【荒川】  そろえるところが大変ですね。データサイエンスをやりたい人たちというのは、データセットくださいと大体おっしゃるのですが、そのデータを作るのが大変なんですよね。しかし、データセットができると研究は一気に進みます。中国などは世の中に公開されたデータセットを100パターン100人でやれば何か一番いいのが出るというぐらい人海戦術でいろいろなAIを組み合わせて一番いいスコアを出すみたいなことをやっています。この戦い方は日本では真似できないということもあって、私としては、自分たちしか計測できないデータを集めるところに注力して世界と戦うようにします。

行動変容の試み

【ーー】  さきほど、実際に行動変容、行動認識からさらに行動変容に応用していくということにも最近いろいろ取り組まれているというお話しをされていました。これに関しても、実際にどういう場面での行動変容に取り組まれているのか、少し具体例を教えていただけますでしょうか。
【荒川】  例えば、今年度は、混雑回避のための行動変容というものをやっています。前年度は、混雑度の可視化だけのみだったのですが、それだけでは人の行動は全然変わりません。なので、変容させるという意味でちょっとした工夫が必要になります。一番簡単なのは金銭的なインセンティブですよね。実験では、昼食の時間を変えてくれたら100円あげると言われたときに、学生がどれぐらいその条件を呑むのかを測ったりしてます。300円配る日もあれば、10円しかあげない日もあり、幾らぐらいであれば行動を変えようと考えてもらえるかを測っています。その上で、金銭的なインセンティブを最小化する方法を考えています。次に、同じインセンティブでも、より楽しく行動を変えてもらうために、心理学の知見を使い、メッセージを工夫しています。金銭的インセンティブをもらえる人は先着10名まで、とか、何時までにエントリーしないといけない、といった文言を追加することによって、どれぐらいみんなの反応率が変わるかを測っています。そういうちょっとした認知バイアスがかかる言葉遣いをすることで学生の参加率が上がるなというのが分かったりしました。
 さらにゲーム性を取り入れて、10人で何かを達成しようみたいなモデルにすると、金銭的インセンティブを下げても、ゲームでいいスコアを取るとかというところの満足感、達成感で動いてくれる可能性もあります。それがうまくいくと、支払うべきポイントを減らすことができたんですね。今回の検証では、1人当たりの行動変容に対して必要だったコストを下げることができたみたいな結果が出てきたという感じですね。
【ーー】  どういう手段が実際の行動変容に効いてくるかというのは、内容によって、どういう行動なのかによって結構変わってくるのでしょうか。もちろん金銭的なインセンティブはかなり普遍的だと思いますが。
【荒川】  ナッジ・認知バイアスなど心理的なものも幾つか試して、それぞれの効果が何%行動変容に寄与したかを分析しているという感じですね。1,650人もモニターがいるので、半分には通常のメッセージ、半分にはそういうちょっとナッジを交えたメッセージということでランダムに群を分けて効用を測っていくみたいなことをやっています。
【ーー】  混雑緩和の場合も、あるいは例えば健康に関わる行動の場合も、いろいろなことに関していろいろな組合せを試してという感じでしょうか。
【荒川】  そうですね。だから、やっぱり先生の御専門、今日、後半で聞かれるかもしれない、哲学的なところとか、倫理とかも出てきます。混雑を変えるだけだったら、自由にゲームっぽくして遊んでもいいのですけれども、健康となってくると、そこは結構慎重にならないといけないと考えています。九州大学の健康診断についても、何かちょっとした認知バイアスを入れることで受診率が上がるんじゃないかとかというのを試そうとして議論を重ねていて、例えば学生に送るメッセージ1通の書き方だけでも、恐らく受診率が変わるだろうなという話はしているんですね。
 有名な論文なので御存じかもしれないですけれども、UCLAでコロナワクチンウイルスの接種率を上げるためのナッジの研究がNatureに発表されていまして、非常に面白いんです。アメリカのほうで、ある程度ワクチンを打ち終わった後に、打ちたくない、反ワクチンも含めて若者が打ってくれないという問題が出てきて、どう行動変容を促すかが課題となりました。アメリカの自治体が金銭的なインセンティブに走って、ワクチン接種の報酬として、若者が欲するAirPodsや野球のチケットを配布するなどが行われました。それに対して、UCLAがやったのは、金銭的なものではなくて、メールの文面に認知バイアスを組み込み、それによってどれぐらい予約率と受診率、接種率が上がるかというものです。UCLA関係者10万人でテストしているんですね。九大もそうですけれども、こうした案内はメーリングリストを使って全職員、学生とかに案内していると思いますが、UCLAでは差し込みメールにして、10万人に1通ずつ送る形に変更し、タイトルに名前を挿入しました。「荒川先生、ワクチン、打ちましょう」とか、「ーー先生、打ちましょう」という実名をメールに挿入して送った群と、全職員向けに「皆様、打ちましょう」と送ったものとテストすると、予約率が6%以上変わったそうです。接種率も3.5%以上向上しています。名前が書いてあるというだけで、10万人の6%と結構な人数を変えることができたのは凄いことだと思います。これを九大でもやろうと言ったんですけれども、なかなかお医者様方たちは慎重でまだ実現できていません。日本人の場合は、認知バイアスの中でも、同調バイアスが効きやすいというのがあるので、既に何人の人が予約済みですよ、今やらないと駄目ですよ、大好評で売り上げナンバーワン、といったみんな買っているみたいな認知バイアスが有効に働くと考えられます。こうした認知バイアスは、マーケティングの世界では相当使われているんですけれども、健康医療の行動変容に活用するとなると、結構、ちゃんと倫理とか哲学的にどうなんだというところまで考える必要があります。
 打ちたくないと思っている人を認知バイアスで打たせる方向に本当に持っていっていいのかとか、本当は議論しなければいけないんだろうなと思います。UCLAの場合は緊急事態ということもあって、多分、2020年にそういうことをやって、2021年に論文発表されていたんですけれども、どこまで踏み込むかというのは、まだ我々九大では議論中というところです。源氏は、何人がいつメールをクリックして、その健康診断サイトに行ったかという部分を計測して、現状を知り、なぜ健康診断の受診率がが低いのかを分析しています。そこを、まずはお医者さんに理解していただき、それで、あ、そういう現状だったら、こういうふうな介入をしていこうみたいなのを建設的に議論していこうとしています。
【ーー】  なるほど。それは線引きがや非常に難しい問題ですね。
【荒川】  難しいです。健康診断、ワクチンを受けて、ワクチン障害ということも1万人に1人とかあったりしますよね。そのため、この手の啓蒙活動というのをあくまで自主判断と多分していると思うんですけれども、リスクがないわけではないので、そういったところで、例えばバイアスで6%変わるというのを知った状態で、同じバイアスを活用しましたというのが、どこまで褒められるのかというのが、多分、人工知能による介入といったところで、結構、今後問題になると考えられます。
 マーケティングの世界では、もうバンバン使われており、オンライン広告はすでにAIが人間のクリック率に応じて、自動で差し替えていくようになってきています。そこではよしとされている一方で、医療、健康のところというのはやっぱり難しいなとは思います。
【ーー】  その辺りは私も非常に関心のあるところで、別の研究プロジェクトでも、ナッジの倫理的な問題について論じたりしています。
【荒川】  そうなんですね。
【ーー】  ええ。例えばナッジだということを分かるように提示すればいいのかとか、どのくらい強力だとまずくなるのかとか、あるいは国がやるのと民間でやるのでどう変わるのかとか、非常に線引きが難しいですね。このケースでも、個人宛てにメールを出すぐらいならばそれほど問題なさそうですけれども、同調を促す、もう7割の人が受けていますと教えるというようなものになると微妙になってくるでしょうし、あと、ワクチンを打たないとこんな危険がありますという、恐怖感をあおる手法になると、たとえそれが事実だとしても、かなりグレーになってきますね。
【荒川】  それを提案したら止められました。大学の1年生は初年度なのでほとんどの人が受け、4年生も就活があるので一応、受けておこうというのが多いんですけれども、2年生、3年生は、去年受けたしなみたいな感じで面倒くさいという子が多いみたいなんです。では、診断を受けない学生は相談が増えています、とか、10代でもこういう癌がありますとか書いておくといいんじゃないですかと言ったら、それは恐怖感をあおる感じになるのでNGと言われました。
 一昔前、健康関連のホームページで健康不安をあおり、健康食品を売る会社が問題になったことがあります。全国の会社で今、義務化されてメンタルヘルスチェックやっていますけれども、受診率が低いとかいったときに、どこまでだったらバイアスをかけていいのかとか、これはみんな多分、やきもきしているんじゃないかなと思いますね。
 性善説では、そういうのは全部、受診、上げていったほうがいいんですけれども、一方で、知らないうちにバイアスで受けちゃったとかというところが将来的な問題にならないかというのが、多分、鬱じゃない人に鬱気味ですと言ってしまったときのリスクみたいな状態だと思うので、何かその辺は今後問題になるだろうと思います。
【ーー】  実際に行動変容に活用していくということを考え出すと、データサイエンティストの人も、その辺りをちゃんと考えざるを得なくなってくるわけですね。
【荒川】  統計的に有効だよといっても、結局、反ワクチンの人がいるというのは、打つか打たないかは自由と言うところに帰着します。我々の研究分野の中に説得工学という分野があって、明示的に説明して、納得して行動を変えるといった研究が進んでいます。マーケティングのような、何か知らないうちに誘導されている、変えられているというような暗黙的な行動変容は、一線を画し、医療、健康については、説得、納得みたいなところが重要と考えられています。日本だと、ほとんどやっている人がいないのですが、GDPRなどデータは誰のものかというところまでケアしているヨーロッパで盛んに研究されています。説得工学上は、例えば今からどんなバイアスが入ってくるかとか、どういう介入があるかというのをちゃんと説明して納得いただく方法が重要であり、不意打ち、だまし討ち、内緒の介入は絶対駄目であると定義されています。
【ーー】  そういった問題に関しては、エンジニアの人はとりあえず手法を開発して、使うか使わないかは別として、こういうやり方がありますよ、これをやったら、これだけ効果がありますよということだけ示して、使うかどうかは、例えば自治体で決めてください、国で判断してください、そういう感じで役割分担をするというのが1つの古典的な考え方だと思うんですけれども、現在ではそれほど単純ではなくて、介入技法を開発する人自体が……。
【荒川】  そうです。デザインしなさいみたいな。
【ーー】  倫理的にも問題のないパッケージをちゃんとデザインしなければならないという意識になってきているわけでしょうか。
【荒川】  そうですね。論文を読むと、2010年ぐらいからその分野というのが、もう10年ぐらいヨーロッパでは進んでいるんですけれども、ナッジと俺らは違うんだみたいなことが結構書いてありますね。
【ーー】  ナッジに対して、それは操作、誘導なんじゃないかという批判があったのを踏まえて論じられているわけですね。
【荒川】  だと思いますね。文脈的には。
 ナッジも、その説得工学も日本ではあまりという感じ、要するに学問としてあまりやっている方がいらっしゃらなくて。マーケティングの会社が結構、ナッジは効果的といって使っているという印象ですね。今後、人間が行動変容をしたくなるような文章を書いてと依頼すると書いてくれるAIなどが出てくると思いますが、それで本当よいかを人間が判断するフローをちゃんと考えておく必要があると思います。

その3に続く

その1
その4