リケラボは研究者、研究開発・技術職など理系の知識を生かしてはたらきたい人を応援する情報サイトです。

フェイクニュースをデータで見破る。SNS上の社会の「空気感」を数理的に解明。筑波大佐野幸恵助教 | リケラボ

データで見破るフェイクニュースの傾向とは？ SNSに潜む社会の「空気感」の数理的構造解明に挑む筑波大佐野幸恵助教

トピック
数学

2020.10.16

リケラボ編集部

私たちの社会には、はっきりと目に見えるわけではないけれど、誰もが存在を認める「空気感」とでも呼ぶべきものがあります。こうした世の中全体の集合的な感情を、Twitterやブログ記事を解析すれば読み取れるのではないか。これが筑波大学システム情報系の佐野幸恵助教の発想です。SNS上を行き交う膨大な生データからノイズを取り除いて整理・分析し、その底流に潜む空気感を読み取る。さらにTwitterの投稿とリツイートの関係性を数理的に解析し、フェイクニュースを見抜く。最先端のネットワーク科学について佐野助教に教えていただきました。

ブログ記事から読み取れる社会の空気

日本でTwitterがサービスを開始したのが2008年ですが、先生が研究を始めたのはいつ頃だったのでしょうか。

佐野　研究をスタートしたのは2007年で、当初の対象はブログ記事でした。そのころ日本ではブログが一種の日記帳としてとても流行っていて、記事を読んでいると、なんとなく世の中の動きがわかることに気づいたのです。例えば12月になると「クリスマス」という言葉が、多くの記事で使われるようになります。仮に1万人分のブログ記事をチェックすれば、クリスマスに関心のある人がそのうちの何パーセントぐらいなのがわかる。これはすごいデータではないかと思いました。実際に1万人と会って「あなたはクリスマスに関心がありますか？」などと聞いてまわるのは現実問題として難しい。ブログを解析すればその答えがわかります。しかもブログに記されているのは、アンケートの回答ではなく、書き手の率直な感情なのです。

確かにブログを解析すれば、多くの人の気持ちがわかりそうですね。

佐野　ブログに書き込まれる言葉と現実の現象との関係を突き合わせてみると、より興味深い結果が明らかになりました。例えば夏なら「暑い」と書き込まれる回数と気温の上昇具合に相関関係が見てとれます。あるいは「ハロウィン」イベントが2007年ぐらいから社会現象化していきましたが、このトレンドと同調するように、ハロウィンに関するブログでの書き込みは年々増えていきました。ブログを毎日チェックしていれば、「ハロウィン」などの言葉が書き込まれた回数を数値化できます。その推移をたどっていけば、世の中の空気の変化を読み取れる。ブログ記事なら、どういう文脈でどんな感情とともに「ハロウィン」が書き込まれたのかまで分析可能です。

そのような研究に取り組まれたキッカケは何だったのでしょう。

佐野　企業でのSE職をやめて東京工業大学・社会経済物理学の高安研究室に入ったのが、ちょうどブログの黎明期でした。そこで企業からブログ解析の共同研究が持ちかけられ、私自身がブログを書いていたこともあって挑戦することになったのです。たくさんのブログを解析する研究は、私を「まるで新しい望遠鏡を手に入れたような気分」にしてくれました。これまでまったく見えなかった新しい世界が、一気に目の前に広がったのです。

Twitterが教えてくれるデマ情報

ネット情報の解析といえば以前、Googleが検索のログデータ解析でインフルエンザの流行予測情報を出して話題になった記憶があります。

佐野　確か2009年だったと思いますが、Googleの研究者たちによって書かれた論文が『Nature』に掲載されましたね。この研究でGoogleは、検索ログのビッグデータを機械学習にかけて予測していました。私たちは機械学習やAIはまったく使っていないのでアプローチはずいぶん違いますが、このようなネット情報の研究でも『Nature』に載る可能性があるとわかり、とても励みになりました。

その後、ブログだけでなくTwitterも解析対象に加えたのですか。

佐野　Twitterが普及し始めると、ブログとの違いに興味を持ちました。Twitterのリツイートや「いいね」の付き具合を見れば、ツイート間のつながりを可視化できます。ニュース性の高いツイートや有名人のツイートなどが「バズる」と、リツイートが拡散する様子をリアルタイムで追っていけるのです。しかもTwitterでは、位置情報や投稿した際のクライアント、つまりスマートフォンなのかパソコンからなのかもわかり、投稿した人のプロフィールデータも取得可能。こうした特徴がブログとの違いです。

Twitterではリツイートの拡散状況からフェイクニュースを見破れると聞きましたが。

佐野　リツイートの拡散状況を視覚化すれば、その情報の真偽を見分けられると考えています。例えば下図のLevel 1は、本物の情報の広がり方です。その特徴は、originつまり情報の発信源を中心として「まりも」のような形にリツイートが広がっていること。これに対してLevel 2はフェイク情報です。発信源を中心として拡散するのではなく、小さな「まりも」のような形がいくつも散らばっているのが特徴です。このようなつながり具合が意味するのは、又聞きによる情報拡散です。Level 3は有名人がフェイクニュースをつぶやいてしまったケース、そしてLevel 4は個人の体験談を複数の有名人がシェアしているケースで、まだ確定ではありませんが、おそらくは真実の伝わり方の一例でしょう。このあたりはいま研究を進めているところです。中国にいる共同研究者がWeiboを同じ手法で解析した結果からも、やはり同じような傾向が見て取れました。フェイクニュースの広がり方は、おそらくプラットフォームや国境の違いを超えたユニバーサルな現象だと思います。

▽画像タップして拡大

東日本大震災で明らかになった情報の流れ方

Twitterの解析に本格的に取り組んだキッカケは何だったのですか。

佐野　東日本大震災です。とにかく何か役に立ちたいとの思いに突き動かされて、Twitterの解析を始めました。すると「放射能にはイソジンが有効」だとか「ヒマワリが土壌の放射性セシウムを除去する」などのデマ情報が飛び交っていました。一方では「それらは科学的ではない」と反論する研究者たちのツイートもありました。この両者は3月末ぐらいまでは拮抗していたのですが、時間が経つにつれて科学者たちの発言の方が影響力を失っていったのです。そこで正しい情報を伝えるためには、どうすべきだったのかを検証するため、当時のTwitterのデータを集めてリツイートをネットワーク化しました。これを見ながらデマを打ち消すリツイートのやり方などをシミュレーションしています。

デマやフェイクニュースに立ち向かえるようになれば、大きなメリットが生まれそうです。

佐野　あくまでも仮説ですが、例えば研究者同士が連携してリツイートしあい、確固としたネットワークをつくりあげていれば感情派に対抗できた可能性があります。放射能に関して4月以降は「放射能は恐ろしい」と一方的に発信する感情派がどんどん勢力を拡大し、これに押されるかのように研究者たちの発信が減っていきました。どうすれば正しい情報を効果的に拡散できたのか。これは今後の研究課題の一つです。

情報の拡散にはマスコミの影響も考えられます。

佐野　放射能関連のツイートに関しては、ひたすら「怖い怖い」と恐怖感をあおる感情派、研究者たちによる真実派、そしてもう一つ大きな勢力となったのがマスコミからの発信です。マスコミによる発信は確実にある程度広がり影響力があるので、情報拡散のハブになるのは間違いないでしょう。

2020年の新型コロナ騒動ではどのような傾向が読み取れたのでしょうか。

佐野　感情に関する単語を含むブログ記事数を比較し、「怒り」「混乱」「疲れ」「緊張」「活気」など各感情の大きさを測る感情シグナルを作成しています。これによれば2月末と3月1日に「緊張」が一気に高まっています。原因は一斉休校要請が出されたからでしょう。それから緊張はだらだらと下っていきましたが、3月の連休を過ぎ4月に入って緊急事態宣言が出されると、再び緊張が高まりました。「混乱」についてはコロナが出始めたころに高まり、その後は落ち着く傾向が見て取れます。そして「疲れ」は4月から5月にかけて少し高まっています。

※佐野助教らのチームが取り組んできた過去のブログ記事解析の例

2006年〜2016年に日本語で投稿されたブログ約36億記事からスパムを除いた後、POMS(Profile Of Mood State)に基づく独自の辞書を構築し、以下の6感情の日次の変動を抽出した。
・緊張ー不安（Tension-Anxiety）｜「ソワソワ」「気掛かり」など
・抑うつー落ち込み（Depression-Dejection）｜「がっかり」「惨め」など
・怒りー敵意（Anger-Hostility）｜「イライラする」「憤慨」など
・活気（Vigor）｜「元気いっぱい」「活動的」など
・疲労（Fatigue）｜「グッタリ」「へとへと」など
・混乱（Confusion）｜「呆然」「グダグダ」など

▽画像タップして拡大

感情は急激に変化するのではなく、緩やかに変動を続けており、その変動には季節や曜日の周期性、さらに数ヶ月スケールの長期記憶が内在していることが明らかになった。

ただし、地震や台風などの自然災害では、主に緊張の感情がパルス的に立ち上がり、数日以内に元に戻る。唯一、東日本大地震だけは、緊張、抑うつ、混乱が約1カ月続いた。
（A）東日本大震災時の緊張・抑うつ・混乱（2011年2月25日〜4月15日）
（B）熊本地震の際の緊張（2016年4月1日〜4月29日）
（C）首都圏豪雪の際の混乱（2016年1月4日〜2月1日）

▽画像タップして拡大

気象予報のように役立つ情報提供を

世の中の出来事と空気感は連動しているのですね。

佐野　震災など非日常的な出来事が発生したときにデマが広がりやすいのは、社会心理学でも明らかにされています。私たちは研究の応用として、デマ注意報のような予報を出せないかと考えています。例えば台風が近づいたときには、警戒警報などが出されますが、これと同じようにデマやフェイクニュースについても事前に警報を出すのです。海外にはObservatory on Social Media、つまりソーシャルメディア観測所と呼ばれるプロジェクトを大学が公開しており、SNS上の情報をチェックしフェイクニュースに注意を呼びかけています。大雨警報が人助けになるのと同様に、デマに人が惑わされないように予報を出せればと考えています。

デマ予報の先にはどのような研究を考えているのですか。

佐野　これまで取り組んできたのは、サイバー空間における情報拡散と、それによる人々の感情変動の解析でした。ただ私が本質的に関心を持っている対象は社会ネットワーク全般であり、さまざまなネットワークに共通する普遍的な数理構造を解明したいのです。

例えばどのようなネットワークでしょう。

佐野　リアルな空間で考えれば、子どもたちの活動もネットワークです。子どもたちがみんなで遊んでいるときに、一人ひとりに加速度センサーをつけてその動きを逐一追いかけていけば、子ども同士の間に発生しているネットワークを読み取れるでしょう。あるいはサッカー選手のユニフォームに同じく加速度センサーをつけておけば、パス回しのネットワークやチーム全体としての攻防の際の動きのネットワークなどを解析できます。そうした解析を通じて、ネットワークに共通する普遍的な数理構造を見つけたいのです。もちろん、そんな構造など存在しないかもしれませんが、もし見つけられればこれほどおもしろいことはないでしょう。

それがネットワーク科学なのですね。

佐野　世の中の現象は、すべて点と線の関係性、つまりネットワークによって理解できるのではないか。実はこんなテーマを大学院で研究し、2002年に物理学科で修士論文にまとめました。残念ながら当時の担当教授からは「こんなの物理じゃないよ」とひと言でばっさり切られましたけれど。それから約20年が経ち、今ではNetwork Scienceつまりネットワーク科学は一つの学問領域として確立され、特に海外でかなり研究が進んでいます。ネットワークに潜む数理的な構造を解明できれば、シミュレーションの精度も高まると考えています。

▽画像タップして拡大

超多忙なSEから博士への転身

そもそもなぜ大学進学時に物理学を選んだのですか。

佐野　幼い頃の夢が、天文学者になることだったのです。そして漠然とですが「末は大臣」ではなく「博士」になりたいと思っていました。もっとも大学に入ってからは、世の中の物理現象をネットワークで解析できるんじゃないかと考えるようになっていったのですが。

修士課程修了後に一度就職していますね。

佐野　当時はネットワークの研究がサイエンスになるとは思っていなかったこともあり、システム会社でSEとなりました。これが超多忙な仕事で、奄美大島や北海道でも日帰りで出張です。毎週1回は飛行機や新幹線に乗るような日々を送り、文字通り日本全国を飛び回っていました。

そこから、もう一度博士課程に戻ったのですか。

佐野　一度就職したら、とにかく3年間はがむしゃらにがんばろうと思っていたので、そのとおりにやりました。仕事にやりがいを感じる一方で、好きな数学や物理の本を読んでいると、このまま研究に関わることなく一生を終えるのがたまらなく悲しくなったのです。何しろ子どものときの夢が「博士になること」でしたから。それで思いきって仕事をやめて、博士後期課程に挑戦したのです。

仮に博士号を取れても、将来の展望を描きにくかった時期でしょう。

佐野　それよりなにより自分のやりたい研究に打ち込みたかったのです。そうやって研究に取り組むと、やはり楽しくて仕方がありません。しかも研究していると簡単に世界とつながります。ブログからの感情変動分析についてはイスラエルの研究者と共同研究に取り組みましたし、先日はブルネイの学生から私の研究室にきたいと連絡がありました。海外に行けば性別や年齢に関係なく、Ph.D.は特別の扱いを受けます。博士号をとって本当に良かったと思います。

研究者のやりがいとは何でしょうか。

佐野　研究に取り組んでいると、毎日自分にしか見えない新しい世界が立ち上がってきます。そんな新しい世界をつくり出していくのが、研究者の仕事ともいえるでしょう。好奇心が続く限り研究には終わりがなく、常に何かに追われている感じがします。でも、それが私には楽しくて仕方がなくて、今日はどんな新しい世界と出会えるだろうかと、わくわくしながら毎日を過ごしています。

筑波大学システム情報系社会工学域助教
佐野幸恵（さのゆきえ）
2003年、奈良女子大学大学院博士前期課程修了後、株式会社富士通ゼネラル入社、SE職を務める。2007年より東京工業大学大学院博士後期課程。博士（理学／東京工業大学）。日本大学助手を経て、2014年より現職。（※所属などはすべて掲載当時の情報です。）