GoToトラベルと感染拡大の因果関係は?GoTo停止は感染に歯止めをかけるか?

イェール大学+半熟仮想株式会社の公共政策リアルタイム解析

半熟仮想株式会社

半熟仮想株式会社(代表取締役社長:成田悠輔)は、データを用いた公共政策のデザインを事業の柱の一つとしています。その一環として、GoToトラベル政策と新型コロナウィルス感染拡大の因果関係を明らかにし、年末年始のGoToトラベル停止が感染に与える影響をリアルタイム予測するデータ解析を行いました。

主な結果は以下の通りです。

・7月のGoToトラベル開始とともに、全国の検査陽性者数が累計で最大5300人増えたとの試算が得られた
・年末年始のGoTo停止中も陽性者数は増える。だが、仮にGoToを継続した場合と比べればGoTo停止中の陽性者数増加は累計約3700人減ると予測される
・政策の影響を予測し、予測を検証して改善し、政策デザインを助ける努力をしよう

注意:そもそも答えを出すのが難しい問題に、厳しい時間や資源の制約の中で取り組みました。できる範囲で最善は尽くしましたが、データや手法に改善の余地があることはもちろんのこと、間違いや誤解が含まれている可能性もあります。データや検証・予測手法へのご批判や改善方法のご提案を歓迎いたします。以下の問い合わせ先までご連絡いただければ幸いです。
【当社について】
半熟仮想株式会社は、データ・アルゴリズム・数理・思想を組み合わせ、事業や政策、そして社会の未来像をデザインしています。特に「市場設計」「反実仮想機械学習」「因果推論」といった技術では国内屈指の人材と技術を持ち、多数の企業との共同事業・研究や独自の基礎研究・ソフトウェア開発などを行っています。これらの活動を産学や国境の壁を超えて行うのが、イェール大学・MIT・スタンフォード大学・東京大学・東京工業大学・東京芸術大学など所属・出身で事業経験も備えた科学者やエンジニアです。

【背景】
新型コロナウイルスの感染拡大が世界でも日本でも止まりません。感染拡大による経済停滞が直撃した飲食業や観光業、地域経済を助けるため、日本では2020年7月22日から国内旅行に対して政府による補助金(GoToトラベル)が出されました。10月1日からは飲食店利用に対する補助金(GoToイート)もはじまっています。日本のGoTo事業には11月末時点で4000億円以上の政府支援が行われ、延べ6800万人以上が利用している世界的にも大規模な政策です(観光庁発表)。

しかし、11月からの検査陽性者数の増加を受けて、GoToトラベル・イート政策(以下「GoTo」)が感染拡大を助長しているのではないかという懸念が高まっています。その懸念から、年末年始(12月28-1月11日)にはGoToの一時停止が予定されています。

過去数ヶ月間のGoToは感染を拡大させたのでしょうか?年末年始のGoTo停止は感染に歯止めをかけられるのでしょうか?GoToと感染の関係性、特にGoToが感染を広げるかという因果関係はよく分かっていません。「GoToと感染には軽微な関係しかない」という力強い断言から、「GoTo利用者の方が感染を示唆する症状をより多く経験している」という慎重な忠言まで、異なる見解が乱立しているのが現状です。

残念ながら、対立する見解とそれを支える分析は客観的に正しさを検証できるような予測を行っておらず、私たちはお気に入りの意見を拾い出して信じるしかないという状態にあります。

【目的と概要】
この現状に楔を打ち、GoToの新型コロナ感染への影響を明らかにしようとするのが私たちの目標です。具体的には、以下の二つの分析を行いました。
 
  • 過去のGoToトラベル・イートの導入が陽性者数に与えた影響を検証する
  • 年末年始に予定されているGoTo停止が陽性者数に与える影響を予測する

データを用いた予測を得意とする「機械学習(人工知能)」と、データから因果関係を発見することが得意な「因果推論(統計学や経済学の一分野)」の技術を組み合わせたデータ解析の結果、以下のような示唆が得られました。
 
  1. 7月のGoToトラベル開始とともに、全国の陽性者数が一ヶ月間で累計最大5300人増えた
  2. 仮にGoToを継続した場合と比べれば、GoTo停止によって同停止中の陽性者数増加は累計約3700人減ると予測される。ただし、GoTo停止中も陽性者数は増えると予測される。

以下では、どのようなデータを用いてどのように影響の測定と予測を行ったかを説明します。再現可能性のため、末尾にソースコードも添えてあります。

【限界、そしてなぜこんなことをしてるのか】
ただし、上述の解析には大きな限界があることも強調しておく必要があります。

GoToの影響の検証や予測は控えめに言ってもとても難しい問題です。コロナ禍中の激変する世界に住む私たちは、陽性者数の変遷データのみを頼りに、GoTo開始・停止などの政策が及ぼす影響を予測しました。このような試みは、たとえて言えば、「目の前に置かれた一本の糸を眺めるだけで、物理法則を学ぼうとしているようなもの」と言えるかもしれません。

データ分析に関する専門知識のない方でも、それがいかに無理難題かは理解できるのではないかと思います。専門的には「非定常の時系列データに基づく反実仮想の予測」などと呼ばれることがあり、様々な効果の測定や予測の中でも特に難易度が高い離れ技として知られています。このような離れ技を再現性があり信頼できる形で行う方法を、人類は今のところ知りません。

今回公表した予測は難しすぎる問題に取り組んでいると言え、高い確率で失敗し、私たちは恥をかくことになるだろうと予想しています。にもかかわらず、この予測を公開するのにはちゃんとした理由があります。予測自体は失敗したとしても、なぜ失敗したのか、どのようにすれば失敗しなかったのか、といった問題に関する鮮度の高い洞察が得られると期待しているからです。

新型コロナウィルスをめぐる政策論議においては、公衆衛生や経済学といった分野の研究者や大学教授たちが、正しさを検証しようのない分析や議論、喧嘩を延々と続ける光景が目立ちます。データとエビデンスに基づく科学の力が期待されたこの局面で、いったい何が正しく何が間違いだったのか検証されずに時が過ぎ状況が悪化していることに、科学者の端くれとして忸怩たる思いがあります。

このような状況に小さな楔を打ち込みたい。あえて正解か間違いかが白日の元に晒されるような分析と予測をソースコードとともに世に出し、未来の世界から忌憚のない批判を受けたいと考えた次第です。

新型コロナウィルスに関して正しさを検証できる分析や予測と言えば、すでにGoogleが長らく開発運用している陽性者数や死者数の予測基盤があります。Googleのような外来の黒船大企業だけでなく、土着の研究者や企業もこのような試みを立ち上げていくことが大事だと思います。

ここで報告するのは、Googleの陽性者数予測を超え、GoTo停止などの政策介入の影響まで予測しようという企てです。このような無理のある課題に取り組む試みに共感いただける方がいらっしゃれば、ぜひ今後の展開に参画していただきたいです。

公衆衛生・疫学・統計学・機械学習・経済学・政治学などの研究者、データ科学者やエンジニア、そしてこのような試みに資源提供していただける企業・政府・自治体などの皆さんのご協力を特にお待ちしています。末尾の問い合わせ先にご連絡をお願いいたします。

【分析準備】
1) データ

分析および予測にはGoogleCloudPlatform提供のcovid-19-open-dataの検査陽性者数データを使用しました(2020/12/26取得)。2020年1月2日から2020年12月25日にかけての全国の検査陽性者数データを使用します。

2) 効果測定・予測について

GoTo導入や停止のような政策の影響を測定したり予測したりするには、政策を実施した場合と政策を実施しなかった場合の2つの結果の差分を取る必要があります。しかし、現実には政策実施もしくは未実施の結果しか観測することができません。たとえば、GoToを実施した場合には、仮にGoToを実施しなかった場合に感染者数がどうなっていたかを観測することは不可能です。

そこで、観測できなかった方の結果を何らかのモデルで予測し、予測結果を用いて差分を取るアプローチを考えます。また、まだ起きていない政策の効果を予測するためには、未来に政策が実施された場合と政策が実施されなかった場合の両方の結果を予測し、その差分を取ることが考えられます。このような分析の精度は予測モデルの精度に左右されるため、精度の高い予測モデルを構築することが重要になります。まず予測モデルを構築・検証した上で、予測モデルを用いてGoTo導入や停止の影響測定および予測を行います。

3) 予測モデルの構築

予測モデルとして、Facebookが開発したProphet(「預言者」の意味)を用います。Prophetは様々な課題について高精度な時系列予測を行えることが知られており、①時系列の季節性とトレンドを自動的に推定できる、②トレンドの変化点を自動的に推定できる、などの利点を持ちます。GoTo停止による検査陽性者数のトレンドの変化を捉えるという目的と相性が良く、新型コロナ感染のトレンド、他新型コロナ政策の導入などの外的なイベントを考慮するのにも適していると考えられるため、ここではProphetを採用します。

Prophetで時系列予測モデルを構築するに当たり、複数の部分時系列の予測誤差を最小とするパラメータの探索を行い、最小の予測誤差を実現したパラメータを採用しています。

ProphetはSIRモデル等の感染症流行固有のモデルとは違い、時系列データを用いた汎用的な予測モデルです。汎用的で単純な予測モデルの性能をまず検証し、その結果を踏まえて人流など感染症流行に特有の構造・情報を加えて予測モデルをより精緻にしていく予定です。

【分析結果】
1) 予測モデルの精度を検証する

まず、Prophetの予測モデルが実用に足る精度を持っているか検証を行いました。具体的には、コロナウイルスが流行しはじめた2020年3月1日から12月14日までの陽性者数データをProphetに学習させ、12月15日から12月25日までの11日間の陽性者数の予測を行います。その結果を示した図1では、黒点がProphetの学習に用いた実測値データ(3月1日から12月14日)、青線がProphetの予測値、赤点がProphetの学習に用いていない12月15日から12月25日までの陽性者数の実測値データを表しています。すべての図について、線の周囲の影(薄い色)の部分は80%信頼区間を表します。

12月15日から12月25日までの予測値と実測値は似通っており、陽性者数の予測誤差は平均して約5%または約210人に留まっています。(評価指標の平均絶対誤差率(MAPE)= 0.0528、平均二乗誤差(MSE)=45676.265)

Prophetは一定の予測精度を備えており、影響測定や予測に用いる意味があると考えられます。もちろん、環境に大きな変化(トレンド変化など)が生じた場合にはProphetの予測が役に立たなくなることもある点には注意が必要です。

図1 Prophetによる全国の検査陽性者数の予測値と実測値の比較図1 Prophetによる全国の検査陽性者数の予測値と実測値の比較


2) 7月のGoToトラベル開始の影響を測定する

Prophetの予測を用いて、7月22日に東京を除いて導入されたGoToトラベルが陽性者数に与えた影響を推定してみましょう。まずGoToトラベルが実施されなかった場合の1ヶ月間(7月22日から8月22日)の陽性者数の予測を、3月1日から7月21日の陽性者数データをProphetに学習させて行います。その予測値と、GoToトラベルが実際に実施された後の同じ期間の陽性者数の実測値の差分を取ることで、GoToトラベル実施の影響が得られます。

図2の一番上の図では、黒線が全国検査陽性者数の実測値、青点線がGoToトラベルを実施しなかった場合のProphetによる予測値を表しています。GoToトラベル実施後には青点線が黒線を下回っているため、GoToトラベル実施によって全国検査陽性者数が増加した可能性が示唆されます。このような分析は広く因果インパクト法(Causal Impact)と呼ばれ、私たちの分析は因果インパクト法における予測モデルとしてProphetを用いたものと言えます。

この点をより詳しく理解するため、中央の図はGoToトラベル実施の影響(一番上の図の黒線と青点線の差分が表す陽性者数の増加分)を日毎に示しています。最後に、一番下の図では、陽性者数の増加分の累積を示しています。GoToトラベル実施により、その後の数週間で陽性者数が最大で累計約5300人増えたという試算を得ました。

ただし、GoTo等の緩和政策に対して検査陽性者の増加が遅れて現れる(感染から発症、報告に至るまでの8〜11日程度)点を組み込めていないため、不完全な測定であることには注意が必要です。また、緊急事態宣言収束後、GoToトラベル以外にも飲食店再開や都道府県間移動緩和などが段階的に行われているため、それらの影響も混じってしまっている可能性は否定できません。GoToをはじめとする段階的な緩和政策を取らなければ、より強固な封じ込めができたのではないかということを示唆していると考えるのが安全です。

図2 GoToトラベル実施による全国検査陽性者数への影響図2 GoToトラベル実施による全国検査陽性者数への影響

  
3) 10月のGoToトラベルへの東京参加・GoToイートの影響を測定する

 

10月1日の東京のGoToトラベル参加とGoToイートの実施の影響はどうでしょうか?これらのGoTo第二弾の実施が陽性者数に与えた影響を推定したのが図3です。読み方は図2と同じです。一番下の図が示すように、全国検査陽性者数の増加分の累積値はGoTo第二弾開始後1ヶ月で約3800人強という試算になります。それ以上の長期に関しては、気温の低下による感染力の増大など外部要因の影響が考えられるため、あくまで参考程度に捉えていただければと思います。

図3 GoToトラベルの東京参加・GoToイート開始による全国検査陽性者数への影響図3 GoToトラベルの東京参加・GoToイート開始による全国検査陽性者数への影響


4) 年末年始のGoTo停止の影響を予測する

私たちの最終目的に関する結果をまとめたのが図4です。まず、3月1日から12月25日の検査陽性者数データでProphetの予測モデルを学習し、GoToトラベル・GoToイートが12/28以降も継続する(つまり政策に変化がない)場合の2週間後までの結果を予測しました。そこから図2で得た7月22日開始のGoToの効果を差し引いたものをGoToが停止された場合の予測値(停止予測値)として採用しました。7月22日開始のGoToの効果と、12/28停止のGoToの効果の大きさが等しいという単純化の仮定に基づいたものです。12月27日時点で既に東京のGoToトラベルは停止もしくは自粛要請が出ており、GoToイートに関しても同様に自粛要請が多くの都市で出ているため、影響は限定的であると考え、ここではその影響を差し引いていません。

図4の一番上の図では、黒線が全国検査陽性者数の実測値、青点線がGoToトラベルを継続した場合の予測値(継続予測値)、赤点線がGoToトラベルを停止した場合の予測値(停止予測値)を示しています。赤点線が青点線を下回ることから、GoToトラベルを継続した場合と比べ、GoToトラベルを停止することで陽性者数を減らせることが示唆されます。ただし、GoToトラベルを停止したとしても陽性者数は増加が見込まれることに注意が必要です。

中央の図の青点線は、予測値と実測値のずれを示しています。12/25までの期間で0付近で上下しており、予測が上手くいっていることがわかります。赤点線はGoToトラベルを停止した場合に検査陽性者数に与える影響の推定値を示しており、負の値であることからGoToトラベルの停止は全国検査陽性者数を減らすということが示唆されます。最後に、一番下の図はGoToトラベル停止後14日間における累積効果を示しており、GoToトラベル停止によって14日間で全国検査陽性者数を3700人ほど減らせるという予測結果が得られました。

図4 GoToトラベルを停止した場合と継続した場合の全国検査陽性者数への影響図4 GoToトラベルを停止した場合と継続した場合の全国検査陽性者数への影響


【今後の予定:予測の検証と改善】
以上の分析から、GoToは感染拡大を促しているかもしれず、GoTo停止は感染拡大に歯止めをかける効果がある可能性があることがわかりました。

今後GoTo停止中の検査陽性者や気温などのデータが明らかになるにつれ、図4で行った予測の検証を行う予定です。さらにGoTo停止中の実測値データを用いて図2-3のような分析を行うことで、GoTo停止が感染拡大にどのような影響を与えたかをより信頼できる形で検証できるようになります。地域や時期ごとの細かな検証を行うことで、GoToをどのようにデザインすれば感染防止と経済活動の両立を図ることができるかの議論に貢献することを目指します。

さらに長い目では、年明けのGoTo再開など新しく繰り出される政策の効果を順に予測し、予測を検証していくことを計画しています。予測・検証・改善の流れを繰り返すことで、GoTo停止のようなまだ起きていない政策の効果を予測するためにどのような技術・手法を用いるべきなのか、実装上どのような点に注意すべきなのかといった知見を得られます。

そのような一般的な知見は日本の個々の政策を超えた科学的普遍性を持つはずですので、世界に向けて英語の学術論文・技術文書として公開していく予定です。GoToという特定の政策にとどまらず、様々な政策の効果予測・検証に貢献することが目標です。

【参考資料】
本分析・予測のソースコード
https://colab.research.google.com/drive/19x0zrfSdy3P7zRTfC8kGQ2RcDAxmPJ-q?usp=sharing 

【研究チーム】
粟飯原俊介(半熟仮想株式会社技術統括)、成田悠輔(イェール大学助教授、半熟仮想株式会社代表)、西村祐樹(コロンビア大学修士課程、半熟仮想株式会社)、匿名分析者(大手民間企業データサイエンティスト)

【問い合わせ先】
成田悠輔(イェール大学助教授、半熟仮想株式会社代表)
E-mail: info@hanjuku-kaso.com
電話番号: 03-6822-5496

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

半熟仮想株式会社

20フォロワー

RSS
URL
-
業種
サービス業
本社所在地
東京都渋谷区渋谷2-19-15宮益坂ビルディング609
電話番号
03-6822-5496
代表者名
成田悠輔
上場
未上場
資本金
-
設立
2020年07月