[確率論的なアプローチによる感染拡大シミュレーション] 新型コロナウィルスの感染者予測は果たして正しいのか

  

以前のブログ記事 [確率論的な科学が誤信を防ぐ] で、「決定論的な」科学よりも「確率論的な」科学のほうが、現代社会の問題解決には有効であるという話に触れました。


その確率論的な科学に対する理解を深めようと、学生時代に履修した確率過程 (Stochastic Process)を勉強し直しているところなのですが、マルコフ過程の統計的応用のところで偶然に「流行病のモデル」が出てきました。


流行病のモデルでは、従来の「決定論的モデル」には限界があり、現実の世界での感染拡大予想には「確率論的モデル」のほうがより適切というような記述がされています。


新型コロナウィルスの蔓延防止が喫緊の課題となっている現在、これほどタイムリーなネタもないということで、いろいろ調べてみたところ、どうやら、世間一般に報道されている感染拡大予測の多くは、従来の決定論的モデルで導き出されていることがわかりました。


東京都の新規感染者予測
(WBS 2021年5月28日の放送より)


これは果たして正しいのでしょうか?


国が公式に発表している感染拡大のシナリオを疑問視することは、社会的責任のある専門家であれば、不必要に社会を混乱させてしまう恐れもあるので迂闊にはできないと思いますが、私のような専門外の人間であれば問題はないでしょう。


個人的には、ワクチン接種が進んで新型コロナウィルスの収束がいよいよ近いというような最近の社会風潮に対して、何となく違和感を感じています。


以下、素人の分析なので、突っ込みどころ満載かもしれませんが、ブログにまとめてみました。

1. 決定論的モデルと確率論的モデル

以前のブログ記事「[確率論的な科学が誤信を防ぐ] 『人間 この信じやすきもの』( T・ギロビッチ) - 誤信を持たないための処方箋」で、いろいろな誤信を防ぐための「確率論的な」科学教育の重要性について書きました。

著者は巻末で、誤信を持たないためには、「決定論的な」科学(物理学や化学)よりも「確率論的な」科学(統計学、確率過程)のほうが有効であると提言しています。

「確率論的な」科学の確率過程について、学生時代の教科書を引っ張り出して、もう一度しっかりと学習しようと計画を立てることにしたのは、ブログに書いたとおりです。

学生時代の参考書に加えて、図書館から「確率過程入門 - 理論と応用」という参考書を借りてきました。


この書籍は、1968年初版の古いものですが、マルコフ連鎖、マルコフ過程、ランダムウォーク、マルチンゲールなどの基礎はもちろん、オプションの価格付け、人口成長、遺伝学、スペクトル解析などの応用や発展まで幅広くカバーしています。

本書を読み進めるうちに、マルコフ過程の統計的応用のところで偶然に「流行病のモデル」という項目に出くわしました。

第4章「いろいろの統計的応用」の 4.4「流行病のモデル」では、人から人への伝染の伝達に関係する確率モデルが吟味されています。

そこには

「これまで決定論的モデルばかりが論じられてきたが、これまで、個体数が多いときの流行病の成長と蔓延をしばしば十分にうまく説明するのに役に立ってきたが、個体数が少なく、また特に流行病の発生の初期の段階では、適当でないことは明らかであろう」 

と書かれています(下の見開きを参照)。


決定論的モデル(Deterministic Model)では、確率母関数は、以下のとおり定義されます。


決定論的モデルでは、S(罹病性の個体の数)とI(実際に感染した個体の数)にともなうランダムな変動は無視されています。


(細かい式の展開は省略しますが)1920年代にロンドンで流行したハシカの場合は、このモデルを使って、2週間の潜伏期と想定し、73.7週という期間と、ピークからピークへの減衰率0.58を算出しています。

しかし、前述のとおり、大きな集団における過程の構造上の傾向を示すのにはある程度役立つが、もっと完全な確率論的モデルを考慮して裏付けられるのでなければ、誤解に導いしてしまう恐れがあります。

現に、ロンドンのハシカの場合の感染率 λ は、ロンドン全体に散らばっている子供たちの非常にバラつきの大きい感染率の平均としてならば別ですが、特定の学校の感染率の数値とはあまりに現実と乖離があったとされています。

一方、確率論的モデル(Stochastic Model)では、決定論的モデルで示された風土病的な安定した平衡状態に到達するはずであるという予測ではなく、(人口理論と同じように)永久的ではないものであること、すなわち、非常に大きな感染率か、または感染の消滅のいずれかに落ち着くものと想定されます。

完全には隔離されていないグループ(寄宿学校のような)では、罹病性の個人の数が十分高い水準に達したときには、いつでも新しい感染源が外部から入ってきて、各流行病の”引き金を引く”ために、頻繁に一連の流行病が(減衰しないで)再発することがあります。

上記の説明は、ハシカについてですが、新型コロナウィルスの状況にも見事に当てはまります。

つまり、隔離されていないグループとは、例えば日本や東京といった地域を意味しており、外部からの新しい感染源とは、外国からの旅行客や、オリンピック開催の関連で他の地域から移動してくる感染源(例えば国内の旅行客)に該当します。

ワクチン接種が進むつつある現在、新型コロナウィルスはようやく制御することができ、経済問題も解決するように感じられます。


ワクチンや非常に優れた治療法があったとしても、人類は今後「数十年」にわたって新型ウイルスと共存していくことになる

という指摘があることを忘れてはいけないと思います。

確率論的モデルでは、時刻 t までに流行病が消滅する確率は、以下の数式で表されます。


1つの町のような大きな連続区域全体にひろがるハシカのような流行病に、準周期性が観察されるとき、これが上のような確率論的機構によってどこまで維持されようとするかについては、なお議論を必要とする。

下のグラフは、寄宿学校におけるハシカの継続的な発生をシミュレートする疑似流行病系列から取ったものです。


9月に大発生したあとも、小発生が起きています。

まさに現在ロンドンを始め世界の各地で起きている新型コロナウィルスの発生パターンと似ていますね。。。

冒頭のWBSの新規感染者予測のグラフのように、世間に公表される予測は、どれも一律にピークから急速に収束するパターンのものがほとんどですが、それは決定論的モデルを前提にしているからです。


決定論的モデルでは、新規感染者がいずれゼロになって、感染率がある程度高止まりをした状態、すなわち集団免疫(人口の60~80%が免疫を持つ)状態でパンデミックが収束するという予測です。

一方、確率論的モデルでは、何年にもわたって感染拡大と縮小が繰り返されたのち、非常に大きな感染率か、または感染の消滅のいずれかに落ち着くものと考えられます。

決定論的モデルの特徴として、たとえば将来の人口成長予測では、集団の絶滅は無限大でのみ起こるのに対して、確率論的モデルでは有限時間内で起こりうるという違いがあります。

一体、どちらの予測が正しいのでしょうか?

2. SIRモデルの限界

現在、感染症の一般的な数理モデルとして最も使われているのが 「SIR モデル」と呼ばれるものです。

「流行が収束するまでに人口の60%が感染」するという予測はこのSIRモデルに基づくものです。

SIRモデルのSとはSusceptible(感受性者:ワクチンがない場合は非感染者とみなしてよい)、IとはInfectious(感染性者:感染力のある感染者)、そしてRとはRemoved(除去者=病院に隔離された人+抗体を獲得して感染しなくなった人+死亡者)です。

SIRモデルの詳細については、「専門家の対策に根拠あり、新型コロナは制圧できる」の記事を参照ください。

SIRモデルの歴史は、1927 年に英国のケルマックとマッケンドリックが、微分方程式によって、人口集団における一回の感染症流行を記述するモデル(SIR モデル)をはじめて定式化したことに遡ります。

上の「確率過程入門 - 理論と応用」に記述されている、決定論的モデルの限界については、本文中にも明記されていますが、このケルマックとマッケンドリックのSIRモデルの限界を指摘しているのです。

にも関わらず、新型コロナウィルスの予測に、SIRモデルが幅広く使われているのは、SIRモデルが数理解析の基本中の基本だからです。

SIRモデルを新型コロナウィルスに適用することに対する批判は、国内のCOVID-19有識者会議の公式ページでも、以下のとおり詳しく触れられています。

(以下引用します)

2020 年4 月15 日に、メディアは、COVID-19 の感染拡大で、人と人との接触を減らすなどの対策を全く取らない場合、国内では重篤患者が約85 万人に上り、半数が亡くなる恐れがあるとの試算を厚生労働省のクラスター対策班の西浦博教授が公表した、と報道した。このことは大きな衝撃を持って受け止められたが、その計算の基礎は多状態のSIR モデルであった。

(中略)

要するに、SIR 型のモデルを固定パラメータで使用する限り、日本人口全体をホストとして一様な混合状態にあるものと仮定した上で、基本再生産数としてR0 = 2.5 程度を設定すれば、巨大な感染ウェーブが発生して、感染の自然収束までに9 割方の人口が感染してしまうという結論は、ほぼ動かないのである。

しかし、一方で、致命率が無視できないような感染症において、人々が回避行動をとらないということはない。したがって接触頻度という社会的変数を含む感染伝達係数は時間的に不変であるはずはない。また入院、治療、隔離などの影響もある。さらに根本的なことに、ホスト個体群は一様に混合しているわけではなく、感染過程に関わる人口サイズそのものが可変的であるとも考えられる。固定パラメータを用いることは、人々の回避行動や政策的介入効果などを反映することは出来ない。

(引用おわり)

つまり、SIRモデルは、全体的なざっくりとした予測には有用であるが、長期的な感染者予測、特にさまざまな変動要因(季節変動、ワクチン接種、隔離対策など)を勘案した長期的予測には大して役に立たない、ということです。

3. 確率論的モデル

では、確率論的モデルではどうでしょうか?

以前のブログに書いたように、確率論的モデル(Stochastic Model)のStochasticというのは、確率論(Probability)と違います。

日本語ではどちらも「確率論」となってしまい紛らわしいのですが、確率過程(Stochastic Process)と確率論(Probability)と違いは、「「確率的」を意味する「Stochastic」と「Probabilistic」(Probability)は何が違うか?」というサイトの解説がわかりやすいので、以下引用します。

「何%の確率」(=イベントが発生する可能性の高さ)などという一般的な意味の「確率」は、英語で「probability」です。その関連用語(形容詞化?)が「probabilistic」(確率的)です。確率(probability)に関する数学の一分野は、「確率論」(Probability theory)と呼ばれます。

一方、統計分析において「ランダムに決定するプロセスであること」は、英語で「stochastic」です。日本語では、同じく「確率的」と訳されますが、、むしろ「確率論的」という訳語の方が適切かもしれません。というのも、「stochastic」の「ランダムに決定するプロセス」は、確率論(Probability theory)に基づく考え方であるためです。つまり「stochastic」は、あくまで確率論の一部であり、特に「ランダムであること」が重要なのです。

「probabilistic」には、「ランダム」の意味はなく、シンプルに「イベント発生の可能性であること」だけを示しています。そこが両用語の使い分け基準になるかと思います。

(引用おわり)

平たく言ってしまえば、確率過程とは、(ある物事の到着や事象の発生が)ランダムという事象に特化した確率論のことです。

前述のとおり、確率論的モデル(Stochastic Model)では、決定論的モデルで示された風土病的な安定した平衡状態に到達するはずであるという予測ではなく、(人口理論と同じように)永久的ではないものであること、すなわち、非常に大きな感染率か、または感染の消滅のいずれかに落ち着くものと想定されます。

ネットを検索すると、確率論的モデルを使った新型コロナウィルスの感染拡大シミュレーションをいくつか見つけることができました。

例えば、「Analytica を使った COVID-19 のモデリング」というサイトでは、確率的マルコフ連鎖シミュレーションを使用した COVID-19 パンデミックのオープンソースモデルを公開しており、無料でダウンロードすることができます。

マルコフ連鎖シミュレーションモデル

プログラムをオープンソース化することにより、モデルの出力をより快適にするためではなく、より良い決定を行うために使えるようにするため、とあり、公共性の高い試みであることがわかります。

このプログラムでは、以下のような様々な要因を含めて拡張できる可能性があるとされています。

(以下引用)

自然免疫 — おそらく、人口の中にアンらかの理由で「自然の」免疫があるのです。それは、人口の一部がすでにコロナウイルスに免疫があるかもしれない、ということであるかもしれません。

季節性 — 一般的なインフルエンザと同様に、夏の感染の可能性を低下させる何らかの要因がある可能性があります。例えば、ドイツのロバート・コッホ研究所は、季節性の可能性と既存の免疫を考慮した論文を発表しました。

人口のセグメンテーション — コロナウイルスに感染すると、明らかに高齢者が深刻な合併症を発症するリスクが大幅に高くなります。そもそも感染することとは異なる親和性があるかもしれません。あるいは、若い人たちには自然免疫があるとか。。。

その他のNPIと戦略 — 社会的距離をとる措置は、主に毎日の相互作用の数を減らしますが、他の手段で感染する可能性を減らすことができます。手洗いがその1つで、マスク着用はさらに効果的です。人々を分離し、恐ろしいコストで経済をシャットダウンする代わりに、マスクを生産して人口全体に提供する方がはるかに安価になるかもしれません。。。ほぼすべての人にいきわたるようにスマートフォンを生産することが可能なのであれば、マスクのような単純なデバイスを生産するのはそれほど難しくありませんよね?

健康状態のさらなる細分化 — おそらく「病気」と「深刻な病気」の区別では十分ではないかもしれません。これは医療の専門家が貢献できる潜在的な分野でした。

利用可能な ICU ベッド、人工呼吸器などに応じた死亡率 — 明らかに、重症患者の数が医療システムの能力を超えると、深刻な症状から回復する可能性が大幅に減少します。

NPIのコストを含める — 現在、モデルには社会的分離のさまざまなレベルの影響のみが組み込まれています。さまざまな対策(学校・店舗の閉鎖、大規模イベントの中止、生産の停止など)が削減レベルにどの程度効果的かをモデル化できていません。

※NPI - (主に政府による大規模な)非医薬品介入(Non-Pharmaceutical Interventions)

(引用おわり)

このオープンソースモデルによるドイツを対象にした試算では、社会的距離を置く措置(50% の接触削減のレベル)を想定して90日間維持しても、今後12ヵ月でウイルスに感染する人は 6,000 万人近く(ドイツの人口は約 8,000 万人)に達すると予想され、また他の要因がない場合(下記を参照)、コロナウイルスに対する一般的な集団免疫に到達するまで感染が広がると予測されました(2020年4月時点)。

これは、12ヵ月後に約 250 万人が死亡し、7月末には 200 万人が重症になることを示しています。これはドイツの医療制度の能力をはるかに超えていました。

実際には、2021年6月時点でのドイツの感染者数は373万人、死者数は9万人に抑えらえているので、オープンソースモデルでは組み込まれていない要因(上記のNPIなどの対策)が功を奏したと言えます。

また、「時空間ランダムウォークモデルによる感染対策の検証」というサイトでは、特定対象地域の二次元空間(地理空間)におけるランダムな人の動きをランダムウォークモデルで表現し,接触する二者の間での感染を計算するモデル構築を試みています。

一方、国内のCOVID-19有識者会議の公式ページでは、「SIR モデルによらず、データへの数学的曲線あてはめによる流行予測が、大阪大学の中野貴志教授によって提案され、その主張は「K 値」という指標によって人口に膾炙することとなり、大阪府や神奈川県においては参考指標として採用され、行政的影響を持つこととなった」とあります。

「K 値」は、一時期ニュースなどでも盛んに報道されていたので、耳にしたことのある機会が多かったと思いますが、K 値モデルの本質は、累積症例数曲線をゴンペルツ曲線というテストで発見されるバグ数をグラフにした曲線にみなすことで、近似的に感染拡大を予測する手法です。

K値によるシミュレーション(2020年5月 出典:西日本新聞

短期的な累積感染者数に対しては、ゴンペルツ曲線がよく当てはまったという報告もあったようですが、長期的な感染拡大の予測にはあまり役立っていないようです。

実際、最近のニュースでは、K 値について一切報道されなくなってしまいました。

K 値は、決定論的な科学でもなければ、確率論的な科学でもないので、感染者数の推移を予測することができなかったのです。

そもそも、COVID-19有識者会議では、SIRモデルに拠り所を置いている姿勢を一貫しており、確率論的モデルについては、その可能性にすら言及されていません。

このように、確率論的モデルによる新型コロナウィルスの感染拡大シミュレーションは、まだ確固たる手法が確立されていないようですが、その手法の有効性は50年以上も前から認められているにも関わらず、なぜ利用されていないのか。。。

新型コロナウィルスの発生以来、感染拡大の予測技術は飛躍的に進歩して、関連する特許申請や論文の数も指数関数的に増加していると、どこかで読んだ記憶があります。

決定論的モデルとは違い、確率論的モデルでは、新型コロナウィルスの脅威は、変異を繰り返しながら、今後何年にもわたって沈静化と蔓延を繰り返し、「コロナに打ち勝つ」というより「コロナと共存する」という社会的仕組みに変わってゆくと予測します。

私自身、確率論的モデルを使った流行病のモデルをよく理解できていません。特に、確率過程の基礎となる確率母関数や、偏微分方程式、またその拡散方程式を理解できていません。

確率過程の数式展開を読み解くのは至難の業ですが、なんとか過去の記憶を頼りに理解を深められればと思います。

4. 感染者予測は果たして正しいのか

私のような門外漢の人間が、世間の多くの専門家が導き出した新型コロナウィルス感染拡大の予測に対して疑念を抱くというのもどうかと思いましたが、感染拡大が当初の大方の予測に反して未だに収束していない状況を鑑みると、従来の予想を「疑ってかかる」のも悪くないのではないでしょうか。


人間は、自分が考えている以上に錯覚を起こしやすい


これは、『錯覚の科学』(クリストファー・チャプリス)と『人間 この信じやすきもの』( T・ギロビッチ) 両冊の心理学書に共通したメッセージです。


『錯覚の科学』と『人間 この信じやすきもの』


国の公式の見解であるコロナウィルスの感染拡大シミュレーションといえども、予測を鵜呑みにせず、疑ってかかるのが正しいのではないでしょうか?


ひょっとしたら、最近読んだ『昭和16年夏の敗戦』(猪瀬直樹)の影響で、大本営発表的な楽観論に不信感を強く抱いてしまうクセがついてしまったかもしれません(笑)

国やマスコミの言う事なんて信用できないと主張するつもりはありませんが、(自衛の意味も含めて)国が言っていることや報道されていることは間違っているわけがないと決めつける前に、まず自分で考えてみたり調べたりする習慣は大事だと思います。

我々人間は誤信しやすいのですから。。。

国内ではワクチン接種100万回/日の目標に迫り、集団免疫となる国民68~80%の接種率も視野に入ってきました。

最近の米国の経済復調を見据えて、6か月遅れで日本も経済回復が見込めるという時期に、水を差すようで恐縮ですが、国内だけでなく全世界の経済回復の見通しはあまりに甘いのではないかと思います。

昨年の春に、コロナ禍によって4回もの緊急事態宣言が発令されるほど事態が長引くと、専門家を含めて一体誰が予想したでしょうか??

(WBS 2020/12/3放送より)

「歴史上、良いワクチンが導入され病気がなくなるには最低3~4年かかる」(東京大学 医科学研究所 石井健教授)

御意。。。

ワクチン接種が進んだところで新型コロナの感染力が衰えるわけでもなく、むしろ新しくてより深刻な変異株が次々と出現すると考えるほうが自然ではないでしょうか?

つまり、現在のコロナ禍は、ワクチン接種が進んで集団免疫(人口の60~80%が免疫を持つ)状態を実現できたとしても、それだけで収束するというのは間違いで、その後何年にもわたって第5波、第6波、第7波といった具合に感染拡大と縮小を繰り返すというのが正しい予測ではないでしょうか??

そして、確率論的モデルで予測されるように、何年、もしくは何十年にもわたって感染拡大と縮小が繰り返されたのち、非常に大きな感染率か、または感染の消滅(ほぼ全国民が感染を通して免疫力と抗体を持つ)のいずれかに落ち着くというシナリオが正しいのではないかと思います。

インフルエンザ感染が、ワクチンがあっても何十年に渡って一向に減少しないのと同じです。

ワクチン接種は、一生に一度打てば生涯安全というものではありません。そもそもワクチンの有効性についての疑問も残ります。

確率論的モデルで予想されるように、集団免疫とコロナ沈静化、その後の再発のサイクルを、何年間にもわたり繰り返すというシナリオのほうが、説得力があるように思えてしまいます。

コロナ禍の一日も早い収束を心から願う一方、ワクチン接種によってコロナ禍がじき解決するといった楽観主義に対しては、過信することなく慎重に受け止めるべきと感じています。

(2021年7月6日 追記)
昨晩のWBSで、新型コロナ新規感染者数の予測(米国)のグラフが紹介されていました。

WBS(2021年7月5日放送)より

7月以降は年末まで抑え込みに成功するグラフです(出所:みずほリサーチ&テクノロジーズ)。

こんな楽観的な予測を今まで何度目にしてきたことでしょうか??

米国のワクチン接種が67%まで高まっているのは事実ですが、一方、ファイザー製ワクチンの予防効果が95%から64%まで低下しているという報告もあります。

デルタ株以外の新種のウィルスの発生とか、ワクチン接種後の再感染とか、いろいろあってこんなんで本当に良いのか、と思ってしまいました。

コメント