東京都・区市町村毎のコロナ患者数と人口の関係性

東京を中心にコロナ感染者数が急増

連日、東京都のコロナ感染者数が急増しているとのニュースが目に入ってきます。昨日は5000人超との報道があり、いつになったら感染が収まるものか?と不安な日々が続いています。2週間後には1日当たりの感染者が1万人を超えるのではとの予測もあるようで、今後が懸念されます。

ふとした疑問。東京のどの辺りで増えている?

ニュースを見ていると、東京で感染者数が増えた、増えたと騒ぎ立てるような内容が多いと感じます。もちろん感染者の急増はとても心配です。しかし、具体的には、東京のどの辺りで感染者が増えているのでしょうか。新宿あたりがよくニュースに出てはきますが、実際のところどうなのでしょうか。ただひたすら感染者数だけを伝えるのではなく、少し詳しく、例えば、区市町村毎に感染者数がこうなっているからこうしたらよいのでは等、多少の分析があってもよいのではないでしょうか。

予めお断り

東京のどの辺りでと言いましても、どこか特定の場所や人、団体等を責め立てたいわけではありません。ましてやコロナ対策や政策などの良し悪しについての議論をしたいわけでもありません。すでにいろんな専門家が真剣に分析済みなことは承知です。ただ、都が発表するデータ、具体的には、区市町村毎のデータを、もう少し自分なりに詳しく見てみたら何か自分自身がわかることがあるのではないか、というのが事の発端です。ただ単にニュースで知るばかりではなく。以降の記載で、このようなデータだったらすでに出回っている情報だというようなご指摘もあるかとは思います。ですが、今回の主旨は、あくまでも、私自身が自分で調べてみたらこうだった、というのが以降の内容となります。また、以降では、データの表現に従って、コロナの感染者ではなく患者数と表記しています。また、前提として、患者が各区市町村に住んでいるものと見なしています。

東京都の区市町村ごとのコロナの患者数は?

まず、区市町村毎のコロナの患者数をグラフにしてみました。なお、以降の説明において、本州以外の島しょ部は除外しています。

f:id:sukoshidemo:20210806120807p:plain

データは以下より引用させていただきました。2021年8月4日時点の累計数です。

新型コロナウイルスに関連した患者の発生について(第2316報)  東京都福祉保健局 (tokyo.lg.jp)

2316.pdf (tokyo.lg.jp)

こうやってみると、世田谷区、新宿区、大田区辺りが、患者数が多いようです。 

コロナの患者数が多いのは人口が多いからでは?

誰しも直感的に思うかと思いますが、人口が多いほど患者数は多いのでは、ということです。そこで、区市町村毎の人口をグラフにしてみました。

f:id:sukoshidemo:20210806122342p:plain

こちらは以下より引用させていただきました。少し古いですが、平成30年(2018年)3月1日時点での推計とのことです。

都内区市町村マップ|東京都 (tokyo.lg.jp)

ただ単に眺めているだけでもいろいろとタメになります。ざっと見たところ、やはり世田谷は人口が多いのですね。世田谷、練馬区大田区の順に多いです。新宿については、目立って人口が多いというわけでもないということがわかります。

コロナの患者数と人口との相関

では、以上2種類のデータを用いて、患者数と人口の関係を相関図で可視化してみましょう。

f:id:sukoshidemo:20210806123459p:plain

左下が混み入っていて申し訳ありません。軸のスケールを変えて拡大すると以下となります。ここで詳しく見たいのはこの辺りではないのですが、お住まいの場所がないと気になる方もいらっしゃるかと思いましたので、載せておきます。

f:id:sukoshidemo:20210806124036p:plain

 

人口と患者数との相関図より分かること

以上の相関図から何が読み取れるかを少し考えてみます。ブルーの線は原点を通るように引いた直線近似の線でして、R2=0.9211(R=0.96)と大きめの数値のため、一般的には、感染者数と人口との間に強い相関があると言ってよいかと思われます。各区市町村のプロットがこの直線近似の線よりも上にあればあるほど、その区市町村の一人あたりの感染者が多く、逆に、各区市町村のプロットがこの直線近似の線よりも下にあればあるほど、その区市町村の一人あたりの患者数が少ないと言えます。

どこの区市町村がどうのこうの言うのは避けたいので、多くは語りませんが、あくまでもデータから読み取れることとしては、新宿区が比較的右上に位置し直線近似の線よりも上側に位置している、すなわち、感染者の絶対数が多く、一人あたりの感染者も多いという特徴が読み取れるかと思います。ニュースで新宿区がよく取り上げれるのがこの辺りに帰着するのかはどうかはわかりませんが、自分でデータを見てみて、なるほどそうなのかと思ったのは確かです。一方、直線近似の線よりも下の区市町村をざっと眺めてみると、例えば八王子市、町田市、府中市、等々、少し23区から離れた自治体のような気が多いような気がしなくもありません。これはざっとみた印象を適当に書いたまでなので、あくまでも主観です。

面積と患者数の相関はなさそう

また、各区市町村の面積と患者数の関係があるのかどうかも気になったので、同じく相関図にしてみました。

f:id:sukoshidemo:20210806131144p:plain

面積のデータは、人口と同じく、以下を参照しています。

都内区市町村マップ|東京都 (tokyo.lg.jp)

 

面積と患者数については、このグラフを見る限り、特に相関はなさそうです。都心から離れた自治体を除外すれば相関が高まりそうな気がしなくはないですが、島しょ部以外の区市町村を見る限りはこのようになっています。つまり、面積が大きいからと言って患者数が多いというわけではありません。まあ、人口を考慮せずに単にプロットしているので、それはそうだなという結果です。

密度で表した方がよいのではないか?

ここまでいろいろやってみたところで、ちょ、待てよ(ホリさん風)、密度でグラフにした方がよいのでは!?と我に返ったので、仕切り直しました。

ほぼ完成形。人口密度対患者密度

それが、以下の人口密度対患者密度のグラフです。横軸が人口密度で、面積を人口で割っていて、1平方キロメートルあたりの人数です。また、縦軸が患者密度(おそらく造語)で、1万人あたりの患者数となります。それぞれ、基準で規格化したようなものなので、先ほどの面積の例のように、ん?なんか変だぞ、ということにはならないかと思います。

f:id:sukoshidemo:20210806165600p:plain

で、肝心のグラフの方はというと、両者の間に強い相関(R2=0.8872(R=0.94)がありますので、つまり、このグラフから言えることは、人口密度が高いほど、患者が多い、誤解を恐れず言うと、人がたくさんいるところには患者が多い、と言えるかと思います。もちろん、クラスタ等の事例が多々ありますように、一つ一つを見ていけば、必ずしもそうとは限らないと思いますが、統計的には、人が多いところほど患者がどうしても多く出てしまう、という解釈ができるかと思います。また、個々を見てみると、新宿区、渋谷区、中央区、港区、千代田区あたりは、患者が多めの傾向であることがこのデータからわかります。

まとめ

東京都のコロナ患者数を区市町村毎に自分なりに分析してみました。そうしたところ、患者数と人口との間に強い相関がありそうだということ、一人当たりの患者数が区市町村毎に違っていること、人口密度対患者密度から人がたくさんいるところには患者が多くなっていること、を東京都が発表するデータから確認しました。言うまでもなく、各区市町村の中でさらに細かくいろいろな事情があるわけで、ここで書いたことはあくまでも東京都のデータを分析してみた、というまでです。データを客観的に見て、どう対策を立てていくかを考えるのがやはり重要なのではと改めて思った次第です。何はともあれ、一早くコロナが収束することを願うばかりです。

ついでに知り得た情報

今回の分析にあたって、当初Pythonで可視化しようとしましたが、そこまでややこしいデータではなくかえって手間取りそうな気がしましたので、手っ取り早くExcelを使用しました。散布図のラベルをExcelのグラフでつける方法を知らなかったのですが、以下のサイトが大変参考となりました。作成された方、ありがとうございます。

Excelによるラベル付き散布図の作り方 | ブログ | 統計WEB (bellcurve.jp)

 

本投稿は細心の注意を払って作成したつもりですが、もし誤り等ありましたら、ご指摘ください。適切に修正等の対応をいたします。