コロナウイルスデータ分析―感染者は誰か

このエントリーをはてなブックマークに追加

tokyo

Photo by Louie Martinez on Unsplash

新型コロナウイルスの感染拡大は依然として続いています。様々な感染対策が取り沙汰されていますが、本稿では「感染者属性」に注目、公開されているデータをTableauで分析した結果をお届けします。

都内新型コロナ感染者の年代を可視化

こんにちは、データデザイン部の金岡です。 本稿ではオープンデータ「東京都_新型コロナウイルス陽性患者発表詳細」を利用、コロナ感染者属性をTableauで可視化し、新型コロナウイルス感染拡大を抑えるような施策を考えたいと思います。

上記のオープンデータはこのようになっています。

 
市区町村名、発症年月日、属性、状態、症状、渡航歴はすべて欠損しており利用できない状態です。調査中のものもある上、オープンデータ化には一定の労力がかかるため仕方ないことでしょう。 ただ細かい行政区や発症年月日など、分析に非常に重要と思われる情報も欠損しているため、今後の公開が望まれます。

まずは欠損していない「年代」に着目してデータを可視化します。以下は各月の比較です。

monthly_age

各月各年代構成割合

20代の感染者数割合が増加していっていることが把握できます。日別ではどうでしょうか。 データの公開されている1月24日から7月29日(記事執筆当時)のデータを見てみます。

daily

各日各年代構成割合

縦の線が1日の感染者全数(100%)、着色部が20代割合です。徐々に20代割合が増えていることがわかるかと思います。

男女性年代クロス集計

他にも欠損していない性別を利用、性年代でクロス集計してみます。5月〜7月の各セルの割合でヒートマップにしました。

may_cross

男女性年代クロス集計(5月)

 
june_cross

男女性年代クロス集計(6月)

 

男女性年代クロス集計(7月)

5月は20代女性以外はあまり偏っていませんが、6月/7月は20代男性に大きな偏りを見せています。

考察

東京の労働力で最も多い年齢階級は「45-54歳」です(東京都労働力統計、令和元年集計)。この層の感染割合が大きく増えていないということはおそらくテレワークなどの感染防止策が一定の効果を発揮しているためと思われます。 仮説として、未就業若年者の感染が増加していると考えると「夜の街」来訪自粛の呼びかけには一定の妥当性があると考えられます。

他にも「20代にはコロナ自粛要請が届いていない」可能性があります。 昨今では「Facebook広告」などのパーソナライズされた広告配信が可能です。位置情報を利用できるDSPもあります。例えば「夜の街」にジオフェンスをはり、圏内に入った20代ユーザーへ接触確認アプリの広告配信を実施するという施策が考えられます。マスへの呼びかけももちろん重要ですが、ブランドコミュニケーション同様ターゲットとなるペルソナへのきめ細かいコミュニケーションが、実は感染防止の糸口になるかもしれません。

【お知らせ】
隠れた“高コスパエリア”を見つけられる「Starflake retail」が今なら20%割引でご利用できます

「Starflake retail」は、任意のエリアごとの人口密度と経済的な価値(地価など)を比較、クラスタリングしたデータです。流通業の店舗開発や不動産ディベロッパーの分譲地開拓などで、エリアごとのコスパを把握できます。  

本サービスのリリースを記念して、20%OFFでご利用いただけるキャンペーンを9/30まで実施中。
興味のある方は詳細ページからお問い合わせください。

「Starflake retail」の詳細はこちら

WRITER
Ryo Kaneoka

プランナー

金岡   亮 Ryo Kaneoka

複数の新規AI・データ活用サービスの企画およびPMを担当する。大手広告代理店様/メーカー様のビッグデータ活用の支援等の実績あり。   JDLA Deep Learning for GENERAL 2018、上級ウェブ解析士

最新記事

ページTOPへ