twitterで雨の日=頭痛を検証してみる

雨が多いこの頃です。頭痛です。
昔は雨の日が好きだったのですが、ここ数年ほどは頭痛や体調不良が起きやすい体質になってしまったとなと感じていました。

「そういえば自分のツイートってDL出来たなー」とふと思いついたので、自らのツイートと気象データを元に検証してみました。

結論としては「まったく関係無いという訳でもないかも……?」でした。

※以下はあくまで私自身のツイートと降水量だけを元にした検証内容です。広く一般的にそうであると言えるような内容・精度のものではありませんのでご留意ください。

1. まずはツイートを全件DLします。twitterにログインし、設定画面の「ユーザー情報」→「全ツイート履歴」から全件DLを申請する事が出来ます。サーバー側で準備が出来たらtwitterよりメールが届き、DLページからDLする事が出来ます。

全ツイート履歴

2. 気象データを用意します。気象庁のWebサイトから過去の気象データがCSV形式でダウンロードできるようになっています。今回は過去1年間の降水量をDLさせて頂きます。
http://www.data.jma.go.jp/gmd/risk/obsdl/index.php

気象データダウンロード

3. 表計算ソフトでまとめていきます。ツイートデータのzipを展開するとCSVが含まれており、気象データともどもExcelやLibreOfficeなどで閲覧可能です。

4. ツイート本文から体調不良と思われる日を抽出します。フィルターを用い、シンプルに「体調が」「頭痛」「頭が痛い」「体調不良」だけ拾う事にします。わざわざつぶやいているほど頭の痛い日はそんなに数も出ないので、明らかに誤ヒットな部分は目で見て削除します。

フィルタリング

5. 昨年の5月はだいぶ体調が悪かったようです。そういえばそうでした。体調が悪かったことが明確なので5月1日~26日までの降水量も集計します。また、一日に何度も頭痛について呟いている日は1つだけにまとめます。

5月1日から

6. 結果です。

1年間の平均降水量: 5.03689
1年間の体調不良時平均降水量: 9.42408

気象データだけを見た1年間の平均降水量と、体調不良だった日の平均降水量を比べると、4.4mm多く雨が降っているようです。統計にしても気象にしても詳しくなく、なんとも言えない差ですが、「まったく関係無いという訳でもないかも……?」と思えるぐらいの違いかなぁ、と。

集計結果

感想1:自己ツイートにしても、気象データにしても簡単にDLする事が出来、内容も普通の表計算ソフトでちゃちゃっと閲覧編集できる内容です。他にも休日をどう過ごしたかなどいろいろデータの取り方は有るでしょうし、自分自身を数値的に振り返ってみるというのも面白いんじゃないでしょうか。

感想2: 今日も頭が痛い。