r-statistics-fanの日記

統計好き人間の覚書のようなもの

某疾患患者の某公園や周辺訪問日をカレンダープロット:今回は潜伏期の確率密度で調整

f:id:r-statistics-fan:20140906153548j:plain

f:id:r-statistics-fan:20140906203852j:plain

f:id:r-statistics-fan:20140907011411j:plain

f:id:r-statistics-fan:20140906153228j:plain
f:id:r-statistics-fan:20140906131956j:plain
f:id:r-statistics-fan:20140906132115j:plain

#追記 昨日と同じカラーのも追加。一部バグ修正。
#感染推定日barplotも追加
#発症日のbarplotも追加

参考にした潜伏期
http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0050972PLOS ONE: The Incubation Periods of Dengue Viruses


元データ
http://www.mhlw.go.jp/bunya/kenkou/kekkaku-kansenshou19/dl/20140904-02.pdf

複数の訪問候補日がある場合、潜伏期の確率分布からその日毎の重みを
計算する方式に変更してプロットしてみた。各個人の重み総計は1に調整。
データも最新のものにした。

でも、あんまり前回と変わんなかった。
あんまり変わらんと思ったけど、元の重みに比べて
16日から22日の推定感染者数の数が増えた感じ。
18日には約6人も感染したのか。
26日でも約3人。潜伏期から発症して、更に気がついて検査して、
更に確定するまで時間がかかることを考えると、潜伏期平均6日、
発症から診断できる医療機関受診まで2日、検査結果2日、発表1日
と見積もっても、11日のタイムラグ。
まだ、8/26から今日は11日目。まだまだこの表の後半はimmatureだね。
今後蚊の殲滅作戦が効果あればいいけど、結果がわかるのはまだ先の話。

発症日のbarplotも追加したけど、蚊に刺されて感染した日の方が
経過が分かりやすいね。


%>%だと、データ内の変数が優先された。グローバル変数を無理に読み込む
の抵抗あるしなあ。attach()的な危うさを感じた。便利な部分もあるけど、
まだ慣れないと常用は出来ないなあ。


library(plyr)
library(dplyr)
library(magrittr)
library(openair)
library(tidyr)


data  %>% gather(key = d1, value = date, -1:-8, na.rm=TRUE, convert=FALSE) %>%
      mutate(date = as.POSIXct(date, origin =  "1970-01-01 00:00:00 JST")) -> data
data$from.onset <- as.numeric(difftime(data$onset, data$date) / 60 / 60 / 24) #なんか%>%うまくいかん
#data$from.onset おかしな値の確認
data %>%  filter(from.onset >= 2 , from.onset <= 15) -> data
data$wt.d <- d1[data$from.onset - 1] #%>%だと、データ内の変数が優先。グローバル変数を無理に読み込むのもなあ
#%>%の中だけで機能する変数の作成機能があればいいのに
data %>% group_by(num) %>% summarise(wt.sum = sum(wt.d)) -> temp3
wt.sum <- temp3[,2]
data$wt <- (1 / wt.sum[data$num]) * data$wt.d

dat2 <- count(data, vars="date", wt_var="wt")   

dat2$date <- dat2$date + 9*60*60

calendarPlot(dat2, pollutant = "freq", year = "2014", cols="heat")