r-statistics-fanの日記

統計好き人間の覚書のようなもの

R

Rでコロナ接触アプリCOCOAのjsonデータを触ってみたい。通知されないような濃厚じゃない接触の回数も表示させる

R

COCOAログチェッカーが話題になっていたGitHub - ktansai/COVID-19-ExposeCheckerCOCOAログチェッカーcocoalog.jpcocoalog.jp iPhoneからjson形式でCOCOAのデータをエクスポートできるようだ。 それを、COCOAログチェッカーにコピペすると”コロナすれ違い人…

Rで生存曲線にNo at riskを書き入れる。自由に記号なども入れたい。パッケージ非依存。

R

かつての同僚から解析依頼があり、Kaplan-Meier 生存曲線にNo-at-riskを書き込む必要が生じた。今の流行は ggsurvplot() ggkm() などを使用する。お手軽にNo-at-risk入のグラフが作れる。しかし、これだと数式なんかをグループ名に入れたいときに文字化けす…

サンダーの色違い率:解析その2

てぃぼりさんたちがサンダーの色違いの集計を公開されていた。 これは大変だったと思います。本当に頭が下がります。 https://9db.jp/pokemongo/data/4345生データが公開されているので早速ダウンロードした。 https://t.co/WCXCE0xFyC?amp=1前回 サンダーの…

スコットランド独立賛成票が素数~Rで素数をチェックする関数色々

某つぶやきで、スコットランド独立賛成票が素数だと知った#2014.09.23中澤さんの別解など追加しましたhttp://business.nikkeibp.co.jp/article/topics/20140919/271500/目的 #本当に素数か確かめる。 #その前後にどのくらい素数があるか。 #ついでに、素…

多倍長出力をキレイに桁を揃えて出力する(改良版

R

多倍長精度計算結果を見やすく出力 - 裏 RjpWiki さんの所で、多倍長出力をキレイに出力する 記事があった。自分の前の記事だと 小数点以下が出力されて、無駄に長くなってダメダメですね。 反省です。今回もコードを勉強させていただいた。 ありがとうござ…

デスマコロシアム:素数を出力

R

library(conf.design) #この行は抜け道でカウントされないのだ。 cat(primes(997),sep=":") 今回もRで最短だったが、都合の良いideone依存の パッケージを発掘しただけのこと。 自慢にはならないわなー。でも2連続R最短で嬉しい。 mamekinさんの正攻法最短…

デング熱グラフ更新2014/9/18分

今回は感染推定日や発症日から発表までにかかる日数をグラフ化してみた。感染から発表までの日数は17日でほぼ安定。 発症から発表までの日数は12日でほぼ安定。ということで、感染日は9/1まで、発症日は9/6までは 大体固定しており、今後大きくは変わらない…

メタアナリシス reiv()

R

メタアナリシス某つぶやきで、reiv()の存在を知った。 http://www.youtube.com/watch?v=0XFlPB0mEzA http://zanet.biz/R/fct/ma_metafor_unibb.zipよりダウンロードできるらしい。そして、自分自身は使うことはないものの、他人に教えることが多いEZR と結果…

9/12現在のデング熱のグラフ。蚊に刺された人の割合の信頼区間も追加

2014/9/12の18時現在のデータに更新 #18:56年齢階級別の症例数も追加今回今までになかったパターンの出現があり。 代々木公園周辺+新宿中央公園どちらも行っている例が出た。 ただ圧倒的に代々木公園が多いこともあり、今回は代々木公園の 例として扱うこ…

デング熱のグラフ:感染日と発症日9/11

#22:20発症日がずれていたのを手直し。本日9/11の21時現在の最新データに更新 http://www.mhlw.go.jp/bunya/kenkou/kekkaku-kansenshou19/dl/20140911-01.pdf代々木公園以外が増えすぎたので、代々木公園以外にまとめちゃいました。 代々木公園かそれ以外の…

2014/09/10 updte デング熱感染日と発症日:Rで同じグラフ内に表示する

本日19時現在のの最新のデータに更新 http://www.mhlw.go.jp/bunya/kenkou/kekkaku-kansenshou19/dl/20140910-01.pdf代々木公園近辺以外にも広がっている模様。http://www.who.int/mediacentre/factsheets/fs117/en/ http://www.mhlw.go.jp/bunya/kenkou/kek…

デング熱の推定感染日をbarplotしてみた。Rで欠損値のあるbarplotをうまく表示する

#追記 ぐぬぬ、夕方は無かったのに、今見たら新データが出てる。 新データに更新した。 発症日も訪問日も未定なヒトがいて、コードを書き換える必要が。 一つのデータのせいで、修正に20分もかかったよ。本日夕方以降に発表のデータにて、8/23-26あたりが…

某疾患患者の某公園や周辺訪問日をカレンダープロット:今回は潜伏期の確率密度で調整

#追記 昨日と同じカラーのも追加。一部バグ修正。 #感染推定日barplotも追加 #発症日のbarplotも追加参考にした潜伏期 http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0050972PLOS ONE: The Incubation Periods of Dengue Viruses …

カレンダープロットで某疾患の某公園の訪問をプロット

カレンダープロット - 東京で尻を洗う声優の誕生日のカレンダープロット - 驚異のアニヲタ社会復帰への道カレンダープロッットが流行しているので、やってみた。某疾患の某公園の訪問を表示する。複数候補日がある人は、候補日数で割って 重みとする。つまり…

paizaオンラインハッカソン:動的計画法 Rで挑戦

R

天才火消しエンジニア霧島「もしPMおじさんが丸投げを覚えたら」|paizaオンラインハッカソンLiteしえる (cielavenir) on Twitterpaiza_solutions/poh1_2.R at master · cielavenir/paiza_solutions · GitHubPHP - POH Lite 天才火消しエンジニア霧島 0.01秒…

paizaオンラインハッカソン:動的計画法

R

コードを見易く改変した下記記事に変更しました paizaオンラインハッカソン:動的計画法 Rで挑戦 - r-statistics-fanの日記

#dplyr #magrittr のお勉強

R

##dplyr##magrittr http://d.hatena.ne.jp/teramonagi/20140814/1408024760http://d.hatena.ne.jp/teramonagi/20140403/1396529027http://rpubs.com/teramonagi/1112http://meme.biology.tohoku.ac.jp/students/iwasaki/rstats/tidyr.htmlhttp://meme.biolog…

FIZZ BUZZ~デスマコロシアム

R

「第5回デスマコロシアム」問題のトーナメント結果発表です!──優勝者は…! #デスマコロシアム|CodeIQ MAGAZINE 標準出力に、余計な記号やスペースなどなしに 12fizz4buzzfizz78fizzbuzz11fizz1314FIZZBUZZ1617fizz19buzzfizz2223fizzbuzz26fizz2829FIZZBUZ…

比率の差の信頼区間の手法色々

R

単なる覚書 ####比率の差の信頼区間 多分Miettinen and Nurminenlibrary(PropCIs)diffscoreci(10, 100, 20, 150, 0.95) ###正確な比率の差の信頼区間 時間がかかるので注意#library(ExactCIdiff)#BinomCI(100,150,10,20,0.95,CItype = "Two.sided", precisio…

男女別の生命表から平均寿命を計算する

R

厚生労働省の所にデータが有ったので、やり直す。 ##男女別生命表#データフレーム作成 厚生労働省H22国勢調査による完全生命表dat <- data.frame(numeric( 226 ))dat $ x = c( 0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,2…

生命表から平均寿命を計算する

R

mean survial time; AUC of survival curve r-statstics-fan Tuesday, August 12, 2014 1年生存率と5年生存率 - 驚異のアニヲタ社会復帰への道 に触発されて、5年生存率ではなく平均寿命やMSTを計算したくなった。 前回の記事を使って、簡単にコピペでデー…

Rのデータフレームをブログ用にテキスト化してコピペで読み込めるようにする

R

1年生存率と5年生存率 - 驚異のアニヲタ社会復帰への道 に触発されて、平均寿命とか計算したくなった。 平均寿命といえば 生存曲線下面積RMST(Restricted mean survival time)~比例ハザード性が仮定できない生存曲線での代替手法 - r-statistics-fanの日記 …

Rで多倍長精度計算~とりあえず10000の階乗を計算してみる

R

多倍長精度計算パッケージ Rmpfr - 裏 RjpWiki #追記2014.9.20 よく見ると自分の関数は小数点以下も出力されていて読みにくい。 裏 RjpWikiさんの所で、より良い方法の記事が出ました。 <a href="http://blog.goo.ne.jp/r-de-r/e/0dee8bc64bfb50b39e796e207d50969e" data-mce-href="http://blog.goo.ne.jp/r-de-r/e/0dee8bc64bfb50b39e796e207d50969e">多倍長精度計算結果を見やすく出力 - 裏 RjpWiki</a> 多倍長精度計算…

子供がやってた算数問題(その3くらい?)

R

□=1~9(重複しない) ちょ、難しいんだけど。 唯一解なのか分からない。総当りで確認する。 library(e1071)f1 <- function(){s <- permutations(9)ans <- s[,1] / (10*s[,2] + s[,3]) + s[,4] / (10*s[,5] + s[,6]) + s[,7] / (10*s[,8] + s[,9])return(…

生存曲線下面積RMST(Restricted mean survival time)~比例ハザード性が仮定できない生存曲線での代替手法

R

生存曲線下面積RMST(Restricted mean survival time)というのを聞いた。 論文の多くは田舎病院では入手できなかったが、下記は読めた。 Royston, P. & Parmar, M.K., 2013. Restricted mean survival time: an alternative to the hazard ratio for the desi…

アンドロイドのパターンロック~GIGAZINE

R

Android OSのパターンロック認証はアルファベット3文字程度のセキュリティ - GIGAZINE 面白そうな記事があり、自分でも検証したくなった。 パターン認証の各点を 123 456 789 と定義する。 試行錯誤して条件を探ったが、 #4つ以上の点をつなぐ #…

子供がやっていた算数問題:シンプソンのパラドックス

R

最近の小学生はこんなこともやるのかと感心した問題。 うろ覚えだが、こんな感じの問題であった A塾とB塾どちらに入ろうか検討している。A塾の生徒もB塾の生徒も同時に受けた統一模試の結果について問い合わせた。 A塾に聞いた所、男性も女性もB塾より平均点…

表からC-index 傾向スコア 操作変数

R

// C-index // C-index r-statistics-fan Sunday, July 13, 2014 某論文で、傾向スコアと操作変数を使った解析をやっていた。 しかし、どちらもデータベースベースドの研究にありがちな これは調整できてへんやろ感が激しい。 傾向スコアの前提が信頼できる…

7を数える(訂正)

R

0を数える場合の部分を書き直した。 f5 <- function(suuji, z){ if (nchar(z) == 1) { if (suuji == 0){ return(0) }else{ return(as.numeric(as.numeric(z) >= suuji))}} else{ x <- rev(as.numeric(unlist(strsplit(z, "")))) #分解してベクトルに keta <-…

7を数える。検証

R

CodeIQ 7 を数えるの解答例 - 裏 RjpWiki 合っているか自信がないので、裏 RjpWikiさんのコードと自分のコードを 比較して検証してみる。 simn <- 100000res <- matrix(0, nrow = simn, ncol = 2)for (i in 1:simn){ res[i,1] <- func2(i) res[i,2] <- as.in…