専門外の人でも『遺伝統計学の基礎』を読むべき理由
はじめに 今日は、以下の遺伝統計学に関する本を紹介したい。タイトルに「遺伝統計学」と書かれているが、遺伝と関係のない分野の人にとっても、統計を学ぶ際に有用な本であると思う。 山田亮 (2010). 『遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析』 東京:オーム社....
View ArticleMac版のRのグラフに文字が出ない場合の対処法
グラフに文字が出ないという状況 前に、MacOSでRを使ってグラフを描いていたら、他のものは表示されるのに、文字だけでないというトラブルが発生した。百聞は一見にしかず。以下の図をご覧いただきたい。 Mac版のRでグラフを描いたところ文字が表示されない状況に 本来は、以下の図のように文字があるグラフが描かれるはずなのだが、なぜか文字が出なかったのである。 しっかり文字が表示されたグラフ...
View ArticleRのバージョン3.1.0がリリース
バージョン3.1.0のリリース 2014年4月10日、R のバージョン3.1.0がリリースされた。コードネームは Spring Dance(春の踊り)である。バージョン3.0.0がリリースされたのは、2013年4月3日なので、およそ1年を経てマイナーバージョンアップが行われたことになる 。 Rのバージョン3.1.0のコードネームは Spring Dance(春の踊り)である。...
View ArticleRのバージョン3.2.0がリリース
バージョン3.2.0のリリース 2015年4月16日、R のバージョン3.2.0がリリースされた。コードネームは Full of Ingredients(素材でいっぱい)である。バージョン3.0.0がリリースされたのは、2014年4月10日なので、およそ1年を経てマイナーバージョンアップが行われたことになる 。 Rのバージョン3.2.0のコードネームは Full of...
View ArticleRのngramパッケージを使ってnグラムを作る
nグラムの生成 Rでnグラムを生成するためのパッケージ ngram について紹介する。ngram はCRANを通じて配付されているので、Rで install.packages(“ngram”) と入力すれば簡単にインストールできる。ただ、このパッケージはできることが少なく、使い勝手は総じて良くない。 このパッケージを使ってnグラムを作るには、文字列が入った変数を引数にとって ngram...
View ArticleRを日本語Windowsで使うときにアクセント付きのローマ字を扱う方法
アクセント付きのローマ字がうまく扱えない事例 日本語Windowsで統計処理ソフトRを使う場合、アクセント付きのローマ字がうまく扱えないことがある。具体的に言うと、アクセント付きのローマ字を含む文字列を入力すると、アクセントがない形で出力されてしまう。以下の例では、”élève”というアクセント付きのローマ字を含む文字列を french という変数に代入している。french...
View ArticleRのバージョン3.3.0がリリース
バージョン3.3.0のリリース 2016年5月3日、R のバージョン3.3.0がリリースされた。コードネームは Supposedly Educational(たぶん教育的)である。バージョン3.2.0がリリースされたのは、2015年4月16日なので、およそ1年を経てマイナーバージョンアップが行われたことになる 。このバージョン3.3.0は本来4月中にリリースされる予定...
View ArticleRのプログラミング言語的側面を学びたい人のための『みんなのR』
はじめに 本記事では、『みんなのR』というRの入門書について紹介する。原書は英語で書かれているが、マイナビ出版から和訳が出ている。 原書:Lander, J. P. (2014). R for Everyone: Advanced Analytics and Graphics. Upper Saddle River, NJ: Addison-Wesley. 和訳:Lander, J....
View ArticleR の ave 函数
ave のデータ出力 R には ave という函数がある。これは、与えたデータに対して何らかの計算をした上で、その計算結果を元々のデータの回数だけ繰り返すというものだ。こう言われても、多くの人にとってはどんな函数かよく分からないだろう。 具体例を見てみよう。2, 6, 7, 13,...
View Article何語の文字列かを判定するためのRパッケージ
franc パッケージ 統計処理ソフト R で、ある文字列が何語の文字列かを判定したい場合、franc というパッケージで判定できる。例えば、"To be or not to be, that is the question." という文字列から、これが英語であると判定することができる。 インストール方法 このパッケージはCRAN上に存在しているので、普通に install.packages...
View ArticleRにおけるNAが関わる演算
はじめに Rにおいては、NAが関わる演算は基本的にNAを返す。例えば、以下の式をRで計算すると、いずれもNAが返される。 NA + 5 # [1] NA 2 * NA # [1] NA 3 ^ NA # [1] NA しかし、NAが関わる演算であってもNA以外の値が返されることがある。例えば、NAの0乗は1を返す。 NA ^ 0 # [1] 1...
View Articleggplot2 ライブラリで作った複数のグラフを1枚にまとめるには、gridExtra ライブラリが使える
gridExtra ライブラリを用いた出力 統計解析ソフトRにおいて、グラフを作成するために非常によく使われているライブラリとして ggplot2 というものがある。このライブラリで作った複数のグラフを1枚にまとめたければ、gridExtra ライブラリの grid.arrange という函数が使える。この函数を使うと、ggplot2 で作ったグラフを、格子状に並べることができる。...
View ArticleRを使って素数な日付を探す
素数な日付とは 2017年12月19日という日付がある。これは、素数な日付だ。どういうことかと言うと、2017年12月19日の数字だけをくっつけると、20171219(二千十七万千二百十九)になる。この 20171219 という数は素数だ。つまり、20171219自身と1でしか割りきれない数だ。...
View Article2016年の統計関係のアドベントカレンダー
アドベントカレンダーとは アドベントカレンダー (advent calendar) とは、もともとクリスマスまで一日一日を数えるためのカレンダーのことである。これにちなんで、クリスマスに向けて記事を1つずつ書いていく企画のこともアドベントカレンダーと呼ぶ。具体的には、12月1日から25日まで、同じテーマで1日1つずつ記事を書いていくのだ。...
View Article2016年に読んで勉強になった統計書五選
『数学ガールの秘密ノート/やさしい統計』 1冊目は、2016年に出た初心者向けの統計読み物について。 結城浩.(2016). 『数学ガールの秘密ノート/やさしい統計』東京:SBクリエイティブ. 著者ウェブサイトでの紹介 版元での紹介 この本は、統計についてほとんど知らない人に向けて、中・高レベルの簡単な統計を説明した読み物である。この本については、以前このブログで紹介文を書いたことがある。...
View Article整然データとは何か
はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。...
View Article