2010 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2011 | 01 | 02 | 04 | 05 | 06 | 07 | 08 | 09 | 12 |
2012 | 02 | 03 | 04 | 05 |
2012-05-27
■[Word] はてな記法をMS Wordのスタイルに変換する

スタイルちゃんと定義しようと思ったけど箇条書きの定義の仕方がよく分からなくてはまってしまったので諦めた。その関係で中途半端なプロシージャがある。段落番号に至ってはあまり使う気がないのでデフォルトから調整してません。
説明
下記の様なはてな記法っぽい記述を…
下記の様にスタイル設定する。
使い方
- Normal.dot(常に使いたい)や対象文書(その文書だけでいい)、あるいはテンプレート(アドインしたい)の標準モジュールに下記コードを追加。
- HatenaStylesAdd実行(1回で可)
- Hatena2Wordを実行
スタイルが追加されたりListGalleries(そもそもこれが何処に入っているのかよくわからないが)をいじったりしているので、その辺りをリセットしたい場合はClearMyStyleを実行。
コード
2012-05-19
■[R] 「推計学のすすめ」メモ 3.1 ゴルファーの腕比べの話 ―平均値の差の検定― (符号検定とt検定)

以下の書き物は途中まで推計学のすすめ―決定と計画の科学 (ブルーバックス)の第3章1節「ゴルファーの腕比べの話 ―平均値の差の検定―」のメモですが、途中からは日記みたいなもんです。
腕がいいのはどっち?
| ゴルフ場 | イ | ロ | ハ | ニ | ホ | ヘ | 平均 |
|---|---|---|---|---|---|---|---|
| ゴルファーA | 209 | 205 | 210 | 208 | 207 | 207 | 207.7 |
| ゴルファーB | 201 | 197 | 211 | 200 | 208 | 199 | 202.7 |
| A-B | +8 | +8 | -1 | +8 | -1 | +8 | +5 |
上の表に2人のゴルファーのスコアを示した。腕がいいゴルファーはどちらだろうか?
ポイントは以下の2点。
- Aの勝利回数は2回、Bの勝利回数は4回。
- 平均スコアはBのほうが5少ない。
符号検定
もし二人の腕前に差が無いのであれば、「Aのスコア-Bのスコア」という値には+と-の符号が同じ回数だけ出現するはずである。より正確に言うならば、+と-の出
現回数は「同じ回数」から多少食い違うかもしれないが、食い違いの測度は自由度1の分布に従うはずである。
今回の場合統計量は次のように計算される。
自由度1の値の5%点は3.84で0.67より大きい。そのため今回の結果は有意とは言えない、というのがAさんの主張。
Excelでは検定は次のように実施する。
=CHISQ.TEST(観測値が入力されたセル範囲, 期待値が入力されたセル範囲)
入力によりセルにはp値が表示される。
Rでは検定は次のように実施する。
# χ二乗検定 chisq.test(c(+の個数, -の個数), p = c(+の確率, -の確率)) chisq.test(c(4, 2), p = c(0.5, 0.5)) chisq.test(c(4, 2)) # 等確率は規定値なので省略可
実行すると、
> chisq.test(c(4, 2)) # 等確率は規定値なので省略可 Chi-squared test for given probabilities data: c(4, 2) X-squared = 0.6667, df = 1, p-value = 0.4142 警告メッセージ: In chisq.test(c(4, 2)) : カイ自乗近似は不正確かもしれません
と表示される。X-squared(値)、df(自由度)、p-value(p値)が表示されるが、警告も出ている。
検定はサンプル数が少ないと精度が落ちるため、今回の例に使うのはあまり適切ではない。
今回の場合、「勝ち2:負け4」という結果が、勝ち負けの確率が等しい場合に出現する確率は二項分布から直接計算することができる。そのため、ゴルファーBのほうが優れているかどうかは直接確率を計算して決めたほうがいい*1。
このように直接確率を計算して行う検定は正確確率検定と呼ばれる。
Rでは今回のようなデータに対して関数binom.test()を用いることによって正確確率検の一種である二項検定を実施できる。使い方は以下のとおり。
# 二項検定 binom.test(c(成功回数, 失敗回数), p = 成功確率) binom.test(c(4, 2), p = 0.5) binom.test(c(4, 2)) # 成功確率0.5は規定値なので省略可能
実行すると次のような結果が返る。
> binom.test(c(4, 2)) # p = 0.5は規定値なので省略可 Exact binomial test data: c(4, 2) number of successes = 4, number of trials = 6, p-value = 0.6875 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.2227781 0.9567281 sample estimates: probability of success 0.6666667
t検定
符号検定では平均値からの偏差の符号のみに注目して検定を行ったが、情報としては2人のスコアの差というものもある。もし2人のゴルファーの腕に差がなければスコアの差は0になるはずである。
ここで、スコアの差の平均値をスコアの差の標準偏差で割って標準化することを考えよう。すこし考えるとこの値がt統計量そのものであることに気づくだろう。そこで今回の場合のt統計量を計算してみよう。
コースは6つなので、自由度は5である。自由度5のt分布表から5%点を求めると、2.57であるため、これより大きな値は5%以下の確率でしか出現しない、今回の結果は有意であると結論できる。
なお、ExcelではT.TEST関数を使用して次のように実施する。
=T.TEST(配列1, 配列2, 尾部, 検定の種類)
Excelのヘルプが不親切なので分かりにくいが、尾部には1(片側検定)または2(両側検定)を指定し、検定の種類には1(対応のあるデータ)、2(等分散2標本の検定)、3(非等分散2標本の検定)を指定する。今回の場合はそれぞれのコースの結果を対応付けて差を計算してからのt検定で、検定の種類は両側にすべきであるから、
=T.TEST(配列1, 配列2, 2, 1)
と入力する。セルにはp値が表示される。値は0.046であり、0.05より小さい。
Rの場合は次のように実施する。
# t検定 A <- c(209, 205, 210, 208, 207, 207) B <- c(201, 197, 211, 200, 208, 199) t.test(A, B, paired = TRUE) # 対応があるデータのt検定 t.test(A, B) # デフォルトでは対応がなく分散も等しいと仮定しない検定(Welchの2標本t検定)を実施する
デフォルトはWelchのt検定を実施する設定となっているため、今回の例ではpaired = TRUEを指定する必要がある。
出力は次の通り。
> t.test(A, B, paired = TRUE) # 対応があるデータのt検定 Paired t-test data: A and B t = 2.6352, df = 5, p-value = 0.04624 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 0.1226639 9.8773361 sample estimates: mean of the differences 5
2つの検定法
今回の例では同じデータに符号検定とt検定という2種類の検定法を適用した。その結果、符号検定では有意な差があるとはいえない、t検定では有意な差があるという異なった結論が導かれた。
符号検定では対象とする値の符号のみを考慮し、大きさを考慮しない。一方でt検定は値の大きさまで考慮する。つまり、t検定のほうが使用している情報が多いのである。そのため、t検定の方が差を見つけやすい。このことを指してt検定の方が「検出力が大きい」と言う。
ただし、どのような検定法をとるかについては実験の前に決めておくべきである。実験が終わってから有意差の出る検定法を探すようなことは慎まなければならない。
なにいってんの?大丈夫?
今回の例の問題点は、各々のゴルフ場におけるスコアの分散である。
例えば、ゴルフ場イ〜ホまでは10前後のスコアで回ることができ、ゴルフ場ハだけは100前後のスコアで回ることができるものだと考えてみよう。10前後で回れるゴルフ場のスコアのばらつきより、100前後で回れるゴルフ場のスコアのばらつきの方が大きいだろうことが想像できる。
> # ゴルフ場イからホまでのスコアを1/10にしてみる > A <- c(20.9, 20.5, 21.0, 20.8, 20.7, 207) > B <- c(20.1, 19.7, 21.1, 20.0, 20.8, 199) > t.test(A, B, paired = TRUE) # 対応があるデータのt検定 Paired t-test data: A and B t = 1.3356, df = 5, p-value = 0.2392 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.571817 4.971817 sample estimates: mean of the differences 1.7
p=0.2392で有意ではないという結果になった。
対応のあるt検定では各々の対応における差の大きさに注目して結果を導くが、その大きさは各々のペアにおける差の出方の分散に支配される。
デフォルトではRのt検定は対応がなく、分散も等分散を仮定しないもの(Welchの2標本t検定)が使用される。これを使用するとどういう結果が得られるのだろうか。
> t.test(A, B) # デフォルトでは対応がなく分散も等しいと仮定しない検定(Welchの2標本t検定)を実施する Welch Two Sample t-test data: A and B t = 2.1087, df = 5.99, p-value = 0.07959 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -0.8042533 10.8042533 sample estimates: mean of x mean of y 207.6667 202.6667
p=0.080であり、有意ではないという結果になった(もっとも、p=0.047なら有意でp=0.080なら有意でないという考え方自体がかなり微妙だが)。p値が大きくなったのは、Welchの2標本t検定のほうが検出力が低い(保守的であるという)からだ。「対応がある」は一種なので、これを使わない検定は検出力が低い。
また、「等分散」を仮定すると同様の理由で検出力が上がる。「対応がある」だとか「等分散である」といったパラメータを設定して行う検定はパラメトリックな方法と呼ばれる。一方、これらを設定しないで行う検定はノンパラメトリックな検定と呼ばれる。
パラメトリックな検定を行う上で注意しなければならないのは、例えば「分散が等しい」ことを保証できる方法は存在しないという点である。安易に等分散という仮定をおいてしまって良いのだろうか。同様に、よく使われる「分布は正規分布に従う」仮定もこれを保証する方法は存在しない。
我々は「世の中の変数は大体正規分布に従う」というような説明を講義で受けてきた。しかし、正規分布しないだろうと考えられる変数はいくらでもあるし、めずらしいものでもない。例えば下限が0で上限が100であるテストのスコアが正規分布するなどというのはどう考えても妥当ではない。あるいは、生物の成長速度は細胞数に比例することが考えられるし、その仮定のもとで多くの成長予測モデルが作られている。それなのに、草丈だとか身長だとかいったデータが正規分布すると仮定してしまっていいのだろうか。
ところで、今回の例では一体どの検定を用いるべきなのだろうか。個人的には符号検定が無難ではないかと思うが、「ゴルフの腕」とスコアの関係をどのように考えるのかということも加味しなければならないだろう。何にせよ、調査を行う人間が、その検定を用いた理由を説明できなければならない。
Rのt検定においてノンパラメトリック手法がデフォルトになっているのもパラメトリックな検定を適用できる範囲が実際はかなり限定されるという背景あっての事だろう。よほどの自信が無ければ検定は保守的な方法でやったほうがいいし、p<0.05だから有意とか有意じゃないとか言わずにp値およびサンプル数をそのまま書いた上で差の大きさも加味した上で自身の判断を示すべき。
というわけなので私は大丈夫です。
*1:勿論この場合は「勝ち1:負け5」の確率、「勝ち0:負け6」の確率も計算し、「4回以上の負け」が偶然生ずるのか否かを検定する必要がある
2012-05-06
■[日記] キリンビール名古屋工場を見学してきました

そういえば一昨昨日見てきました。
工場周辺ホップと麦汁の香りが漂っていて周辺大丈夫なのかという感じだったけど50年もやってるということなので多分大丈夫なんだろう。
連休ということもあり見学は予約でいっぱいだった。
仕込み
最初は原料の説明。
ビールの原料は二条大麦(ビール麦)で、小花が2条に並んで咲いているように見える*1、大粒でデンプンをたっぷりと含んでいる。
まずは大麦に水を含ませて発芽させる。これが麦芽(モルト)で、麦芽は85℃程度で乾燥させ、成長を止めた後に根を取り除いて次の工程へと進む。
AR的なものを使った説明があった。
ビールづくりの次の段階は麦汁づくりで、最初は荒く砕いた麦芽を50℃ほどの熱湯とともに仕込み釜に入れる。この時、麦芽に含まれるタンパク質分解酵素が活性化し、タンパク質がアミノ酸へと分解される。次に温度を60〜70℃程度まで段階的に上げていく。すると今度はデンプンが酵素により加水分解され、糖質に変わる。
この段階では麦汁はもろみを含んでいるので、ろ過器を使ってろ過する。この時、最初のろ過で出てきた麦汁を「一番麦汁」と呼ぶ。一度のろ過ではもろみに麦汁が残っているため、お湯をかけて洗い流す。この時回収した麦汁を「二番麦汁」と呼ぶ。通常は一番麦汁と二番麦汁を混合して利用するが、一番麦汁のみを使用した製品もあり、例えばキリンの一番搾りがそれに当たる。
完成した麦汁を試飲することができる。甘い。
このとき、やけに薄っぺらい工場長が出てきて挨拶してくれる。
麦汁はこのあとホップを加えて煮沸され、ビール特有の苦味と香りが付けられる。ホップはアサ科のつる性多年草で、成長すると10m以上の高さにまで成長する*2。キリンではチェコのザーツを中心にホップを輸入している。
発酵
発酵に用いる酵母は様々な株が保管されており、ビールに適したものを選んで使用するらしい。
仕込みの終わった麦汁は冷やした後酵母を加えられ、発酵・貯蔵タンクにて低温発酵させる。
タンク内をイメージしたらしい通路を案内される。
全長23mのタンクの1mmでビール154缶分らしい。
一日1本飲むとタンク一本で4000年分とか言ってた気がするけど、それで計算すると10m分くらいなので1日2本で4000年分だったかもしれない。もしくは発酵タンクと貯蔵タンクで容量が違うのかもしれない。とにかくタンク一本で5000〜1万本分くらい入る。でかい。
そしてでかいタンクが沢山ある。ビールをイメージしたカラーリングらしい。放射よけとかは考えなくていいのだろうかと思ってしまう。
熟成
1週間ほど発行させた麦汁は若ビールと言われ、まだ未熟臭を含む。
若ビールは貯蔵タンクに移され、0℃で1〜2ヶ月かけてゆっくりと最後のアルコール発酵を進める。アルコール発酵の間に発生した炭酸ガスはビールに溶け込むことで発泡性を付加する。
ろ過
熟成の終わったビールは酵母やタンパク質を取り除くためにろ過される。
昔はさらに熱処理により品質の安定化をしていたが、現在はろ過だけを行うのが一般的。熱処理を加えていないビールを生ビールと呼ぶ。
缶・びん・樽詰め、箱詰め・ケース詰め
ろ過の終わったビールはビール詰めのラインへ移される。休日は基本的に稼働してないとのこと。
今回のようにラインが稼働してない場合はモニター(冒頭写真参照)での説明となる。600インチをやたらと強調していた。モニターというかプロジェクターが横に並んでいて画面を繋げている感じ。
試飲
なんか非売品のおつまみが出てきた&おかわりは2回まで。
試飲込みで所要時間70分くらい。
*1:実際は通常食用にされる六条大麦と同様に6条並んでいるが、そのうち対角線の2条のみが肥大している。cf. 二条大麦と六条大麦 | 株式会社はくばく
2012-05-05
■[Excel][VBA][Emacs] ExcelでEmacsライクなキーバインドを使う

いったい何なの
どうしてもExcelに大量のデータを入れないといけない状況にあってむしゃくしゃしたので、VBAのApplication.Onkeyメソッド等を利用して「概ね*1」EmacsライクにExcelを操作できる環境を作った。どうしても無理な部分は諦めたがカーソルの移動程度は上手くできたと思う…ので残り誰か作って下さい><
なお、「Mac使えよ」「Xkeymacsっていうのがあってね」「yamyでいいだろ」等々の発言をしたい恵まれた環境にある人は今すぐ帰って下さい!
インストール
使いたいExcelファイルの標準モジュールに後述のコードをコピペすればOK。
EmacsModeマクロを起動すれば各種キーバインドが設定されるので、ファイルを開いた時に自動起動したい場合は、ProjectのMicrosoft Excel ObjectのなかのThis Workbookに下記のように記述する。
Private Sub Workbook_Open() Call EmacsMode End Sub
また、どのファイルに対しても使用したい場合はPersonal.xlsの作り方等を参考にPERSONAL.XLS(2007以降は.XLSB)を作成し、そちらに記述しておく(Excelが壊れたとか言われても対応できないので上記文章の意味がわからない人は無理に導入しないで下さい)。
使用方法
Emacs Mode
EmacsModeマクロを起動すると以下のコマンドが使用可能になる。それぞれのコマンドの実態はマクロで、Application.Onkeyメソッドでショートカットに割り当てている。なお、Application.Onkeyの設定を解除するマクロはDisable key or key combination or run a macro if you use itのものを使用している。
| Command | マクロ名 | 動作 |
|---|---|---|
| Ctrl + f | ForwardCell | 右のセルに移動 |
| Ctrl + b | BackwardCell | 左のセルに移動 |
| Ctrl + p | PreviousLine | 一行上に移動 |
| Ctrl + n | NextLine | 一行下に移動 |
| Ctrl + a | BeginningOfUsedRangeLine | 現在の行でUsedRange*2の左端へ移動 |
| Ctrl + e | EndOfUsedRangeLine | 現在の行でUsedRangeの右端へ移動 |
| Alt + < | BeginningOfUsedRangeRow | 現在の列でUsedRangeの上端へ移動 |
| Alt + > | EndOfUsedRangeRow | 現在の列でUsedRangeの下端へ移動 |
| Ctrl + v | ScrollUp | 1画面進む |
| Ctrl + z | ScrollDown | 1画面戻る |
| Ctrl + l | Recenter | 現在の行が概ね中央となるようスクロール |
| Ctrl + s | Search | 検索ダイアログの表示 |
| Ctrl + x | CxMode | C-xモード(後述)への移行 |
| Shift + ESC | Enable_keys | 全てのショートカットをデフォルトの状態に戻す(Emacs Modeの終了) |
C-x Mode
2ストロークのショートカットを仮想的に実現するため、Ctrl + xが押下されるとショートカットが切り替わるようになっている。このうち、Ctrl+x(切り取り)、Ctrl + v(貼り付け)およびCtrl+z(もとに戻す)を除くコマンドか、Ctrl + gでEmacs Modeに戻るようになっている。
| Command | マクロ名 | 動作 |
|---|---|---|
| Ctrl + s | SaveFile | 上書き保存 |
| Ctrl + w | WriteFile | 名前を付けて保存ダイアログの表示 |
| Ctrl + f | FindFile | ファイルを開くダイアログの表示 |
| Ctrl + p | PrintFile | 印刷ダイアログの表示 |
| Ctrl + x | なし*3 | 切り取り |
| Ctrl + v | なし | 貼り付け |
| Ctrl + z | なし | Undo |
| Ctrl + g | EmacsMode | Emacs Modeに戻る |
ソースコード
2012-04-30
■[Agirculture] 植物の病気について

植物の病気
植物が病気である、とはどういう状態を指すのだろうか。植物本来の機能が十分に発揮されている状態は「健康」と言っていいだろう。つまりその逆、何らかの要因により植物本来の機能が十分に発揮できない状態が「病気」であると言えるだろう。
ただし、植物にとっては正常な生理活動であっても、経済的な視点から見て「病気」と判断される事例もある。例えばマダケは60〜100年の周期で一斉に開花し、一斉に枯死してしまう。これはマダケにしてみれば当然の活動であるのだが、生産者からすると経済的な被害を受ける現象であるため、病気の例として挙げられることがある。もっとも、このような例は一般的に問題となる植物の病気全体から見ると極めて稀な例である。
病気によって引き起こされる被害のことを「病害」と呼ぶ。
農作業などで葉、茎が切り取られた場合、そこから病気に感染する可能性が高くなるが、これは通常「損傷(injury)」として病気とは区別している。また、誘引などの作業によるショックで植物の生育が一時的に不調となる場合もあるが、これも通常は病気としては扱わない。
病気の発生
植物の病気はいかにして発生するのだろうか。植物の病気は、素因、主因、誘因という3つの因子が発生に必要なレベルにあるときに発生する。
- 素因: 病気に感染する素質をもった植物のこと。種族としての因子(種族素因)と、個体の健康状態としての因子(個体素因)に分けられる。
- 主因: 植物を侵すことのできる病原のこと。
- 誘因: 温度や湿度など病気の発生に必要な環境条件のこと。
これらの3つの因子のうちどれが重要であるかは場合により異なる。
例えば、露地栽培では同じ圃場であっても年毎に病気の発生は大小の差がある。これは、誘因が病気の発生に対し大きなウェイトを占めていることを反映している。
また、同じ作物を連作すると害を及ぼすセンチュウの密度が高まったり、特定の病害が多発しやすくなって栽培が困難となる場合がある。この場合は主因たる病原の蓄積が病気発生の主な原因である。
輪作を行ったり、抵抗性の品種を導入することは素因の面からの対策と言える。
植物の病気の原因(病原)
以下では、主因、つまり病原について詳しく見ていく。
病原は、まず大きく非伝染性のものと伝染性のものとに分けることが出来る。
非伝染性病原
非伝染性病原というのはいわゆる環境条件のことである。環境条件が植物の耐えられる状況を超えて変化したとき、植物は病気になる。
病気の原因となりうる環境条件としては、以下の様なものがある。
- 温度、湿度、水分、光、酸素、栄養素などの過不足
- pHの不適
- 化学物質による土壌、空気、水の汚染
- 農薬による薬害
非伝染性病原による病害は「障害」と呼ばれることが多い。
伝染性病害
一般に植物が病気であるというとき、その病原は伝染性病原である場合がほとんどである。伝染性の病原としては動物や微生物などの生物性のものと、ウイルス・ウイロイド*1、によるものがある。以下その概要を見ていこう。
ウイルス、ウイロイド
ウイルスは核酸(DNAまたはRNA)とタンパク質からできている。細胞を持たず、代謝系もないので、生きた生物細胞の機能を借りることでしか自己を増殖させられない。そのため、非生物に分類されるのが一般的である。大きさは極めて小さく、電子顕微鏡を使用しなければ観察することは困難である。
自ら感染する能力は持たず、虫による媒介や傷口からの侵入が主な感染経路となる。
ウイルスに感染した植物の病徴としては以下のようなものがある。
- モザイク: ウイルス病の最も一般的な症状。緑と黄色の部分がまだらに生ずる。
- えそ斑点: 組織の一部が褐変し、斑点状の壊死を示す。
- 輪紋: 葉、果実に円形、同心円状の斑紋を生ずる。
- 萎縮: 株全体の成長が抑制され、葉が小さくなったり節間が詰まったりする。
- 奇形: トマトにCMVが感染した場合に見られる糸状葉など。
宿主の代謝系を利用して増殖する関係上、感染した個体を治療することはほぼ不可能で、そのような農薬の登録もない。アザミウマ、コナジラミ等の媒介昆虫の防除や、耐病性品種の利用といった予防的な対策が基本となる。また、2種類のウイルスが前後して同じ作物に接種されると、後から接種されたウイルスが感染しにくくなる(干渉作用)場合があり、毒性の低い弱毒ウイルスを予め接種しておくことによる防除も利用されることがある。また、種子であれば熱処理による不活性化が利用可能な場合もある。
ウイロイドは外皮タンパクすらもたない低分子のRNAで、電子顕微鏡を用いても観察することは困難である。キクわい化病など十数種の病気が知られているが、ウイルスほど被害は大きくない。
細菌
細菌は2分裂増殖をする単細胞で核膜を持たない原核生物で、形状から球菌、螺旋菌、桿菌などに分類されるが、植物の病原菌となるのは基本的に桿菌である。
桿菌のほかに糸状菌のように菌糸を伸ばす放線菌と呼ばれる菌もジャガイモそうか病などの原因菌である*2。
細菌のサイズは長さ1〜5μm、幅0.5〜1μmと微小であることと、植物病原細菌がいずれも桿菌で形状的な差異が少ないことから、光学顕微鏡による判別は難しい。ただし、鞭毛の有無の違いから遊走性を持つものと持たない物に分かれるため、泳ぐ・泳がないによる大雑把な判断は可能である。
細菌は自然界に広く分布しており、植物組織内に居るにもかかわらず病徴を示さない内生細菌もあることから、植物組織試料から細菌が検出されたからといって即細菌病であると判断することは難しい。通常、抗原抗体反応を利用した血清学的な方法などによる診断が必要となる。ただし、植物組織切片から多量の細菌の溶出(菌泥)が認められるような場合は細菌が原因と判断する多い。菌泥はナス科植物の青枯病(Ralstonia属)などで顕著に現れる。
細菌は植物の細胞壁などを破って侵入することはできず、気孔や傷口などの開口部から侵入する。また、侵入したとしても温度、湿度などの条件が好適でなければ発病に至ることはないが、反面、温湿度が好適であれば速やかに増殖し素早く病徴を呈する。
糸状菌
糸状菌は核膜を持つ真核生物で、ほとんどが菌糸を作り胞子で繁殖する。菌糸の幅は4〜10μmと細菌に比べて大きく、菌糸や胞子の形状が種類によりバリエーションに富んでいるため顕微鏡による判別が比較的容易である。胞子や菌糸が塊状となった菌核などの特徴的な構造を作る菌も多く、そうした構造物から肉眼での判別が可能な場合も多い。
糸状菌による病気は植物の病気の中で最も種類が多く、約80%を占めている(ウイルスと細菌によるものが各々10%程度ずつである)。
一般に糸状菌は湿度が95%以上の場合に胞子を形成し、植物組織内への侵入には水滴が必要となる。ただしうどんこ病菌はやや特殊で、水滴がなくとも発芽し、やや低い湿度のときに発生しやすい。
ファイトプラズマ
ファイトプラズマは細菌よりも微小な微生物で、細胞壁がない等の相違点はあるが基本的には細菌と同じ構造をもっている原核生物である。古くは細菌として分類もされていたが、細胞壁を持たない原核生物としてモリキュート綱に分類されている。人工培養に成功していない。
感染初期はウイルス病と区別しにくいが、黄化、萎縮、叢生(激しい枝分かれ症状)などが主な症状で、各種作物にてんぐ巣病を引き起こす。
防除としては媒介昆虫であるヨコバイ類の駆除が基本となる。完全な治療法が無いことから発症した植物は抜き取り処分が必要となる。
その他の植物病原
スピロプラズマ
ファイトプラズマとおなじ綱に分類される微生物で、特殊な培地を用いることで培養ができる。カンキツstubborn病やトウモロコシstunt病の病原菌がスピロプラズマに属する。日本での発生はない。
難培養性原核微生物
培養に特殊な培地が必要か、あるいはまったく培養に成功していない微生物。原核生物を新しい種として発表するには形態のほか分子生物学的な情報を記載する必要があるが、これらの情報収集には培養がほぼ不可欠である。そのため、培養に成功していない原核生物は難培養性原核微生物として暫定的な扱いを受ける。
ファイトプラズマ以外に難培養性原核微生物の中で病原として問題となっているものは殆ど無いが、リベリバクターと呼ばれる細菌の一種はカンキツグリーニング病を引き起こし、柑橘類に致命的な被害を与えるため問題視されている。日本では徳之島以南の西南諸島に侵入しており、本州への侵入が警戒されている。
参考文献
- 松井正治ほか著「改訂 植物防疫」2007年、全国農業改良普及支援協会
- 奥田誠一ほか著「最新植物病理学」2004年、朝倉書店
- カンキツグリーニング病 - Wikipedia
突然どうした?
最近Rいじる用事と暇と気力がなくて書くことがないんだけど、まとまった文章を書いて晒す作業をたまにはやらないとどんどん物を書けなくなるのでリハビリを兼ねて植物病理学の扉をノックするところまでまとめた。
4000字くらいになったけど本当は800〜1600字くらいにまとめたい。
半日くらいかかったけど1時間くらいで書けるようになりたい。
分かりにくいことを分かりにくく、多めのテキストに起こすのはとても楽だ。分かりにくいことを分かりやすく、簡潔にまとめるのはとても苦手で、そういう仕事を任せられるといつも疲れ果ててしまう。
本は入念に書けば書くほど薄くなり、それだけ書くための労力が大きくなる、おおざっぱに言って、著者が綿密さを2倍にすれば、本の厚さは半分になる。つまり2倍の労力に対して、支払いは半分になる。したがって、著者への支払いは、なされた仕事の2乗に反比例する。
レフ・ポントリャーギン




















全然大丈夫ではないので統計学の復習をお勧めします。
パラメトリックかノンパラメトリックかは母集団の分布について仮定を設けるかどうかで決まります。等分散や対応関係を仮定するかどうかは関係ありません。t検定は分布が正規分布に従うことを前提にしたパラメトリック検定です。
また、「世の中の変数は大体正規分布に従う」というのは中心極限定理によってある程度保証されています。
他にも色々突っ込みどころはありますが、ご自身で勉強なさった方がいいかと思います。
コメントありがとうございます。
ノンパラかパラメトリックかの判断については後半織り込んだつもりでしたが分かりにくかったでしょうか。
等分散や対応関係はまさに母集団分布への仮定の一つだと思いますし、それがすべてと言うような書き方はしなかったと思うのですが、何か不十分な点がありましたか?
一応、私としてはパラメトリック検定は余程使う根拠がなければ無闇に使うべきではない、という立場を昔からとっております。
今回は冒頭にもあるように既存のテキストの内容を途中までは無批判にまとめたものなので、前半はパラメトリックを推奨するような書き方になってしまっています。
テキストの内容につっこみどころがあるのは承知しておりますし、それゆえ補足が長くなっております。その他の点についてつっこみどころがあるとは思っておりません。しかし、万が一他の点でも「色々」つっこみどころがあるとなると確かに問題ですので、要点の列挙のみでもしていただけると今後の参考になります。
なお、意図的に端折ったのかもしれませんが、中心極限定理についての記述が正確ではありません。中心極限定理は世の中の変数が正規分布に従う事の保証はしません。変数の平均値の分布が正規分布に従う事はある程度保証できますが…。
1. 対応あるなしはパラメトリックかどうかとは関係ない。
2. 等分散の仮定で考慮されるのは、ゴルファーの例で言えばゴルフ場ごとではなくて、各ゴルファーの分散が等しいこと。
3. 「対応のある」について誤解されていると思う。対応のあるデータを対応のないデータとして扱ってはいけません。
4. Welchの等分散を仮定しないt検定はパラメトリック検定。
5. Ionaさんのいうとおり等分散を仮定するかどうかもパラかノンパラかとは無関係。
ご指摘ありがとうございます。指摘の通りパラ/ノンパラの理解については誤っている点がありました。