分析化学とその周辺の分野で、「統計」がどのように使われているか、分析屋はどの程度「統計」の知識を身に付けなければならないか、議論する機会があった。けっこう網羅的な話ができたので、まとめておく。
まず、たいていの定量では検量線を描かなければならない。その検量線の直線性を評価するために、相関係数を求めなければならない。同じ測定を繰り返した場合には、平均値と標準偏差を算出する。このあたりはExcelを使って簡単にできるし、統計であることすら意識しないくらいだ。
分析法バリデーションのためには並行再現性と室内再現性を求める。大規模なバリデーションでは室間再現性も求める。検出限界及び定量限界は、シグナル/ノイズ比やブランク値の標準偏差等から求める。範囲も求めなければならない。これらの計算式は単なる標準偏差の算出よりもややこしいが、難しいというほどではない。
不確かさの見積もりあたりから、少し高度になる。誤差法則の応用。内部精度管理においては、管理図を描き、管理限界を決める。管理試料によって得られるデータはあくまで標本であることを意識して、その数値から母集団(分析系)の状況をモニターする体制の構築。
さらに外部精度管理となると、同じ分析化学でも分野によって評価基準が様々で混乱する。しかし、おおもとにある概念はどれも同じだ。例えばzスコア、Horwitzの式、HORRAT値等、次々に新しい評価法、新しい述語が生み出されているが、統計の基本がわかっていれば理解するのは困難でない。
サンプリングにも統計の知識が必要だ。全数検査するのでない限り、「このサンプリング数でどの程度正確に全体像を把握できるのか?」という問題が付きまとう。目的に照らして合理的なサンプル数はいくつか。どんな方法でサンプリングしたらいいか。最低限のコストで最大の効果を上げるためのツールが統計だ。
得られた分析値から何かを結論付ける場合もある。公衆の安全確保を目的とした分析であれば、例えばある有害物質について、分析値から摂取量を推定し、健康被害の懸念される摂取量と比較してリスク評価が行われる。また、特定の物質の環境中濃度データから環境動態モデルを導く場合もある。いずれも高度な統計処理が必要だ。
さらに、量的な分析のためだけでなく質的な分析のためにも統計が使われる。各種スペクトルデータや不純物のクロマトグラムパターンから、農産物の産地を推定したり違法薬物の流通ルート解明を試みたりするケモメトリックスが話題を呼んでいる。
上記全部にまたがって、研究を行うのであれば実験計画の策定に統計的手法が必要だ。
分析屋が統計を使う場面はこんなに多様に存在する。専門外の人は、「数値を出すのが仕事の分析屋は当然統計を勉強している」と思うことだろう。ところが実は、大学の化学系できちんと統計の基礎を教えているところは少ない。教養課程の選択授業に入っている程度だ。このページを読んでおられる皆さんの大部分は分析屋だろうが、「統計をちゃんと勉強した」と言える人はあまり多くないのではないか。
生物系では統計は必須アイテムなのに、なぜ化学系では統計を教えないのか。このことについても面白い話をしたのだが、続きはまた今度。なお、大学で統計を教わらなかった私が自費でした勉強の詳細は、現代統計実務講座を受講して に書いている。統計の知識を使ってドキュメンタリー風に書いてみた小論は、残留農薬スクリーニングの腕前を確かめるには に。
管理者:津村ゆかり yukari.tsumura@nifty.com