抗体検査の適正規模

イラストや万能すぎる。

 

献血血液をつかった新型コロナウイルスの抗体検査が行われるそうです。そのサンプルサイズは東京都内で500人。この数について「少なすぎる!」「こんなので分かるのか?」という批判をTVでみました。たしかに23日にNY市が発表した検査では3000人で,ちょっと見劣りしている感があります。

https://www3.nhk.or.jp/news/html/20200424/k10012403011000.html

本当のところどうなのでしょうか。ちゃんと計算してみましょう。

 

まず母集団です。東京都内で行うそうですが,多分23区内でしょう。23区内人口は957万人だそうです。献血できる年齢と被る1564歳の人口比はおよそ66%なので,母集団はN=631万人くらいと見積もれます。

https://www.toukei.metro.tokyo.lg.jp/jsuikei/js-index.htm

https://www.metro.tokyo.lg.jp/tosei/hodohappyo/press/2018/03/29/24.html

 

次に集団の分布を踏まえて適切なサンプルサイズを考えてみます。サンプルサイズを大きくすれば精度が上がるのは当然ですが,一定の誤差・信頼度のもとで必要なサンプルサイズnを求めます(厳密には有限修正が必要です)。大学1年の統計ででてくる話題ですね。

n=\lambda^2\frac{p(1-p)}{d^2}

ここで \lambda は信頼度のZ値,dは許容誤差です。pは回答比率と呼ばれるパラメータです。d\lamdaは任意ですが,一般的には信頼度95%,許容誤差5%に設定している例が多いです。pについては,結果がまったく不明な場合は0.5p(1-p)が最大なるように)にしますが,ある程度結果がわかっている場合には,だいたい予測されるpを使ってサンプルサイズを減らします。日本におけるpは不明ですが,NY市では13.9%だったので,仮に14%としておきましょう。あとは計算するだけです。信頼度95%,許容誤差5%の場合

n=1.96^2*(0.86*0.14)/0.05^2= 185.0 

あれ,ずいぶん少ないような・・・

では,もう少し厳しくして3%くらいにしてみましょう。確かにp=14%で5%の誤差はおおざっぱすぎる感じです。

n=1.96^2*(0.86*0.14)/0.03^2= 513.9

ずいぶん近づきました。Nによる有限修正をいれてもほとんど変わりません。おおざっぱな計算ですが,23区内で献血をする人口であれば,500人くらいで95%の信頼度,3%の許容誤差で間に合うという結果になりました。ちなみに3000人の調査で95%信頼度のままであれば,1.25%まで許容誤差を抑えられます。


このように統計検定としては,500人という数は根拠がありそうです。でもNY市が3000人できるのに,どうして東京は500人なの?という疑問は残ります。実際のところNYの検査方法は「州の衛生研究所が開発した検査を使用した」とあり,どのような手段だったのかよくわかりません。一方東京では献血検査というかなりしっかりした検査になりそうです(このあたりは門外漢なのでわかりませんが)。

東京都の献血者数は下記資料によると,全国の11.5%です。

https://www.bs.jrc.or.jp/ktks/tokyo/center/files/h30_shiryonempo.pdf

4月の全国献血者数から推測すると,4月は5200人程度。1日あたり200人くらいです。既に4/22,23で採血済らしいですが,今このタイミングでの抗体獲得率を測るにはこの人数が限界なのかもしれません。5/1に出るという東京での正確な検査結果を待ちたいと思います。罹ってはいませんが,いつの間にか抗体ができてくれているといいなぁ。(以上はすべて個人の考察です)