【24-32】中国の農業生産統計は信頼できるか?(第3回)
推定に推定を重ねる穀物生産量調査統計
2024年07月30日
高橋五郎: 愛知大学名誉教授(農学博士)
略歴
愛知大学国際中国学研究センターフェロー
中国経済経営学会前会長
研究領域 中国農業問題全般
生産量推定方式に転換(1989年~)
中国の農畜産物生産量を把握する方法は、1989年からサンプル調査による母集団推定方式に変わった。それまでは「全面報表」、すなわち地方から中央に上がる悉皆調査報告書に拠っていた。地方の生産統計がどのように把握されていたかが分かる正確な実態を示す資料はないが、基本的には生産現場を所管する部署の実測に拠っていたと思われる。生産量のすべてを政府が買い取る制度が消えて、政府が生産量を把握しようとすれば別途に調査する以外になくなったのである。現在は、生産量のうち政府が買い取る量は穀物の場合20%に満たないとされている。畜産物統計も同様で、すべてが統計的推計に移っている。
そこで、今回は穀物を対象に、政府が発表している生産量推定の方法を取り上げたい。しかし、実際の推定作業で使われているはずのマニュアル等は入手できないので一定の限界はあるが、生産量推定の方法には、基本的なところが反映されているはずである。
夏穀物生産量を事例に
2024年の夏穀物の作付面積は25の地域で合計26,613,000ha、生産量は149,780,000トン、1ha当たり生産量は5,628㎏だったという(国家統計局、2024年7月12日)。いうまでもなく、この数値は重量計を用いて1粒ずつ量ったものではなく、統計的推定によるものである。
ただし、この数字の発表に併記されている生産量推計方法には、知りたい点が記載されていないことが多々ある。そのため、誤った理解が生まれやすい書き方になっているが、基本的なポイントは不十分ながらも記載されていると思う。以下、この生産量推定の骨格を紹介しよう。
生産量推定方法の骨格
生産量推定は主な穀物が対象とされ、夏穀物(前年の冬に播種し、夏に収穫する穀物。主に小麦、大麦、豆類[蚕豆・豌豆]、薯類[甘藷・ジャガイモ]:年間の穀物生産量全体30%程度を占める)と秋穀物(原則的に、春に播種し秋に収穫する穀物。主にトウモロコシ、水稲、大豆:同70%程度を占める)ごとに推計される。ただし、生産量の推定結果は夏穀物と秋穀物を同時に行うのではなく、その都度、春穀物は播種と生育の見通しが概ね定まる7月中旬に、秋穀物は秋も深まる10月末頃、国家統計局から公表される。
生産量の推定は、まずは①穀物の種類ごとの作付面積推定を行い、次に②穀物の種類ごとの生産量推定を行い、③穀物の種類ごとの推定作付面積を前提とする生産量推定を行うという手順である。以上については、地方に散らばる「国家調査県(市)」でサンプル調査と「重点調査」が行われる。
本稿では、このうち夏穀物調査に焦点を当てる。秋穀物調査も、調査地が秋穀物の産地に重点を置く点が異なるだけで方法上の骨格は変わらない。
夏穀物生産量推定調査の対象地は、北京、天津、河北、山西、江蘇、安徽、山東、河南、湖北、四川、貴州、雲南、陝西、甘粛、寧夏、新疆の16省(自治区、市)であり、上海、浙江、福建、江西、湖南、広東、広西、海南、重慶の9省(自治区、市)については、各関係調査総隊が「重点調査」を行い推定するという。
このように調査対象地は二つのグループに分かれているが、北京、天津、河北などの前者は夏穀物の小麦の主産地であり、推定調査の対象地である。また、上海、浙江、福建などの後者のグループは「関係調査総隊」による調査が行われるというが、「重点調査」とは何かは不明である。「関係調査総隊」とは、各地方に配備される食料生産を専門に調査するグループであるが、組織構成や活動実態の詳細は不明である。「重点調査」について本稿が立ち入ることは、実態が紹介されていないので困難である。
穀物の種類ごとの作付面積推定
生産量推定調査の対象地である上記の北京、天津、河北等の穀物の種類ごとの作付面積推定方法は、次のように説明されている。
すなわち穀物の種類ごとに、先ず「国家調査県」に属する4,000村を全国から抽出。ここでいう村は「村民委員会組織法」(1988年)によって、解体後の農村人民公社の受け皿となった村民委員会に重なるとすると、その数は492,000村(2021年、民生部。政策的に都市化を進める目的で村の合併を推進しているため、実は毎年減少傾向にある)なので、サンプル抽出率は0.8%となる。
この4,000村を対象に、1村当たり3か所、各20ムーを抽出し、合計60ムーの土地をサンプル調査するという。ここには、母集団推計の手法は欠かせないであろう。その上で考えるに、この土地についての調査は、以下の二通りがあると思われるが、実際にいずれの方法が採用されているのかは不明である。
① 穀物種類別作付面積(割合も?)を計り、これを母集団=全村492,000に当てはめ、全村の穀物種類別の作付面積を推計。この場合、492,000の村の当年の耕地面積統計(2期作等を考慮)が存在することが前提となる。
② 穀物種類別作付面積(割合も?)を計り、サンプルを16,000ha(4,000×60ムー(60ムー≒4ha))とし、母集団推計式により推計する。この場合、村全体の数は無視できる。2023年の耕地面積(母集団)は171,624,470ha(国家統計局)。ただし、推計には、以上の諸データに加え、標準となる穀物種類別の作付面積割合、サンプル全体の標準偏差が既知であることが前提となろう。
穀物種類ごとの生産量推定
穀物種類別の生産量推定は、作付面積推定と同じく、二つの調査地域に分かれる。「国家調査県」のうち穀物種類ごとの作付面積推定調査を行うのは北京、天津、河北等であり、もう一方の上海、浙江、福建等の地域は別途の「重点調査」の対象である。
北京、天津、河北等の生産量サンプル調査の対象地は、作付面積調査を行う4,000か所から2,000か所を選び、そのなかから一か所当り4区画、全体で8,000の耕地区画になるという。さらに、各調査耕地区画から、生産量を実測するために、面積10平方尺(1.1平方メートル)の地片(小区画の土地)を3~5選ぶ。それぞれの地片を対象に、調査員が穀物生産量の実測を行い、当該地域が属する全省・自治区の当該穀物の平均単位面積当たりの生産量を推定する、という方法である。なお穀物生産量の実測は、一つの地片当たりの脱穀後穀物の粒数全体の重量を重量計で量る。豆類の場合は莢(さや)から抜いた状態の豆を同じ方法で量るという。
面積調査と生産量調査の組合せ
以上が、公表されている穀物生産量推定調査の方法である。おそらく、公表されていない調査方法に関する説明項目や詳細な内容があると思われるが、以上から中国の穀物生産量調査の仕組みの概要を理解することはできる。
その基本的な仕組みをみると、生産量調査に当たって、先ずは穀物種類別の作付面積を把握するための調査を行い、次いでその耕地で、目的とする穀物が単位面積当たりどのくらい生産されているかを把握する、という二段階から成り立っている。現代の通常の農産物生産量統計は統計調査、すなわち推定によって成り立っており、中国もこの点で変わりはない。
その一方で、統計調査の仕組みや方法がどうかとなると、立ち止まらざるを得ない点もある。今回取り上げた中国の穀物生産量調査は、穀物種類別の作付面積調査、それに基づく穀物生産量調査と二段階編成になっている。既述のように、それぞれが調査対象の省・自治区、実際の調査地点や調査区画の分布と最終的な調査穀物の採取地片の分布、そして、それらの作付面積サンプルと生産量サンプルを全国レベルの耕地に当てはめ、全国の生産量推定に至るという帰納的プロセスから構成されている。
二重の推定
このように、作付面積に関する母集団推定の上に、次の穀物種類別の生産量に関する母集団推定を行う二重推定という方式である。
一般に、統計学の常識では二重推定法は次の諸点が問題となる場合がある。
① 誤差の累積:最初の推定(穀物種類別作付面積の推定)に含まれる誤差が、次の推定(穀物別生産量の推定)にも影響を与える可能性。誤差が累積すると、最終的な推定の精度が低下することがある。
② バイアスの伝播:仮に最初の推定にバイアスが存在すると、次の推定にも伝播し、最終的な推定結果が偏る可能性がある。
③ 依存関係の無視:二重の推定を行う際に、最初の推定と次の推定の間の依存関係を正しく扱わなければならない。穀物種類別の作付面積に調査地域ごとの特徴があり、生産量との間に相関関係の強弱がある場合、それらが無視されると推定の正確性に影響する可能性がないとはいえない。具体的な例として、作付面積と栽培穀物との間に特定の穀物に偏る特性がある地域が一定数あるような場合、母集団推定の過程では、この地域特性が無視または軽視されると、推定結果に歪みが生まれる可能性がある。
さらに重なる推定
しかも、作付面積と生産量の二重推定に限らず、それぞれの調査プロセスにおいて、さらに個別の推定が行われる場面がある。例えば、作付面積調査では4,000村が全国の492,000村を統計的に代表しているという推定、3区画の60ムーの穀物種類別作付面積が当該村の穀物種類別作付面積を代表しているという推定、2,000の調査地点が全国の穀物種類別生産を代表しているという推定、20ムー≒1.33haの区画における3~5か所の1.1平方メートルの地片、すなわち3.3~5.5平方メートルの3地片(合計60ムーに対応)が集まった8,000か所の区画、合計7.9~13.2haが32,000ha(8,000か所×60ムー)を代表しているという推定が行われている。
農畜産物の調査に当たりサンプルが母集団を代表しているかどうかは、母集団(この場合、全国の耕地面積)の数値が正確であることを前提に、サンプル数とサンプル選択の方法が重要なカギになろう。しかし母集団に対するサンプル数は母集団の数に比例して必要なわけではなく、サンプル選択の方法が適切であれば数千でも多すぎる。この点は、母集団が数千万人の一般の有権者世論調査の有効回答数が1,000件でも、十分に実態を把握できることが示している。そう考えると、一連の穀物生産量推定に関する中国のサンプル数自体に問題はないといえよう。
サンプル選択の方法の詳細は不明であり、評価する方法がない。この点は、最も恣意が働きやすいが、その実態に立ち入ることは不可能である。
生産量推定の可動性
中国の穀物生産量調査当局が、今回の生産量を実際にどのように推定したのかは不明ではあるが、ありうる一つの方法から、仮の条件を設定し、小麦の生産量(公表値は138,220,000トン)のみの推定値を求めてみよう。中国当局が実際にどのような条件をおいたかは不明であり、この推定は、推定の性格を知るための仮の推定である点を承知願いたい。
推定の条件:
・信頼度95%。
・全国の母集団に当たる耕地面積:171,624,470ha。
・小麦の作付面積:母集団耕地面積の15%(仮定)。
・サンプル数:8,000か所。
・各サンプルの面積:1.1平方メートルを5か所、合計5.5平方メートル(1サンプル当たり)。
・サンプルの合計面積:132,000平方メートル(13.2ha)。
・1ha当たりの平均生産量:6,000kg(中国の標準的な生産量)。
・サンプルの標準偏差:600kg(標準的な生産量の±10%と仮定)。
結果は、中国の2024年の小麦生産量は154,462,000~154,800,000トンの範囲にあると推定される(計算過程は省略)。計算上のこの数値が変動する要素は多く、母集団を除くすべてである。それだけ、一つひとつの前提条件や推定値の変動が全体に与える影響が大きい。
例で示すと、その推定値の一つ、小麦の作付面積割合が耕地の15%から20%へ増えたとすると、生産量推定結果は205,498,000~206,401,000トンの範囲に変わる。生産量推定値は一気に50,000,000トン増加する。また逆に10%へ減ったとすると、102,750,000~103,200,000トンの範囲に変わり、今度は50,000,000トン減少する。同様に、サンプルの標準偏差が600㎏から半分の300㎏に縮小、すなわち調査対象の栽培条件の均質性が向上すると、生産量推定値は154,293,000~154,631,000トンの範囲に変わる。
公表値は138,220,000トンだが、数段階におよぶ調査過程における推定値をどうするかによって、指定結果はこのように大きく変動する可能性がある。
中国の穀物生産量の評価に当たって
以上は、母集団推定の技術的問題で、完全な払拭は難しい。しかも中国の生産穀物の種類は多く、それぞれの生産量も千万トン単位から億トン単位と大きい。個別の穀物は、それぞれ独自の推定が行われ、最終的にそれぞれの推定値が合計され、全体の穀物生産量となる仕組みである。
土地利用の精度と実態が明確にされている日本と異なり、中国のように耕地の使用権者ごとの利用、その区画が明確に特定しにくい土地利用条件の下では、生産量について、推定に推定を重ねる調査はやむを得ないところがある。公表される中国穀物生産量については、これらの点を踏まえた評価が必要であろう。