技術力と技能力 Ⅳ:取引Data

四たび技術力と技能力についてである。 此処で云う技術とは主にデジタル技術でありコンピュータリテラシーであると云ってもよい。 技能とはデジタル化の陰に潜む罠を洞察出来る能力のことを指している。 今回は統計技術について考えてみたい。 いわば統計の罠《ウソ》であり、統計数字への疑いの眼である。

このような書き出しを用意してから既に二十日近くが過ぎた。 このテーマについて材料が無かった訳ではない。材料はあるのだが、書く気が起きなかったのである。 一つは晴天が続いていたから野良仕事に疲れて、パソコンに向かう気力が湧いてこなかったのである。 もう一つは、『鄙からの発信』は旬を過ぎてしまったという思いが拭えなかったのである。 浦島太郎化が進んだ茫猿が何を発信すればよいのか見つけることができなかったのである。

フェードアウトを意識してから既に数年が過ぎた。 現役を引退し、家守、野守に専念するように成ったから数年、何を書いても「今さら感」がつきまとって離れないのである。 でも、今朝は随分と久しぶりの雨の日である。室温も28度と連日の猛暑を過ごした身には、冷涼さを感じる天候である。 冷涼といえば、梅雨明け十日の猛暑を過ごしたせいだろうか、大暑をはさむこの数日間は立秋の訪れを思わせるような空の色や風の爽やかさを感じて過ごしていた。 夜明けから雨降りの今朝は、畑に干天の慈雨ならば、茫猿にも心のお湿りがもたらされたという訳で、自らに課した宿題を整理してみようと云うのである。

脇道に逸れすぎた、テーマである「技術力と技能力 Ⅳ:統計の罠」に戻ろう。 統計とは広辞苑によれば「集団における個々の要素の分布を調べ、その集団の傾向・性質などを数量的に統一的に明らかに すること。また、その結果として得られた数値。」とある。 また、集団における個々の要素の分布を調べたもの、即ちデータについて広辞苑はこのように述べている、「立論・計算の基礎となる、既知あるいは認容された事実・数値。資料。与件。」 ようするに「基礎となる数字の集まり《データ》」が示す傾向や性質を、数量的かつ統一的に分析して示すことが統計的処理 なのである。

茫猿にとって馴染みが深く、長年にわたってその作業の末席に連なってきた「地価公示価格《推移指数》」や最近に登場した不動産価格指数を例として「統計に潜む罠」というものを考えてみようと云うのである。 両者共に国土交通省が実施公表する統計値であるし、地価公示価格推移指数については四十年以上の歴史を有している国内で最も権威あるとされている不動産価格統計値である。 この両者にどのような問題点が潜んでいるというのであるか。

先に示したように統計とは基礎となるデータ《統計処理の母集団》を数理的に解析して得られる結果としての数値である。 だから統計結果の信頼性はデータ《母集団》の適否に大きく依存しているのである。 地価公示について云えば、全国26,000地点《2013年公示》を選んで毎年1月1日時点の価格を調査公表しているものである。 いわば地価公示は標本抽出調査なのであり、全数調査ではないのである。 定められた地価公示仕様書のもとに全国約2,700名の不動産鑑定士が標準地の選定から公示価格の決定に至る全過程に関与しているものである。

地価公示価格が全国26,000地点の標本抽出調査であること、不動産鑑定士の評価という過程を経ていることなどについては、費用対効果という側面があるし五十年近い歴史が支えているという側面もあるから、ここでは話題としない。 話題とするのは「地価公示価格推移指数」についてである。

地価公示価格推移指数については、全国概況をはじめ用途別、圏域別に様々な指数が公表されているのであるが、それらは総て1㎡単価の算術平均である。 統計的に平均といえば、一般的に算術平均を指すものであるが、算術平均《相加平均》には大きな問題点が潜んでいることもよく知られていることである。 すなわち算術平均値は往々にして中央値と乖離することがあるという課題である。 母集団に歪みが大きい値が含まれてあれば、平均値は実態を示さないという課題である。 また単価と総額の問題も避けて通れない課題である。 1㎡単価を基礎とする算術平均値と総額を基礎とする平均値が自ずと異なるものとなるであろうことも自明であろう。

(注) 100、10、5の算術平均値は38.3であるが、中央値は10なのである。経済統計に於ける個人金融資産統計などで実感と違和感を感じることが多いのは、乖離値《外れ値》の存在に依る算術平均値と中央値の乖離によることが多いのである。
(注)Excelの関数で算術平均は AVERAGE であり、中央値は MEDIAN である。

同時に地価の変動率を問う場合には、単価以上に総額という問題が避けて通れないのである。その時々の経済情勢に応じて、単価の低い住宅地変動が顕著であった時代もあったが、近年は都心商業地やマンション適地が地価の上昇も下落もリードしてきたのである。 だから単価の算術平均を眺めているだけでは全体を見誤ったり過小評価する危険が伴うのである。 土地総額の推移変動を見極めようとするには、幾つかの困難な問題が存在しているが、それでも単価と面積の相乗平均から地価推移を眺めようとする姿勢も欠かせないと考えるのである。
(注)仮に面積100㎡@10,000円の土地が5%上昇し、面積100㎡@1,000,000円の土地が10%上昇したすれば、 単価平均変動率は7.5%である。 しかし総額平均変動率は限りなく10%に近似するのである。

このことに関して、一つの例を示そう。
内閣府が公表している国民経済計算ストック編参考表に「土地の資産額の都道府県別内訳(民有地)」という資料が存在する。それによれば、平成22年全国民有地資産額は1,000,905.9(単位・十億円)である。 うち、東京都の資産額は206,969(同・十億円)である。 東京都の総資産額は全国のほぼ20%を占めている。 埼玉、千葉、神奈川、東京の4都県合計値は398,573.7(同・十億円)と示されている。 4都県の面積は13,369.68k㎡であり、全国面積は377,959.91k㎡である。《東京都面積は2,103.97k㎡》 東京都は国土面積の0.6%を占めるのみであるが土地資産総額は20%を占めているのである。 4都府県についていえば、国土面積3.5%が資産総額では40%を占めるのである。
(注)国民経済計算は、我が国の経済の全体像を国際比較可能な形で体系的に記録することを目的に、国連の定める国際基準(SNA)に準拠しつつ、統計法 に基づく基幹統計として、国民経済計算の作成基準及び作成方法に基づき作成される。 公表されている参考表は出典が明示されていないが、固定資産税土地評価額累計値であろうと推量される。

地価公示価格から土地総額を類推するのは容易ではないが、宅地について公示価格と固定資産税評価額の連関を推計することはさほど難しいこととは思われない。 町丁名や状況類似地域などを手懸かりとして連関を推計することは可能であり、推定総額を基礎とする地価総額推移を検証することは実態認識の上からも意味あることと思われるのである。

不動産価格指数については、そのデータ母集団に大きな罠が潜んでいるのである。不動産価格指数は不動産の取引価格情報提供制度により得られた取引価格データを基礎として算出されているものである。 毎年約30万件の取引価格データを得ているものであるが、実態は全取引の25%程度を把握しているに過ぎないのである。全国の土地取引件数は130万件前後発生しているが、そのうち任意で回答が得られた1/4~1/3を把握しているに過ぎない。 また把握標本数も均等に分布しているのではなく、特に都心部では10%も把握できていないのである。

直近公表データ《H24/1-3月~H24/10-12月》によれば、新宿では206件中4件、銀座では71件中3件を把握するのみである。 現在稼働中の価格指数は住宅地のみであり、商業地は公表されていないが、住宅地にしても都内の住宅地の把握率は相当に低いものである。
(注)国交省土地総合情報システム:不動産取引価格情報検索にて青四角アイコンで表示される地域をクリックすれば、期間中の取引件数と価格情報件数が表示される。 都心商業地と郊外住宅地では明らかに取引価格情報の把握割合が異なっている。  しかも取引発生状況とその取引価格把握状況について、その分布が統計的に見て整合性が認められるか否かについて、公表資料は何も示してはいないのである。

この不動産取引価格情報提供制度の不十分さはもう一つの問題点を抱えている。 それは地価公示の鑑定評価の基礎資料である取引価格事例が、その大半を価格情報提供制度に由来する資料に依存しているという実態である。 個人情報保護法その他の理由から、提供制度由来事例に依存せざるを得ないと云う状況には正当理由が認められるけれど、だとしてもそれでよしとすることにはならない。 地価公示価格が抱えている様々な問題点については、以前にも記事にしたことがあるが、統計値として公示価格推移指数や不動産価格指数を見る時には、そこに潜んでいる問題点について知ったうえで利用してゆきたいものである。 同時に標本抽出調査が実態を現しているのか乖離しているのか、乖離しているとすればどの程度か、乖離を埋めてゆく施策は有り得るのかなどについて、検証と検討を続けてゆかねばならないと考えている。

そういった意味から、入手可能な資料《照会に応えて得られた資料》を母集団として、不動産価格指数も地価公示価格も依存せざるを得ないのが現状である。 とはいっても、照会回収資料の原資料である所有権移転全資料を分析することは十分に可能なのである。 そこから、所有権移転の実態も原始資料と回収資料との分布状況も見えてくるであろうし、回収資料の偏在状況も把握できるであろうと考えられるのである。 原始資料は未だに封印されたままで開示されないと聞くが、そのような状況を放置しておくことが即ち、技能力に欠けるところありと云うのである。

統計値というものには、母集団の適否、分布状況、分析ツールや前提条件の適否など、結果を大きく左右する死角が潜んでいるものであり、鵜呑みにすることは避けなければならないのである。 純粋に統計値とは云えないかもしれないが、世論調査なども眉唾的な要素を多く抱えているのである。 一般に行われている世論調査はRDD方式による電話アンケートが主流であるが、これだけ携帯電話が普及しているにもかかわらず、固定電話による標本抽出を行っている問題点が指摘出来るし、設問の内容と設定方法、電話をかける時間帯など、ある種の誘導質問や当初から調査の対象漏れが存在することなども指摘されなければならないと考えている。

ネット時代であるから、多種大量データを手軽に利用出来るようになっているし、パソコンを利用する統計解析ツールやソフトも多く流通している。 つまり、技術的には統計解析はとても身近なものとなっているのであるが、手軽に利用出来るだけに統計解析の前処理として、データの特性や傾向を把握することつまりデータ分析が重要であり、統計値にはデータの特性から得られる結果としてのバイアスが懸かりやすいという特性にも留意しておきたいのである。

(注)茫猿は「不動産価格指数と公示価格推移指数」と題する記事その他を2012.09始めに掲載している。

関連の記事


カテゴリー: 茫猿の吠える日々 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください