通常、われわれのようないわゆるシステム業者がある自治体の路線価計算の比準表を作成する場合には、多変量解析を用いるのが一般的です。というか、ほかに方法がない(と考えられている)のです。
普通は重回帰分析、ちょっと気が利いた業者だと数量化Ⅰ類を使用します。
まああまり大差はありませんが、とにかく多変量解析を用いた場合の問題点としては、一般論的には多重共線性の問題が考えれられます。
多変量解析では、それぞれの説明変数(ここでは価格形成要因)が独立して目的変数(ここでは路線価)に影響を与えるという大前提が存在するのですが、実際の価格形成要因は全く独立しているとはいえません。
たとえば、駅に近いところはだいたいスーパーも近くにあったりします。容積率の大きい商業地は道路幅員も広かったり、道路の系統も優れている、駅にも近いとか、とにかく土地の価格形成要因は全く独立しておらず、相互関連が大きいのが普通です。にも関わらず、これを無理やり統計ソフトに放り込んで解析すると、どうなってしまうのでしょうか?
答えはデータのわずかな揺らぎによって結果がいかようにも変わってしまうということになります。分析したといっても、お題目なんですね。
ほかにもいろいろ問題はあります。多変量解析では説明変数から多元1次線型方程式によって直接価格を算出するのですが、実際の路線価計算は要因ごとに比準表を適用して格差を出すので、計算式が全く違います。ちょっと説明が難しいのですが、解析手順と実際の計算手順が異なっていることによる誤差も相当にあると考えれるのです。
昔、わたしも上記のような理由から土地の回帰分析というものはうまくいかないんだと思っていました。それは間違ってはいないのですが、もっと大きな要素が欠落しているのでした。
実際に、多変量解析によって比準表を作ってみると、とても極端な格差ができてしまうのです。上述の理由で精度が劣るというのなら、あるときは緩やか過ぎる比準表ができても不思議はないのです。
しかし、実際に多変量解析から得られる比準表はいつも格差の大きい比準表なのです。
なぜなのか、わたしも昔は分かりませんでした。
そして、あるときその理由に気づきました。馬鹿馬鹿しいくらい簡単なことでした。
土地の価格形成要因には数値化可能なもとと不可能なものがあるということなのです。しかし、解析は数値化可能な要因でしかできませんから、両者の影響を無理やり数値化可能な要因に振り分けた結果が得られていたのです。だからいつも極端な格差の比準表が得られていたのでした。
昔、ある自治体の比準表分析結果を見たことがあります。業界では誰でも知っている超大手の鑑定業者の分析結果でした。
多変量解析を用いて分析しているので、当然に極端な格差の結果ができてしまいます。とてもそのままでは使用できないので、これをなぜは半分の格差に圧縮して適用する、と書かれていました。なぜ半分なのかは不明でした。
たぶん全国的にはその昔とあまり変わっていません、いまも。ある政令市で1億円かけて比準表を作ったなんて話を数年前に聞きました。大手の鑑定業者に委託されたそうです。どんな解析をやっているのか大変興味がありますが、おそらく昔と同じです。