一、问题的提出
在经历了2007年的“大热”和2008年的“严冬”之后,2009年中国土地市场出人意料地瞬间再次升到沸点,尤其下半年的成交量异常火爆,成就了一个又一个“地王”神话。根据中国指数研究院土地监测数据显示,2009年中国70个大中城市土地出让金共计10 836亿元,同比2008年增加140%,甚至比业界公认“疯狂”的2007年都增加了49%,估算下来全国的土地出让金约占2009年GDP的4.4%。其中,杭州市土地出让金高达1 054亿元,位居全国第一,同比上涨幅度达到238%,上海市以1 043亿元次之,同比增长172%,第三名北京市也达到928亿元,同比增长85%。日益高涨的地价使房价与地价关系之争也随之迅速升温,地价是否为造成目前房价高涨的主要推动力,成为引起社会普遍争论的一个焦点问题。
令人感到奇怪的是,相对于房价与地价之间因果关系的研究已存在着汗牛充栋般的文献,研究地价对房价影响程度大小的文章却很少。Michael Potepan(1996)定量研究了地价对房价的影响,通过采用1974—1983年美国58个大都市区(MSA)的年度住房调查数据,建立房价、地价、房租三者间的联立方程,估计出房价对地价的弹性为0.32。Glaeser(2003)通过对美国多个城市的房屋建筑成本、政府管制等因素比较发现,对土地限制以及随之而来更高的土地成本是导致纽约曼哈顿房价高昂的最重要原因。国内学者中,平新乔和陈敏彦(2004)、梁云芳和高铁梅(2006)分别采用1998—2001年中国35个大中城市的面板数据和1999年1季度—2005年4季度全国的时间序列数据,估计了房价对地价的弹性值分别为0.785和0.80。
虽然目前我国为保障粮食安全,正在执行世界上最严格的耕地保护政策,即实行耕地总量动态平衡、土地用途管制、建设用地的年度供应计划,以限制农地过度非农化。限制土地供给的规制政策势必会通过紧缩地根推动房价上涨(Peng and Wheaton,1994;Barlow,1993;Bramley,1993;Evans,1996;Hannah et al.,1993),但是这应该不是导致中美两国地价弹性存在如此大的差异的原因,平新乔和陈敏彦(2004)、梁云芳和高铁梅(2006)的结果很有可能被高估了。黄静和屠梅曾(2010)利用全国1999年1季度—2008年1季度29个大中城市的面板协整DOLS方法,估计了房价对地价的整体弹性为0.481,这个结果还是相对让人接受的。但是他们对各城市的估计结果差异很悬殊,如广州市高达10.097,而长春市却只有0.113,这明显是有问题的。
国内学者的估计结果之所以或多或少存在一定问题,本书认为主要是因为采用了不恰当的数据。房地产最大的一个特点就是异质性,房屋和土地的价格与其自身的质量和所处地段等息息相关。他们采用的无论是全国时间序列数据还是各省(区、市)的面板数据,都属于宏观年鉴数据,房价和地价都是取自当年本地区所有交易房屋和土地的平均值,这样一来就不能体现由于地段和房屋类型不同所造成的房价和地价差异,所以用该数据得到的估计结果自然存在很大的偏误。因此,研究房地产问题最好利用具体楼盘和地块的微观调查数据,获取建筑特征、邻里特征和区位特征等相关特征,采用Rosen(1974)提出的特征价格模型(hedonic model)来解释住宅价格空间差异形成的原因(Gillard,1981;Li and Brown,1980;Sirpal,1994;Walden,1990)。该方法目前已经在国际上被广泛采用,但是在我国由于相关微观数据获取十分困难,这方面的研究还很少。幸运的是国土资源部为了回击外界对当前高地价的质疑声,于2009年6月23日公布了其对全国30个省(区、市),除西藏自治区外的105个城市620个房地产开发项目的抽样调查结果,指出地价占房价比例平均为23.2%,其中30%以下的占约78%,并在7月25日正式对外公布了620个楼盘的具体统计数据,为能准确估计房价对地价的弹性提供了一个非常好的样本。
本书的贡献在于利用全国大规模具体楼盘的调查数据研究了地价对房价的影响程度,而且充分考虑了该影响程度的区域差异,既研究了东部、中部、西部之间的地区间差异,也研究了每个地区内部大城市与中小城市的地区的差异。通过准确估计出地价变化对房价的具体影响,为制定正确的土地政策提供依据。同时还研究了不同的土地出让方式和土地开发程度。在以往的研究中,由于数据原因而无法涉及这些问题,使本书对地价对房价的影响机制有了一个更为全面的分析。
二、数据处理与统计描述
(一)样本预处理
2009年7月25日,国土资源部对外正式公布了其对全国620个楼盘的数据,其公布内容包括被调查楼盘的所在行政区域、项目名称、具体位置、土地面积、容积率、土地取得方式、土地取得时间、楼面地价、土地开发程度、开盘平均售价和地价房价比例。由于有些调查项目统计内容不清楚、统计口径不统一,并且某些项目抽样的样本过小或过于集中而不具有代表性,在计量分析之前有必要进行相应处理。
在调查的620个楼盘中,绝大多数土地取得时间都在2006年、2007年和2008年三年,但是其中也有来自2004年和2005两年的15个样本,为了避免小样本带来的偏差,因此将这15个样本剔除。基于同样的考虑,在620个楼盘中,以招标方式出让土地的仅有18例,而且有14例都来自北京市,抽样分布严重不均匀,没有地域上的代表性,因此把这18个样本也剔除了。同时,也有很多统计内容不清楚的样本,如没有给出具体容积率数值,而是给出一个比较模糊范围;土地出让方式没有明确说明到底是挂牌、拍卖还是招标,而是笼统注明为招拍挂。为了不影响估计的准确性,同样把这些观测值也给去掉了。经过上面这些处理,最后得到来自30个省(区、市),除西藏自治区外的87个城市的536个楼盘样本所组成的混合截面数据,在计量分析中这仍然是相当大的样本,从而能够保证回归结果的可靠性。本书的附录2中给出了所使用的样本楼盘的相关信息。
在进行正式计量分析之前,本书对这组调查数据进行了十分细致的统计描述,这有助于对我国房地产价格的区域差异有一个更清醒认识。在房地产经济学中有这么一个关系式:
地价=楼面地价×容积率
其中真正构成住房建筑成本的是平摊到每平方米住房建筑面积上的楼面地价,而容积率往往又体现了政府和开发商在城市规划和房屋设计方面的要求,所以本书在对地价进行统计分析的时候也将其进一步细分为楼面地价和容积率。
(二)统计分析
在这536个楼盘中,房价平均为4 795.7元/平方米,略高于2006年、2007年、2008年三年全国住房平均价格3 366.8元/平方米、3 863.9元/平方米和3 799.9元/平方米[2]。其中最高为北京市西苑好山居每平方米45 000元,最低为重庆市万州区五桥街道纵二路的1 130元/平方米。如图5.1所示,房价大部分集中在3 000—8 000元/平方米之间,占这次调查样本的近70%,特别是3 000元/平方米以下的低价商品房也有四分之一的份额,与之相对应,万元以上的高档商品房比例很低,只有百分之五点几。
图5.1 房价分布图
图5.2 楼面地价分布图
楼面地价平均为1 188元/平方米,从图5.2可以看出主要集中在500—1 000元/平方米这个水平,整体还是比较低的,其中最低为荆州市玉兰小区的每平方米125元。当然也不乏一些高价地块,比如最高的苏州市华润平门府高达每平方米11 613元,当然这与2007年8月24日南京市苏宁房地产开发有限公司以44.04亿元竞得上海南京路步行街商办宝地——黄浦区163街坊地块,折合楼面地价66 930元/平方米的内地单价地王还有很大差距。
图5.3 容积率分布图
容积率的一个明显特点是分布很集中,有40%处于1到2这个区间,平均为2.47,特别高的(大于5)和特别低的(小于1)都很少,加起来还不到10%。其中最高的为大连市城市公元的17.2,最低的是海口市海岸绿洲二期的0.5。
楼面地价与房价的比例平均为22.7%,与2007年8月第30期的《城市地价与房价关系专题报告》公布的23%—28%比例很接近。20%—30%这个区间所占的比例最大,占了整个调查数据的三分之一,这也与通常房地产业内人士所认为的地价在房价中占三成的比例比较吻合。值得注意的是,有近五分之一的楼盘其楼面地价占房价的比例超过了30%,其中比例最高的是石家庄市新公爵的58.6%,而最低的是重庆市涪凌区东站天街的5.3%。
图5.4 楼面地价占房价比例分布图
从前面对各指标最大值和最小值分析中可以看出,我国各个地区的房价和楼面地价差异是非常大的,东部经济发达省份(自治区、直辖市)、副省级城市和省会城市,这些通常意义上的大城市[3]的房价和楼面地价都大大高出中西部欠发达省份(自治区、直辖市)和中小城市。为了更清楚地看到这种差异,本书按照楼盘所在地区(东部、中部和西部)[4]、楼盘所属城市(大城市和中小城市)对上述536个楼盘进行区域间的统计分析。即使在同一个省(区、市)内部各城市房地产价格也存在明显差异,因此,又进一步对每个地区内部大城市与中小城市进行了区域内的统计分析。
表5.1中的东部地区房价和楼面地价的均值和中位数远远高于中部和西部,而中部与西部之间的差异并不大,特别是房价均值差距还不到50元/平方米,基于均值和中位数差异检验也有力地证明了这一点。同时表5.2中的大城市与中小城市的房地产价格差异也是十分明显,都在1%水平上拒绝了均值和中位数相等的原假设,数字显示前者均值比后者高出50%左右。前面反映的都是楼盘区间价格差异,表5.3中体现了楼盘区内价格差异,该差异主要通过同一地区大城市与中小城市房地产组间价格的均值和中位数差别和该地区同一类型城市房地产价格组内变动的标准差体现出来。
表5.2 楼盘所在城市间差异的统计分析
表5.3 楼盘所在地区内部城市间差异的统计分析
根据表内数据,可以发现在同一区域内,大城市与中小城市的组间价格差异也十分明显,各地区的大城市与中小城市房价和楼面地价的均值和中位数差异全部都是在1%水平上显著。同一区域、同一类型城市内部房地产价格变动的组内差异方面,东部大城市标准差最高,房价与楼面地价标准差分别高达7 461.9元/平方米和1 847.6元/平方米,这说明即使在房地产价格普遍偏高的东部地区,不同城市间的差距也很大,其最低的房价和楼面地价水平比西部中小城市均值还略低。但是西部中小城市标准差却是最低的,分别只有679.0元/平方米和247.7元/平方米,这说明该区域内部房地产价格差异不是很大。对不同地区、不同类型城市进行交叉比较后可以发现一个规律:除了中部大城市的楼面地价要略低于东部中小城市以外,中部大城市的房地产价格均值要高于东部中小城市,西部大城市的房地产价格均值要高于中部中小城市,这就说明同一地区、不同类型城市的房价产价格的区内差异要大于同一类型城市不同地区之间的区间差异,而梁云芳和高铁梅(2007)、况伟大(2008)都只强调房地产价格东部、中部和西部之间的区域间差异。关于容积率,除了在东部地区的大城市与中小城市间的差异不显著以外,其他各种情况都高度显著。
续 表
注:以上都是对同一区域大城市与中小城市的对应变量进行均值、中位数检验,相关解释同表5.1。
此外,又按照土地出让方式和土地取得时间对上述变量进行了分类,从表5.4可以看出,拍卖和挂牌的均值、中位数差异检验除了房价均值和容积率中位数差异在10%水平上显著,其他都不拒绝两者相等的原假设,这更说明拍卖和挂牌两种不同土地出让方式造成的房价和地价差异并不明显。以拍卖形式出让土地的楼面地价和容积率的均值略高于挂牌出让,相应的地价均值(楼面地价*容积率)3 029.7元/平方米也较2 897.7元/平方米要高,这跟现实中的情况很吻合。由于拍卖采用的是单纯“价高者得”的英式竞价形式,而且是当场就确定中标人。挂牌出让要求挂牌时间不得少于10个工作日,出让人确认该报价后,更新显示挂牌价格并继续接受新的报价,挂牌期间可根据竞买人竞价情况调整增价幅度。由于挂牌时间长并允许多次报价,有利于投资者理性决策和竞争,不易受现场非理性气氛的影响而拍出“天价”,因此拍卖出让的地价一般说来都比挂牌要高,但是拍卖出让导致的高地价却并没有形成高房价,拍卖出让的房屋均价4 309元/平方米,要比挂牌的4 872元/平方米低出不少。从这个数据来看,高地价导致高房价的说法似乎站不住脚。
表5.4 按土地出让方式的统计
注:拍卖中房价均值下面报告的是其与挂牌房价均值相等性检验(test of equality)的t统计量,拍卖中位数下面报告的是其挂牌房价中位数相等性检验的wilcoxon统计量。***、**、*分别代表均值(中位数)差异检验在1%、5%、10%水平上显著。楼面地价和容积率的相关检验及统计量的表示同房价。
从表5.5中可以发现,2006年以后取得土地的房价与楼面地价逐年降低。由于从取得土地到建成出售往往需要一年左右的时间,这样房价在2007年达到高峰。2008年下半年以来,由于全球金融危机,房地产市场也受到影响,特别是2008年取得土地的房价和楼面地价有了非常大幅度的下跌,这也充分体现了金融危机这一突如其来的外生冲击对房地产市场的巨大影响。相等性检验结果也表明,2006年和2007年之间除了房价均值差异在10%水平上显著外,其他情况下房价和楼面地价差异都是不显著的,值得注意的是,这个时候容积率的均值和中位数差异却是十分显著的。与之相反的是2007年和2008年房价和楼面地价的均值和中位数差异都在5%以下水平显著,这也进一步说明了2008年金融危机以来房价和楼面地价确实发生了比较大的变化,此时容积率的差异却是不显著的。
(三)计量模型设定
从上面的分析可以看出,不同地区、不同城市类型的房价与楼面地价有很大差异,因此当估计地价变动对房价弹性时,必须把这些因素考虑进去。在计量经济学中,把这些定性变量纳入回归分析往往是通过设置虚拟变量的办法,因此本书设置了如下虚拟变量。
(1)楼盘所在地区和城市虚拟变量:以西部地区为参考组,通过设置东部(east)、中部(middle)两个地区虚拟变量反映地区间差异的影响。以中小城市为参考组,设置反映城市类型的虚拟变量(city),控制城市差异对房地产价格的影响[5]。
(2)土地出让方式虚拟变量:以挂牌为参考组,通过设置拍卖(auction)这个土地招拍挂虚拟变量反映两种不同土地出让方式的影响。
(3)土地取得时间虚拟变量:以2006年为参考组,通过设置year2007、year2008两个时间虚拟变量体现土地取得时间的影响。
此外,开发程度不同的土地也会对房价产生一定影响,此次调查中的土地开发程度主要有以下几个等级:生地出让、三通一平、五通一平、六通一平、七通一平和熟地出让,为此本书设置了一个反映不同土地等级的控制变量rank,对应赋值分别为1、2、3、4、5、6。如果一个楼盘征地面积越大,那么它就很可能用来盖室内建筑面积大的高档商品房,这样土地面积(area)能够在一定程度上作为反映房屋类型差异的控制变量。
房价(hp)用调查结果公布的开盘平均售价来衡量,地价(lp)采用楼面地价乘以容积率计算得到。由于本次调查公布的定量数据十分有限,仅有房价、楼面地价、容积率、土地面积四项,为了避免遗漏重要解释变量问题,本书对照各楼盘所在城市选取如下若干控制变量:
(1)反映经济基本面因素的变量:根据Quigley(1999)、沈悦和刘洪玉(2004)等的研究,房价与人口、收入等经济基本面因素高度相关,因而本书选取了人均可支配收入(income)、人口自然增长率(rkzzl)作为房价的控制变量,预期这些解释变量显著为正。
(2)反映城市基础设施建设的变量:通过扩大基础设施投资,提高城市基础设施的质量和规模,可以大幅减少居民生活成本,进而提高人们对房地产支付意愿(Song and Knaap,2003),并参考周京奎和吴晓燕(2009)的相关研究,本书选取人均绿地面积(green)、每万人拥有公交车数量(bus)、人均铺装道路面积(road)等作为控制变量,同样预期这些变量显著为正。
上述控制变量的数据除人均可支配收入来源于《中国区域经济统计年鉴》,其他全部来自历年《中国城市统计年鉴》,由于此次没有公布各楼盘具体的销售时间,这里都假设房屋是在取得土地后一年销售。
三、计量结果及解释
(一)全部楼盘的房价影响因素分析
表5.6 整体回归结果
续 表
注:因变量都是ln hp。小括号中报告的是根据异方差稳健性标准差计算的t统计量,*、**、***分别表示在10%、5%、1%水平上显著,以下同。
在表5.6中,通过逐步增加解释变量的方法来估计房价对地价弹性,第一列只是让房价对地价回归,跟国内大多数相关研究一样,结果都被高估了,地价弹性高达0.456。之所以会出现这个结果,是因为遗漏了对房价有正向影响的收入、人口、楼盘区位等解释变量,而这些变量又与地价正相关,自然导致了估计系数产生向上的偏误[6]。随后在第二列中加入反映楼盘特征的相关控制变量后,地价弹性变为0.394,这些控制变量也全部在1%水平上显著。回归结果显示大城市的房价要比中小城市高出25.0%(exp22.3%-1)[7],东部和中部要比西部分别高出43.2%和19.5%,主要体现了我国房价的地区间差异。为了考察每个地区大城市和中小城市房价的地区内差异,在第三列中又加入了东部和中部两个地区虚拟变量与城市虚拟变量的交叉项,这两个交叉项也是非常显著的,其值显示东部大城市比东部中小城市的房价要高出42.2%,中部大城市比中部中小城市的房价要高出25.0%,这也跟前面统计分析结果比较吻合。除了梁云芳和高铁梅(2007)、况伟大(2008)等所强调的东部、中部和西部之间的区域间差异,本书还发现同一地区内部、不同城市之间房地产价格也存在着十分明显的区内差异。在第四列中又继续加入楼盘所在城市的经济基本面和基础设施等控制变量,地价弹性又进一步降低到0.355,大大低于平新乔和陈敏彦(2004)、梁云芳和高铁梅(2006)、黄静和屠梅曾(2010)的估计结果,跟Michael Potepan(1996)的0.32很接近。此时反映地区内房价差异的两个交叉项仍然高度显著,但是其系数略有降低,新加入反映经济基本面因素的控制变量,只有人均可支配收入很显著。根据Mankiw and Weil(1989)的研究,人口数量变化大概要经过20年左右时间才能对住房需求产生影响,因为新出生婴儿要经过20年以后才进入婚姻阶段,所以人口数量变化对住房需求和房价的影响有滞后效应,这也决定了当期的人口增长与房价没有很大相关性。几个反映城市基础设施建设的控制变量虽然符号为正,但却没有显著性,这是因为具体楼盘价格主要受离车站、公园的距离这些邻里特征影响。由于无法获得上述统计资料,因此用楼盘所在城市的人均绿地面积和每万人所拥有的公交车辆数等代替。
在其他控制变量中,代表土地开发程度的变量rank估计出来系数为0.037,且在1%水平上显著,说明在其他因素保持不变情况下,土地开发程度每高出一个等级,平均说来会使房价提高3.77个百分点。因为开发商在土地开发一级市场上拿到的是未开发的土地,即生地,那么他会赚取到土地开发的利润,并且会适当调低房地产二级开发市场的利润目标;如果开发商拿到的是熟地,由于他赚不到土地开发的利润,就会适当调高房地产二级开发市场的利润目标,表现为要求获得更高的房价。土地取得时间的两个虚拟变量在各模型中都是显著为负,而且year2008相对负得更显著,说明受金融危机的影响,房价在2007年达到顶点后有一个比较大的下跌,模型4的回归结果显示2008年拿地的楼盘售价比2006年下降了24.1%。[8]此外拍卖虚拟变量也是显著为负,其估计结果表明土地以拍卖方式出让的楼盘售价比挂牌出让要低8.32%。
(二)房价对地价弹性的区域间差异分析
表5.7 分地区和城市的区域间弹性差异估计结果
续 表
注:为了使输出结果更简洁,反映经济基本面因素和城市基础设施因素的控制变量的估计结果没有给出,以下同。
前面研究了房价区域间和区域内差异,那么房价的这种区域差异是由地价引起的么?接下来就通过分地区和分城市估计房价对地价弹性来回答这个问题,以表5.6的模型4为基础进行估计。本书重点关注的房价对地价弹性在中部和西部分别是0.321和0.308,基本上是无差异的,只是东部的弹性0.367要略高些。回归结果还显示,东部和中部地区大城市房价要比中小城市分别高出29.8%和22.0%,而在西部地区这个差异却没有明显体现出来。采用Chow test对东部、中部、西部之间房价影响因素差异进行检验[9],结果发现东部和中部地区在1%显著水平上拒绝了不存在差异的原假设,而中部和西部地区房价的影响因素则无明显差异。值得注意的是,拿地时间的两个虚拟变量在中部和西部并没有显著为负,土地开发程度变量也没有显著性。计量结果同时表明在大城市中,东部、中部、西部之间的房价差异更加悬殊,东部和中部地区分别比西部高出58.2%和40.8%,而中小城市不存在这种明显差异。同时Chow test结果也表明我国大城市和中小城市之间在房价的影响因素方面也存在十分明显差异。
(三)房价对地价弹性在同一地区不同城市之间的区内差异分析
为了更深入研究房地产价格区域差异的影响因素,本书进一步考察了同一地区、不同类型城市之间地价对房价的影响,我们发现同一地区(尤其是西部)内部大城市与中小城市之间的地价弹性差异更大。将上述各区域的弹性作比较,地价弹性最高的是东部中小城市,中部大城市次之,接下来是西部大城市、中部中小城市、东部大城市,最低的则是西部中小城市。房地产市场竞争最激烈的东部大城市地价弹性仅高于西部中小城市,目前房价和地价都很低的、房地产业还有待进一步发育成熟的市场,这与黄静和屠梅曾(2010)的研究有很大不同。他们的结果是东部和西部大城市地价弹性要比中部大城市高,由于他们的研究只是简单地对房价与地价进行DOLS估计,遗漏了很多重要解释变量,因而系数是有偏的。在对各地区不同城市进行分类后,每一个子样本变得更小,特别是中部大城市和西部中小城市分别只有46和30个数据,这个时候模型的多重共线性问题很严重,对估计结果可能会产生一定影响。因此在对这两个模型进行估计的时候,本书对进入回归中的每个变量都根据经济学意义进行仔细筛选,这就导致了在中西部大城市与中小城市的计量方程不一致,从而不能进行Chow test。然而不同组别之间的计量模型不一致,这也能够说明它们之间的影响因素是不同的。与此同时,对东部地区大城市与中小城市进行Chow test发现,它们两者之间在房价影响因素方面也存在显著差异。上述各模型中,两个拿地时间虚拟变量此时变得更加不显著,土地开发程度和土地面积的显著性也有所下降。
(四)不同土地出让方式和土地取得时间情形下房价对地价的弹性分析
此外,为了充分利用这次调查的数据,本书还对不同土地取得时间和土地出让方式的房价对地价弹性进行了估计。结果表明拿地时间越晚,地价对房价的影响程度也越低。这一方面是由于外部经济环境的影响,2006年以来国家先后出台了“国八条”“国六条”等多项宏观调控政策,建设部与国土资源部等多部委对房地产市场进行了大力整顿。特别是2008年以来,由于全球金融危机的影响,房地产市场也受到了很大的冲击,成交量开始萎缩,房价也开始下跌,Chow test结果都在1%的显著性水平上显示了2007年和2008年的房价影响因素发生了变化,这些因素都直接导致了地价弹性的降低。另一方面地价对房价的作用力逐年下降,这也是房地产企业都开始认识到土地的重要性,有意识地加强土地储备,从而增强抵御地价上涨的能力的结果。土地拍卖时的房价对地价弹性为0.366,大于土地挂牌时的0.345,由于这次调查中招标出让土地的楼盘过小且大都在北京市,因此将其剔除后,样本中就没有招标的样本,从而第四章所得出的推论只是部分得到证实。但是Chow test的结果表明,拍卖和挂拍出让土地的楼盘价格整体影响因素并不存在明显差异。除了2008年取得土地的楼盘外,东部和中部与城市之间的两个虚拟变量也基本都是显著为正,这再一次证明了同一地区内部大城市和中小城市之间确实存在着较为明显的房价差异。其他控制变量如土地取得时间虚拟变量等在上面几个模型中也基本显著为正。
表5.9 不同土地取得时间和土地出让方式的估计结果
四、稳健性分析
房地产价格具有区域差异和空间相关两个最重要的特征。第一个特征具体表现为不同地区房地产价格的巨大差异,这个在前面统计和计量分析中已得到充分体现。同时,高度离散的房地产价格数据导致异方差现象特别严重,加上又是抽样调查数据,不排除有异常值可能。房价的第二个特征突出表现在一个中心城市的房价走势明显带动周边地区变化,在考虑了房价地区间相互作用后,地价对房价的影响程度是否会发生变化?另外,国土资源部虽然对外声称这次调查是基于全国范围内的随机抽样原则,但是本书发现在536个有效楼盘中绝大部分都来自中小城市,大城市也是西部居多,因此我们有必要考虑中西部中小城市和那些房价比较低楼盘的数据截断问题(truncated)。基于上述几个原因,前面OLS回归结果的可靠性就很值得怀疑,下面本书将采用一些前沿计量方法进行稳健性分析。
(一)基于分位数回归的分析
为了克服房地产价格巨大区域差异造成的严重异方差问题,本书采用了由Koenker和Bassett于1978年提出的分位数回归(Quantile Regression)方法。相对于传统的OLS估计,分位数回归具有四个方面优势:①特别适合具有异方差的模型。②对条件分布刻画更加细致,能给出条件分布大体特征。每个分位点回归都赋予条件分布上某个特殊点(中央或尾部)一些特征;把不同分位点回归集中起来就能提供一个关于条件分布更完整的统计特征描述。并且不同分位点下所给出的参数估计本身也可能有值得进一步探讨的意义。③分位数回归并不要求很强分布假设,在扰动项非正态情形下,分位数估计量可能比OLS估计量更有效。④与OLS通过使误差平方和最小得到参数估计不同,分位数回归是通过使加权误差绝对值之和最小得到参数估计,因此估计量不容易受到异常值影响,从而估计更加稳健(高铁梅,2009)。分位数回归的上述特征使之特别适合于本书这个数据离散的调查数据,参照多数文献做法,本书报告了0.1、0.25、0.5、0.75、0.9五个分位点的回归结果。
(二)基于空间计量的分析
对于房地产价格的空间相互影响问题,因此可以借助由Anselin(1988)提出的空间计量经济学方法,该方法目前被广泛应用在城市和房地产经济学、公共经济学和地方财政、农业和环境经济学等领域。在进行空间计量相关检验与估计之前,必须先设置空间权重矩阵。本书采用最常见的地理相邻矩阵,由于样本是各城市具体楼盘的调查数据,因此把属于同一城市的楼盘视为相邻。汕头市等9个城市由于只调查了1个楼盘,因此将样本中与其距离最近的城市楼盘视为相邻。在空间计量经济学中,检验各地区之间的经济变量在地理空间上是否表现出空间自相关性,最主要有Moran’s I、Geary’s C及Getis &Ord’s G指数,详见表5.10。经检验,除了地价的Geary’s C统计量不拒绝不存在空间自相关的原假设外,其他统计量都表明我国房地产价格表现出十分明显的空间自相关性,这说明运用空间计量经济学模型研究房地产价格变化是很合适的。目前空间计量经济学主要有空间滞后模型(又称空间自回归模型,简称SLM)和空间误差模型(又称空间自相关模型,简称SEM)。为了便于比较,本书同时估计了这两个模型。
表5.10 房价与地价的空间自相关检验结果
注:以上进行的都是单尾检验,各统计量下面小括号报告的是z统计量。
(三)基于截断回归的分析
由于本书样本中西部中小城市的低价楼盘偏多,可能在一定程度上会对估计结果产生影响。因此本书对其进行必要处理,这时既可以采用简单剔除低价楼盘后再用OLS估计的办法,又可以采用截断回归模型,通过设置左截断点将部分低价楼盘样本给截去。具体采用哪种方法更有效,这取决于本书的研究目的。由于本书是要根据这次调查样本对我国地价对房价整体影响程度进行推断,还是应该将低价楼盘的影响也包括进来,因此采用截断回归模型估计更合理[10]。根据房价的具体分布情况,本书设置了2 000、2 500、3 000三个截断点,分别截掉了29、76、156个样本,这其中绝大多数都来自中西部中小城市。
表5.11 房价对地价弹性的各种稳健性分析结果
同样这里也是对表5.6中的模型4进行估计,以上各种模型的各种估计结果的房价对地价弹性都是在1%水平上显著,而且其系数在0.31—0.39这个范围内,与OLS估计出来的0.355十分接近,这说明本书估计结果是很稳健的。分位数回归结果显示随着分位点提高,房价对地价弹性有逐渐下降趋势,说明售价越高的楼盘,地价对其影响也越小,这也跟前面全国各房地产市场中,东部大城市的地价弹性是倒数第二低的估计结果相吻合。空间计量方面,SEM和SLM模型估计出来的地价弹性分别是0.348和0.322。基于Lagrange multiplier和Robust Lagrange multiplier检验结果表明,SEM模型的解释效果更好,该模型系数跟OLS估计的0.355更接近,这说明尽管我国房地产价格具有很强的空间相关性,但是各地区房价之间相互作用却并没有明显改变地价对房价的影响程度。考虑了数据截断的影响后,本书发现随着左截断点的提高,地价弹性有逐渐上升趋势,但是跟OLS结果差别也不是很大。两个拿地时间虚拟变量和东部和中部两个地区与大城市交叉项在上面各个估计结果中也都是十分显著,宏观控制变量中只有收入具有显著性,这些都跟OLS估计结果很类似。为了使输出结果更简洁,本书不再报告。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。