房地产虽然已经是中国居民财富的绝对载体
这也导致仅凭目前的数据结构,很难对房地产市场的现状进行准确的判断,更遑论预测房地产市场了,而总量数据对购房决策的意义也不大,或者说,现有的数据无法(及时)回答以下问题:
1. 现在的房地产市场是涨还是跌?
2. 整个市场购房者的情绪如何?
3. 这个城市哪个区的房子最好卖?哪个价位的房子接受度最高?
4. 房价的趋势应该是怎样的?
但是,在万物互联之下,虽然不至于让所有交易在任何时间都留下痕迹,但至少可以让部分交易在任何时间、或任何交易在某些时间留下痕迹——我们的目标就是找到这些数据,并分析这些数据。
结果是,我们找到了一个有意思,但不是特别完整的数据:司法拍卖。由于其商品可能存在着各种瑕疵(凶房、长期租约或难以强制执行),司法拍卖通常都是二手房的次级市场,二手房正常市场卖不掉的房子(且有债务纠纷)才会放到司法拍卖上去卖;在二手房正常市场上买不到房子的人才会选择在司法拍卖市场上去买。
正因为此,司法拍卖市场是个更加敏感、波动更大的房地产次级市场,用它来衡量及预测房地产市场的现状及未来再好不过。
可是有数据吗?
当然有!根据2016年最高人民法院发布的《最高人民法院关于人民法院网络司法拍卖若干问题的规定》,人民法院以拍卖方式处置资产的,应当采取网络司法拍卖方式,但法律、行政规定和司法解释规定必须通过其他方式处置、或者不宜采取网络拍卖方式处置的除外。
换句话说,所有司法拍卖数据都要上网——上了网意味着可以爬。
那么去哪里爬呢?
当然是——万能的淘宝。
法院不比链家,数据并不规范,有些数据抓得到有些数据抓不到,比如面积数据我们就抓不到,而有时候,有些奇奇怪怪的比如工业用地、厂房、机器设备甚至手机也会被放到房屋拍卖的栏目里——真情实感,不信你去淘宝司法拍卖里看。
数据清理倒不是事儿,但面积数据抓不到,也就意味着我们抓不到房屋成交的单价——先别着急关网页,虽说没有成交单价,但这对买房来说毕竟不重要,对房地产这种市场,情绪显然更加重要。
既然数据不全,那么在分析的时候,找新的指标就非常重要,我们找了三个指标来替代传统的带看次数、成交均价和成交量:
1. 成交率:每月有多少房子拍卖最后成交的,该数据比成交量好,单纯的成交量数据不能说明问题,可能是供给太少限制了成交量,也可能是供给太多推动了成交量,用成交率显然更能说明问题;
2. 折扣率:虽然没有单价信息,不同房屋的总价不同,自然无法对比,但司法拍卖的前提是评估报告,而由于估值方法大差不差,一般来说都是市场价的一定折扣,所以用成交价除以估值价来计算房屋的折扣率,是房屋单价很好的替代指标;
3. 围观数:这不用多说了,一套房子有多少人看,有多少人报名,都很能说明问题。
就这三个指标能说明什么问题呢?
一般来说,围观数代表着当前的市场情绪,而在房地产市场上通常“量先动,价后行”,所以成交率一般比折扣率走的更快,量是价的领先指标,而情绪又是影响量的指标。
换句话说,成交率快于折扣率,情绪是个参考。
还有一些结构性的数据我们待会儿说。
爬了8000多条北京和上海的司法拍卖交易数据后,我们得到了以下结论。