91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于机器学习的长租公寓租金定价

  2021-03-29    132  上传者:管理员

摘要:近年来,在政策、需求和资本的刺激下,长租公寓进入了快速增长阶段。然而,行业竞争日益激烈,公寓运营商们都希望能扩大市场份额。合理的租金定价不仅能帮助企业吸引更多的顾客,提高品牌的知名度,而且能降低房间空置率,加快资本回收,从而达到扩大市场份额的目的。但目前长租公寓在运营中的租金设定大多基于门店管理者的主观判断,缺乏一定的标准,合理性很难得到保证。为解决人工定价存在的问题,本文将影响租金价格的内外部因素作为特征属性,利用某长租公寓运营商的已开业项目过去一年的经营数据及相关外部数据作为样本集,尝试构造了梯度提升回归树(GradientBoostingRegressionTree)模型为长租公寓进行房间级定价,并通过验证得出,该模型对长租公寓的租金定价具有很强的参考性。

  • 关键词:
  • 企业经营
  • 梯度提升回归树
  • 租金
  • 长租公寓
  • 加入收藏

一、引言


2018年,是长租公寓迅猛发展的一年。随着十九大报告“租购并举”的提出,“长租公寓”成了人们关注的热词。由于住房租赁行业竞争壁垒低,人口租赁需求巨大,各方资本纷纷涌入长租公寓市场,使得市场竞争愈发激烈,长租公寓行业也进入快速增长期。然而,由于缺少相关政策的监管,该行业仍处于粗放的发展初期阶段;经营品类集中度高,经营主体类型多样化,各企业市场占有率低,难以盈利是长租公寓行业该阶段最大的特点。

到2019年上半年,长租公寓在经历过一轮洗牌,在保持高增长的同时逐步提升经营效率。目前有的长租公寓龙头已经将成本控制做到相对成功,因此我们主要通过提升租金收入来提升经营效率。对于租金收入,主要通过价格和出租间天数(即一年中所有房间出租天数的和)共同决定,从以往行业经验来看,两者虽然是反向变动的变量,但由于价格变动幅度相对较小,因此在正常范围内收入和出租间天数整体呈现同向变动。并且,长租公寓的顾客群大多是普通都市白领,房租是该群体在租房时考虑的重要因素。因此,对于待出租房间,进行价格调整使顾客感知价格与房间的使用价值和得到的服务相匹配,从而尽快将空置房间出租,是行业目前提升销售额较为常用快捷的办法。然而,租金价格的调整目前并不存在完全合理的科学模式,而一般由门店管理者进行主观调整。这衍生出两个问题:第一,租金价格的合理性完全依赖于个人水准,有很强的不确定性;第二,将出现总部对门店的管理问题,即对门店运营的考核标准是否体现与公司的目标一致性。

本文拟运用机器学习的方法,即建立一个梯度提升回归树模型,以某长租公寓运营商的经营数据为样本基础,选取内部及外部两方面影响定价的多种因素作为影响定价的参数,并选取目前能使房间较快出租的租金定价,以此作为定价规则训练模型,最后对结果进行分析。该模型能在租金定价时尽可能多的考虑相关因素,借鉴过去的经验,高效地制定出较为合理的价格,不仅帮助长租公寓企业提高出租间天数,而且能为总部对门店的考核提供一个标准。


二、长租公寓行业现状及其租金定价


(一)长租公寓行业

1.行业发展及现状

我国租赁市场起源很早,古时候的客栈就是租赁的一种短期形式。从传统的私人业主出租房,到政府出资的廉租房,再到各种以企业为运营主体的长租公寓,租赁市场发展至今,品类繁多。长租公寓最初的经营者以个体为主,大多是个人业主分散租赁,少数二房东包租自主经营。2010年,互联网创业公司依靠融资开始进入长租公寓市场。之后,中介公司、房地产开发商、酒店管理公司依托原有资源陆续进入该领域。长租公寓慢慢进入公众视野。2018年,在政策红利以及大量的需求刺激下,各路资本杀进该市场。目前市场上运营机构超过500家,长租公寓进入风口期。

长租公寓是依附于存量房的改造升级,并提供适度服务的租赁性公寓,主要客户群是青年白领,以中长期租赁为主。如今,该行业的运营主体主要分为四类:房地产开发商、地产服务中介、酒店运营商以及创业公司。房地产开发商拥有成本优势,地产服务中介拥有房源及租客的信息,酒店运营商能够提供统一高质量的服务,创业公司凭借互联网技术解决信息不对称的痛点,这四类运营商依靠不同的优势进攻市场。虽然目前存在众多的运营者,行业发展迅猛,但市场的整体成熟度较低,正处于抢占市场份额的阶段。

该行业目前仍处于粗放发展初期,未来发展空间巨大。从需求端看,2017年底我国流动人口达到2.44亿人,其中有1.7亿人需要以租房的方式居住。同时租客年龄结构呈年轻化,而青年群体对生活品质有着较高的要求,因此区别于传统租房,提供增值服务的长租公寓仍有很大的市场空间。从供给端看,市场上参与者众多,核心竞争力不强,500家国内规模公寓企业仅占租赁市场份额的2%;同时,该行业缺乏相关的政策规范,没有统一的行业标准,导致市面上的产品良莠不齐,产品服务趋向同质化,距离成熟期还有很长的距离。

2.长租公寓的经营模式

长租公寓的经营模式大致经历四个阶段:获取房间、改造房间、开业寻找租客、租后管理。

首先公寓运营商获取房源,对于运营商而言,资产类型分为轻资产和重资产两种。重资产模式意味着其通过购买或自建的方式获得并拥有房源,一般是整栋楼宇或者楼宇的某几层;而轻资产模式则是通过承租方式获得,类似二房东。根据房源的空间位置,可以分为集中式和分布式公寓,主要区别在于房源集中于整栋建筑物内或者分散在各地,当前80%的长租公寓为分散式公寓。

房源获取后,运营商对房源进行设计装修,并配上相应的家具,注入自己的品牌。集中式公寓的装修风格更为标准化,还会增加公共休闲区域等作为配套设施。开业后,运营商通过自己的App或其他社交平台进行宣传,吸引租客签约。在租客入住后会提供统一的租后服务及区别于传统租房的社区化服务,比如建立社群、组织节日活动等,在集中式长租公寓中比较常见。

长租公寓表面上五花八门,实质上模式单一,其最主要的收入来源就是租金。然而,大部分企业盈利甚微。据统计,一线、二线城市长租公寓的租金回报率不足2%。一方面是因为前期项目获取、装修成本高,另一方面,运营商更看好其产品的未来,把产品的价值增长建立在客户黏度获取后的效率提升上,而不是产品的价格兑付上,希望利用高性价比争取客户。现阶段,企业首要保证的是价格竞争力,在客户感觉物有所值的基础上,提高客户的支付黏度。

在行业整体租金回报率不高的情况下,运营能力将会成为核心竞争力。企业可通过精细化管理,控制成本,提高房间出租率,提升整体运营效率,这将成为企业未来掌握市场主导权的利器。而上面说到,目前行业内最有效的运营效率的提升在于通过定价的调整提升出租间天数,以此来增加营业收入,因此本文将从定价入手,降低房间空置率,提升企业经营效率。

(二)现有定价方法及分析

租金价格的制定可分为开业前和开业后两个阶段。公寓运营商会在开业前,制定一个其认为合理的价格,一般按户型分类定价。在开业一段时间后,公寓运营商再根据市场情况、营销策略等进行调整,在经营过程中价格调整将持续存在。

开业价格的制定可分为以成本为基础的定价和以市场为基础的定价两大类。以成本为基础的定价方法在长租公寓租金定价中比较少见。原因如下:首先,由于该市场目标群体大部分为打工的白领,租金价格是影响其选择的重要因素,企业只考虑自身成本而不考虑目标市场,很难将公寓出租;其次,大量的企业为了拓展市场份额,抢占未来主导权,瞄准的是中低端长租公寓市场,该市场产品同质化严重,在相同区域相似产品的前提下,唯有低价才能取胜;再次,即使是定位中高端的产品,也应在充分了解市场的前提下定价,例如,深圳某公寓运营商因为拿房成本高,将产品定位在中高端市场,以此提高租金价格,但由于该片区目标客户群只有4%,最终出租率惨淡,不得不下调价格。在鱼龙混杂的长租公寓市场,品牌集中度低,运营商没有定价权,脱离市场行情定价,只能是自讨苦吃。

因此,长租公寓的开业价格一般都以市场为基础定价。某些企业在开业前通过周边市场走访或价格探寻的方法,以项目周边的出租房平均租金初步制定价格区间,然后对目标客户进行秘密价格测试,根据测试结果最终确定不同户型的最优价格方案。

通过对比不同公寓租金的市场价格可以发现,租金定价受外部环境和项目本身两大方面的影响。外部环境包括地理位置、生活配套等因素,项目本身包括房间大小、配置等。由于目标客群多为每日通勤的白领,在选房时更关心交通便捷度、生活配套等因素,因而外部环境因素对租金定价的影响大于项目本身。运营商在确定公寓的初始定价的过程中,通常将交通、商业配套、周围竞争情况、产品本身服务、房间配置等多方面因素考虑在内,根据该项目特点在平均租金的基础上进行调整。

后期的价格调整更多受市场供求关系影响。由于价格要适时而变,且需要调价的房间少,运营商不会像开业初期花精力进行大量的市场调研,一般是由运营者根据淡旺季的市场波动,采取直接调整租金或营销折扣的方式调整租金,从而将空置房出租,或者在旺季时适当提高租金。在实际经营中,后期的调整主要基于门店管理者的判断,由于信息不对称,主观考虑不全面等,管理者往往很难做出准确的调价决策,这是长租公寓运营商在经营过程中未解决的难题。


三、梯度提升回归树模型


(一)梯度提升回归树模型原理

1.回归树

决策树是一种用于分类和回归的树结构。一棵决策树的基本组成要素有根结点、内部结点,有向边和叶结点。样本集在每个结点进行属性测试,根据评估标准判定生成子结点,自上而下直到不可分,叶结点就是最终的决策结果。

图1决策树结构

回归树是决策树模型(见图1)的一种,用来解决预测问题,即定量问题,例如根据人的特征预测某人的年龄。为理解回归树的原理,应先了解其产生过程。回归树从根结点开始根据当前条件下按特征分割的所有方法中,形成最小平方误差的方法分割样本集,据此生成内部结点,若有子集被正确划分则生成叶结点,然后再将每个区域中所有样本的算术平均值作为这个区域的预测值。回归树每次只生成两个结点,如此递归下去直到所有子集被正确划分在不同空间生成叶结点,并附上相应的数值。

2.集成学习法

集成学习法的基本原理是将多个个体学习器的学习结果利用某种结合策略整合,输出最终结果。这些个体学习器又被称作“弱学习器”,整合后生成“强学习器”。强学习器“博采众长”,得到的结果准确率更高,具有很强的泛化能力。

回归树因为简单直观,解释性强,常被作为集成学习的个体学习器。目前将回归树作为个体学习器的集成学习思想主要有Boosting和Bagging。Boosting学习法的学习机制是根据前一个学习器的学习误差率调整下一个学习器的训练样本点权重,误差率高的点将在这个学习器被重视,同时正确分类点的权重减少,如此迭代进行。而Bagging学习法的个体学习器之间没有串行关系,主要原理是先随机抽样分别训练不同的模型,然后根据所有输出结果表决出最终结果。Boosting充分考虑了学习误差率,预测精度更高。

3.梯度提升回归树

梯度提升回归树(GradientBoostingRegressionTree)是以回归树为基础学习器的集成学习方法。GradientBoosting是一种改进的Boosting算法,传统Boosting对错误样本权重的增加不一定能使得结果越来越接近真实值,因此,Freidman提出梯度提升算法。它的改进在于每一棵树的迭代生成都是建立在残差(真实值与预测值之差)减少的梯度方向上,每一棵树学的是之前所有树结论和的残差,随着树的增加,残差越来越小,最终所有树的结果累加就是预测值。梯度提升回归树的主要原理如下:

(1)模型初始化。

(公式)

(2)迭代生成M棵回归树,对每棵树执行以下动作。

对所有的样本计算损失函数的负梯度值,将其作为残差估计值。

(公式)

根据拟合一棵回归树,将输入的样本集划分得到叶结点Rmj,j=1,2,…,J。

对于叶结点的计算:

(公式)

(3)更新模型。

(4)输出模型。

梯度提升回归树在解决预测问题上有着很好的表现,它能克服单个决策树为提高准确度而导致的过拟合,具有强解释性、高精度、高可靠性、强泛化能力的优点。

(二)梯度提升回归树应用于长租公寓租金定价的可行性

根据上文可知,租金的价格水平主要受供求关系、公寓的地段及公寓本身配置等因素的影响,这些因素的影响程度各不相同。而树模型的实质就是探究相关因素的差异性对因变量的影响。因此,这些影响因素可以作梯度提升回归树的内部结点进行属性测试。

公寓运营商在开业后的价格调整是基于门店管理者对市场的判断。而人的信息处理能力有限,无法将所有影响租金价格的因素全部考虑在内。梯度提升回归树的优势便在此体现。它可以将所有输入的因素全部进行测试并且考虑了这些特征的重要性,每一步的计算逐渐逼近真实值,无须运营商花费大量时间筛选对租金产生影响的因素以及考虑其影响大小。

另外,梯度提升回归树可以处理文本、数值等多种数据类型,且不需要进行数据缩放,使用方便,在预测问题上有很好的表现;能充分学习大量的历史数据,处理速度快;具有很强的泛化能力,训练后的模型能直接运用到日常运营中,不仅帮助门店管理者调整价格,并且能应用到新项目的定价中,大大提高了工作效率。


四、模型的建立与测试


(一)实验数据集及模型建立

树模型的实质是通过样本数据探究特征属性对因变量大小的影响,因此样本集和特征的选择对模型的输出结果有很大的影响。为保证模型的合理性,首先要保证样本及特征选取的有效性。

首先,选取影响租金价格的相关因素。经过初步分析,租金价格主要受公寓的地段和交通、该区域的竞争情况、公寓的配套设施和服务、房间的特征和内部配置、淡旺季以及其他因素影响。结合数据的可获得性,选取40个特征作为模型的自变量(见表1)。

其次,选取某长租公寓运营商2017年7月1日至2018年6月30日厦门地区若干个已开业项目的租赁合同的成交价格以及对应的出租房间的相关特征数据作为原始数据,剔除由于后台操作造成的无意义合同,成交价格远低于市场价格的合同(例如项目员工享受五折优惠),以及缺少房间相关数据的合同,得到4139条数据。实验的目的是给房间进行合理定价,提高房间的经营效率,使得房间的空置时间尽量减少,因此我们把使房间空置时间小于等于30天的成交价格作为合理定价(空置时间等于该合同的开始时间与上个合同结束时间之差),最终得到符合条件的2522条数据。

房间的配置参数、公寓配套设施、合同成交的相关细节等特征,即f9~f39共31个特征的数据来源于企业的内部经营数据。f17、f25、f36以文本类型储存,其余为数值。其中f9~f14,f21~f23、f26~f35的参数取值为{0,1},0代表没有,1代表有。其他影响租金的外部因素,考虑到数据的可获得性,选取f0~f8共9个特征,这些数据来源于百度地图等网络上的公开数据,其中周围企业密度f0和生活配套数量f1(生活配套包括便利店、餐饮店等商铺)无法准确统计数据,因此将f0的参数值划分为{1,2,3,4,5}5个等级,f1分为{1,2,3,4}4个等级,每个等级的具体含义如表2所示。

表1特征选取

至此,将40个影响因素作为自变量,租金价格作为因变量的梯度提升回归树模型初步建成。

表2f0与f1参数值含义

(二)模型训练和结果展示

1.实验准备

本实验的操作平台为Anaconda环境下的Spyder,Python版本为3.6,使用机器学习模块Scikit-learn建模。在训练模型前,先从构建好的数据集中预留5条数据做之后的实例测试,在剩下的数据中随机抽取其中80%作为训练集,20%作为测试集。

2.参数调优

调整参数对优化模型的性能具有重要的意义。为了找到最优的参数组合,选取评价回归模型的指标R2,RMSE(均方根误差),MAE(平均绝对误差)作为调参的指标,其中R2表示模型的拟合程度,越接近1,模型精确度越高,RMSE、MAE越小,模型效果越好,具体公式如下:

(公式)

就梯度提升回归树而言,有三个指标很关键,分别为:

max_depth:决策树的最大深度,也就是树生成的最大节点数,节点数越多,树模型越复杂。

n_estimators:决策树的最大个数,一般而言,拟合效果需要一定的决策树数量保证,但该指标过大容易导致过拟合。

learning_rate:步长,表示每棵决策树的学习效率,和n_estimators高度相关,步长越小,意味着需要更多的决策树,这两个参数一起决定模型的拟合效果。

首先默认learning_rate为0.1,n_estimators为40,max_depth的取值范围为[5,40],决策树的最大深度和模型性能指标的关系如图2所示。随着树深的增加,误差呈现先极速减小后缓慢增大的趋势,而R2变动趋势正好相反,当取值为30时,性能相对最优。

图2max_depth不同取值结果

其次,决定另外两个参数。由于n_estimators和learning_rate高度相关,学习效率越高,表明每次学习的步长越小,就需要更多的学习器保证其拟合程度。反之,学习效率越高,模型的迭代次数就越少。这两个参数需要一起调参,所以采用网格搜寻法,即遍历所有的参数组,找到性能最优的组合,该方法的缺点是耗时长。现将n_estimators的调参范围设在[40,120],learning_rate为[0.001,0.1],经过多次尝试,最终R2得分最高的组合为n_estimators=100,learning_rate=0.05。

其他参数的调参过程不再赘述,设置结果如表3所示。

表3参数组合参数名

3.运行结果展示

利用最优性能的模型得到的训练结果如表4、图3、图4所示。测试集的训练结果总体不错,R2得分0.979,拟合程度很高。平均误差率(MRE)为2.13%,平均绝对误差达到37,即预测值与实际租金价格相差37元,具有很强的参考性。但是从个体来看,少部分样本误差较大,在10%以上。

表4训练结果分析指标

图3租金价格预测值和真实值

图4预测值误差率

4.实例预测

将训练好的模型保存后,输入实验前预留的5组数据,模型的预测结果如表5所示(表中省略40个特征值)。从表5可知,5组数据的误差率均在2%以内,其中4组的实际误差值均为个位数,而在实际中,房间的出租价格多为整十数,因此误差可忽略不计。第4组预测结果与实际值相差44.44元,相对其他4组误差较大,与实际定价存在一定偏差。

综上所述,模型总体训练效果良好,个别结果的误差较大,但依然在可接受范围内。误差的产生可能是由于某些特征无法取得而导致训练集特征不完善,也可能是没有考虑影响价格的外部因素的动态变化。

(三)模型优缺点讨论

根据实验结果,该模型的总体预测准确率高,预测结果具有很高的参考价值。该实验的数据来源于企业的真实运营数据,说明了将梯度提升回归树应用于长租公寓租金定价的可行性和有效性。梯度提升算法也决定了不同特征属性对租金的影响不同,这与现实情况相同。虽然结果存在一些偏差,但在实际出租过程中,顾客对月租金差异在两位数以内的数字敏感度不高。因此,在保证特征完整及参数真实的情况下,训练后的模型可为门店经营者提供价格参考,经营者可利用一些定价技巧对该价格进行适当的调整,促进交易的完成,从而提高门店的出租率。

然而,该模型依然有不完善的地方。首先,该模型本身相对于其他模型计算复杂度更高。其次,该实验仅仅是为了证明梯度提升回归树在租金定价预测上的可行性,且某些数据难以获得,因此在特征属性的设计上不具有全面性。另外,数据也存在缺陷。同时某些公寓运营商内部经营数据是人工录入,可能存在一些误差。而且某些属性值的判断带有一定的主观性,例如对企业密度的划分。最后,影响租金定价的外部因素是动态变化的。用于实验的数据的时间跨度只有1年,没有将外部因素的变化考虑在内,使用的是某一时点的特征值。以上这些因素都可能对结果造成影响。因此,在训练模型之前首要考虑的是参数的完整性和准确性。模型的效果依赖于数据,高质量且丰富的样本集保证了模型的预测准确性,使用者需要有很强的数据获取能力,该模型更适用于有强大技术支持的企业。在实际应用过程中,培训员工学习使用该模型帮助其工作也是需要考虑的因素。

表5实例测试结果


五、结论与展望


本文分析了长租公寓行业的现状和租金定价在实际经营过程中的问题,提出利用梯度提升回归树帮助公寓运营商进行定价的可行性。通过分析影响租金的因素,制定适用的训练集,建立梯度提升回归树模型对实际经营数据进行实验,并分析预测结果。实验证明利用该模型对长租公寓进行房间级定价具有很强的参考性。在企业建立好数据体系的前提下,通过企业本身所具有的大量的数据,再运用本文提出的模型进行定价引导,必然可以获取更加合理的价格。这客观上解决了总部对于各地具体的价格并不能因地制宜,且运营人员主观判断有误的问题,也解决了实际中存在的总部对长租公寓运营方的管控问题。

由于模型的预测精度很大程度上取决于样本集,因此,在实践中需要进一步完善数据集,在特征的选取上还需要进一步考虑,在特征值的判断上要更精细,使用更多的经营数据训练模型,这将会使模型的实践性更强,应用范围更广,不仅能为已开业项目进行价格调整,而且也能直接应用于新项目的定价。另外,由于租金受外部因素影响较大,并且外部环境变化较快,数据库需要及时更新,对外部环境的研究需要更深入,这对企业的技术以及数据获取能力有很大的要求。因此,利用机器学习构建一个定价精准的模型还需要进一步的研究,但随着技术的日新月异,定价智能化以及经营决策智能化指日可待。


参考文献:

[1]高超.长租公寓商业模式构建.上海房地,2019(2):6-8.

[2]龚越,罗小芹,王殿海,等.基于梯度提升回归树的城市道路行程时间预测.浙江大学学报(工学版),2018,52(3):453-460.

[3]沈夏炯,张俊涛,韩道军.基于梯度提升回归树的短时交通流预测模型.计算机科学,2018,45(6):222-227+264.


邵屾,陈亚盛.基于机器学习的长租公寓租金定价[J].管理会计研究,2021,4(Z1):35-44+102.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

企业管理

期刊名称:企业管理

期刊人气:2999

期刊详情

主管单位:国务院国有资产监督管理委员会

主办单位:中国企业联合会

出版地方:北京

专业分类:管理

国际刊号:1003-2320

国内刊号:11-1099/F

邮发代号:2-650

创刊时间:1980年

发行周期:月刊

期刊开本:大16开

见刊时间:7-9个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定