瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI
2018-07-26 11:51 星期四

杨浩涌为算法定价交了3000万学费。如今每个月,瓜子的盘子里倒腾着价值10亿的二手车。


老师傅的权力

下午2点最毒的日头底下,郭桐举着手机,绕着一辆黑色SUV,前后转了快一个小时。他用手拔开车门边缘的胶皮,掀开车前盖,手指抹过油箱口渗出的一圈油渍,又绕到后面钻进车底,捏了张车底大梁的照片……

他既不是修车工,也不是侦探,不过他需要知道关于这辆车一切。

为此他一共要做259项检查。每操作完一步,他会把数据录入公司发的小米手机。之后这些数据会传入云端,像饲料一样被喂给系统。

郭桐告诉我,更专业的说法叫“算法”,同时那也是他的搭档。

他是名入行13年的二手车评估师,被人尊称一声“老师傅”,足见角色之金贵。

这种荣誉源自评估师对定价的话语权。传统的二手车商,赚的是低买高卖的差价。定价的高低,直接决定了周转效率,以及撮合交易的成功率。

瓜子的市场总监陈艳艳,亲眼见过这种权力运转的样子。

她去北京最大的二手车交易市场花乡,拜访一位大车商。对方拥有一个能容纳几百辆高档车的门店,里面的车均价百万,最便宜的也50万起。聊天的过程中,不断有销售跑进来,询问这辆宝马多少钱能卖,那辆奥迪又该多少钱出?

然后这位大车商会拿起手机,翻看一串数字,思索片刻,给出“可以出”、或“不能出”的最终判决。

看着沙发上的李老板,这个房间似乎变成了微缩版的华尔街证券交易所。

陈艳艳觉得不可思议。“你做这么大的生意,为什么销售自己决定不了价格,每辆都要跑过来问你?”

对方解释说,“他们不知道进价。另外,每辆车在厂子里一天,场地、资金、人员皆有成本。多少钱能卖出去,能卖给谁,多长时间能卖出去,全都要靠我的经验。”

在这儿,他就像个国王,一切围绕他才得以运转。

可见的,定价是件复杂的活儿,有眼力的评估师很稀缺。

郭桐很快就向我证明了他的实力。他指着车头、车中和车尾三块墨色车身,“看出来了吗?这三块地方反光的澄澈度是不一样的。”

顺着他手指的方向,两个人影被曲面的车身滤成了不规则的团状,虚映成三团。一块在太阳底下反着光,一块在阴影处,最后一块车身蒙着薄薄一层灰。

我暗自想,这哪看得出什么区别,难不成哪块车身没洗干净就映得模糊?

“看不出,大概我们的眼睛不一样。”

“是,我这是评估师的眼睛,”他乐了,随即给我揭了秘,“反光清晰度差那块的油漆重新涂过,说明之前很可能有过刮蹭,价格会打些折扣。”

评估师的经验,就像是黑匣子,有时候自己也说不清影响报价的全部因素。

但对于郭桐如今的搭档,这个黑匣子前所未有的清晰。准确地说,瓜子二手车的后台算法把一辆二手车的价格拆解成了2000多项指标,每一个都或多或少影响到价格的波动:年份、款式、配置、有没有天窗、用户操作偏好,甚至天气和季节……

瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI

郭桐拿着工具做检测

瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI

系统要求郭桐抓拍一张45度角的车身图片,据说这是最佳的展示角度。郭桐说,这张图之后会成为封面照,很重要。为了抓准角度,他不小心一脚踩进了树坑里。

瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI

瓜子系统把关于车辆的检测分解成259个步骤,评估师严格按照次序执行。为了保证采集上来的数据是标准化和结构化的,车况描述被设计成选择题,评估师只需要勾选。以此避免不同评估师语言和工作习惯差异,造成的不准确。

瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI

验车完毕后,评估师会将所有检测数据和自己的评测总结输入系统,这些数据会被传入云端,经后台人工审核后通过后,又算法生成定价。

郭桐盯着手机屏幕。数据传入云端,算法迅速吐出了一个数字:3.82万。

这是那位来卖车的女士能拿到的成交价。

“另一个平台之前给我的价格是4万多”,像所有车主一样,她希望拿到更高的价格。

这看上去并不是个好消息。二手车商在争取车源上竞争激烈,价格往往是一种武器。

但郭桐并不怎么紧张,他尝试着说服车主,“他们这样的价格,回头是卖不出去的。”

他告诉36氪自己的判断:另一家平台验车时,很可能没留意到发生追尾事故的痕迹。对于平台,这意味着极大的风险。高价收回的车,最后很可能砸在手里,或者不得不贱价出售。

从定价、收车到出售,算法卖车的每个步骤,就像一台精密的仪器。上一环失误,下一环的利润就会崩塌。定价并不是越高越好。要让卖家不吃亏,对买家又要有竞争力。算法要找的,是中间那个平衡点。

一门概率生意

用算法卖二手车靠谱吗?

2015年底,杨浩涌刚找到张小沛时,后者对这行不以为然。在美国,因为信用体系健全,Facebook上都能看二手车,她自己卖过、也卖过二手车。而在国内,她周围的朋友没有人交易过二手车,偶尔还会听说些坑蒙拐骗的事。

夸张点的案例,一辆车只要钥匙插进锁眼,拉开了车门,先掉价15%。

三个月的持续说服,杨浩涌用一个老套又强大的理由,击中了张小沛作为技术人的兴奋点——用技术改变世界。

二手车市场信息严重不对称,算法可以重构整个交易链条,提升效率,让这门生意大到前所未有。套用杨浩涌的话,美国二手车保有量是2亿,国内二手车年交易量目前是1200多万,以每年20%的速度增长,最终,这会是个万亿的盘子。

互联网创业者的惯用思路,是用线上模式和技术手段,把线下一棵树的生意,变成一片森林。前述的李姓大车商,大脑中有整个北京车市的数据网络,但一家百辆周转量的门店,已经占据了他全部精力。为此,李老板不得不忍痛关了沈阳分店。像他这样的车商,中国有接近10万个,但市场盘子却小而分散,只有1200万。这门生意优渥,却做不大。

但算法会弥合人类操盘手精力,以及数据量的限制。

张小沛从前在微软研发广告精准投放技术,之后去了美国在线视频公司Hulu,研发视频推荐系统和搜索引擎,以及在宜信,用大数据做风控和反欺诈。本质上她一直在做一件事,用算法和数据消除信息不对称。

瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI

瓜子二手车CTO张小沛

相对于广告和金融业,看得见摸得着的二手车行业,场景格外真切。要改变传统车商以差价为中心的定价模式,瓜子二手车把盈利模式定为收取4%的佣金。这种模式的挑战性在于,只有基于大数据精准定价,并跑出交易量,才能打平成本赚到钱。

张小沛心动了,2016年3月28日,她入驻瓜子总部的CTO Office。

不过,她真正觉得这门生意令人期待,是4个月后去美国硅谷CarMax门店的考察。

瓜子算法学“老师傅”卖二手车,最难的是量化人性 | 你好AI

加州的阳光热烈。宽阔的露天停车场里,几千辆各色的二手车在阳光下连成片,闪烁成波浪。

张小沛被晃了眼,心里也震了一下。

“那么多车能(在短期内)卖得掉,我觉得这肯定是一件很了不起的事情。”

CarMax成立于1993年,是美国最大的二手车连锁零售商。这家公司最值得称道的,是开创了一套全新的商业模式,让买卖二手车就像在沃尔玛买瓶洗发水那么简单,以及标准化。买卖双方不再面红耳赤地讨价还价,他们安静地坐在CarMax门店里,以销售给的一口价为准,在合同上签下自己的名字。

人们喜欢这种新卖法。在CarMax平台拍卖二手车的成交率是97%,而美国传统二手车拍卖商的成交率还不到60%。

CarMax也因此成了台赚钱机器。在2016年,CarMax每卖出一辆车就能赚到2173美元(约合人民币14000元)。

Carmax的模式是先从车主手里吞货,再转手卖出去,这很考验经营者的库存周转能力。

那么如何理解这门生意的奥秘?

二手车商是双边市场的撮合者,这门生意的核心就是数据定价和周转效率:用多少钱收车最吸纳最多的货源,又不至因为收货价格太高而让车砸在手里?定价多少最能让消费者接受,又能有钱赚?如何最快地把车卖出去,少交一天车位租金……每一步的决策和效率,环环相扣。

按照张小沛的理解,卖车就是一道数学题:用这个价格在平台上以当时动态的供需关系,在多少天之内卖出去的概率有多大?

在Carmax平台上,一辆车的周转周期是20天。对于这个行业,这已经很高效。

Carmax最核心的资产是定价模型。制定一口价意味着权力和信服度,买卖双方都认为自己并没有吃亏。这很难。前端的报价背后,是周密的定价体系和庞大的数据集,涉及到一切可能让价格波动的因素,品牌、车况、出产年份、市场存量、用户偏好……

之所以能做定价,是因为Carmax从1993年成立后的两年间,一直在收集和评估汽车的数据。

做保卖定价的前提,是大量积累数据,关于车本身的、买方的、卖方的、关于销售员的、以及二手车评估师的……数据达到一定体量,才可以建模,抽离出其中的规律,通过算法来把控周转效率。

所以瓜子并没打算一口吃个胖子。

交学费的工程师

“优先卖”启动前,张小沛先问杨浩涌要了200万学费。其中,100万分给评估师,100万分给算法。最坏的情况,就是赔个精光。

“优先卖”是做保卖和算法定价前的过渡阶段。即预先付给车主1000-2000元把车源预定下来,如果一个月内卖不掉,这笔钱就归车主所有。

这也是张小沛给出的一道题。她在全国圈了20座城市做试点,实现AB测试。在每座城市,最好的评估师和算法,分别负责一半客单的定价。跟最终成交价比较准确性。

一辆二手车,均价8万块,不是笔小数目。在定价不准的情况下贸然吃进库存,后果可想而知。要想全盘接管定价这活儿,算法得先证明自己。

“我定了这个价,真金白银拍出去把这个车拿下来,要有本事卖出去。这是很有挑战的,一直到今天,也是在不断优化的过程中。”张小沛告诉36氪。

在这之前,瓜子花了段时间为算法积累交易数据,通过不吃货(非保卖)的C2C撮合模式。这些数据被交到魏旋手里,将每个交易环节的数据拆解成小颗粒,再结构化,最终形成三样成果:

  • 一份描述了2000多个可能影响车价因素的标签图谱;

  • 为1万名评估师和销售设计的任务调度体系;

  • 郭桐手机那张包含259项流程的车况检测表;

能影响二手车线上交易的因素,可能很出人意料。

举个例子,如果收车赶上了雾霾天气,拍照上传的头图是模糊的,相对于晴朗天气时商品的点击率会下降80%。

瓜子算法团队负责人魏旋,进一步对36氪解释这张图包含的逻辑:“除了对车建模、定价,我们也对销售和评估师做画像,分析他们和车之间的关系。比如有的销售,最擅长卖日产的车,多匹配这类车给他,能实现的效率是最高的。”

“我们花了很大精力把销售和评估师的服务标准化。比如评估师录入,每个人原本有自己的语言和做事习惯,所以我们让这259项检测变成选择题,给每个选项一个明确的定义。”张小沛向我解释,如何让原本非标的流程标准化。“到现在,我们依旧在迭代,很多地方结构化的并不准确,需要不停分析过往填过的数据,再做结构化。”

魏旋一直知道,算法在营收上牵一发而动全身的效果。但直到2016年10月,算法定价上线,他才真切地感受到这事离钱有多近。一辆车最多亏2000元,一共开了20座城市……随着单量的扩大,魏旋的紧张也像滚雪球一样膨胀。

“老板说,收上来可以赔钱卖,最多赔2%。”他絮叨着带我算账,也就是一辆10万块的车,能允许2000块定价误差。可是市面上的平台,估价误差正常都在6%。他依旧头疼不已。

曾有一度,魏旋和其他50多位算法工程师的压力到了阀值点。张小沛带着他们喝酒开解。沮丧的工程师们,提出要用工资赔偿公司的损失,错一辆车8万,已经错了5辆,40万。

边算边想,这活儿这么做下去,八成要破产了。魏旋一脸的苦笑。

顿了顿,他又狡猾地眨了眨眼,“不过我们觉得,公司也不会真要我们钱。”

在这项大胆又野心勃勃的尝试里,失败是被允许的。

杨浩涌后来对媒体透露,因为定价不够准确,瓜子在2017年一共亏了3000万。但他觉得值得,“这事哪有那么容易啊。”

竞赛进行了两个月后,张小沛拿到一组让她欣慰的数据。优秀的评估师,10辆车中准确定价5-6辆;算法也从一开始的逆势,逐渐追赶上来。到了2017年春季,算法能准确定价10中之7,最好的城市能做到10中之9。

在所有试点城市,机器都跑赢了评估师。

于是2017年3月,瓜子开始全面收车,上线算法定价。

第一个月,算法评估了50辆车,这笔信心价值400万元人民币。到2017年底,瓜子算法一个月的定价量已经上涨到一万部车。它催生出了裹挟着庞大现金流的巨无霸。对于前述的李老板,和其他车商,这前所未见。

“10个亿在里面倒腾,每个月都不断往上加码,中间肯定有交学费的,这对那些算法科学家来说是非常痛心的,会带来更大的压力和敬畏心。所以多数时候,我都是在宽慰他们。”

张小沛甚至希望他们的胆子能更大点,这样才能拿到更多有价值的数据。

按一个月每个车位50块的租金成本,加上资金成本,并留有一定的盈利空间,算法对车辆售卖率的计算周期是以14天为准的。工程师为算法设计的标准,是按14天内能有90%的售出概率来定价。张小沛逼着他们降低到75%。

按照不同SKU、卖家和买家来细化模型,如今保卖业务的周转周期缩短到9天。效率的提升,意味着盈利空间的扩大。

难以量化的人性

算法会揭示人性有趣又隐秘的一面。

在瓜子平台上,点击量最高的,是售价140万上下的兰博基尼。这些热情的浏览主要来自新客户。尽管他们中的很多人,在看车时抱着10万块的心理预算;而实际成交最多的,是手动档的五菱宏光,均价2至3万,其貌不扬的面包车。

为什么那么多人搜兰博基尼?

理由可能很多样。比如:

“万一兰博基尼8万8呢!”

又比如:                                                                                  

“我想看看郭美美坐的车什么样!”

看吧,这就是人性。

然而对于算法,这些数据却是“噪音”。它只关心真正能让你打开钱包的信息。

这也是为什么,虽然张小沛是个喜欢给工程师减压的CTO,却对一件事格外坚持——她强制要求工程师定期下一线调研,去了解业务,去接地气。

张小沛相信,一线才能看到生意里关于人性的秘密,这些看似不起眼的地方,往往又是决定成败的关键。

这种想法,源自在城市经理站点的考察。

她发现,一间办公室里,总有几张桌子堆满了鲜花和巧克力。桌子的主人通常是年轻的女孩,掌握着调度任务的“生杀大权”。所有评估师和销售都想同她们搞好关系,这样可以分配到更好卖、抽成更高的二手车。

张小沛对其中隐秘的权力感动震惊。

“我得让这种权力下岗,”她在一次分享中说。

她用算法取代了小姑娘,没了鲜花和巧克力,平台的效率和权力通过算法更加集中。

“相对于纯线上业务,瓜子是O2O场景,它带给我们算法团队最大的冲击,就是如何平衡人性的部分。你知道,人性是最难以量化的。这不像今日头条的算法,我们需要更多跟人的磨合,以及更长的反馈时间。”

不过这很难。

算法无限逼近准确的前提,是将一切能影响到结果的变量标准化。然而,总有一部分人为的、偶然的变量,会超出算法,甚至工程师们的常识范围。

2016年下半年,瓜子上线针对销售的调度系统。

每个销售都有自己的画像。比如,某个人可能是适合卖日系车、中档价位、SUV的,甚至更擅长跟知识分子型客户打交道的……瓜子希望算法能知人善用,把更适合不同销售的任务,有针对性地分配出去。

“我们想得挺美的,但下去走一圈,发现系统是有漏洞的,很多城市经理私下在调整任务分配。有些事,超出了算法的考虑范畴。”

后台显示销售A以往卖日系车成绩斐然,于是A又分到了一辆日系车。结果张小沛发现,以往A的日系车卖单,并不是自己完成的,譬如最近的这单,城市经理把它订单分给了销售B完成。

但系统对这一切并不知情,后台里呈现的销售A,永远是日系车冠军。

“姐,我肯定得调啊。”城市经理对张小沛解释,“这位买家跟B的老家是郊区同一个县城的老乡,B去卖,他俩肯定更容易建立亲近感。”

在另一个案例中,这位经理发现,卖车的夫妻二人,妻子性格强势,在背后做主家庭决策者。巧在这位妻子刚生完孩子,而销售B也是个刚生产完的女生。尽管从后台看,以往B卖这款车的概率并不高,但经理相信,销售B更能搞定这位妻子。

“这带给我很大的冲击。我们算法团队得下去调研,去采访真正在一线的主管、城市经理和销售,看看他们撮合交易的过程中考虑的变量到底是什么,然后想办法把这些数据结构化,在系统里面把它呈现出来,考虑到算法模型里面去。好多这种冲击的地方。”张小沛说。

晚些时候,e代驾的司机会把郭桐刚验过的黑色SUV,开进保卖车场。顺利的话,9天内,它的钥匙就会被交到新车主手里。

在三公里的范围内,郭桐这一天还会被分配到7单他擅长的、路径规划更省时的验车任务,亲手把它们的数据送入系统。

根据瓜子提供的数据,瓜子平台日均看车的UV是500万。随着数据量越滚越大,算法的智识在增长,撮合的效率也在提升。平均每个发生交易的保卖客户,成交前看车的次数是不到2次。

我问张小沛,你认为算法卖车的边界是什么?

她回答我,“现实的商业世界,依旧有很多偶然性在里面。在这种小数据集上,怎么保证你的模型本身有足够的勇气继续往前走,这里需要很多群体的决策和智慧。”(文中“郭桐”为化名)

 

文/孙然 36氪