• 資料科學協會
2024 領航計畫導師&導生心得分享
前往 Medium 閱讀好讀版

講者:陳明愉( Robert Chen)|Director of Engineering @ Compass

新興的科技領域 PropTech

房地產 是一個還沒有被科技業攻克的領域,隨著大量的投資進入這個新興領域,資料科學跟人工智慧已經開始在改變這個領域,在這個討論中,我們會分享如何使人工智慧在這個領域跟未來這個領域的發展。

活動主辦單位: Taiwan Data Science Meetup 台灣資料科學社群

講者介紹:

Robert目前任職於Compass,一個科技房地產業的獨角獸,負責Compass的人工智慧的研發,之前在Zillow負責人工智慧的研發工作,曾經在微軟擔任過管理職,負責個人化新聞的研發,畢業於卡內基美濃的電腦科學博士。

大綱:

一、介紹 (Introduction)

二、美國的房地產 (Real Estate @ USA)

三、房地產科技介紹 (Introduction to PropTech)

四、房地產AI 應用 (AI @ PropTech)

五、Q&A

一、介紹 (Introduction)

Robert大學畢業於國立台灣大學,於Openfind搜尋引擎公司擔任軟體工程師2年,爾後於美國卡內基美濃大學讀博士班。結束博士班學位之後,進到Microsoft擔任Principal Applied Science Manager,主要負責Search Ads, Search and News。接著進入Zillow的機器學習部門工作,從11人的團隊成長到90人(2年半時間),主要負責Home valuation, Recommendation, and MarTech。之後加入Compass服務。

二、美國的房地產 (Real Estate @ USA)

  1. Real Estate Overview
  • Residential Real Estate
    定義:Residential Real Estate 即是與我們日常生活息息相關的住房相關服務。可以分為下列三種項目。
    - Transactions:如買賣房屋。
    - Home service:如長短期的房屋租賃。
    - Investment:投資建造新的房屋。
  • Commercial Real Estate
    定義:Commercial Real Estate 即是關於商用的房地產服務,也是分為Transactions、Home service 以及 Investment。(此次分享著重於Residential Real Estate)

2. Residential Real Estate @ US
此處介紹美國的Residential Real Estate特色。

  • 美國有597家 MLS(Multiple Listing Service) ,美國的Broker(房屋仲介公司),會將資訊互通有無,一起建立一個MLS。MLS屬於 地區性 的服務,例如加州的Broker會互相集合建立一個MLS。對比於台灣的Broker如信義房屋,台灣是沒有辦法看到其他家的Broker的資訊。
  • NAR(National Association of Realtors) 是一個 商會 ,約略有200萬人,權力非常大,可以把一些房地產的規則上升的法律程度。
  • 美國的房地產仲介(Agents)買賣一定要透過Broker ,大部分的州都是如此。
  • 美國的仲介(Agents)一定要隸屬於仲介公司(Brokers)。
  • 也因為MLS屬於地區性的服務,有許多的限制,使得科技公司發現有商機可以前往發展。例如原先住在加州的民眾想要搬去德州,但卻無法看到德州的MLS。

3. US V.S. Taiwan(美國與台灣房地產比較)

台灣與美國房地產比較圖

  • 仲介 Agents
    - 台灣的仲介屬於員工,而美國則是員工、契約工都有。
  • 仲介公司 Brokers
    - 台灣是獨立公司,而美國則是屬於獨立公司或者連鎖加盟店。
  • 佣金 Commission
    - 台灣佣金是買家給買方仲介,賣家給賣家仲介;美國則是賣方支出給賣方仲介,賣方仲介再分潤給買方仲介。(例如: 賣家收到錢後,分6%給賣家仲介,賣家仲介再分其中的一半(3%)給買家仲介)
  • 資料 Data
    - 台灣資料近年來有在推房地產資料公開透明化,但實際上還是有許多限制,造成沒有如美國那麼透明;美國MLS、Broker都有所有的資料,且政府也公開所有資料,據Robert所說,大部分的州都是如此,但像德州就是有自己的限制,沒有列出交易金額。

三、房地產科技介紹 (Introduction to PropTech)

1. 房地產科技現況與誘因

  • 美國的房地產交易一年有 1.6 Trillion 美金的交易金額
    - 其中 112 Billion (7%) 是交易成本,7%又可以分為5.5%的佣金以及1.5%的closing cost(如代書、第三方手續費等等)。
    - 科技公司希望去改善這112 Billion的交易成本,將這些錢可以轉化為自身的利潤。
  • 根據 CRETech Study 統計自 2015–2019,大約有75 Billion 美金從VC(風險投資)流向房地產科技(PropTech)
    - 根據瑞士銀行調查,全球每人平均大約有 45 % 的資產都是在房地產上。
    - 而美國的 15 % GDP 來自於 Housing service 以及 Residential fixed investment(並不是房屋本身價值而來),對比於零售業佔總GDP之24%,也是相當大的一部分。
  • 軟銀(SoftBank)是目前房地產科技的主要投資者。
    - 其中軟銀投資了 WeWork, Compass, Opendoor, OYO KATERRA等等

2. 沒有一個統治者在房地產科技(No one is the dominator in the space)

通常我們說到統治者就是如Google在搜尋引擎、Amazon在零售業等等,下面列出房地產科技業務的五個面向以及主要公司。

  • 整合者 Aggregator
    - Realtor.com
    - Zillow (31 Billion)
    - CoStar (35 Billion),為Commercial Real Estate的佼佼者
  • 數位仲介公司 Digital Broker
    - Redfin (8 Billion)
    - Compass
    - eXp (6 Billion)
  • iBuying
    - Opendoor (15 Billion)
    - Zillow, Redfin, Flyhome etc
  • 房地產資料 (Real Estate Data)
    - CoreLogic (6 Billion)
  • 數位房屋貸款 Digital Home Mortgage
    - Rocket (45 Billion)
    - Bankrate, better.com etc

各個業務上都有領跑者,但還沒有一家獨大的情況出現,因此還在處於競爭的階段。

3. iBuying 介紹

搬家繁瑣程序

概念:賣一個房子、搬家需要許多步驟,iBuying就是想要簡化這些繁瑣的事務,幫助消費者變得更加便利。

  • 搬家很繁瑣
  • 以往需要先賣房子,才能取得足夠的錢買房子
  • 房地產科技公司根據此痛點去先買入你的房子,讓搬家變得容易
  • 為什麼房地產科技公司想要這麼做?
    - 整合服務
    - 得到房子(Content)
    - 直接接觸 112 Billion(先前提到的 7% 交易成本)

四、房地產AI 應用 (AI @ PropTech)

Robert主要接觸過的專案應用如下:

  • 房價估值 Home Valuation
    - Home Price Prediction (AVM, Automated Valuation Model)
    - Compass AI Adjustment
  • 買賣家預測 Lead Prediction
    - Compass likely to sell score
    - Digital marketing
  • 電腦視覺 Computer Vision
    - Compass Lens
    - Listing Videos Generation
  1. AVM — Automated Valuation Model

AVM

  • 這不是一個新興的概念,銀行過往就以此概念去房屋貸款估價。
  • Zillow 是第一個去呈現給消費者,使得消費者可以得到一個參考價格。
  • 資料有許多噪音
    - MLS / public data,都有許多統整上的問題。
    - Neighborhood data,因為區域性關係,會面臨許多挑戰,如某些特定區域房屋升值。
    - Economic data,經濟變數的考量也是一大重點。
  • 沒有足夠的訓練資料
    - 一年只有550萬的交易資料,美國鄉鎮差異大(Hyper local),分散下去其實資料量不太足夠,延長取得label data卻會產生新的問題,如該地區近年來升值等。
  • 目前主要使用模型(回歸)
    - 隨機森林
    - 梯度提升樹
    目前都是用這類型的ensemble model去建立。
  • 可以將Listing Price 作為一個變數嗎?
    - AVM for seller
    - AVM for buyer
    買家與賣家著重的點不同,對賣家來說,是要list多少的價格會賣得最好;而買家是已知AVM的listing price去出價來取得房屋,所以Listing Price可不可以做為一個變數是一個值得深思的問題。

2. Compass AI Adjustment

Compass AI Adjustment

  • 房仲不喜歡AVM,因為:
    - AVM 讓房仲難以解釋為什麼是此價格
    - 房仲喜歡使用CMA (Competitive Market Analysis)去解釋價格 — — CMA 是指找出類似的房屋取其平均價格。但是在美國其實很少有非常相似的房子,因此不會是一個好的衡量方式,這也是為什麼需要用AVM去建立Model。

3. Compass Likely to Sell

Compass Likely to Sell & Data Training Timeline

概念:根據房屋以及屋主的狀況去預測未來可能賣的機率。

  • 計算未來一年可能賣的機率
  • 目前使用梯度提升樹來作為預測模型
  • 其中使用到許多的房屋、鄰居、經濟以及屋主本身的特徵。
  • 以上述Timeline為例,使用2018資料作為訓練,2019作為測試,使用2019作為測試,2020做推論、預測。

4. Digital Marketing

  • 個人化的廣告推薦
    - 根據個人喜好去作廣告內容的推薦,使得點擊率提升。
  • ROI (Return of Investment) 的最佳化
    - 根據該區域的房屋價值去 Bid 適合的價格。
  • Dynamic Landing Page
    - 根據使用者來源的不同(可能是買家 / 賣家),給予不同的頁面呈現,其中使用Contextual — Bandit技術去實現。
  • Automatic Video Generation
    - Video對於使用者的吸引程度高於圖片,根據圖片、文字自動產生影片是很有效的廣告方法。

5. Compass Lens

  • 根據AI技術去展示給消費者可能的房屋改造,讓以往只能憑空想像改造後的效果進行改善,例如: 找出相似的廚房,改造前後使得價格多賣了多少錢,供消費者參考。
  • 其中使用到CNN Image Embedding的技術去搜尋相似的圖片。

6. Listing Video Generation

Listing Video Generation

  • 在社群網路上,影音黏著度高於單純圖片呈現,但是一部影音的成本大約是400–600美金,以往只有高級的房屋會花錢去製作,Compass擁有所有自動製作影片的資料,也實踐了此技術。
  • 其中使用到的技術:
    - CV:圖片分類,找出圖片屬於哪一個類別。
    - CV:物件辨識,找出圖片內各個不同的物件。
    - NLP:內容分析,將Agents寫的敘述作分析。
    - Matching:將NLP內容與圖片對應在一起,如廁所 — — 廁所圖片
    - Image Selection:找出最有辦法呈現房屋特色的圖片
    - Music Selection:找出最適合該房屋風格的音樂

五、Q&A 精選

Q1:感謝分享! 資料分析在各產業的應用愈來愈普及,許多企業行號皆有意運用自身所握有的資料,身為應屆畢業,想投入資料分析的求職者,產業的選擇在資料分析領域是否重要 ? 還是在各產業資料的處理及運用有一定遵循的邏輯,未來跨產業轉職不會有太大問題?(例如先投身零售,但未來想在科技業),不好意思問題與今日主題無關,想藉您的經驗~謝謝

  • 資料科學領域有2種很不同的方向,第一種方向需要非常有經驗,也就是傳統的資料科學家/產品分析師,此方向須要有很多的經驗,因為需要足夠了解產業,知道什麼事情是重要與否;而第二種方向則是機器學習工程師,此類型需要比較強大的Coding技能,偏向真正去製作出產品,也是業界需求比較強烈的人才。

Q2:您好。想請問,就台灣的環境來說,房地產的資訊較不透明,難以輕易取得資訊,那在房地產科技領域,會不會是一種阻礙?或是您們是否看好台灣在房地產科技領域的發展? 謝謝分享!

  • 基本上沒有資料很難去做價值估價的部分,但像其他提到的房地產科技應用則是可以做的部分。如果法規沒有幫助,基本上是非常困難去實現的。

Q3:Robert 哥您好,我現在是名機器學習工程師,平常做比較多生物醫學影像相關的題目;未來想要將應用領域轉到更多商業邏輯上,最近找工作發現大家很看領域重疊性跟分析資料型態差異(Data/CV/NLP),看到您跨足資料分析跟影像領域,所以想請問如果未來要轉往更偏向資料科學家,有什麼方向是您覺得我可以去準備的,謝謝!

  • 我的答案可能有點偏頗,我個人認為對於演算法的優劣要有所了解後,對於不同領域的學習曲線應該並不高。但是經驗上則是不可避免的部分,需要有機會去學習。

Q4:Robert哥您好,可否分享您待過的兩間PropTech公司Zillow 和 Compass 的公司文化差異和整個資料組織的架構是如何? (是集中的資料team 還是每個組都有資料科學家在協助)?

  • 最大的差異是受眾不太一樣,Zillow 是一個消費者面向的公司,它想要服務的是一般的買家與賣家;Compass 是一個Digital Broker,主要是面向Agents(仲介),使得Agents得到的服務更好,則買家與賣家也會相應得到更好的服務。也可以用B2B(Compass)與B2C(Zillow)的方向去解讀。

Q5:Hi!感謝分享! 想請問,資料科學在不久的將來會不會像現在Microsoft 辦公軟體一樣普及,成為文職工作者必備工具?是的話應該掌握到什麼程度?

  • 會!以往寫程式的門檻很高,現在則是有Python這樣平易近人的語言。像特徵工程十年後,搞不好會有工具可以讓你把資料餵進去,它就會自動找出方法幫你做出結果。當這些機器學習的工具都成熟後,可能機器學習技術的門檻會降低,但有一個東西不會降低,將產業知識、商業問題以及經驗的轉換。可能對於模型、演算法的掌握可以不用到那麼深入,但對於商業問題的轉換是機器沒辦法做到的,這是無法替代的部分。

Q6:請問美國的這些PropTech的公司 像是Zillow or Compass 對於海外/非美國市場 ( 像是 台灣 韓國🤫) 的拓展是什麼想法? 國家法律的不同是不是這類公司的大門檻? 非美國的PropTech產業發展如何? 謝謝

  • 美國市場目前在PropTech市場上進度是最快的,但美國市場太大了,目前都還沒有殺出一個dominator,殺出之後應該就會向外擴展。舉例來說,中國有一個公司叫做 貝殼找房 ,三個月前在美國上市了,它們的估值為795億美元(2021/2),他們大概有中國10%的市場佔有率,會有一些地方開始做類似的事情,但房地產一直都是一個進入門檻高的產業。因此,如果美國產生一個dominator,則會挾帶大量的資源與資金進入其他國家,則其他國家會迅速的被改變。

筆手:Aaron Yang
校稿:陳明愉( Robert Chen)
👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!

社團法人
資料科學協會

立案證書字號

1090070264

Copyright 2020-2024 資料科學協會 All Rights Reserved.

本網站由 資料科學協會 維護