從數據收集、處理、標籤定義再到實際應用,看如何實踐數據應用並協助行銷執行。
莊雅涵,曾擔任數位廣告投放經理,有3年以上的廣告投放經驗,而後擔任 Data Consultant,與前端一同協助客戶導入數據產品服務,現在為 Vpon 數據產品經理,致力於打造活化數據應用的產品,放大數據價值。
活動主辦單位: Taiwan Data Science Meetup 台灣資料科學社群
一、如何收集數據
二、數據處理及標籤定義
三、實際應用情境
四、Q&A
在數據應用中,如何收集數據是非常重要的部分。
在介紹收集數據之前,我們需要先理解 Vpon 過去的公司角色定位。Vpon 在過去是以廣告聯播網(Ad Network)起家,過往所蒐集的數據都著重在第二方廣告數據上。
廣告聯播網 :以 Vpon 為例,協助 App publisher 做廣告流量變現,方式是使用 AD SDK 嵌入到 App 上,當廣告主想要投放廣告時,可以透過 Vpon 的廣告聯播網做廣告投放,Vpon 則會發出廣告請求到 App Publisher 端,當 App Publisher 收到請求後,Vpon 就可以順利投放廣告給 App Publisher 端的使用者,並且順利讓 App Publisher 進行廣告變現。
同時 Vpon 會透過 AD SDK 進行數據收集。比方說,某一個 App 使用者在某地使用 App,App 可能會跳出讓使用者有興趣的廣告,當使用者點擊廣告後,他可能會有瀏覽、購買等行為出現。在同一時間,AD SDK 會發送出一個帶有人事時地物等 非特定個人隱私資料 的請求給 Vpon。
Vpon 收集的資料,其實被稱為 Mobile Advertising ID (MAID),每台行動裝置都附有一組裝置辨別碼 Mobile Advertising ID,能讓開發者和行銷人員出於廣告目的追蹤使用者活動。同時,使用者可以透過手機重設 MAID,也可以啟用「限制廣告追蹤」(LAT,Limit Ad Tracking) 來阻止廣告主使用 MAID 投放定向廣告。
MAID 有兩種格式,就像手機分安卓和 iOS一樣,安卓的 MAID 又稱為 Android Advertising ID / Google Advertising ID,簡稱為 AAID/ADID/AdID/GAID,iOS 的 MAID 又稱為 Identifier for Adverting / Identifier for Advertisement,簡稱為 IDFA。兩者除了英文字母大小的差異外,都是由數字和英文字母混合並以 8–4–4–4–12 的格式組成 MAID。
一般會較著重在 Cookie ID 的蒐集,較少蒐集 MAID,但 Vpon 便是專注在 MAID。以下會分別列舉 MAID 和 Cookie ID 的不同:
MAID
Cookie ID
同時,除了 MAID 外,Vpon 也會和第三方數據進行合作,如消費數據,並整合政府公開數據。多元的數據蒐集後,會由 Vpon Data Engineer Team 來進行數據處理(ETL,Extract — Transform — Load),最後儲存到雲端資料庫。
把原始資料轉換成可利用的數據,雅涵舉例了幾個例子:
經過 ETL 後,Vpon 便會以 使用者實際行為 去進行標籤定義。例如,有一位安卓手機使用者在某段短期時間經常前往 3C 賣場,可以說明這位使用者有 3C 產品購買需求。同時,可以透過 App 安裝來挖掘出該使用者的興趣或傾向或生活型態,如安裝台北等公車可能代表使用者是台北通勤族,安裝投資先生、三竹股市可能代表對投資理財有興趣。
Vpon 也整理出四大類別: 位置、人口統計、行為和興趣 。透過四大類別標籤的組合,可以產生出 3000 種以上的標籤,最後 Vpon 可以透過標籤辨識使用者的屬性和偏好,並做使用者輪廓分析。
雅涵用兩種標籤類來介紹: App 興趣偏好、POI 興趣點
分析裝置 App 使用類型,獲取用戶的行為和偏好,並掌握品牌 APP 外的使用者輪廓。以下舉例可能的分類標籤方式(非實際標籤內容):
高端用戶
年輕潮流
母嬰育兒
POI,Point of Interest,是指電子地圖上某個地標、景點,Vpon 最小距離可匡列到半徑 50m x 50m,透過線下行為掌握人流。比方說,如果想知道有哪些人可能對於家居、裝潢有興趣,可以匡列以 POI 興趣點(如IKEA)為中心的 50m x 50m 的範圍內的人群,或許就可以定義這樣的人群有去過 IKEA。除了用一個 POI 興趣點去描繪使用者輪廓外,也可以透過多維度標籤去挖掘使用者的造訪動機,如除了去 IKEA外,是否還曾去過房仲、建案等地點。同時,也可以透過造訪時間和頻率去辨識使用者是否是員工。
定義完標籤後,其實 Vpon 也可以根據客戶要求做 匿名化 和 多樣性 處理來避免侵犯個人隱私。
K 匿名化,是為了 防止間接識別 的問題。以台灣為例,個人資料保護法其實有要求避免直接或間接的辨別個人資料。而 Vpon 所蒐集的 MAID 非個人資料保護法中定義的個人資料,但為行為數據標籤。儘管不會蒐集個資,但有可能透過其他標籤間接的識別出特定某個人。因此,為了降低間接識別的風險,會避免 k = 1 該標籤只有一個人的情況發生。
L 多樣性,是為了 避免敏感資料 ,如病例、犯罪等,或各國定義的敏感資料。因此 Vpon 也會做處理,比如說承接上面使用 K 匿名化後,可能會定義出有四個人基於興趣和工作地相同而被定義為 k = 4,但如果他們都前往過同一家診所(L=1),是有可能讓人知道這群人做了什麼事情,為了保證 L 多樣性,會避免 L = 1。
K 匿名化:[ i>k /i>-匿名性- 维基百科,自由的百科全书](https://zh.wikipedia.org/wiki/K-%E5%8C%BF%E5%90%8D%E6%80%A7)L 多樣性:[l-diversity — Wikipedia](https://en.wikipedia.org/wiki/L-diversity)
以一個 信貸 產品為例,客戶期望提供給從事科技產業的工程師,有興趣做金融投資,未來計畫買房、買車或生育的目標族群優惠利率,客戶想觸及到目標族群,推廣新的信貸產品,並且增加申請信貸人數。
在讀完上述雅涵的分享後,閱讀本文的讀者們,何不花個 3–5 分鐘 定義看看這樣的目標受眾可以使用哪些標籤,以及有哪些 App 會被定義為該標籤呢?(若忘記了,可以回頭看看 二、數據處理及標籤定義 中提到的 App 興趣偏好 喔!)
透過標籤定義及數據撈取後,便可以上架到 Facebook Ads、Google AdWords、theTradeDesk 和 Vpon 廣告聯播網進行廣告投放。
除了將數據標籤名單上架至廣告平台進行廣告投放外,Vpon 也會協助客戶做自有 CRM 貼標,以達到CRM360。如客戶 App 有一個使用者是會員,當他在使用 App 時,App 就會貼給他各種標籤,而 Vpon 則可以提供客戶該使用者在 App 外的外部標籤,讓該客戶對於會員的輪廓更加完整。除了可以進行更精準的廣告投放外,也可以進行一些模型預測等行銷運用。
Q 1:請問雅涵,收集到這些 raw data 後,是如何進行 實際的貼標作業,都是採人工貼標?還是有其他的方式,能夠精準的定義標籤?
Q 2:比較好奇前期導入和產品架構。在面對那麼多不同產業與資料成熟度的企業後,有沒有總結出一些方法框架能夠協助客戶更快onboard? 在產品上怎麼支援企業第三方和第一方的數據導入與整合?有哪些坑可以提醒大家不要踩?感謝!
Q 3:想知道兩位分別在團隊內各自負責什麼工作
Q 4:好奇 Yvonne 的轉職經歷,包含契機跟準備,想問需要那些硬實力
Q 5:(to Yvonne) 在 ios14 以後,多數 app 都很難繼續拿到 user 同意追蹤,這對很多廣告公司有巨大影響。請問你們在收集 MAID 過程中有特別找其他方法解決這問題帶來的影響嗎?
Q 6:TO 雅涵:想請問 vpon 有沒有人安排人員在做產品提案?(如設計 開發新的廣告投放系統) 如果準備一些關於廣告投放的數位產品 有沒有利於面試 product manager 呢?
Q 7:想問雅涵 : product manager 的工作需要具備多強的資料科學分析能力?
雅涵當天也有分享徵才資訊,歡迎對 Data 及 MarTech 有興趣及熱情的人加入 Vpon Data Team 團隊,並歡迎和我進行交流
LinkedIn: Yvonne Chuang
Vpon: Vpon威朋大數據集團,威朋大數據股份有限公司。
筆手: **HungWei Lin
** 校稿: Yvonne Chuang 👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!