2024 領航計畫已開放報名,請點擊後查看報名資訊
前往 Medium 閱讀好讀版

Member-only story

講者:鄭凱承 Kevin Cheng | 資深資料科學家@FAANG

成為具備影響力的資料科學家

從個人學習到產生組織影響力的關鍵硬實力與軟實力,資深科學家和入門科學家的不同。

活動主辦單位: Taiwan Data Science Meetup 台灣資料科學社群

在不同階段的資料科學家,如何更有效率的從自己擴大影響力到組織,包含在電商(e-commerce)和產品導向產業(Product)的實務經驗,提供進入資料科學領域的參考培養技能。另外,職涯階段成長建議包含目標, 專業技能以及如了擴大影響力的建議。

大綱:

  1. 瞭解資料科學的工作內容
  2. 增進能產生影響力的技能

講者介紹:

Kevin目前在FAANG之中擔任資深資料科學家,專注於NLP應用開發和評估(Evaluation)。過去十年間曾任職於芝加哥高頻交易公司Jump Trading, 電商公司 Orbitz, Groupon 擁有豐富的職場經驗。先後擔任過 Senior Machine Learning Engineer 和 資料科學技術Lead Data Scientist 的相關職位,有機會近距離觀察美國企業如何將機器學習和數據科學轉換為data-driven在不同領域的演變和應用。特別專注於自然語音處理,資料科學,大數據分析在市場營銷, 產品與用戶的應用。美國密西根大學University of Michigan EECS碩士主修AI跟數據庫, 清華大學物理系學士。

資料科學的工作領域

了解自己的強項是哪一種,可以找到適合自己的職稱,對於找工作很有幫助。

** 資料>**

  • Analysis and Data Manipulation
  • Distributed Data Pipeline
  • Data Pipeline

** 科學>**

  • 優化 Optimization : 包含Dollar Value 優化收入, Customer Experience 優化體驗, Rank Optimization, Personalization, Recommendation System, Predictive Modeling
  • 驗證 Evaluation: A/B Testing, Often Evaluation, Observational Study, Human Annotation,
  • 進階分析Advanced Analysis: Metrics Development, Metrics Reporting , Data Analysis & Insights

** 呈現>**

(模型呈現 → 分析報告)

  • Interactive UI App
  • Model Service
  • Data Product/ Table
  • Dashboard
  • Report/Paper

如何成為有影響力的資料科學家?

教科書上可能常見模型開發流程如下。

資料 → 模型訓練 → 線下評估 → 模型部署 → 線上評估 A/B Testing

實際工作則是一個循環,而且錯中複雜。評估後,有時要回到資料有時,又回到模型訓練。

重點是提升可靠, 快速, 精準的結果。

可靠&精準>

** 穩定性Robustness**

適用於模型和分析和預測。

  • 結果要計算Uncertainty 或是 Confidence Interval
  • 分析:多次取樣資料(不同時段和不同樣本大小)重複同一個分析
  • 模型:同一個模型架構,同樣訓練樣本,看Metrics大小和變化
資料科學協會

資料科學協會

社群分享筆記 更新紀錄

Copyright 2020-2024 資料科學協會 All Rights Reserved.

本網站由 資料科學協會 維護