Joey | Data Scientist (Ads Interface & Growth) @Pinterest & Ming Hao | Data Scientist @Amazon
活動主辦單位:Taiwan Data Science Meetup 台灣資料科學社群
本次講座邀請了在 Pinterest 擔任 Data Scientist 的 Joey 以及在 Amazon 擔任 Data Scientist 的 Ming-Hao 來討論資料科學家的日常工作任務、大小型公司對 Data Scientist 的定位和差異,以及找工作、面試技巧、內部晉升的經驗分享,講座內容主要分成 5 段:
Joey 目前在 Pinterest 擔任 Data Scientist (Ads Interface & Growth),大學時唸經濟系,大三大四時發現對計量經濟有興趣,在 Texas 念了商業分析碩士,之後進到 Visa 擔任 Data Scientist。
Ming Hao 目前在 Amazon 擔任 Data Scientist,從電機系畢業,認為自己在寫程式及數學相對有優勢,又喜歡把程式及數學應用在金融領域,後來在 UCLA 念財務工程碩士,畢業後在當地的金融新創公司做 Data Scientist 做了大約 1年半左右。
** Q1 — 請問兩位目前擔任資料科學家的日常工作任務、時間分配大致是什麼樣子?**
Joey
每天早上會先翻開行事曆、確定今日工作項目、昨天做了什麼、今天準備做了什麼通常來說比較傾向以下時間分配:
每天下班前會整理今天做了什麼、明天準備做什麼,這樣和 manager 1 on 1 可以提供素材。
總體來說,約有 40% 時間在開會、30% 時間 coding、30% 時間做 dashboard。
Ming Hao
每天不太一樣,會議以每週來說會集中在週一和週二,所以比較傾向以週來做時間規劃:
週一、週二 — 和 PM , stakeholder 同步專案進度。
週三、週四、週五 — 取決於目前的專案階段,例如以下專案階段對應的工作項目:
** Q2 — 工作上的 Tech stack**
Joey
以重要性來說,SQL 可能是最重要的,不論從拉資料、資料探索、模型開發到部署,都有機會用到 SQL。
Ming Hao
** Q3 — 兩位目前分別在 Amazon 與 Pinterest 擔任資料科學家,屬於大型跟中型的公司,先前也有在中型及 startup 的經驗,想請問兩位對於資料科學家這個職缺,在不同規模的公司裡面,定位分別有什麼不同?**
Ming Hao (Amazon)
Applied Scientist — 根據不同的單位會有不同的業務內容,進而產生不同的工作項目:
Data Scientist — 面向分析、將既有的模型應用到真實世界中,如果組內很幸運又有 Machine Learning Engineer,那 Data Scientist 就只要做模型開發,程式碼產品化則會交給 Machine Learning Engineer。
Machine Learning Engineer — 定位在軟體工程師、模型部署、產品化。
Joey(Pinterest, ex-Visa)
因為講者待過兩家公司, Visa 偏向大型公司,而 Pinterest 偏向中型公司,講者覺得對於 Data 相關職位的分類差不多,通常分為 Machine Learning Engineer, Research Scientist, Data Scientist。其實跟 Amazon 是有點像的,不過在 Visa 下有不同的部門,同樣職位做的事情可能也很不一樣。
Pinterest 雖然是中型公司,但行事風格也蠻像新創的, Joey 之前有機會碰到 Generative AI 的工作,公司也不會因為你是做廣告的,就不讓你做,文化上會更有彈性一些,也看自己願不願意做嘗試,例如 Data Scientist 想轉 Machine Learning Engineer 或是 Business Intelligence Engineer 其實都是可以互轉:
Visa — Engineering Department
Visa — Customer Department
Pinterest — Advertisement Department
** Q4 — 方便和我們大致介紹一下你們所在公司,做資料科學相關的職缺及工作內容有什麼不同嗎?**
Joey
先前在 Visa 做 Data Scientist 是隸屬於 Engineering 部門下,偏向在 Modeling 的工作。而在 Pinterest 屬於 AdTech Company (例如 Google, Meta, Snapchat) 都偏向做產品,以下展開說明:
Ming Hao
目前位於 Amazon 內部的 IT Support 部門,類似內部的 IT 客服部門,當員工電腦有問題,或是相關電腦配備有問題時,會找 IT Support。部門內有一項工作任務是讓需求者找到適合的維修者,就像是如果今天是 Iphone 送修,如果配對到的維修工程師是主攻 Mac,那最後可能解決不了問題,這種情況下必須媒合主攻 Iphone 的維修工程師,這個配對問題中, IT Support 企圖使用 Machine Learning 的方式做問題分類以及媒合,例如:
如同 Joey 所說,當接到商業需求時,需要知道手邊有哪些可用資料,而在給定商業需求以及可用資料時,有哪些 algorithm 可以達成目標,根據這些 algorithm ,哪些可以做 fine tuning 哪些可以做 optimization,因此這份職位會需要工作者對 ML 的認識足夠廣泛,且認識新出現的模型,例如在推薦系統領域,一般的 Classification 可能比較難有好的效果,需要工作者對推薦系統常用的模型有一定的了解,才能夠在工作上較好的實作且解決問題。
模型完成後,也需要將模型上線,這部分就和 Machine Learning Engineer 或對應的軟體工程師有很深的合作,就不會僅限於讓程式碼活在 jupyter notebook , 這部分就需要吃重工作者的軟體工程經驗。
** Q5 — 公司文化分別是什麼樣呢?**
Ming Hao
要面試 Amazon 的面試者應該都知道 Amazon 有所謂的 14 條軍規 (現在應該是 16 條, Amazon Leadership Principles),內容有客戶至上、節儉、快速交付等等,這些軍規會形成公司文化:
此外 Amazon 不同組別之間的文化與Tech Stack 有很大的差別,像是亞馬遜叢林的不同部落,這也會影響到組織文化,所以講者的描述僅供參考,不代表整體 Amazon 的文化走向。
Joey (ex-Visa, Pinterest)
Q6 — 兩位目前所在的公司以及先前的經歷,包含幾個不同類型的產業及領域,有做廣告與內部客服,以及支付領域,想請問不同的領域是否需要不同的技能、背景與經歷,怎麼樣的人會是加分的?
Ming Hao
Joey
** Q1. 想請問兩家公司的 ML platform 是否成熟,會不會有很多 scalability and stability 的 issue? 遇到時通常如何處理?**
Ming Hao
Amazon 有對外發布的 ML Platform,所以整體來說算是成熟,真的遇到問題時,內部會有工程師解說目前極限。
Joey
Pinterest 的 ML Platform scalability 沒有問題,但 stability 有點問題,有時候不知道發生什麼事,要自己找為什麼壞掉了,要跟 stakeholder 做溝通,說目前產品端的工程有問題。
** Q2. 最近開始寫數據分析相關的作品集 想請問 1、整體專案的data overview 需要寫的內容會是什麼樣的呈現方式比較合適呢?(SQL畫面➕關聯性建立結果?)還是強調 features & entries 數量? 2、內容著重在呈現的成果為重?還是分析過程的問題解決?**
(共同說明) 取決誰會看你的結果:
** Q3. 想詢問零售業 Data Analyst or Business Analyst 履歷著重的能力 (過去有零售管理背景/目前自營 ig 商店),且目前有的硬實力是 Python、SQL、Tableau 有推薦增加軟實力與商業思維能力的管道嗎?**
Podcast
Medium / Blog
1. How would you measure the success of Facebook Stories?
2. Cracking the Facebook Data Scientist Interview — Part 1
** Q4. 如果不懂模型本身就直接應用會有什麼潛在問題嗎(ex: 每次都暴力使用 xgboost),然後預測指標如果都不錯的話(ex: F1 score, AUC),是不是影響沒那麼大?**
和專案目的有關,有些專案是 insights 重要,可解釋性就很重要,例如對應到財務部門,準確度則未必。
** Q5. 想問一下生成式 AI 的發展,對資料科學家、資料分析師這類的職務影響大嗎**
Joey
在 Pinterest 目前不會用到,但公司內部開始思考如何利用生成式 AI。
Ming Hao
工作中已經在使用 ChatGPT,減少了 google 的時間,消化知識、吸收知識的時間變得更短了,害怕被該東西取代就去學習他,過去當 excel 出現時,會計師並沒有因此失業,多嘗試新出現的工具,其實會讓自記得工作效率更好。
** Q6. 請問一個庸俗的問題 Data Scientist 全 remote, hybrid 或全 on site 會影響薪資高低或者員工福利嗎?**
(共同回覆) 所有職位都會這樣,remote 會根據所在的地區的薪資水平來配薪水
** Q6.2 Follow-up — remote 在升遷上潛在的影響 畢竟在公司內部的互動變少**
看公司,在 Pinterest 的 remotion 有比較完整的管道,所以其實覺得沒差。
** Q7. 在美國或你們所在的公司裡,會有 work life balance 嗎**
Joey
Pinterest — 文化重視 work-life balance ,每次和主管 1 on 1 都在討論最近會不會很忙,需不需要休假XD。
Ming Hao
Amazon — 看組別,且 Amazon 有 PIP 壓力, work 會有比較重的壓力,但上手後就取決於自己,想不想要更快速地升職。
筆手 : Joe Tsai
校稿:Ting Yu, Joey, Ming-Hao
👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!
Copyright 2020-2024 資料科學協會 All Rights Reserved.
本網站由 資料科學協會 維護