從資料中尋找價值的淘金者─資料科學家

當資料科學家在2012年被《哈佛商業評論》評為「二十世紀最性感的職業」時,這個角色頓時成為眾人追捧的對象。這個熱潮持續延燒,Gartner預估,2018年全球將有440萬個能從龐大資料中看出價值的資料科學家,將在未來就業市場的風口上屹立不搖。

「這是一個很迷人的職業,性不性感我不知道、但它很迷人,迷人度是看你對資料的興趣。」沛星互動科技(Appier)首席資料科學家林軒田認為,以他自己從台灣大學資工系副教授到加入Appier,一路從學界到業界的經歷來談,他最有興趣的就是用資料實現人工智慧的應用,用AI觀察資料的蛛絲馬跡。

不過,資料科學家有分很多種,因為可以從資料中變出的東西很多,例如視覺化的報表、用資料協助商業決策等,與其一定要給資料科學家一個定義,不如說資料科學家每天在做的事情其實很簡單,就是讓資料更有價值。

林軒田提到,資料科學家每天要面對的問題很多,不管是資料量的限制、資料內容的限制,或是目標的限制等,當這些問題加在一起時,資料科學家要能夠判斷自己下一步要做什麼,是要改工具還是執行實驗,然後最後再把一連串的問題解決掉。例如Appier做的是跨螢廣告,當中也經歷過不少摸索,一開始的目標是把網路上不同使用者的資料串連起來,再接下來是要如何用這些跨螢的資料去幫助客戶解決行銷問題。概括來說,就是先訂出一個目標,再看資料怎麼對應到目標,並且透過AI達到系統化。

即便不同產業要解決的目標、擁有的資料類型都不同,但資料科學家多會經歷這樣從無到有的過程,因此在林軒田看來,一名好的資料科學家需要具備的技能分作三個面向。第一當然還是技術背景,他必須判斷哪些工具是可以用的;第二是研究能力,因為每個全新的問題,並不是舊的工具套上來就可行,他必須修改、或是設計新的工具,來處理這些新的問題;第三則是一定的好奇心與創意,「這件事情有點像是做偵探,做偵探的人是有一點需要好奇心跟創意,把觀察到的現象連結起來。解決未知的問題,如果只用已知的工具去解,注定行不通。」他認為,資料科學家要有好奇的性格,才有可能解決未知的問題。

廣告

可以說,資料科學家所具備的其實是綜合的能力,從統計學、電腦科學、應用數學等領域知識皆然,「與其看背景,比較重視他有沒有解決問題的能力。只要有興趣、有能力,一開始不見得那麼重要。」在林軒田看來,實戰經歷非常重要,無論是透過學生時期參與專案、比賽等,都是在累積如何解決問題的能力。

另外,資料科學家未來在產業裡的位置之所以益發重要,一部分來說也是因為未來資料可能會成為驅動人工智慧的關鍵。林軒田說明,資料與人工智慧的關係密切,資料就像是原料、出發點,就像是廚師要煮食物的食材,而機器學習等技術就像是廚師煮飯的技術,最後把它變成一道道AI產品,「從資料到AI是一個過程,而資料科學家就是站在中間,與技術相輔相成的角色。」他認為,一個好的AI系統,背後需要很多角色,但其中很重要的一個角色就會是資料科學家,負責操刀把資料變成AI的過程。

林軒田觀察,現階段大家積極在談AI,會有像Appier這樣提供技術平台的公司出現,也會有許多想要靠AI轉型的傳統企業,回頭都是要靠資料來解,而資料科學家的任務之一,就在於加速這樣的過程。