262期
2020 年 06 月 10 日
  北美智權官網 歷期電子報   電子報訂閱管理  
 
比神奇寶貝訓練師更夯的人工智慧訓練師登場了
李淑蓮╱北美智權報 編輯部

2020年1月,經中國人力資源和社會保障部(人社部)同意,中國就業培訓技術指導中心於同年2月25日發佈了《關於擬發佈新職業資訊公示的通告》,新增包括人工智慧 (AI) 訓練師在內的16個新職業。雖然AI訓練師的薪資水平不算特別吸人,但由於AI市場漸熾,未來前景絕對比神奇寶貝訓練師來得夯。另一方面,台灣產官學研雖然也在積極發展人工智慧,但AI產業職場狀況不太清晰,是不是也該考慮來「正名」一下

據朱明德《AI新職位「人工智慧訓練師」》分析報告(下稱《報告》)指出,有人認為「人工智慧訓練師」是AI給人類帶來的第一個非技術類的「新職位」。雖然於2020年時全中國AI訓練師的人才缺口才3,494人,但伴隨著AI行業的高速成長,至2022年人才需求可望猛增5倍多,達21,884人。至於職缺需求及薪資水準方面,大公司的要求明顯高於新創公司,一般希望有3年以上經驗,而新創公司大多只要求1年以上經驗,甚至經驗不拘。

由於是非技術類的「職位」,因此相對於工程師來說薪水偏低,薪資範圍有73%落在8000元 (人民幣,下同)以下,甚至有過半數55%低於5000元,僅有27%是超過8000元的。

至於薪資偏低的原因相信是由於目前AI訓練師所屬行業以智慧客服居多 (占53%),一般而言客服薪資水準本來就不高。

AI訓練師產生之背景與定義

機器學習 (Machine Learning) 及深度學習 (Deep Learning)是人工智慧的2個子集,也是其核心所在;而AI訓練師主要工作顧名思義,是用資料來訓練AI 設備及系統 (即使其學習)。

《報告》指出,一般而言,AI公司(或公司的AI部門)從客戶(使用者)那裡獲取到的原始資料無法直接用於模型訓練,在AI訓練師出現以前,是由AI產品經理先用相關工具簡單處理,然後再交給資料標註人員進行標註加工,但因為標註人員對資料的理解和標註品質差異很大,導致整體標註工作的效率和效果都不夠理想。

同時,AI公司(部門)在其細分領域內積累了大量資料,這些資料往往在使用一次後就不再產生更多價值,隨之帶來了第二個問題:資料無法累積和重複使用。

基於以上兩個問題,AI訓練師即應運而生。

《報告》給予AI訓練師的定義為:「人工智慧訓練師,是通過分析產品需求和相關資料,完成資料標註規則的制定,最終實現『提高資料標註工作的品質和效率』以及『積累細分領域通用資料』的價值,從工作流和工作難度等角度看,它介於資料標註和AI產品經理之間。

據說,AI訓練師是由BAT (百度、阿里巴巴、騰訊)某部門在2016年時創造出來的,但到了2020年才正式成為一門職業。不過,早在2017年10月12日,浙江省杭州市已發佈了關於公佈《杭州市專項職業能力考核項目(六)》的通知,明確了人工智慧訓練(初級、高級)的職業能力考核。在2019年中國國際貿易促進委員會商業行業委員會發布的《人工智慧訓練師職業能力要求》(徵求意見稿)中,更是明確的將AI訓練師區分為L1 ~ L5 五個等級,其中L1是最高級的,需要在相關領域有超過8年工作經驗。

在台灣,訓練AI 設備、系統的人員尚沒有正名,就筆者在104人力銀行所見,有人工智慧演算法工程師、人工智慧系統應用程式開發工程師、人工智慧應用工程師、人工智慧研發工程師、人工智慧應用後端工程師……等等,都是以工程師為主, 訓練AI可能只是其工作的一部分。所以,也可以說目前台灣很少AI公司或是公司的AI部門有專門訓練AI系統或設備的部門及職位。

然而,在中國除了正名之外,工作內容也是很明確的,《報告》指出AI訓練師工作職責主要有3大項:

(1) 提供資料標註規則:通過演算法聚類、標註分析等方式,從資料中提取行業特徵場景,並結合行業知識,提供表達精準、邏輯清晰的資料標註規則,最終確保資料訓練效果能滿足產品的需求;

(2) 資料驗收及管理:參與模型搭建和資料驗收,並負責核心指標和資料的日常跟蹤維護;

(3) 積累領域通用資料:根據細分領域的資料應用要求,從已有資料中挑選符合要求的通用資料(適用於同領域內不同客戶/使用者),形成資料的沉澱和積累。

仔細一看,這倒有一點像是大數據工程師。

與其他職位之差異

《報告》詳細分析了AI訓練師及AI產品經理與工程師之異同,人工智慧訓練師需要和AI產品經理討論需求,進而制定資料標註規則,並提出產品體驗優化建議,如圖1。在這裡,「優化」是很重要的關鍵字。試想一個服務型機器人一直沒有把服務做好 (例如點餐作業),這時候即必須不斷改進(資料標註規則)、不斷優化,AI機器人才能把服務做好。

圖1. AI訓練師及AI產品經理的合作關係
640
資料來源:朱明德《AI新職位「人工智慧訓練師」》

人工智慧訓練師需要和資料標註人員緊密協作,管控好整個流程的輸入規則和輸出結果,及最終輸出標註準確的資料(供模型訓練)(如圖2)。

圖2. AI訓練師和資料標註的異同
640
資料來源:朱明德《AI新職位「人工智慧訓練師」》

表1為人工智慧訓練師的工作流程,展示了人工智慧訓練師和資料標註、AI產品經理協作的工作流及其每個節點的交付物。不難發現,人工智慧訓練師在資料標註和AI產品經理之間,起到橋樑的作用。

表1. 人工智慧訓練師的工作流程
640
資料來源:朱明德《AI新職位「人工智慧訓練師」》

 

作者: 李淑蓮
現任: 北美智權報主編
學歷: 文化大學新聞研究所
經歷: 半導體科技雜誌(SST-Taiwan)總編輯
CompuTrade International總編輯
日本電波新聞 (Dempa Shinbun) 駐海外記者
日經亞洲電子雜誌 (台灣版) 編輯

 

Facebook 在北美智權報粉絲團上追踪我們       

 





感謝您閱讀「北美智權報」,歡迎分享智權報連結。如果您對北美智權電子報內容有任何建議或欲獲得授權,請洽:Editorial@naipo.com
本電子報所登載之文章皆受著作權保護,未經本公司授權, 請勿轉載!
© 北美智權股份有限公司 & 北美聯合專利商標事務所 版權所有     234新北市永和區福和路389號五樓 TEL:+886-2-8923-7350