為數據打上“價值標簽”,這個基地不一般
24歲的黃燦輝坐在位於濟南市明水國家經濟開發區核心地段的辦公室裡,他左手敲打鍵盤,右手點擊鼠標,目不轉睛地對著面前的兩台顯示器操作。
在人社部公布的國家職業分類目錄中,黃燦輝的職業被認定為“人工智能訓練師”(AI訓練師)。他所在的基地全名是百度智能雲(山東)人工智能基礎數據產業基地,這是百度在全國布局的第二家、在山東布局的第一家數據標注基地。
目前,像黃燦輝一樣的AI訓練師,該基地內已經超過了1500名。
“AI的老師”,可讓機器更“懂”數據
AI訓練師是什麼?在《人工智能訓練師國家職業技能標准(2021年版)》中,他們是“使用智能訓練軟件,在人工智能產品實際使用過程中進行數據管理、算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業的人員”。
數據是人工智能的“燃料”,而數據標注是AI訓練師的重要工作之一,被稱為“人工智能的老師”。在上述基地相關負責人李志偉看來,“簡單理解,數據標注就是為數據貼上標簽,讓AI機器人容易識別數據,更‘懂’數據,從而按照算法作出判斷,更好地為人類服務”。
中國工程院院士鄔賀銓曾對此職業有過解釋。他表示:“比如AI訓練師會進行智能駕駛的訓練。智能駕駛中需要讓汽車自動識別馬路,但如果只是將視頻單純地傳給計算機,計算機無法識別,需要人工在視頻中將道路框出,再交由計算機,計算機多次接受此類信息后,才能逐漸學會在視頻和照片中識別出道路。”
實際上,現在人們生活中常見的小度智能屏、小愛同學、天貓精靈等智能產品背后,都有AI訓練師的身影。
鄔賀銓院士提到的智能駕駛,李志偉有著切身體會。
“實現自動駕駛並不容易,因為數據大多是碎片化、非結構化,需要經過清洗、標注才能喚醒價值。”李志偉說。這就需要一支龐大數據採集團隊,他們需要將全國各地路況信息及時傳送上來,此外還需要組建一支專業的數據加工處理團隊。
這些正是上述基地的強項。
既培育AI訓練師,也孵化科技企業
在8000多平方米的工作區裡,1500多名AI訓練師創造的價值十分驚人。
“這裡可提供連續幀標注、路況信息提取、停車點標注,包括3D點雲障礙物、紅綠燈、車道線,可為行人識別、車輛識別、紅綠燈識別等技術提供精確訓練數據。”李志偉表示,這些數據經過模型訓練,會應用到自動駕駛、智能交通、智慧城市等各個人工智能場景中。
如果從去年6月百度智能雲與明水開發區簽約共建百度山東數據標注基地之日算起,該基地的運行剛剛超過一年。數據顯示,截至今年4月,累計產值超過3700萬元,培育數據標注師1500余人。
但在上述成績單之外,該基地還有另一項重要職能。
孫姣娜是數字經濟領域的老兵,最終走上了自主創業的道路。她在7年前便開始接觸數據標注,但一路走來並不順,特別受到疫情影響,企業陷入危機之中。加入百度智能雲山東數據標注基地成為孫姣娜的轉折點,在這裡接受的培訓為她打開了另一扇門。如今,孫姣娜的企業業務從山東擴展到了山西。
如果說數據標注是上述基地的業務依托,那麼他們規劃的事業版圖還包括建設數據應用創新中心、數據標注培訓中心、數據標注生產中心和數據流通服務中心,幫助客戶培育區域AI人才、引入或孵化數據標注企業、培育區域數據要素市場、構建數據標注產業集群。
據李志偉透露,該基地在一年間已經培育孵化22家企業。
在明水國家經濟開發區有關負責人看來,從孕育新職業到孵化新企業,百度山東數據標注基地推動了區域數字經濟發展。
而該基地現在也有了更高的目標:“預計未來3年內,基地將提供至少2000人的就業崗位,同時培育20家有特色的數據標注企業,打造區域范圍內最有特色的數字經濟新名片。”
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注