
圖片來(lái)源:廣州日?qǐng)?bào)
人工智能是引領(lǐng)未來(lái)的戰(zhàn)略性通用技術(shù)和驅(qū)動(dòng)新一輪產(chǎn)業(yè)變革的新引擎,對(duì)于搶占未來(lái)發(fā)展制高點(diǎn)、構(gòu)建現(xiàn)代化產(chǎn)業(yè)體系至關(guān)重要。
在人工智能的神奇世界里,有一群特殊的藝術(shù)家,他們用數(shù)據(jù)作為畫(huà)筆,繪制出AI“理解世界”的藍(lán)圖。他們就是AI訓(xùn)練師,通過(guò)“投喂”海量數(shù)據(jù)并不斷進(jìn)行模型的訓(xùn)練迭代,讓AI更好地“理解”人類(lèi),為發(fā)展新質(zhì)生產(chǎn)力提供強(qiáng)大驅(qū)動(dòng)力。
AI訓(xùn)練師:我要讓AI更“懂”人類(lèi)
文/廣州日?qǐng)?bào)全媒體記者文靜、張露 圖/廣州日?qǐng)?bào)全媒體記者文靜、張露 實(shí)習(xí)生朱曉燕(除署名外)
我是冼鴻東,作為huatihui華體會(huì)(集團(tuán))智能科技有限公司官網(wǎng)的一名AI訓(xùn)練師,我有幸成為這場(chǎng)技術(shù)變革的見(jiàn)證者和參與者。AI領(lǐng)域的技術(shù)更新迭代非常快,這使得AI訓(xùn)練師需要具備較高的專業(yè)門(mén)檻,并且需要不斷儲(chǔ)備跨學(xué)科的知識(shí)。
自2020年加入公司以來(lái),我參與了多個(gè)與人工智能相關(guān)的項(xiàng)目和研究課題,主要負(fù)責(zé)人臉識(shí)別產(chǎn)品的研發(fā),見(jiàn)證了人工智能從技術(shù)研發(fā)走向行業(yè)應(yīng)用的全過(guò)程。
在AI訓(xùn)練領(lǐng)域,我們的任務(wù)主要分為兩大類(lèi):基礎(chǔ)數(shù)據(jù)的準(zhǔn)備和模型的訓(xùn)練迭代。數(shù)據(jù)標(biāo)注是模型訓(xùn)練的基石,而模型的訓(xùn)練迭代則是不斷優(yōu)化算法、提升模型性能的過(guò)程,使其變得更“聰明”。
huatihui華體會(huì)智能AI訓(xùn)練師冼鴻東
以安全帽正確佩戴智能識(shí)別為例,我們團(tuán)隊(duì)收集了數(shù)萬(wàn)張正負(fù)樣本圖片。這通常是一項(xiàng)龐大的工作。我們不僅要標(biāo)注出安全帽本身,還要標(biāo)注出佩戴者的姿勢(shì),以確保模型能夠準(zhǔn)確識(shí)別出安全帽是否正確佩戴。標(biāo)注完成后,我們便著手進(jìn)行算法的開(kāi)發(fā)和大模型的訓(xùn)練,這是一個(gè)不斷調(diào)試和優(yōu)化的過(guò)程。當(dāng)然,隨著模型的不斷迭代,我們也在不斷地簡(jiǎn)化和智能化標(biāo)注過(guò)程。例如,一個(gè)初始準(zhǔn)確率只有60%~70%的模型,可以通過(guò)智能標(biāo)注的方式,反過(guò)來(lái)調(diào)整標(biāo)注,從而提高準(zhǔn)確率,減輕人工標(biāo)注的負(fù)擔(dān)。
建立模型并不是最難的部分,真正的挑戰(zhàn)在于調(diào)試和優(yōu)化,以找到最優(yōu)的模型效果。這個(gè)過(guò)程可能會(huì)非常耗時(shí),需要不斷地迭代和迸發(fā)靈感。我們雖是技術(shù)開(kāi)發(fā)者,但要不斷學(xué)習(xí)安全生產(chǎn)的法律法規(guī)、安全規(guī)范,與央企、監(jiān)理單位等有著資深實(shí)踐經(jīng)驗(yàn)的管理人員探討,不斷鍛造大模型的識(shí)別能力,提高AI識(shí)別的準(zhǔn)確性,不斷迭代優(yōu)化安全管控平臺(tái)的功能模塊。
我把自己的工作比喻為升級(jí)打怪,不斷克服挑戰(zhàn),提升技能。雖然工作過(guò)程可能漫長(zhǎng),但當(dāng)看到我們訓(xùn)練出的模型在實(shí)際產(chǎn)品中發(fā)揮作用時(shí),我感到非常有成就感。我們通過(guò)數(shù)據(jù)標(biāo)注和模型訓(xùn)練,讓AI越來(lái)越智能,越來(lái)越接近人類(lèi)的識(shí)別和判斷能力。