人民網(wǎng)
人民網(wǎng)>>四川頻道

人工智能訓(xùn)練師幫助學(xué)習(xí)模型識別“有用”信息——

教人工智能讀懂專業(yè)文件(新職業(yè)新故事)

本報記者 黃曉慧
2024年08月27日08:20 | 來源:人民網(wǎng)-《人民日報》
小字號

  楊洪旭在制訂人工智能訓(xùn)練計劃。

  楊洪旭(右)和同事在討論人工智能訓(xùn)練進展。
  以上圖片均為本報記者黃曉慧攝

  打開電腦,開啟智能訓(xùn)練軟件,人工智能訓(xùn)練師楊洪旭開始一天的工作。他最近的任務(wù)是訓(xùn)練一個能自主識別銀行電匯申請書的人工智能(AI)模型。

  楊洪旭供職的達觀數(shù)據(jù)有限公司,位于上海浦東軟件園,是一家智能文本處理技術(shù)企業(yè)。這里研發(fā)的AI模型,能讀懂合同工單、財務(wù)報表、行業(yè)報告等各類文本文件,在銀行流水識別、合同審核與比對等多場景落地應(yīng)用。

  “在訓(xùn)練AI模型前,訓(xùn)練師首先要閱讀大量相關(guān)的文件文本,從中提煉和標注出關(guān)鍵信息?!睏詈樾癜炎x文本、做標注的過程比作老師備課,是訓(xùn)練的基礎(chǔ),“我們劃重點、做標注,然后將‘有用’信息‘投喂’給AI模型,告訴它們應(yīng)該提取哪些信息、按照什么格式提取?!比斯ぶ悄苡?xùn)練師一年需要閱讀上萬份文檔,訓(xùn)練幾十個AI模型。

  楊洪旭在智能訓(xùn)練軟件中打開某銀行一張電匯申請書的掃描圖像,將“業(yè)務(wù)種類”“匯款人名稱”“賬號”“開戶銀行”“聯(lián)系地址”等字段信息一一拉框選中,再在旁邊打上相應(yīng)標簽,隨后點擊生成訓(xùn)練模型。

  模型生成后,他需要給AI模型出一些練習(xí)題,輸入字段信息,比對AI模型生成的結(jié)果,以此檢驗學(xué)習(xí)效果。當(dāng)發(fā)現(xiàn)生成結(jié)果與原文本有出入時,楊洪旭會記錄并整理成問題列表。“比如文章中有一處圖像,它沒有讀取出來。有一個圖像應(yīng)該是正向的,它讀取成了側(cè)向的?!边@些問題會統(tǒng)一反饋給AI模型的研發(fā)人員,為后續(xù)改進作參考。

  “AI模型經(jīng)過訓(xùn)練后,再遇到類似的文本文件,它就能自主抓取、審讀這些關(guān)鍵信息,更高效地執(zhí)行人類指令?!痹趧e人眼中單調(diào)、重復(fù)、略顯枯燥的文檔閱讀、數(shù)據(jù)標注、效果測試等工作,楊洪旭卻得心應(yīng)手。他最開心的事就是看到自己訓(xùn)練的模型越來越“聰明”。

  1993年出生的楊洪旭,患有先天聽力障礙,要戴助聽器才能聽到外界的聲音。2014年,他從上海一所職業(yè)技術(shù)學(xué)院的環(huán)境設(shè)計專業(yè)畢業(yè),先后做過家裝設(shè)計、會計文員和倉庫管理員等工作。

  “和客戶交流時,因為口齒表達不夠清晰流利,經(jīng)常會有挫敗感?!痹跅詈樾裣萑朊悦VH,上海市浦東新區(qū)殘聯(lián)向他推薦了達觀數(shù)據(jù)有限公司的“人工智能訓(xùn)練師”崗位。盡管沒有計算機編程技術(shù)基礎(chǔ),也對人工智能了解不多,但在聽說這份新工作主要和機器打交道后,楊洪旭決定嘗試。

  招聘楊洪旭入職的運營管理總監(jiān)袁少楊說,公司首批人工智能訓(xùn)練師主要從事最基礎(chǔ)的數(shù)據(jù)標注工作,重復(fù)的工作內(nèi)容和大批量的標注強度,很考驗人的耐心、細心和專注度。

  5年下來,踏實、專注、好學(xué)的楊洪旭贏得了同事們的交口稱贊。在公司的內(nèi)部培訓(xùn)和自我學(xué)習(xí)下,他逐漸勝任模型處理、產(chǎn)品測試、接洽客戶等多項工作。2022年底,上海發(fā)布了首批人工智能訓(xùn)練師(二級)職業(yè)技能等級認定通過名單,楊洪旭位列其中。

  面對人工智能產(chǎn)業(yè)的飛速發(fā)展,楊洪旭主動學(xué)習(xí)AI模型主流的編程語言,編寫一些簡單代碼處理模型出現(xiàn)的問題?!氨热?,當(dāng)發(fā)現(xiàn)訓(xùn)練的模型有誤讀問題,我能夠編寫幾行程序代碼,做一些初步糾正,而不是把問題直接轉(zhuǎn)給模型研發(fā)人員。”楊洪旭說,為了提升自己,眼下,他正在備考信息系統(tǒng)項目管理師職稱證書。

  人工智能是上海的三大先導(dǎo)產(chǎn)業(yè)之一。近年來,上海從算力、語料、模型、測試、應(yīng)用場景等方面布局人工智能產(chǎn)業(yè),同時加大人才培養(yǎng)力度。2022年,上海啟動人工智能訓(xùn)練師職業(yè)技能等級認定工作,目前已有450多人獲得了“人工智能訓(xùn)練師”證書。

  

  版式設(shè)計:汪哲平

  《 人民日報 》( 2024年08月27日 13 版)

(責(zé)編:袁菡苓、羅昱)

分享讓更多人看到

返回頂部
宜宾县| 凭祥市| 鸡西市| 布拖县| 通山县| 鄱阳县| 大埔县| 安西县| 鄂托克旗| 武城县| 尼玛县| 阳朔县| 灵山县| 高唐县| 罗源县| 邯郸市| 沂水县| 台南县| 调兵山市| 禄劝| 湘潭市| 汉源县| 辽源市| 五家渠市| 班玛县| 佛山市| 永泰县| 讷河市| 德阳市| 翁牛特旗| 剑阁县| 文登市| 兴海县| 措勤县| 普安县| 鹤岗市| 平度市| 来凤县| 崇左市| 津市市|