【資料圖】
經濟觀察網 記者 周應梅
7月7日,京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬在2023世界人工智能大會上接受包括經濟觀察網在內的媒體采訪時表示,京東在大模型上一直進行技術積累與布局,并深度結合了京東和產業的需求,已經陸續發布了十億級、百億級參數的大模型。今年的京東探索者科技大會上,京東即將發布千億級參數大模型。
今年以來,大模型產品批量涌現,根據世界人工智能大會官方微信披露數據,2023年的大會上聚齊了三十多個大模型及相關產品。何曉冬認為,有市場競爭是好事,從2016年以來就感受到競爭非常激烈,這也說明市場有需求,其次,競爭中產生的技術和產品才是真正有生命力的。
何曉冬表示,當你的技術過了一個門檻以后,就會出現百花齊放的情景,各種各樣的衍生形態都會出來,包括AI生成的繪畫、數字人、人機對話等應用的出現,其實是因為基礎的深度學習為代表的技術過了一個門檻。
何曉冬稱京東大模型并不是馬上就產生的,而是多年的鋪墊。他提及2020年時京東就關注到了深度學習模型和語言生成,當時也開啟了語言模型研發。當AI通用算法生成語言時免不了會生成事實錯誤內容,這樣的情況在to C端或許可以調侃,但在電商領域是無法容忍的。“技術只有和現實世界的真實場景和產品產生緊密融合,才有可能真正產生AI落地的價值。”何曉冬說。
2021年京東針對零售電商場景中內容生成專業度不足問題,提出了十億級K-PLUG算法模型,目前模型已經在京東的發現好貨等場景廣泛應用;2022年針對模型泛化性不足,京東提出了百億級模型Vega;百億級模型之后,今年京東再推出千億級大模型。
何曉冬認為,大模型有它的好處,可以容納多種技能,互相之間沒有太多沖突,多個行業都可以覆蓋。帶來的困難是它的推理過程和部署成本會更高,因此對于一些特定場景,模型不一定求大。
何曉冬在本屆人工智能大會的公開演講中提及,京東言犀大模型在語言方向已經有大量的使用,寫了超過30億字的營銷文案,使得營銷文案生成做到了自動化和智能化。他表示,其它已有的應用領域還包括數字人直播、智能政務熱線、銀行數字員工等。
何曉冬認為,大模型的可靠性問題不解決,就無法在產業場景中廣泛應用。他提到,為保證大模型的可靠性,三年以來京東在這方面進行了一系列改進,會把特定的行業知識注入文本訓練中,比如要寫新品文案推薦會讓它參考產品說明書;另外,還會設計一個損失函數,出現錯誤或者重要的內容沒被抓取到,就會有額外損失,有一個懲罰模型,最終讓模型學會從可信的信源里獲取基礎知識。
目前大模型朝著通用大模型和垂直行業模型兩個方向發展。何曉冬稱,垂直行業模型訓練成本和訓練難度其實更高,但部署和應用成本會盡量降下來,因為直接關系到客戶的成本。要做好行業模型,行業領域的Know-How非常重要,也需要足夠的基礎常識作背景,才能帶來好的體驗。
關鍵詞: