電腦版 | 陸科技巨頭華為入局AI 即將公布千億級大模型盤古Chat | 國際新聞 | 20230604 | match生活網 Insert title here
Insert title here

國際新聞

  • 陸科技巨頭華為入局AI 即將公布千億級大模型盤古Chat

    中時新聞網     2023/06/04 01:10

    字級:

    大陸通訊科技龍頭企業華為公司在全球一片人工智慧(AI)熱潮中亦不落人後,即將發佈一款類似ChatGPT的多模態千億級大模型產品,名為「盤古Chat」,這意味著繼阿里、百度之後,大陸又一重要科技巨頭入局AI賽場。

    據大陸《鈦媒體》獨家報導,預計今年7月7日的華為雲開發者大會上將對外發佈以及內測,產品主要面向政府與企業端客戶。基於華為的技術能力,盤古Chat有望成為大陸技術能力最強的ChatGPT產品,同時華為生態產業鏈企業也將因此受益。

    報導指出,盤古大模型於2020年11月在華為雲內部立項成功,華為內部團隊為盤古大模型確立了3項最關鍵的核心設計原則:1.模型要大,可以吸收海量資料;2.網路結構要強,能夠真正發揮出模型的性能;3.要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。

    華為發布的訊息指出,盤古NLP大模型是首個千億參數中文預訓練大模型,CV大模型則首次達到30億參數。2022年4月,華為盤古升級到2.0,發佈層次化開發方案並打造工業級盤古大模型。

    華為雲人工智慧領域首席科學家田奇今年4月曾表示,盤古NLP大模型覆蓋的智慧文檔檢索、智慧 ERP、小語種大模型等落地領域,2022年華為剛交付了一個阿拉伯語的千億參數大模型。在應用方面,盤古大模型可以應用於智慧客服、機器翻譯、語音辨識等多個領域,提供AI技術支援。

    報導說,去年華為將盤古大模型在垂直產業領域落地應用。例如華為基於盤古AI大模型在礦山領域打造首個「基於大模型的人工智慧訓練中心」,實現Al應用工業化開發,不僅降低成本而且增加效益。

    與其他廠商相比,華為的優勢或在於擁有完整的產業鏈和較強的算力調配能力。據浙商證券披露,在訓練千億參數的盤古大模型時,華為團隊調用了超過2000塊的昇騰910晶片,進行了超2個月的資料訓練能力。華為內部稱,每年大模型訓練調用GPU/TPU卡超過4000片,3年的大模型算力成本高達9.6億元人民幣(約合台幣41.8億元)。

    報導表示,由於盤古大模型擁有超大規模的參數,因此訓練成本較高。同時,盤古Chat大模型也將面臨著行業激烈的競爭壓力,需要不斷優化和提高模型的性能和品質,才能以保持在市場中的領先地位。


    用facebook 分享給朋友   用 LINE 分享給朋友   用 email 分享給朋友   用twitter 分享給朋友   用新浪維博 分享給朋友   用WhatsApp 分享給朋友

最 Hot 財經專題

媒體選單