(圖片來源:鈦媒體App編輯攝)
(資料圖)
6月3日消息,鈦媒體App近日從華為獨(dú)家獲悉,華為將發(fā)布一款直接對標(biāo)ChatGPT的多模態(tài)千億級大型模型產(chǎn)品,名為“盤古聊天”。
華為盤古聊天預(yù)計(jì)將在今年7月7日舉行的華為云開發(fā)者大會(huì)(HDC.Cloud 2023)上對外發(fā)布并進(jìn)行內(nèi)部測試。該產(chǎn)品主要針對To B/G政企客戶。
這意味著,在國內(nèi)大規(guī)模的模型軍備競賽中,繼阿里巴巴、百度之后,又一重要科技巨頭入局。基于華為的技術(shù)能力,盤古聊天有望成為國內(nèi)技術(shù)能力最強(qiáng)的ChatGPT產(chǎn)品,華為生態(tài)產(chǎn)業(yè)鏈企業(yè)也將從中受益。
據(jù)悉,盤古大模型項(xiàng)目于2020年11月在華為云內(nèi)部成功立項(xiàng)。對于盤古大模型的定位,華為內(nèi)部團(tuán)隊(duì)確立了最關(guān)鍵的三個(gè)核心設(shè)計(jì)原則:第一,模型要大,能吸納海量數(shù)據(jù);其次,網(wǎng)絡(luò)結(jié)構(gòu)必須強(qiáng)大,才能真正發(fā)揮出模型的性能;第三,必須具有優(yōu)秀的泛化能力,能夠真正應(yīng)用于各行各業(yè)的工作場景。
2021年4月,盤古大模型正式對外發(fā)布。其中,盤古NLP大模型是中國首個(gè)預(yù)訓(xùn)練1億參數(shù)的大模型,CV大模型首次達(dá)到30億參數(shù)。 2022年4月,華為盤古升級至2.0,發(fā)布分級發(fā)展規(guī)劃(LO、L1、L2),打造大型工業(yè)級盤古模型。
根據(jù)華為云高管的演講PPT信息,目前華為“盤古系列AI大模型”的基礎(chǔ)層主要包括NLP大模型、CV大模型、科學(xué)計(jì)算大模型等,上層是華為的行業(yè)與合作伙伴開發(fā)的大型模型。
華為云人工智能領(lǐng)域首席科學(xué)家田奇今年4月表示,盤古NLP大模型涵蓋智能文檔檢索、智能ERP、小語言大模型等實(shí)現(xiàn)領(lǐng)域。 2022年,華為剛剛交付了千億參數(shù)的阿拉伯語大模型。在應(yīng)用方面,盤古大模型可應(yīng)用于智能客服、機(jī)器翻譯、語音識別等多個(gè)領(lǐng)域,提供AI技術(shù)支撐。
去年,華為在垂直行業(yè)落地了盤古模式。一個(gè)例子是,基于盤古AI大模型,華為打造了礦業(yè)領(lǐng)域首個(gè)“基于大模型的人工智能訓(xùn)練中心”,實(shí)現(xiàn)了AI應(yīng)用的“產(chǎn)業(yè)化”開發(fā),不僅降低了成本——,節(jié)省了80 %+ 與人工驗(yàn)證相比,還降低了每噸成本每噸降低8元(年產(chǎn)能260萬噸),效率提高——,防撞防壓節(jié)省80%+與人工驗(yàn)證相比,效率提升——,智能客戶效率提升30%。
與其他廠商相比,華為的優(yōu)勢可能在于其完整的產(chǎn)業(yè)鏈和強(qiáng)大的算力部署能力。據(jù)浙商證券此前披露,在訓(xùn)練千億參數(shù)盤古模型時(shí),華為團(tuán)隊(duì)使用了2000多顆升騰910芯片,進(jìn)行了2個(gè)多月的數(shù)據(jù)訓(xùn)練能力。華為內(nèi)部表示,每年超過4000張GPU/TPU卡用于大型模型訓(xùn)練,三年大型模型的算力成本高達(dá)9.6億元。
東吳證券3月27日發(fā)布的研報(bào)顯示,華為盤古大模型具有人才儲備和算力自主掌控的優(yōu)勢。有望成為國內(nèi)領(lǐng)先大機(jī)型,生態(tài)產(chǎn)業(yè)鏈標(biāo)的有望加速發(fā)展,包括拓維信息、四川長虹、麒麟軟件(中國軟件)、同心軟件(誠邁科技)等華為生態(tài)系統(tǒng)企業(yè),以及麒麟校長。國盛證券認(rèn)為,華為盤古是首個(gè)多模態(tài)千億級規(guī)模化模型,有望賦能各行業(yè)。
根據(jù)華為發(fā)表的論文數(shù)據(jù),華為PanGu-大模型參數(shù)高達(dá)1.085萬億,基于華為自研的MindSpore框架開發(fā)。總體而言,PanGu-大模型在對話方面可能接近GPT-3.5的水平。
值得注意的是,由于盤古大模型參數(shù)極大,訓(xùn)練成本較高。盡管盤古大模型在處理漢語方面具有較高的準(zhǔn)確性和質(zhì)量,但在語義理解方面仍然存在一定的局限性,特別是在處理復(fù)雜的語言結(jié)構(gòu)和語義推理方面。與此同時(shí),盤古聊天大模型也將面臨行業(yè)激烈的競爭壓力,需要不斷優(yōu)化和提高模型的性能和質(zhì)量,以保持其在市場中的領(lǐng)先地位。 (本文首發(fā)于鈦媒體App,作者|林志佳)