不知道大家還記得年初上映的DALL·E2嗎?因?yàn)槭軞g迎,大家開始討論AI繪畫是否會(huì)取代設(shè)計(jì)師的工作。這個(gè)話題至今仍經(jīng)常被提及。近日,OpenAI又出大招,推出ChatGPT,風(fēng)靡互聯(lián)網(wǎng)。大家都開始討論內(nèi)容創(chuàng)作者、技術(shù)從業(yè)者、甚至HR崗位是否會(huì)被取代!
(資料圖)
但事實(shí)真的是這樣嗎? GPT真的有這么強(qiáng)大的能力嗎?今天我們就來看看GPT是如何“密謀”搶走大家的“飯碗”的。
GPT發(fā)展歷史
生成式預(yù)訓(xùn)練Transformer (GPT),一種基于互聯(lián)網(wǎng)上可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型。要談GPT,就不得不談他的雇主OpenAI。 2016 年成立時(shí),該公司的主要目標(biāo)包括創(chuàng)建使用自然語言的“通用”機(jī)器人和聊天機(jī)器人。如今,其核心目的仍然是“實(shí)現(xiàn)安全的通用人工智能”。 (AGI)”,這也給很多人造成了誤解,認(rèn)為GPT的未來就是AGI,但事實(shí)真的是這樣嗎?
我們先來了解一下GPT的發(fā)展歷史吧!
GPT-1
眾所周知,2018年是自然語言處理(NLP)預(yù)訓(xùn)練模型的元年。同年也是GPT-1 誕生的一年。
GPT-1使用的模型結(jié)構(gòu)是Transformer Decoder結(jié)構(gòu),總共12層。
這在當(dāng)時(shí)已經(jīng)是一個(gè)非常大的模型了,但就性能而言,它只能用于監(jiān)督和與任務(wù)無關(guān)的任務(wù)。
(Transformer解碼器模型)
常用的任務(wù)包括:自然語言推理、問答和常識(shí)推理、語義相似度識(shí)別、分類。
GPT-2
一年后,一句“發(fā)布太危險(xiǎn)”和GPT-2走紅網(wǎng)絡(luò),也開啟了OpenAI的成名之路。
與GPT相比,GPT-2并沒有在原有網(wǎng)絡(luò)上進(jìn)行太多的結(jié)構(gòu)創(chuàng)新和設(shè)計(jì),但模型、數(shù)據(jù)、訓(xùn)練模型都得到了很大的增強(qiáng)。
(GPT-2型號(hào))
性能方面,GPT-2在——這一代才發(fā)現(xiàn)了自己真正的實(shí)力,尤其是在閱讀摘要、寫續(xù)寫等方面表現(xiàn)出了強(qiáng)大的天賦。
同樣在這一年,OpenAI通過GPT-2認(rèn)識(shí)到了Zero-Shot的可能性,并發(fā)布了許多搭載GPT-2的衍生品。
GPT-2 衍生品MuseNet
MuseNet 是OpenAI 的早期衍生品,它使用與GPT-2 相同的通用無監(jiān)督技術(shù)。
GPT-2是OpenAI之前提出的大規(guī)模Transformer模型。它訓(xùn)練人工智能預(yù)測(cè)序列中的下一個(gè)標(biāo)記,包括音頻和文本。當(dāng)在MuseNet 上使用時(shí),給出一組音符后,AI 需要預(yù)測(cè)接下來會(huì)出現(xiàn)什么。筆記。
MuseNet可以使用10種不同的樂器生成4分鐘不同風(fēng)格的音樂;即使MuseNet 知道許多不同的風(fēng)格,它也可以混合并生成新的音樂。
例如,當(dāng)你輸入肖邦夜曲的前6個(gè)音符并讓它生成一首流行音樂后,然后讓它添加鋼琴、鼓、貝斯和吉他伴奏,生成的音樂將完美融合。肖邦和邦喬維風(fēng)格。
GPT-3
GPT-2 流行僅一年后,OpenAI 就推出了GPT-3。雖然模型上沒有什么創(chuàng)新,只是遵循了更大更強(qiáng)的風(fēng)格,但通過GPT-3 我們也可以明確:OpenAI 對(duì)GPT 的迭代不再是其模型的創(chuàng)新,更多的是其實(shí)用性,即能否完成自然語言處理的大部分任務(wù)。
在性能方面,GPT-3已經(jīng)能夠?qū)⒕W(wǎng)頁描述轉(zhuǎn)換為相應(yīng)的代碼、模仿人類敘事、創(chuàng)建自定義詩歌、生成游戲腳本,甚至模仿已故哲學(xué)家的風(fēng)格。而且,OpenAI還開放了GPT-3 API接口。您可以自行申請(qǐng)白名單,體驗(yàn)GPT-3的效果,從而正式開啟GPT的商業(yè)化模式。
GTP-3衍生物DALL·E
DALL·E圖像生成器是GPT的衍生品,它的名字是為了向藝術(shù)家薩爾瓦多·達(dá)利和皮克斯的機(jī)器人WALL-E致敬。作為熱門的AI繪畫平臺(tái),DALL·E2可以通過文字描述直接生成超現(xiàn)實(shí)般的圖像,讓機(jī)器擁有頂級(jí)畫家和設(shè)計(jì)師的創(chuàng)造力。
而得益于GPT-3強(qiáng)大的模型,DALL·E 2甚至可以通過AI計(jì)算來考慮整體構(gòu)圖。當(dāng)標(biāo)題文字暗示圖像必須包含未指定的具體細(xì)節(jié)時(shí),DALL·E 2 可以自然地將其整合到圖像中。對(duì)于整個(gè)畫面來說,這是其他AI繪畫工具無法做到的。 OpenAI 將這一概念稱為“填補(bǔ)空白”。
DALL·E 2的使用也非常簡(jiǎn)單。用戶只需輸入自己心中對(duì)圖片的描述,也可以上傳一段想要變換的文字,輸入命令就可以得到自己想要的圖片。這對(duì)于沒有接受過專業(yè)美術(shù)培訓(xùn),但想從事美術(shù)工作,或者想嘗試自己的設(shè)計(jì)的感興趣的用戶來說,無疑是大有裨益的。
然而,目前DALL·E2的整體算法模型還不夠充分。有時(shí)自動(dòng)生成的圖片不能滿足我們的設(shè)計(jì)需求,有時(shí)圖片不合邏輯。隨著GPT算法訓(xùn)練的次數(shù)越來越多,相信它生成的圖像會(huì)越來越豐富。
GPT-3 衍生物ChatGPT
ChatGPT是GPT-3自然語言生成模型的最新衍生品,也是繼DALL·E之后的又一風(fēng)潮產(chǎn)品。它理解并生成自然語言,并且具有高度智能和可訓(xùn)練性。它可以以對(duì)話方式與人類互動(dòng),回答后續(xù)和連續(xù)的問題,承認(rèn)其答案中的錯(cuò)誤,并在人類提出問題時(shí)指出不準(zhǔn)確之處。糾正前提,拒絕回答不恰當(dāng)?shù)膯栴}。
ChatGPT 能做的遠(yuǎn)不止這些,這就是為什么每個(gè)人都稱自己失業(yè)了。我們來看看ChatGPT的功能。
寫入內(nèi)容
內(nèi)容創(chuàng)作者是當(dāng)今大時(shí)代最常見的工作類型之一。很多人都表現(xiàn)出了自己獨(dú)特的創(chuàng)造力和不可替代性;各種熱門關(guān)鍵詞也層出不窮,豐富了很多人的閑暇時(shí)間。
現(xiàn)在,ChatGPT可以通過算法完成內(nèi)容輸出!
您甚至可以在問題后輸入風(fēng)格要求,這樣您就可以對(duì)著名藝術(shù)家、世界首富、著名政治家、甚至美國(guó)殺人犯的表達(dá)風(fēng)格感到滿意。
但ChatGPT創(chuàng)造的故事重復(fù)度還是比較高的。這可能與其工作原理有關(guān),即根據(jù)初始輸入短語將單詞相互關(guān)聯(lián)并生成后續(xù)的其他單詞。因此,文字作者無需擔(dān)心GPT 會(huì)取代您的作品。
指出錯(cuò)誤
ChatGPT 使用“預(yù)訓(xùn)練-微調(diào)”工作范式訓(xùn)練了一個(gè)初始模型:人類AI 訓(xùn)練員提供對(duì)話,其中他們扮演雙方—— 個(gè)用戶和AI 助手。 AI訓(xùn)練師可以訪問模型編寫的對(duì)話回復(fù),并幫助AI調(diào)整你的回復(fù)內(nèi)容。
編寫軟件
真正讓ChatGPT在互聯(lián)網(wǎng)上流行的自然是因?yàn)樗皩⑷〈夹g(shù)人員的工作”。據(jù)說可以自己寫代碼、自己調(diào)試。但事實(shí)上,ChatGPT 自己的解釋是“我可以為用戶解決各種技術(shù)問題。比如我可以幫助用戶解決編程語言的問題,比如Java、Python、C++等,我也可以幫助用戶解決操作系統(tǒng)的問題。問題,例如Windows、Linux、MacOS等。此外,我還可以幫助用戶使用軟件工具解決問題,例如Eclipse、Visual Studio、Git等?!?
也有人在ChatGPT 和Google 上搜索同樣的問題。通過比較,他們發(fā)現(xiàn)ChatGPT往往能夠給出用戶最想要的答案,而且答案呈現(xiàn)的方式也非常直接,為未來的搜索引擎提供了新的范式。 ChatGPT也被認(rèn)為是最有可能取代Google的下一代智能搜索引擎。
正是因?yàn)镚PT-3衍生出來的很多支持各行業(yè)自動(dòng)補(bǔ)全的產(chǎn)品的出現(xiàn)。您只需輸入幾個(gè)單詞即可完成一個(gè)段落(或更多)。因此,GPT-3 被描述為世界上最強(qiáng)大的自動(dòng)完成系統(tǒng)。
那么回到文章開頭提到的觀點(diǎn):GPT 的未來是AGI。但GPT真的可以等同于AGI嗎?
預(yù)測(cè):GPT-4等于AGI嗎?
說到AGI,很多非技術(shù)專業(yè)人士可能會(huì)有些困惑,但相信“人工智能”這個(gè)詞大家都很熟悉。自從早年“AlphaGo在圍棋方面擊敗了人類最優(yōu)秀棋手”以來,人工智能戰(zhàn)勝人類的話題就一直被討論不斷;因此,當(dāng)GPT可以取代設(shè)計(jì)師、編曲者、內(nèi)容創(chuàng)作者、技術(shù)工程師等工作的話題一出,立即引起關(guān)注。
其實(shí)通過我們剛才的分析,相信大家都能夠明白,OpenAI推出的GPT衍生品并不能取代任何人的工作。人類通常善于整合各種感官信息來創(chuàng)造新的內(nèi)容,所以我們?cè)谧鯝GI研究時(shí)必須考慮的東西是征服的基礎(chǔ)。
AGI,至少從一開始,將需要一個(gè)機(jī)器人身體來學(xué)習(xí)這樣的東西。
這些計(jì)算機(jī)不需要駐留在機(jī)器人內(nèi)部,但可以遠(yuǎn)程連接,因?yàn)殡娦盘?hào)的傳輸速度比我們神經(jīng)系統(tǒng)中的信號(hào)傳輸速度快得多。然而,機(jī)器人能夠?qū)W習(xí)如何堆疊積木、移動(dòng)物體、隨著時(shí)間的推移執(zhí)行一系列動(dòng)作,并從這些動(dòng)作的后果中學(xué)習(xí)。使用視覺、觸摸、操縱器等,AGI 可以學(xué)習(xí)以基于文本的系統(tǒng)根本無法實(shí)現(xiàn)的方式進(jìn)行理解。
GPT沒有針對(duì)該內(nèi)容的訓(xùn)練,更多地局限于內(nèi)容生成訓(xùn)練。我們相信,隨著人類不斷使用反饋訓(xùn)練,GPT生成的內(nèi)容會(huì)越來越豐富、越來越有邏輯性,但用文字來表達(dá)抽象層次是GPT無法學(xué)習(xí)的。
總結(jié)
雖然GPT不等于人工智能,但它之前有DALL·E2,之后有ChatGPT。一定程度上確實(shí)降低了各類勞動(dòng)者的準(zhǔn)入門檻和工作壓力;相信隨著AlphaGo的前行,更多的人工智能產(chǎn)品將會(huì)逐漸與大家見面。
我們可以看到,人工智能引入日常生活將對(duì)我們的生活和工作方式產(chǎn)生深遠(yuǎn)的影響;我們還相信人工智能將用于自動(dòng)化日常任務(wù)、創(chuàng)建個(gè)性化服務(wù)并根據(jù)數(shù)據(jù)做出決策。
頂?shù)街锹?lián)注重打造以人為本的運(yùn)營(yíng)體系。我們也希望操作系統(tǒng)能夠?yàn)榭蛻籼峁└觽€(gè)性化、智能化的操作體驗(yàn)。希望大家持續(xù)關(guān)注釘?shù)渡鷳B(tài),和我們一起參與更多更新。就多個(gè)主題進(jìn)行討論。