“如果我問人們想要什么,他們會說更快的馬?!边@種情緒,以及諸如“人們不知道自己想要什么,直到你向他們展示”之類的衍生品,使得技術(shù)的未來非常可預(yù)測。變得困難是因為它需要創(chuàng)新來徹底改變范式。對于即將到來的新的和現(xiàn)有的谷歌應(yīng)用程序的人工智能功能浪潮來說尤其如此。
【資料圖】
Google 對即將發(fā)生的事情并非毫無準(zhǔn)備。該公司在過去兩屆I/O 開發(fā)者大會上公開討論了自然語言理解(NLU) 和大語言模型(LLM),這是該公司每年最大的活動。 2021 年的Conversational App 語言模型通過Pluto 進(jìn)行了演示,去年的LaMDA 2 也能夠通過AI Test Kitchen 應(yīng)用程序進(jìn)行演示。
還有多任務(wù)統(tǒng)一模型(MUM),有一天它可以回答“我已經(jīng)爬過亞當(dāng)斯山,現(xiàn)在想明年秋天爬富士山,我應(yīng)該做哪些不同的準(zhǔn)備?”未來,在Google Lens 中,您可以拍攝自行車零件的損壞照片并獲取如何修復(fù)它的說明。
除了詳細(xì)介紹其技術(shù)外,桑達(dá)爾·皮查伊(Sundar Pichai) 的說法更有說服力:“自然對話功能有潛力使信息和計算從根本上更容易訪問和使用?!彼阉?、助手和工作區(qū)被特別命名,因為谷歌希望“[集成]更好的對話功能”產(chǎn)品。
然而,正如最近的評論所證明的那樣,這還不足以被記住。相反,谷歌沒有提供更具體的例子來讓公眾意識到這些新的人工智能功能將如何使他們每天使用的產(chǎn)品受益。
話又說回來,即使在2022 年5 月提供了更具體的示例,當(dāng)當(dāng)年晚些時候推出ChatGPT 時,它也會很快被淘汰。 OpenAI 演示/產(chǎn)品現(xiàn)已推出(并已付費),體驗它們的感覺無與倫比。它引發(fā)了很多關(guān)于直接響應(yīng)如何影響谷歌基于廣告的商業(yè)模式的討論,認(rèn)為如果用戶已經(jīng)在生成和總結(jié)的句子中得到答案,則他們將不再需要點擊鏈接。
讓谷歌措手不及的是競爭對手將這些新的人工智能進(jìn)步整合到交付應(yīng)用程序中的速度之快??紤]到紅色代碼,很明顯該公司認(rèn)為不必這么快推出除演示之外的任何東西。安全性和準(zhǔn)確性問題是谷歌在其現(xiàn)有預(yù)覽中明確強調(diào)的問題,高管們很快指出,當(dāng)今市場上的產(chǎn)品如何“編造謊言”,如果大規(guī)模推出谷歌搜索,將損害聲譽。
宣布裁員的同一天,《紐約時報》披露了谷歌計劃在今年5 月的I/O 2023 上展示的20 多款A(yù)I 產(chǎn)品。
這些公告大概是由“具有聊天機器人功能的搜索引擎”主導(dǎo)的,它們似乎渴望與OpenAI 正面交鋒。特別令人感興趣的是“圖像生成工作室”,它看起來像是DALL-E、Stable Diffusion 和Midjourney 的競爭對手,其中Pixel 壁紙創(chuàng)建器可能是其中的一個分支。當(dāng)然,谷歌將直接應(yīng)對藝術(shù)家因圖像生成人工智能而引起的強烈反對。
AI Test Kitchen 將文本添加到圖像演示除了搜索(稍后會詳細(xì)介紹)之外,泄露的內(nèi)容似乎都沒有從根本上改變普通用戶與Google 產(chǎn)品的交互方式。當(dāng)然,這從來都不是谷歌的做法,它一直是在現(xiàn)有產(chǎn)品(甚至只是其中的一部分)技術(shù)可用時添加一些小便利。
Gmail、Google Chat 和Messages 中有智能回復(fù)功能,文檔和Gmail 中的智能撰寫功能并不能完全為您撰寫電子郵件,但自動完成建議確實很有幫助。
Pixel 上有Call Screen、Hold for Me、Direct My Call 和Clear Calling,其中人工智能用于改進(jìn)手機的原始關(guān)鍵用例,而設(shè)備上的語音識別則可以實現(xiàn)出色的錄音機和更快的助手。當(dāng)然,還有計算攝影和現(xiàn)在的Magic Eraser。
這并不是說谷歌沒有使用人工智能來創(chuàng)建全新的應(yīng)用程序和服務(wù)。 Google Assistant 是自然語言理解進(jìn)步的成果,而計算機視覺使Google Photos 中的搜索和分類成為可能,七年后我們認(rèn)為這是理所當(dāng)然的。
最近,谷歌鏡頭通過拍照和附加問題進(jìn)行視覺搜索,而谷歌地圖中的實時視圖則提供AR 方向。
在ChatGPT 之后,人們想象一個搜索引擎,您的問題將通過完全為您/該查詢生成的句子直接回答,而不是獲取鏈接或顯示引用可能有答案的相關(guān)網(wǎng)站的“特色片段”。
縱觀這個行業(yè),我感覺自己是少數(shù)對對話體驗和直接答案缺乏熱情的人。
我預(yù)見到的一個問題是,并不總是(甚至經(jīng)常)需要閱讀完整的句子來獲得答案,尤其是如果只需閱讀知識面板中的一行即可找到答案的情況下;它可以是日期、時間或其他簡單的事實。
與此同時,信任任何公司的聊天機器人搜索生成和總結(jié)能力都需要時間。至少精選片段可以讓我立即查看并決定我是否信任引用的出版物/來源。
在很多方面,直接的句子是智能助理一直在等待的東西,而今天的谷歌助理則轉(zhuǎn)向它已經(jīng)知道的事實(日期、地址等)(知識面板/圖表)和功能片段。當(dāng)您與語音交互時,可以肯定地認(rèn)為您無法輕松地看著屏幕并期望立即得到答案。
我知道技術(shù)的歷史充滿了迭代更新,這些更新很快就被改變游戲規(guī)則的創(chuàng)新所踐踏,但感覺技術(shù)還沒有到來。我回想起語音助手的早期階段,它明確地試圖在盒子里復(fù)制人類。即將到來的人工智能浪潮有點像人類回答你的問題或為你完成任務(wù),但這種新鮮感會持續(xù)多久?