ChatGPT 參加了MBA 考試。這是它的表現(xiàn)
沃頓商學(xué)院教授對OpenAI 的聊天機(jī)器人進(jìn)行了測試。測試結(jié)果對未來的教育意味著什么?
賓夕法尼亞大學(xué)沃頓商學(xué)院的一位教授給ChatGPT 進(jìn)行了MBA 項(xiàng)目期末考試,ChatGPT 獲得了B 級成績。
(相關(guān)資料圖)
沃頓商學(xué)院運(yùn)營管理教授Christian Terwiesch 表示ChatGPT “在基本運(yùn)營管理和流程分析問題上做得很好”。
他在新的白皮書中寫道:“答案不僅正確,而且解釋也很好?!?
但他補(bǔ)充說,聊天機(jī)器人“在相當(dāng)于六年級數(shù)學(xué)水平的相對簡單的計(jì)算中犯了令人驚訝的錯(cuò)誤”,而且它還無法處理更高級的過程分析問題。另一方面,當(dāng)前版本的ChatGPT可以根據(jù)人工提示修改答案,以得出正確的解決方案。
Terwiesch 寫道:“鑒于這樣的表現(xiàn),Chat GPT3 將在考試中獲得B 到B- 的成績?!?
Terwiesch 的幾個(gè)問題旨在測試ChatGPT 在處理具有不同吞吐量能力的多臺機(jī)器時(shí)是否會(huì)出現(xiàn)瓶頸。
然而,ChatGPT 在使用中級算術(shù)時(shí)“犯了一個(gè)巨大的錯(cuò)誤”。
有趣的是,ChatGPT 最初錯(cuò)誤地回答了一個(gè)有關(guān)隊(duì)列分析的問題。教授向ChatGPT 提出了更好的答案,因此ChatGPT 改進(jìn)了答案。第二天,教授在沒有提示的情況下向它提出了相同的初始隊(duì)列問題,而ChatGPT 在第一次嘗試時(shí)就正確回答了。
這位教授指出:“要么是能夠從過去的反饋中學(xué)習(xí),要么就是我很幸運(yùn)?!?“其答案的質(zhì)量似乎存在一些隨機(jī)性,”他補(bǔ)充道。
Terwiesch 還發(fā)現(xiàn)ChatGPT 能夠提出巧妙而幽默的問題,供他在未來的考試中使用。然而,該聊天機(jī)器人在某些問題上也存在缺陷,導(dǎo)致無法回答。
此外,著名科學(xué)期刊的編輯表示ChatGPT 缺乏深度和洞察力
Terwiesch 警告其他人注意ChatGPT 的功能和限制。他說,在閱讀了ChatGPT 對第一個(gè)問題的回答后,他“愛上”了ChatGPT,但警告說ChatGPT “在一些相當(dāng)簡單的情況下犯了重大錯(cuò)誤”。 '
這位教授寫道:“對于復(fù)雜問題,我們距離A+ 還很遠(yuǎn),我們?nèi)匀恍枰腥藚⑴c其中?!?
“在我的教育觀中,小學(xué)生仍然需要學(xué)習(xí)7 7=49,以及賓夕法尼亞州的首府是哈里斯堡,盡管計(jì)算器已經(jīng)廣泛使用了50 多年,學(xué)生可以使用Google 維基百科查找大數(shù)據(jù)。數(shù)字。大多數(shù)事實(shí)問題的答案。這是基礎(chǔ)技能的本質(zhì),需要這些技能來理解更高級的主題。
Terwiesch 還認(rèn)為,教育工作者應(yīng)該擔(dān)心K-12 學(xué)生可能會(huì)使用ChatGPT 在作業(yè)和考試中作弊。例如,紐約市教育部最近禁止了聊天工具,因?yàn)榭煽康臏y試對教學(xué)很重要,而且技能認(rèn)證不應(yīng)因?yàn)樾录夹g(shù)而受到損害。他指出,使用ChatGPT 的學(xué)生就像要求“學(xué)術(shù)能力一般”的朋友為他們完成測試。
但他也認(rèn)為ChatGPT 和類似技術(shù)有能力充當(dāng)“智能顧問”——給出優(yōu)雅但經(jīng)常錯(cuò)誤的答案,他認(rèn)為這是培養(yǎng)MBA 學(xué)生技能的“完美訓(xùn)練場”,他們需要批判性地評估備擇方案。