快訊

AI狂潮降臨 X世代遇年齡歧視 求職慘輸「數位原住民」

可可價飆漲期貨漲幅超過輝達 巧克力只會愈來愈貴

寶林和食品中毒案很不一樣 游淑慧:僅3月20日沒狀況

GPT-4來了!ChatGPT律師考試贏9成考生 還有哪些地方變強了

圖片來源:Shutterstock
圖片來源:Shutterstock

【文.編譯 張詠晴】

人工智慧研究公司OpenAI公布了大型語言模型的最新版本GPT-4,據說在律師考試中擊敗9成的考生,還有哪些高級智慧?

最強人工智慧(AI)聊天機器人ChatGPT 「生成式預訓練轉換器」升級到第四代,也就是GPT-4,有變得更強嗎?

在GPT-4支援下,ChatGPT提供了醫療建議,讓部分醫師震驚不已,並且如今可以支援圖片、影像,並即將要創作出真的好笑的笑話。

但《紐約時報》發現,GPT-4還是會犯一些ChatGPT剛剛問世時的一些錯誤。但升級後的ChatGPT似乎更善於考試,但要說它已經逼近人類智慧了,似乎又言過其實。

彭博社也指出,由GPT-4支援的ChatGPT也無法回應時事,因為和GPT-3一樣,它是根據2021年9月以前就存在的數據資料所訓練的。

由最新釋出GPT-4支援的ChatGPT有哪些變強的地方,以下整理《紐約時報》發現:

在律師資格考,勝過9成考生

OpenAI表示,GPT-4在律師資格考試(Uniform Bar Examination, UBE)中可以擊敗90%的考生。在滿分1600分的美國大學入學測驗SAT拿到1300分,在高中的大學先修課程測驗中,不論是生物、微積分、總體經濟學、心理學、統計學和歷史都拿到5分的滿級分。

至於前一版本的ChatGPT並無法通過律師考試,在大部分高中的大學先修課程測驗中,也無法拿到那麼高分。

OpenAI總裁與共同創辦人布羅克曼(Greg Brockman)將一個律師考試的考題丟給ChatGPT,變強後的ChatGPT回答了出來,但充斥著法律術語。

布羅克曼要ChatGPT說一般人也能懂的話,ChatGPT也做到了。

GPT-4似乎學會更精準了

當人工智慧專家尼克遜(Chris Nicholson)告訴GPT-4,自己會說英文,但不懂西班牙文,可否給他一個學基礎西班牙文的教學大綱,ChatGPT提供了一份鉅細靡遺且非常有組織的課程大綱,還順道附上了學習和背誦西班牙單字的技巧。

尼克遜問未升級GPT-4前的ChatGPT同樣問題,也會得到一份課程大綱,但內容比較泛泛,獲得幫助較少。

尼克遜的回饋是,現在能提供的事實性描述更多了,而且通常都是正確的。

加強了正確性

艾倫人工智慧研究所前執行長伊奇奧尼(Oren Etzioni)在升級版ChatGPT,輸入自己的名字和兒子的名字,問兩人是什麼關係。

舊版ChatGPT老是說兩人是兄弟,新版則答對了。

但新版ChatGPT還是犯了一個錯, ChatGPT依然介紹伊奇奧尼是艾倫人工智慧研究所執行長,而不清楚伊奇奧尼已經離任。這顯示的是GPT-4並沒有吸納太新的資訊。

GPT-4可以描述圖片細節

GPT-4學會新能力,現在不但可以回應文字,也可以回應圖片。

OpenAI總裁與共同創辦人布羅克曼示範,ChatGPT如今可以描述哈伯太空望遠鏡的樣貌,敘述文字長達好幾段。

你也可以貼出一個圖片,然後再問問題。比方說對著冰箱裡的食材拍照,然後問,「有這些材料的話,我可以做哪些餐點呢」。ChatGPT會依照冰箱裡有的食材,給你建議。

多了點專業

北卡羅來納大學教堂山分校心臟科醫師蓋希先向GPT-4版ChatGPT描述了一位病患狀況,包含這位病患送醫後出現的併發症等等,整段描述包含一些難以理解的醫學術語。

接著,蓋希詢問可能的醫治選項,結果ChatGPT給出了完美的答案,「我就是這麼打算治療這名病患的」,蓋希說。

接著他又描述了不同的病症,結果ChatGPT提出的療程同樣讓人驚艷。

摘要能力直逼專業編輯

將《紐約時報》文章放上ChatGPT並要它摘要,每一次的摘要幾乎都相當精確。接著,你故意在摘要裡放進一段跟文章毫不相關的話,ChatGPT也會把它標註起來說,文章並沒有這樣說。

伊奇奧尼表示,能夠提供高品質的摘要,需要具備相當的文字理解能力,「這是高級智慧」。

GPT-4長出了幽默感,雖然有點冷

伊奇奧尼要升級後的ChatGPT說一個有關歌手瑪丹娜的笑話給他聽,ChatGPT說了之後,伊奇奧尼笑了。

ChatGPT現在說笑話的能力,還是侷限在那種「雖然有點冷,但你還是會笑的笑話」,但不得不說,已經強過前一代。

ChatGPT說的瑪丹娜笑話是,「瑪丹娜為什麼要學習幾何學?因為她想學會如何擺出各種角度的pose!」

但ChatGPT不擅於談未來

雖然對現有的知識,或已知的事,ChatGPT可以應答如流,但當你要ChatGPT對未來提出假設,它則不太在行,或者說它無法原創,只能重複其他人說過的話。

ChatGPT也依然會「捏造事實」

困擾著所有人工智慧聊天機器人的問題,ChatGPT也還是有,像是「幻覺」(hallucination),白話的說就是還是會給你欺騙性的數據,這是因為系統本身還無法辨識真偽,因此可能生成完全錯誤的陳述。

當你請ChatGPT給你收錄最新癌症研究的網站,它會生一個網址給你,但這個網站根本不存在。

(資料來源:New York Times News, The Atlantic, CNBC)

【延伸閱讀】

GPT-4上線!ChatGPT怎麼玩?再進化的微軟AI助手Copilot多強大?

不只搶飯碗 ChatGPT創造新工作,年薪直逼千萬

掃廁所的投手 百年一遇的棒球天才!大谷翔平這樣被養成

電動車火熱,全球產值增3成 台灣鋰電池產業鏈20強出列

有望搶先Gogoro、光陽獲利 中油加油站變充電站,留得住兩千億?

※更多精彩報導,詳見《天下雜誌》網站。

※本文由天下雜誌授權報導,未經同意禁止轉載

相關新聞

金價驚驚漲背後的三隻手,中國、波蘭、新加坡央行為什麼要爆買黃金?

金價屢創新高,背後是哪些國家央行的爆買在推波助瀾?為什麼?

業務員沒說的保單省錢技巧 漲價時代規劃「4心法」

面對保險業巨大變革,一般人過去沒買齊的保障,接下來該怎麼辦?保單轉型不一定都是壞消息,仍能從中找到不花大錢的方法;保戶認知也必須調整,讓保險回歸姓「保」。

1個月不吃白飯 身體會發生什麼變化? 專家曝減重效果:得付出代價

減重20公斤的達人說,戒白飯一個月確實達到減重效果,但也付出了相當的代價。如果就是愛白飯,沒吃就感覺沒吃飽,什麼才是吃白飯的黃金時機?

車燈龍頭帝寶營收、獲利創新高 苦熬5年奪歐洲千萬超跑訂單

台灣汽車車燈龍頭帝寶去年的營收、獲利都創下新高,除了大環境助陣,成功打進歐洲超跑車廠,更為公司帶來嶄新商機。但風光背後,有一段被拒絕上百次、苦蹲5年才敲開客戶大門,不為人知的辛酸歷程。

預防變胖可做這件事!私人教練:早上遵守「1習慣」 降低晚上暴食率

如果你想要減肥,早上採用一個習慣能夠幫助你更快達成目標。

比金融海嘯更慘!石化外銷接單大跌25% 比ECFA沒了更冷酷的現實

中國取消ECFA對12項石化品的優惠關稅,外界擔憂若全面取消將帶來衝擊。但事實上,台灣石化業者面臨的生存危機,比這還嚴重:產能利用率將連7季低於八成;兩年後,更有中國爆量低價供應倒入全球。

商品推薦

udn討論區

0 則留言
規範
  • 張貼文章或下標籤,不得有違法或侵害他人權益之言論,違者應自負法律責任。
  • 對於明知不實或過度情緒謾罵之言論,經網友檢舉或本網站發現,聯合新聞網有權逕予刪除文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。
  • 對於無意義、與本文無關、明知不實、謾罵之標籤,聯合新聞網有權逕予刪除標籤、停權或解除會員資格。不同意上述規範者,請勿下標籤。
  • 凡「暱稱」涉及謾罵、髒話穢言、侵害他人權利,聯合新聞網有權逕予刪除發言文章、停權或解除會員資格。不同意上述規範者,請勿張貼文章。