996热re视频精品视频这里,国产精品久久久久久久久久免费 ,草草影院CCYY国产日本欧美

今年初以來，以AI大模型GPT3.5為基礎的聊天機器人ChatGPT引發大量關注，股市上相關概念遭到熱炒。正當ChatGPT的熱度有所下降時，微軟投資的OpenAI又推出了GPT-4，號稱功能比GPT3.5更強大。

【資料圖】

北京時間3月15日凌晨，OpenAI正式發布大型多模態模型GPT-4。據介紹，與ChatGPT只能接收文字不同，GPT-4能接收圖像和文本輸入來輸出文本內容；擴寫能力得到增強，能處理超過2.5萬個單詞的文本；更具創造力，回答準確性顯著提高；能夠生成歌詞、創意文本，實現風格變化；并且能夠處理更細微的指令。

“這是我們迄今為止功能最強大的模型！”OpenAI的高管和工程師在介紹視頻里直言：“GPT-4是世界第一款高體驗、強能力的先進AI系統，我們希望很快把它推向所有人。”

新的大模型一經發布，便受到網友們的熱捧。但仍然值得的一提的是，雖然GPT-4的功能進一步增強，但仍然不完全可靠。OpenAI坦言，GPT-4仍然會產生幻覺、生成錯誤答案，并出現推理錯誤。

自去年11月推出以來，ChatGPT已經能夠根據用戶提示生成原創文章、故事和歌詞，但它也引發了一些擔憂。最近幾周，人工智能聊天機器人（包括來自微軟和谷歌的工具）因情緒反應過激、犯事實錯誤和完全“幻覺”而受到指責。

GPT-4文字輸入限制提升至2.5萬個單詞

專業場景中接近人類水平

開發GPT大模型的OpenAI稱，GPT-4能接受圖像和文本輸入，輸出文本內容，雖然在許多現實場景中的能力不如人類，但在各種專業和學術基準測試中已做到人類水平的表現。

之前人們使用的ChatGPT只有處理文本的能力，GPT-4開始接受圖像作為輸入介質。比如，給它展示一張圖片，問它手套掉下午會發生什么，很快會得到“它會掉到木板上，并且球會被彈飛”的回答。

OpenAI還用一張“梗圖”演示了GPT-4的新功能。用戶提問：解釋下圖的笑點是什么，并對圖片中的每部分進行描述。GPT-4會分別對每張圖中的內容進行描述，并指出這幅圖把一個大而過時的VGA接口插入一個小而現代的智能手機充電端口，是荒謬的。

GPT-4也能簡練指出圖片的違和之處。用戶提問：“這張圖片有什么不尋常之處”時，GPT-4簡練地回答出“一名男子正在行駛中的出租車車頂上使用熨衣板熨燙衣服”。

不僅是圖像理解，它還可以閱讀圖片形式的論文。通過幾張論文的圖片，GPT-4可以總結內容，也可以對指定內容展開解釋。

除了在文本輸入的基礎上進一步接受了圖像輸入外，GPT-4還升級成為了一個“學霸”，基準測試表現遠遠優于現有模型。OpenAI表示，如果是隨意聊天，用戶可能不太能感受出GPT-3.5與GPT-4之間的區別。但當任務的復雜性達到足夠的閾值時，GPT-4將明顯比GPT-3.5更可靠、更有創意，并且能夠處理更細微的指令。“在我們的內部評估中，它產生正確回應的可能性比GPT-3.5高40%。”

根據測試，在“美國高考”SAT中，GPT-4的分數增加了150分，現在能拿到1600分中的1410分。它還通過了模擬律師考試，且分數在應試者的前10%左右；相比之下，GPT-3.5的得分在倒數10%左右。

此外，GPT-4對于英語以外的語種支持也得到了大大的優化。許多現有的機器學習基準測試都是用英語編寫的。為了初步了解GPT-4在其他語言中的性能，OpenAI使用Azure Translate將MMLU基準測試（一套涵蓋57個主題的14000個多項選擇題）翻譯成各種語言。在測試的26種語言中，有24種語言，GPT-4優于GPT-3.5和其他大語言模型的英語語言性能。

在API（應用程序編程接口）方面，GPT-4還開放了一個使用功能，允許修改“系統提示”。之前ChatGPT的回答總是冗長而平淡，這是因為系統提示中規定了“你只是一個語言模型……你的知識截止于2021年9月”。現在通過修改這句話，GPT-4就可以展現出更多樣的性格，比如扮演蘇格拉底。

OpenAI請GPT-4模型以蘇格拉底風格教學，絕對不能給學生答案；相反地，還要不斷提出好問題幫助學生思考。ChatGPT果真循循善誘，以提問代替直接回答。取自OpenAI官網

仍然不完全可靠

在體驗ChatGPT之時，不少用戶會發現ChatGPT時不時會“一本正經地胡說八道”，而GPT-4盡管號稱功能更全面，但會出現幻覺、胡說八道的毛病還是沒能完全改掉。

OpenAI介紹，盡管功能已經非常強大，但GPT-4仍與早期的GPT模型具有相似的局限性，其中最重要的一點是它仍然不完全可靠。GPT-4仍然會生成錯誤答案，并出現推理錯誤。

也就說，在GPT-4身上依然可以看到之前版本“一本正經地胡說八道”的情形。OpenAI強調，仍然推薦在使用它的時候要附加諸如人工審查、或者附加上下文，甚至在高風險情境中，要避免使用它。

不過OpenAI也提到，該系統已經接受了六個月的安全培訓，在內部對抗性真實性評估中，GPT-4的得分比最新的GPT-3.5高：“響應不允許內容的請求的可能性降低了82%，產生真實事實的可能性提高了40%，優于GPT-3.5。”

網傳GPT-3和GPT-4參數對比圖，但此次OpenAI沒有給出GPT-4參數量

“它仍然存在缺陷，仍然有限，但它有明顯的改進。它比以前的模型更有創意，它的幻覺明顯減少，而且它的偏見也更少。”OpenAI公司CEO奧特曼在Twitter上稱，GPT-4是其模型“最有能力且最符合”人類價值觀和意圖的模型。

這也意味著，相較之前的模型來說，GPT-4雖然仍可能“一本正經地胡說八道”，但頻率有所減小。

不過頻率的減小還是不能讓人們放松警惕。在GPT-4發布后，微軟營銷主管表示，“如果你在過去六周內的任何時候使用過新的Bing預覽版，你就已經提前了解了OpenAI最新模型的強大功能。”

這似乎可以理解為，微軟的新必應早就已經用上了GPT-4。而結合前段時間對新必應的爭議來看，已經用上了GPT-4的新必應還是出現了不少“發瘋”行為。

此外，與前一代一樣，GPT-4是基于2021年9月之前的數據訓練的，所以GPT-4對于2021年9月之后發生的事件仍然缺乏有效理解，也不會從其經驗中進行學習。OpenAI表示：“GPT-4仍有許多已知的局限性，我們正在努力解決，例如社會偏見、幻覺和對抗性提示。”

本文系觀察者網獨家稿件，未經授權，不得轉載。

關鍵詞：

亚洲AV无码一区二区二三区软件,青草青草久热精品视频在线百度云,久久精品午夜一区二区福利,国产V亚洲V天堂无码久久久

您的位置：首頁>資訊 > 國內 >

多模態GPT-4被吹爆，但仍會“一本正經胡說八道”

頻道精選

最火資訊

每日熱點