OpenAI 宣布推出最新一代的 ChatGPT 模型「GPT-4o 」,該模型在文字、語音及影像處理方面均有顯著提升,並且相較於前一代速度更快。
OpenAI 發表聲明指出:「使用者現在可以直接藉由電腦與 ChatGPT 進行語音對話。GPT-4o 在視覺及音頻理解方面有著顯著提升,後續將會推出更先進的音頻及視頻功能。」
「藉由 GPT-4o,我們將文字、視覺及音頻訓練在同一個新模型上,這意味著所有輸入及輸出皆由同一個神經網路處理。由於 GPT-4o 是我們首個結合所有這些模態的模型,我們目前僅是開始探索其功能及限制的表面。」OpenAI 的聲明中提到。
根據公司表示,音頻輸入的反應時間現為 320 毫秒,與人類反應時間相當。
OpenAI 建議:「不論你是任職於行銷公司想構思新的點子的行銷人員、準備研究所面試的準研究生,或是想討論某些話題的宅宅,現在你只需點擊桌面應用程式右下角的耳機圖示,即可開始語音對話,就是這麼方便!」
Altman 談 ChatGPT-4o
OpenAI 執行長 Sam Altman 在今日的一篇博客文章中分享了他對 GPT-4 新版本「Omni」的看法。
Altman 表示:「過去與電腦交談對我來說從未感覺自然;但現在不同了。」
「隨著我們增加(可選擇的)個性化功能、存取您的訊息、代為執行操作等,我可以真切地看到一個令人興奮的未來,我們能夠藉由電腦完成更多事情。」Altman 寫道。
「最初的 ChatGPT 展示了語言界面可能達到的一絲潛力;而這個新模型感覺截然不同。它速度快、智慧、有趣、自然且實用。」Altman 說。
提供免費的 ChatGPT 整合功能 部分新功能將在重新設計的免費版本 ChatGPT 中提供。
OpenAI 的聲明指出:「每週有超過一億人使用 ChatGPT,我們將在之後的幾週內開始向 ChatGPT 免費使用者推出更多智慧及先進工具。」
部分功能包括:
- GPT-4 級別的智慧
- 從模型及網路取得回應(新視窗開啟)
- 分析資料(新視窗開啟)並製作圖表
- 討論您拍攝的照片
- 上傳檔案以協助摘要、撰寫或分析
- 探索並使用 GPT 及 GPT 商店
- 藉由記憶建立更實用的體驗
此外,還將推出新的 ChatGPT 桌面應用程式,供 macOS 使用者使用。該應用程式設計為無縫整合到您電腦上的任何操作中。按下 Option + 空格鍵即可即時詢問 ChatGPT 問題。
模型規格詳述 LLM 衝突解決 OpenAI 本週亦發布了有關該公司如何在非營利/營利模式下塑造模型行為的訊息。公司揭示了如何在衝突發生時評估取捨,以及在其網站上發布了規範:
-
目標:提供方向性原則以指導期望行為
- 協助開發者和最終使用者:藉由遵循指示及提供有用回應來幫助使用者達成目標。
- 造福人類:考慮到包括內容創作者和廣大公眾在內的各方潛在利益和傷害,符合 OpenAI 的使命。
- 反映良好的 OpenAI 形象:遵守社會規範及適用法律。
-
規則:處理繁複性的同時,也確保安全性和合法性的指令
- 遵循指揮鏈
- 遵守適用法律
- 不提供危險訊息
- 尊重創作者及其權利
- 保護個人隱私
- 不回應不適合工作環境(NSFW)的內容
-
預設行為:與目標和規則一致的指導方針,提供處理衝突的範本並展示如何優先考慮和平衡目標
- 假設使用者或開發者的善意
- 必要時提出澄清問題
- 在不過度干涉的情況下盡可能提供幫助
- 支援互動聊天和程式化使用的不同需求
- 採取客觀立場
- 鼓勵公平和善意,並反對仇恨
- 不試圖改變任何人的想法
- 表達不確定性
- 使用合適的工具完成工作
- 在尊重長度限制的情況下,做到詳盡但高效
深入瞭解生成式 AI 建議參考: