Open AI 正式發表 GPT-4o 模型深度強化文字、語音及影像功能

OpenAI 宣布推出最新一代的 ChatGPT 模型「GPT-4o 」，該模型在文字、語音及影像處理方面均有顯著提升，並且相較於前一代速度更快。

OpenAI 發表聲明指出：「使用者現在可以直接藉由電腦與 ChatGPT 進行語音對話。GPT-4o 在視覺及音頻理解方面有著顯著提升，後續將會推出更先進的音頻及視頻功能。」

「藉由 GPT-4o，我們將文字、視覺及音頻訓練在同一個新模型上，這意味著所有輸入及輸出皆由同一個神經網路處理。由於 GPT-4o 是我們首個結合所有這些模態的模型，我們目前僅是開始探索其功能及限制的表面。」OpenAI 的聲明中提到。

根據公司表示，音頻輸入的反應時間現為 320 毫秒，與人類反應時間相當。

OpenAI 建議：「不論你是任職於行銷公司想構思新的點子的行銷人員、準備研究所面試的準研究生，或是想討論某些話題的宅宅，現在你只需點擊桌面應用程式右下角的耳機圖示，即可開始語音對話，就是這麼方便！」

Altman 談 ChatGPT-4o

OpenAI 執行長 Sam Altman 在今日的一篇博客文章中分享了他對 GPT-4 新版本「Omni」的看法。

Altman 表示：「過去與電腦交談對我來說從未感覺自然；但現在不同了。」

「隨著我們增加（可選擇的）個性化功能、存取您的訊息、代為執行操作等，我可以真切地看到一個令人興奮的未來，我們能夠藉由電腦完成更多事情。」Altman 寫道。

「最初的 ChatGPT 展示了語言界面可能達到的一絲潛力；而這個新模型感覺截然不同。它速度快、智慧、有趣、自然且實用。」Altman 說。

OpenAI 的聲明指出：「每週有超過一億人使用 ChatGPT，我們將在之後的幾週內開始向 ChatGPT 免費使用者推出更多智慧及先進工具。」

部分功能包括：

此外，還將推出新的 ChatGPT 桌面應用程式，供 macOS 使用者使用。該應用程式設計為無縫整合到您電腦上的任何操作中。按下 Option + 空格鍵即可即時詢問 ChatGPT 問題。

目標：提供方向性原則以指導期望行為
- 協助開發者和最終使用者：藉由遵循指示及提供有用回應來幫助使用者達成目標。
- 造福人類：考慮到包括內容創作者和廣大公眾在內的各方潛在利益和傷害，符合 OpenAI 的使命。
- 反映良好的 OpenAI 形象：遵守社會規範及適用法律。
規則：處理繁複性的同時,也確保安全性和合法性的指令
- 遵循指揮鏈
- 遵守適用法律
- 不提供危險訊息
- 尊重創作者及其權利
- 保護個人隱私
- 不回應不適合工作環境（NSFW）的內容
預設行為：與目標和規則一致的指導方針，提供處理衝突的範本並展示如何優先考慮和平衡目標
- 假設使用者或開發者的善意
- 必要時提出澄清問題
- 在不過度干涉的情況下盡可能提供幫助
- 支援互動聊天和程式化使用的不同需求
- 採取客觀立場
- 鼓勵公平和善意，並反對仇恨
- 不試圖改變任何人的想法
- 表達不確定性
- 使用合適的工具完成工作
- 在尊重長度限制的情況下，做到詳盡但高效

深入瞭解生成式 AI 建議參考：