回到頂端
|||

Open AI 正式發表 GPT-4o 模型深度強化文字、語音及影像功能

台灣產經新聞網/MTMG網路行銷 2024.05.14 00:00
新聞圖片

OpenAI 宣布推出最新一代ChatGPT 模型「GPT-4o 」,該模型在文字、語音及影像處理方面均有顯著提升,並且相較於前一代速度更快。

OpenAI 發表聲明指出:「使用者現在可以直接藉由電腦與 ChatGPT 進行語音對話。GPT-4o 在視覺及音頻理解方面有著顯著提升,後續將會推出更先進的音頻及視頻功能。」

「藉由 GPT-4o,我們將文字、視覺及音頻訓練在同一個新模型上,這意味著所有輸入及輸出皆由同一個神經網路處理。由於 GPT-4o 是我們首個結合所有這些模態的模型,我們目前僅是開始探索其功能及限制的表面。」OpenAI 的聲明中提到。

根據公司表示,音頻輸入的反應時間現為 320 毫秒,與人類反應時間相當。

OpenAI 建議:「不論你是任職於行銷公司想構思新的點子的行銷人員、準備研究所面試的準研究生,或是想討論某些話題的宅宅,現在你只需點擊桌面應用程式右下角的耳機圖示,即可開始語音對話,就是這麼方便!」

Altman 談 ChatGPT-4o

OpenAI 執行長 Sam Altman 在今日的一篇博客文章中分享了他對 GPT-4 新版本「Omni」的看法。

Altman 表示:「過去與電腦交談對我來說從未感覺自然;但現在不同了。」

「隨著我們增加(可選擇的)個性化功能、存取您的訊息、代為執行操作等,我可以真切地看到一個令人興奮的未來,我們能夠藉由電腦完成更多事情。」Altman 寫道。

「最初的 ChatGPT 展示了語言界面可能達到的一絲潛力;而這個新模型感覺截然不同。它速度快、智慧、有趣、自然且實用。」Altman 說。

提供免費的 ChatGPT 整合功能   部分新功能將在重新設計的免費版本 ChatGPT 中提供。

OpenAI 的聲明指出:「每週有超過一億人使用 ChatGPT,我們將在之後的幾週內開始向 ChatGPT 免費使用者推出更多智慧及先進工具。」

部分功能包括:

  • GPT-4 級別的智慧
  • 從模型及網路取得回應(新視窗開啟)
  • 分析資料(新視窗開啟)並製作圖表
  • 討論您拍攝的照片
  • 上傳檔案以協助摘要、撰寫或分析
  • 探索並使用 GPT 及 GPT 商店
  • 藉由記憶建立更實用的體驗

此外,還將推出新的 ChatGPT 桌面應用程式,供 macOS 使用者使用。該應用程式設計為無縫整合到您電腦上的任何操作中。按下 Option + 空格鍵即可即時詢問 ChatGPT 問題。

模型規格詳述 LLM 衝突解決  OpenAI 本週亦發布了有關該公司如何在非營利/營利模式下塑造模型行為的訊息。公司揭示了如何在衝突發生時評估取捨,以及在其網站上發布了規範:

  1. 目標:提供方向性原則以指導期望行為

    • 協助開發者和最終使用者:藉由遵循指示及提供有用回應來幫助使用者達成目標。
    • 造福人類:考慮到包括內容創作者和廣大公眾在內的各方潛在利益和傷害,符合 OpenAI 的使命。
    • 反映良好的 OpenAI 形象:遵守社會規範及適用法律。
  2. 規則:處理繁複性的同時,也確保安全性和合法性的指令

    • 遵循指揮鏈
    • 遵守適用法律
    • 不提供危險訊息
    • 尊重創作者及其權利
    • 保護個人隱私
    • 不回應不適合工作環境(NSFW)的內容
  3. 預設行為:與目標和規則一致的指導方針,提供處理衝突的範本並展示如何優先考慮和平衡目標

    • 假設使用者或開發者的善意
    • 必要時提出澄清問題
    • 在不過度干涉的情況下盡可能提供幫助
    • 支援互動聊天和程式化使用的不同需求
    • 採取客觀立場
    • 鼓勵公平和善意,並反對仇恨
    • 不試圖改變任何人的想法
    • 表達不確定性
    • 使用合適的工具完成工作
    • 在尊重長度限制的情況下,做到詳盡但高效

深入瞭解生成式 AI 建議參考:

社群留言

台北旅遊新聞

台北旅遊新聞