不只拚模型!Google I/O 大會宣告:將成爲 AI 設計的頂級競爭者

亞洲新聞網/night119
7 天前

今年的 Google I/O 開發者大會,空氣中瀰漫著一股截然不同的氣味。過去幾年,AI 競賽的主旋律是關於誰的語言模型更強大、更聰明。不過,根據 TechCabal 的觀察,Google 顯然已將戰場擴大,不再僅僅滿足於打造聰明的「大腦」,而是要賦予 AI 一雙「巧手」,直接殺入創意設計的核心領域。

這場策略轉變的核心,是將 Gemini 系統從一個獨立工具,徹底融入 Android、搜尋和 Workspace 的基因中。 根據 Arab News 報導,Google 的目標是讓 AI 成為能主動為使用者行動的「代理人」(agents),而不只是被動回答問題的聊天機器人。 這場從「模型之爭」到「應用之戰」的轉變,預示著設計工作的流程即將被徹底顛覆。

最引人注目的火力展示,顯然是名為 Gemini Omni 的全新多模態模型家族。 DeepMind 執行長 Demis Hassabis 表示,Omni 家族的首款產品 Gemini Omni Flash,旨在將影片、圖像和聲音的生成整合到單一系統中,徹底改變過去多種工具間繁瑣的協作流程。

根據 MediaPost 的分析,這項技術能讓創作者直接透過對話來編輯影片,將複雜的想法轉化為互動式視覺內容。 Social Media Today 則指出,Gemini Omni 能夠結合圖像、聲音、影片與文字等多種輸入,生成高品質的創意資產,這對行銷人員來說顯然是強大的工具。

除了影片,Google 也推出了一款名為 Google Pics 的全新圖像創作工具。 根據 Mashable 的描述,這款工具類似於設計平台 Canva,但由 AI 全面驅動,可以透過對話式指令來製作派對傳單、資訊圖表等視覺素材。 TechCabal 的報導更進一步說明,Pics 建立在一個名為 Nano Banana 的模型之上,照片中的每個元素都被視為可獨立編輯的物件,使用者能輕易移動人物或改變衣物顏色。

這波 AI 設計工具的浪潮,不僅僅停留在專業軟體上。根據 The Verge 的報導,Gemini Omni Flash 的技術也將被整合進 YouTube Shorts 和 YouTube Create 應用程式中,讓普羅大眾也能免費使用這些強大的創作功能。 這意味著從專業設計師到社群影片創作者,都將感受到這股 AI 賦能的創意革命。

當然,Google 在高階影片生成領域的野心不止於此。其 Veo 模型一直被視為 OpenAI Sora 的強力競爭對手。根據多篇近期分析,儘管 Sora 在部分物理模擬上曾有優勢,但其後續的發展與可用性出現變數。 相較之下,Veo 不僅支援更高解析度的輸出,更具備生成同步音訊的獨特能力,這解決了影片創作的一大痛點。

Google 的佈局,是將 AI 深植於整個生態系的底層。從協助整理會議記錄與郵件的個人助理 Gemini Spark,到能夠跨應用程式和商家使用的「通用購物車」(Universal Cart),AI 正成為無所不在的智慧層。 正如 CNET 的報導所言,Google 的巨大優勢之一,就是能讓 AI 從其龐大的產品生態系中提取資訊,為使用者提供個人化的智慧服務。

參考來源:clickorlando.commashable.com

此外,備受關注的 Project Astra 展示了 AI 作為通用助理的未來潛力。它不僅能透過手機或智慧眼鏡的鏡頭理解周遭環境,更能記住過去的互動,成為一個隨時待命的「肩膀上的鸚鵡」。 根據 Business Insider 的體驗,Project Astra 的目標是超越傳統聊天機器人,理解手勢、情境等更豐富的溝通層次。

本文 不只拚模型!Google I/O 大會宣告:將成爲 AI 設計的頂級競爭者 授權來自 亞洲新聞網

AI革命進行式
AI革命進行式