回到頂端
|||

Google發表Gemini最新版!凡事問谷歌 AI幫你找答案

品觀點/資深記者 李錦奇 2024.05.15 16:20

Google 今天凌晨舉辦 I/O 開發者大會,展示自家AI基礎模型 Gemini的 最新應用,強調可成為個人AI 助手,無論是透過應用程式或網頁版,都能幫你完成複雜任務,甚至主動代勞。而這項技術也將導入Google搜尋,從今天開始,將率先在美國推出 AI 總覽,並於日後支援更多國家,例如想找一間新的瑜珈或皮拉提斯教室,只要詢問「幫我找在波士頓最棒的瑜珈或皮拉提斯教室,並告訴我它們的新會員優惠資訊、還有從燈塔山走過去的時間。」,就能得到參考答案。

DeepMind 執行長 Demis Hassabis指出,Google去年12月推出了第一個原生多模態模型 Gemini 1.0,包括 Ultra、Pro 和 Nano 三種規模。透過使用者的回饋,Google瞭解到大家需要更低延遲、更低服務成本的應用程式,因此推出 Gemini 1.5 Flash,是 Gemini 模型系列中最新的模型,也是在 API 裡速度最快的 Gemini 模型。

1.5 Flash 特別針對大規模、高頻率的任務進行最佳化,可以降低服務成本,並提供大幅擴展的脈絡長度,擅長做摘要、聊天應用、提供圖說和影片字幕、從長篇文件和表格擷取資料等工作。

此外,Google也推出Gemini 1.5 Pro ,是處理多項工作時,通用性能最好的模型。除了將脈絡長度擴展到1百萬個詞元(開發人員和 Google Cloud 的客戶可加入等候名單,使用2百萬個詞元脈絡長度的 1.5 Pro),透過資料和演算法的強化,提升 1.5 Pro 在程式碼生成、邏輯推理和規劃、多輪對話,以及理解音訊和圖像方面的能力。

Gemini 體驗與 Google 助理副總裁暨總經理蕭令怡,也在Google台灣官方部落格發文,提及自家最先進的模型 Gemini 1.5 Pro 將會開放 Gemini Advanced 的訂閱者使用。

Gemini Advanced 能理解內容更為龐大的文件,像是長達一千五百頁的文件檔案、或是處理約 100 封電子郵件的摘要。不久後,Gemini Advanced 還可以處理長達一小時的影片內容,或者超過三萬行的程式碼。

Google新增了可以透過 Google 雲端硬碟或直接從裝置上傳檔案到 Gemini Advanced 的功能。可以運用這項功能,快速取得複雜文件中的疑問解答和深入分析結果,比如租賃合約中關於寵物條款的細節,或是比較兩篇冗長研究論文的關鍵論述。未來,Gemini Advanced 能夠擔任資料分析師,深入解讀試算表等上傳資料檔案,並產出客製的圖表視覺。

Gemini 也會確保用戶上傳的檔案以及相關對話保持隱私,不會被用於訓練模型。

Gemini 支援原生多模態模型,而且 1.5 Pro 版大大提升了影像的理解能力。舉例來說,在最愛的餐廳吃到喜歡的菜,只要拍張照,就可以請 Gemini 提供食譜。或是如果一直沒有辦法解開數學題目,也只要拍張照,讓 Gemini 透過步驟來幫助尋找答案。

Gemini 1.5 Pro 將會向超過 150 個國家/地區中的 Gemini Advanced 訂閱者推出,並支援超過 35 種語言。 

透過 Gemini Live,用戶可以從眾多自然流暢的人聲語音中,選擇自己最喜歡的選項作為 Gemini 回應時所使用的語音。不只如此,在跟 Gemini 互動時可以用自己習慣的語速交談,也能中途打斷 Gemini 的回應來詢問額外的問題進一步釐清資訊,就像任何日常對話一樣。

舉例來說,假設要準備一個工作面試跟練習一個重要的演講,可以透過 Gemini Live 來幫你準備。Gemini 可以提供你在面試過程中可以分享跟強調的工作技能,或是在上台演講前有一些幫助放鬆的小技巧。

今年下半年,你也可以透過手機鏡頭來使用 Gemini Live, 讓你跟 Gemini 暢聊眼前所見的事物。 

為了提供更加個人化的體驗,Gemini Advanced 訂閱者很快就能建立自訂版的 Gemini,稱為 Gem。你可以根據需求打造各式各樣符合夢想的 Gem,包括個人專屬的健身夥伴、廚房助手、編寫程式碼的好夥伴,甚至是創意寫作的導師等等。

Gem 建立的方式非常簡單,只需要描述你希望 Gem 能完成什麼任務,以及你想要的回應風格,像是:「你是我的路跑教練,用要正向、樂觀和激勵的方式來幫我排定每天的慢跑訓練計畫。」告訴 Gemini 這些指示後,你只需要透過一個點擊,它就能延伸這些指令,建立符合你的特定需求的 Gem。

Google強調,不久,將整合更多 Google 工具到 Gemini 裡面,包括 Google 日曆、Google Tasks 和 Google Keep。 很快,你可以拍下孩子的學校課程表,然後要求 Gemini 為每個作業建立對應的行事曆事項,或是拍下一個食譜並且將帶採買的食材加入 Keep 成為你的購物清單。

至於最受網友依賴的Google 搜尋,Google 搜尋副總裁與負責人 Liz Reid指出,現在,有了生成式 AI 的幫助,Google 搜尋將能夠幫助你做到更多的事情。透過專門為 Google 搜尋量身打造的全新 Gemini 模型,能夠將 Gemini 的先進能力,像是多步驟推理、規劃和多模態等特性,跟搜尋系統進一步整合。

例如有時候你只想快速找到答案,但沒有時間看網路上的大量資訊。這個時候,Google 的 AI 總覽就能派上用場。

從今天開始,Google將率先在美國推出 AI 總覽,並於日後支援更多國家。從這周起,將會有數億的使用者可以進一步體驗 AI 總覽,也預計在年底前讓超過十億的使用者能夠使用這項新功能。

舉例來說,你想找一間新的瑜珈或皮拉提斯教室,而且希望它的評價不錯、通勤方便,而且有提供新會員優惠。不久後,你就可以直接查詢:「幫我找在波士頓最棒的瑜珈或皮拉提斯教室,並告訴我它們的新會員優惠資訊、還有從燈塔山走過去的時間。」

AI 總覽很快就會在 Search Labs 推出並支援多步驟推理功能,並先適用於美國地區的英文查詢。

除了替複雜問題找出正確的答案或資訊之外,Search  還能幫助你制定計畫。

透過 Search 裡面的規劃能力,它可以幫助你依照需求制定對應的計畫,像是度假規劃或是準備三餐等。舉例來說,你可以搜尋:「幫我制定三天的備餐菜單,要容易準備,而且能餵飽一大群人。」接下來,你就可以大概有個概念,不必在龐大繁雜的資訊中,慢慢搜找各式食譜。

 

如果想改菜單,也可以直接調整你的需求,像是把晚餐換成素食料理。Google 搜尋會替你客製備餐內容,並且讓你能夠把食材清單快速匯出到 Google 文件或 Gmail,方便採買規劃。 

客製化備餐與旅程規劃功能今年會在 Search Labs 推出,並先支援美國地區的英文查詢。今年下半年,會新增更多客製功能和計畫類別,像是規劃派對、跟運動健身等類型。

在美國地區進行英文搜尋時,你將會很快就會看到這個全新的 AI 整理搜尋結果頁面,從餐飲和食譜開始,接著是電影、音樂、書籍、飯店、購物等等。

Google 搜尋不只是在文字框裡打出文字搜尋而已,使用者想要尋找的或許是你周遭的東西,也可能是移動中的物體。

透過對於影片理解技術的進步,讓你可以用影片內容提出問題。

假設你在二手店買了黑膠唱片機,但回家打開後卻不能用,金屬唱針也不規則晃動。這個時候,你可以拍下影片直接搜尋。不必思考該如何描述問題,AI 總覽就能為你提供解決問題的方法和步驟。

這項功能不久後就會在 Search Labs 推出,適用於美國境內的英文查詢,預期會逐步擴大支援地區。

社群留言

台北旅遊新聞

台北旅遊新聞