Google強打OpenAI：Gemini Live和GPT-4o誰能更勝一籌？

Google 近日推出了一款全新的人工智慧產品「Gemini Live」，支援實時語音對話功能，被外界認為是要與 OpenAI 的「ChatGPT Voice」抗衡，本文將比較兩者間的差異。
（前情提要：Google I/O大會猛攻AI：影片生成模型Veo、個人助手Project Astra、Gemini 1.5 Pro..亮點一次看）
（背景補充：iPhone將整合ChatGPT！彭博：Apple與OpenAI達成合作、最快六月發表 AI Siri）

在本週二舉行的Google I/O 大會上，Google推出了一款全新的人工智慧產品「Gemini Live」。人們原本以為安卓系統的 Gemini 助手會帶來某些新東西，但這就是 Google，一切皆有可能。

值得一提，Gemini Live 是在 OpenAI 首次消費者產品活動的第二天釋出的，很難不讓人猜想該產品是否是為了對抗 ChatGPT Voice 而釋出的。

而且兩者都採用了原生多模態人工智慧模型，並擁有出彩的語音和視訊功能。

目前，在全球人工智慧競賽中，領跑者無疑是 OpenAI 和 Google，前者似乎與蘋果和 iPhone 建立了緊密的聯絡，而後者則掌控著安卓系統。

並且，相對於 Rabbit r1 或 Humane Pin 這樣的人工智慧裝置而言，智慧手機才是短期的贏家。ChatGPT Voice 和 Gemini Live 都被整合到了現有的智慧手機產品中，而且這兩款產品目前都還未上市。至於下一代助手是否能夠與之相比，這是後話了。

Gemini Live 與 GPT-4o 誰更勝一籌？

下圖是 Google 釋出 Gemini Live 時的發言：

「今年夏天，我們將擴展套件 Gemini 的多模態功能，包括使用語音進行深入的雙向對話。這種新體驗被稱為 Live。」

在即時視訊分析和語音功能方面，Google 是有所欠缺的。去年 Google 釋出 Gemini Ultra 時，它釋出了一段響應「即時視訊」的視訊，但生成的結果並不理想。不過，這一次 Google 把這項技術放在了 I/O 上試用，包括語音和視訊對話。

OpenAI 和 Google 都為視訊及語音對話提供了一個介面，都可以通過手機攝像頭進行即時的視訊分析。並且語音和視訊的響應都很快，能夠進行真正自然的對話，甚至可以中途打斷人工智慧。

不過，兩者也有一些明顯的不同之處。OpenAI 的 ChatGPT Voice 聽起來更自然，能檢測並響應情緒和聲調，甚至能根據你的要求即時調整說話方式。在 Gemini Live 上並沒有看到這種功能。

二者另一個最大的不同是多模態。Gemini 仍然依賴其他模型進行輸出，包括使用 Imagen 3 輸出影象和 Veo 輸出視訊。但 GPT-4o 是雙向的原生多模態，「o」代表了全方位，可以建立自己的影象和聲音。

AI 的下一步發展：全方位語音助手

總的來看，目前人工智慧的發展趨勢似乎正在從文字輸入轉向語音輸入。

當人們看到 OpenAI 的公告時，可能就會意識到，這是人機介面的一次正規化轉變，其意義不亞於滑鼠或觸控式螢幕的推出。

Google 也將繼續推出原生、自然的語音介面，Meta 公司在其 VR 頭顯和 Ray-Ban 智慧眼鏡中配備了語音機器人 MetaAI。

雖然智慧手機可能是目前的贏家，但這些語音 AI 模型真正的適配裝置顯然是智慧眼鏡。因為眼鏡上的攝像頭與眼睛同高，眼鏡臂也可以將聲波送入使用者的耳朵，我們可以稱之為完美的人工智慧裝置。

目前的問題在於，OpenAI 是否會進軍硬體領域，推出自己的智慧眼鏡，或者這會成為新的 Siri，並為未來的蘋果眼鏡產品提供動力。此外，Google 是否真的有勇氣復活 Google 眼鏡，也是一個問題。

OpenAI正面對決Google！驚傳5/9發布ChatGPT搜尋引擎，挑戰谷歌本命產品

ChatGPT大規模升級！五個必知新功能：即時編輯圖像、加強隱私、多重身份驗證..

ABS獨家專訪》Gitcoin共同創辦人Scott：台灣是現實與Web3治理的重要交匯點

ABS獨家專訪》Gitcoin共同創辦人Scott：台灣是現實與Web3治理的重要交匯點

ABS獨家專訪》Gate.io CEO韓林：無懼銀行進軍加密服務，台北特別有人情味

6 Sci-fi Gadgets in Movie We Wish Actually Existed

The 10 best games to play on your new PlayStation 4

Tesla’s Chinese factory just delivered its first cars

近期文章

Pump.fun遭駭1.23萬枚SOL，攻擊者喊向Slerf、Saga手機用戶空投8000萬鎂，會致Solana分叉？

Welcome Back!

Create New Account!

Retrieve your password

Add New Playlist

ABS獨家專訪》Gitcoin共同創辦人Scott：台灣是現實與Web3治理的重要交匯點

ABS獨家專訪》Gitcoin共同創辦人Scott：台灣是現實與Web3治理的重要交匯點

ABS獨家專訪》Gate.io CEO韓林：無懼銀行進軍加密服務，台北特別有人情味

6 Sci-fi Gadgets in Movie We Wish Actually Existed

The 10 best games to play on your new PlayStation 4

Tesla’s Chinese factory just delivered its first cars

Google強打OpenAI：Gemini Live和GPT-4o誰能更勝一籌？

Gemini Live 與 GPT-4o 誰更勝一籌？

AI 的下一步發展：全方位語音助手

📍相關報導📍

近期文章

Pump.fun遭駭1.23萬枚SOL，攻擊者喊向Slerf、Saga手機用戶空投8000萬鎂，會致Solana分叉？

Welcome Back!

Create New Account!

Retrieve your password

Add New Playlist