動區動趨-最具影響力的區塊鏈新聞媒體
  • Home
    • Home Layout 1
    • Home Layout 2
    • Home Layout 3
  • Browse
    • News
    • Movie
    • Music
    • Technology
    • Howto & Style
    • Entertainment
    • Gaming
  • Features
    • Youtube Video
    • Vimeo Video
    • Dailymotion Video
    • Self-hosted Video
    • User Profile
    • Playlists
    • User-created Playlist
    • Favorite Playlist (Private)
    • Watch Later Playlist (Private)
    • All JNews Features
No Result
View All Result
  • Login
  • Register
UPLOAD
動區動趨-最具影響力的區塊鏈新聞媒體
No Result
View All Result
Currently Playing

ABS獨家專訪》Gitcoin共同創辦人Scott:台灣是現實與Web3治理的重要交匯點

ABS獨家專訪》Gitcoin共同創辦人Scott:台灣是現實與Web3治理的重要交匯點

ABS獨家專訪》Gitcoin共同創辦人Scott:台灣是現實與Web3治理的重要交匯點

搶先看
ABS獨家專訪》Gate.io CEO韓林:無懼銀行進軍加密服務,台北特別有人情味

ABS獨家專訪》Gate.io CEO韓林:無懼銀行進軍加密服務,台北特別有人情味

搶先看

6 Sci-fi Gadgets in Movie We Wish Actually Existed

Movie

The 10 best games to play on your new PlayStation 4

Gaming

Tesla’s Chinese factory just delivered its first cars

News

Google強打OpenAI:Gemini Live和GPT-4o誰能更勝一籌?

Google 近日推出了一款全新的人工智慧產品「Gemini Live」,支援實時語音對話功能,被外界認為是要與 OpenAI 的「ChatGPT Voice」抗衡,本文將比較兩者間的差異。
(前情提要:Google I/O大會猛攻AI:影片生成模型Veo、個人助手Project Astra、Gemini 1.5 Pro..亮點一次看)
(背景補充:iPhone將整合ChatGPT!彭博:Apple與OpenAI達成合作、最快六月發表 AI Siri)

 

在本週二舉行的Google I/O 大會上,Google推出了一款全新的人工智慧產品「Gemini Live」。人們原本以為安卓系統的 Gemini 助手會帶來某些新東西,但這就是 Google,一切皆有可能。

值得一提,Gemini Live 是在 OpenAI 首次消費者產品活動的第二天釋出的,很難不讓人猜想該產品是否是為了對抗 ChatGPT Voice 而釋出的。

而且兩者都採用了原生多模態人工智慧模型,並擁有出彩的語音和視訊功能。

目前,在全球人工智慧競賽中,領跑者無疑是 OpenAI 和 Google,前者似乎與蘋果和 iPhone 建立了緊密的聯絡,而後者則掌控著安卓系統。

並且,相對於 Rabbit r1 或 Humane Pin 這樣的人工智慧裝置而言,智慧手機才是短期的贏家。ChatGPT Voice 和 Gemini Live 都被整合到了現有的智慧手機產品中,而且這兩款產品目前都還未上市。至於下一代助手是否能夠與之相比,這是後話了。

Gemini Live 與 GPT-4o 誰更勝一籌?

下圖是 Google 釋出 Gemini Live 時的發言:

「今年夏天,我們將擴展套件 Gemini 的多模態功能,包括使用語音進行深入的雙向對話。這種新體驗被稱為 Live。」

在即時視訊分析和語音功能方面,Google 是有所欠缺的。去年 Google 釋出 Gemini Ultra 時,它釋出了一段響應「即時視訊」的視訊,但生成的結果並不理想。不過,這一次 Google 把這項技術放在了 I/O 上試用,包括語音和視訊對話。

OpenAI 和 Google 都為視訊及語音對話提供了一個介面,都可以通過手機攝像頭進行即時的視訊分析。並且語音和視訊的響應都很快,能夠進行真正自然的對話,甚至可以中途打斷人工智慧。

不過,兩者也有一些明顯的不同之處。OpenAI 的 ChatGPT Voice 聽起來更自然,能檢測並響應情緒和聲調,甚至能根據你的要求即時調整說話方式。在 Gemini Live 上並沒有看到這種功能。

二者另一個最大的不同是多模態。Gemini 仍然依賴其他模型進行輸出,包括使用 Imagen 3 輸出影象和 Veo 輸出視訊。但 GPT-4o 是雙向的原生多模態,「o」代表了全方位,可以建立自己的影象和聲音。

AI 的下一步發展:全方位語音助手

總的來看,目前人工智慧的發展趨勢似乎正在從文字輸入轉向語音輸入。

當人們看到 OpenAI 的公告時,可能就會意識到,這是人機介面的一次正規化轉變,其意義不亞於滑鼠或觸控式螢幕的推出。

Google 也將繼續推出原生、自然的語音介面,Meta 公司在其 VR 頭顯和 Ray-Ban 智慧眼鏡中配備了語音機器人 MetaAI。

雖然智慧手機可能是目前的贏家,但這些語音 AI 模型真正的適配裝置顯然是智慧眼鏡。因為眼鏡上的攝像頭與眼睛同高,眼鏡臂也可以將聲波送入使用者的耳朵,我們可以稱之為完美的人工智慧裝置。

目前的問題在於,OpenAI 是否會進軍硬體領域,推出自己的智慧眼鏡,或者這會成為新的 Siri,並為未來的蘋果眼鏡產品提供動力。此外,Google 是否真的有勇氣復活 Google 眼鏡,也是一個問題。

📍相關報導📍

OpenAI傳下周一將發布ChatGPT搜尋引擎!路透:與Google直球對決

OpenAI正面對決Google!驚傳5/9發布ChatGPT搜尋引擎,挑戰谷歌本命產品

ChatGPT大規模升級!五個必知新功能:即時編輯圖像、加強隱私、多重身份驗證..

No Result
View All Result

近期文章

  • 精選文章搶先看!動區登入Access質押訂閱服務,解鎖寶貴資訊快人一步
  • ABS獨家專訪》Gitcoin共同創辦人Scott:台灣是現實與Web3治理的重要交匯點
  • ABS獨家專訪》Gate.io CEO韓林:無懼銀行進軍加密服務,台北特別有人情味
  • 快訊!BTC 現在已來到 58996.2
  • 快訊!BTC 現在已來到 58815.03
Next Post
Pump.fun遭駭1.23萬枚SOL,攻擊者喊向Slerf、Saga手機用戶空投8000萬鎂,會致Solana分叉?

Pump.fun遭駭1.23萬枚SOL,攻擊者喊向Slerf、Saga手機用戶空投8000萬鎂,會致Solana分叉?

Copyright (c) 2019 by Jegtheme.
  • About
  • Buy JNews
  • Request A Demo
  • Contact

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms below to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

- Select Visibility -

    No Result
    View All Result
    • Account
    • BlockTempo Beginner – 動區新手村
    • Change Password
    • Forgot Password?
    • Home 1
    • Home 2
    • Home 3
    • Jin-homepage
    • Latest
    • Login
    • Profile
    • Register
    • Reset Password
    • Trending
    • Users
    • Users List Item
    • 不只加密貨幣,談談那些你不知道的區塊鏈應用|動區新手村
    • 所有文章
    • 關於 BlockTempo

    © 2025 JNews - Premium WordPress news & magazine theme by Jegtheme.