12月13日,谷歌在Google Translate應用中推出了基于Gemini大模型的實時耳機翻譯測試功能,用戶只需佩戴任意品牌耳機,即可實現"同聲傳譯"體驗。這項功能可將任何一副耳機瞬間變成單向翻譯設備,支持超過70種語言,目前在美國、墨西哥和印度的Android設備上先行開放,計劃2026年登陸iOS平臺并逐步擴大至更多國家。與傳統的機器翻譯不同,這項新功能最大的突破在于能夠完整保留說話者的語氣、重音和語速節奏。通過Gemini模型的深度優化,系統會分析原始音頻的音調、音量變化,在語音合成時模仿相似的抑揚頓挫,讓翻譯后的語音聽起來更加自然。用戶不僅能聽懂內容,還能感受到說話者的情緒變化,更容易分辨不同說話人的身份。在應用場景上,該功能支持兩種模式:持續監聽模式適合聽外語講座、看無字幕視頻等被動場景,系統會自動將外語轉化為目標語言在耳機中播放;雙向對話模式則專為面對面交流設計,雙方都佩戴耳機即可實現實時互譯。谷歌搜索產品副總裁Rose Yao表示,無論是旅行、跨國會議還是學習觀影,這項功能都能讓用戶像戴著"隱形翻譯官"一樣輕松跨越語言障礙。除了實時翻譯,谷歌還同步升級了文本翻譯質量。借助Gemini的先進能力,系統在處理俚語、成語、地方表達等具有語境依賴的語句時,能夠給出更符合實際含義的譯文,而非機械化的逐詞直譯。例如,英文習語"stealing my thunder"會被準確翻譯為"搶了我的風頭",而非字面意思的"偷走我的雷聲"。谷歌還擴展了語言學習工具,將其推廣至近20個新國家和地區,包括德國、印度、瑞典和中國臺灣地區等。英語使用者現在可以在應用中練習德語,而使用孟加拉語、簡體中文、荷蘭語、德語、印地語、意大利語、羅馬尼亞語和瑞典語的用戶,則可通過該工具練習英語。新增的連續打卡功能會記錄用戶學習天數,幫助保持學習連貫性。此次更新標志著谷歌翻譯從單純的文本轉換工具,向"說、聽、學"一體化的語言生態鏈全面升級。隨著Gemini模型的持續迭代,未來可能實現更精準的情感捕捉和雙向同傳,真正打開"語言不再是障礙"的大門。(來源于網絡)