3月2日至3月5日,MWC 2026的巴塞羅那展館里,AI眼鏡幾乎成了每個展臺都想抓住的“下一代入口”。
科大訊飛把這股風潮具象化成一副更有剛需場景的產品:訊飛AI眼鏡首次亮相,主打把多模態同聲傳譯集成進日常佩戴的眼鏡形態里,語音翻譯與視覺翻譯同時工作,面向跨國會議、商務洽談、海外展會等跨語言溝通場景;在展會、酒會這類高噪環境中,它用攝像頭捕捉講話人的唇部運動,再結合骨傳導麥克風采集佩戴者聲音,把音視頻兩路信息融合處理,以便在多人交談的嘈雜背景中鎖定目標講話人,據報道可將語音識別和翻譯準確率提升50%以上;整機重量做到40克,相比常見的50克以上同類產品輕約20%。

AI眼鏡之外,展臺上還有兩件“更像辦公桌上會出現的東西”:智能辦公本AirNote2和同傳麥克風——一個負責把會議記錄、內容整理和知識沉淀做得更順手,一個負責把跨語言溝通在多人場景里做得更穩定、更可控。它們跟AI眼鏡看似分屬不同品類,但放在同一面展墻上,會讓人更直觀地理解科大訊飛在MWC想呈現的邏輯:不是單點產品秀,而是圍繞同一套國產算力的底座大模型能力,把學習、辦公、溝通這些高頻剛需串成一條軟硬一體的鏈路。
這條鏈路的中軸,是星火大模型,尤其是近期發布的星火X2。公開信息中,星火X2被放在國產算力訓練這一維度上反復強調:在國內主流大模型敘事里,能否基于全國產算力完成訓練,越來越被視作底座能力的一道硬門檻,星火X2是目前少數、甚至唯一走通這一訓練路徑的通用大模型底座之一。

與此同時,X2也被歸納為一次面向可用性的升級:數學、語言理解、推理、翻譯等能力繼續加強,同時更強調智能體能力與工程化部署效率——這些聽起來“偏底層”的變化,恰恰決定了終端產品在真實場景里能否跑得穩、跟得上、扛得住。
MWC展臺上那副40克的眼鏡,其實把底座能力的難點展示得很具體:同傳不是簡單的“翻譯”,它要在嘈雜環境里先把聲音聽清、把人聲分離、把語義理解連貫起來,再把譯文以低時延輸出。展會現場的噪聲、混響、多人疊話、口音差異、臨場表達,是對識別和翻譯最不友好的變量。眼鏡提出的唇動識別多模態降噪思路,像是把問題拆開重做:讓攝像頭提供額外信號,讓骨傳導麥克風提供更干凈的聲源線索,再把音視頻信息融合,去鎖定目標講話人。
你能感受到這背后是一種更典型的軟硬一體方法論:不是只靠模型“更聰明”,而是模型、信號處理、傳感器與端側工程一起協同,把輸入變得更可控,才能讓翻譯在真實世界更可靠。
同樣的邏輯,在AirNote 2和同傳麥克風上也能看見。AirNote 2更像是把大模型能力壓進一個確定的辦公流程里:開會時記錄、會后整理、把討論變成結構化紀要和行動項,讓信息沉淀變得更輕、更順、更可復盤。它不像AI眼鏡那么潮,卻更接近日常效率的剛需:會議內容多、節奏快、信息碎,用戶真正介意的往往不是寫得“像不像”,而是能不能在多人發言、插話、術語密集的情況下還原得足夠準確,整理得足夠清晰,便于檢索和分發。另一邊,同傳麥克風的存在提醒人們:跨語言溝通要真正好用,除了模型能力,還要把拾音、降噪、聲源定位這些“硬功夫”補齊,才能在會場、展會、路演等復雜聲場里穩定輸出。眼鏡做的是佩戴形態的“隨身同傳”,同傳麥克風做的是會議場景的“多人同傳”,AirNote2做的是會后沉淀的“閉環”,三者共同把一條跨語言與知識生產鏈路從頭到尾串起來。
當你再回頭看科大訊飛展出的硬件矩陣:學習機、辦公本、翻譯機、耳機、錄音筆、智慧黑板、批閱機……以及這次在巴塞羅那亮相的AI眼鏡,它們并不是在講“訊飛有多少硬件”,而是在講一件更難的事:在全國產算力訓練的大模型底座之上,把同一套核心能力做成可復用的模塊,然后落到不同的終端和流程里。教育場景里,學習機、黑板、批改機要面對的是錯不起的高壓環境,輸出必須更穩、更一致;辦公場景里,辦公本、錄音筆要面對的是耗不起的協同成本,效率提升必須可感知、可衡量;溝通場景里,翻譯機、耳機、同傳麥克風、AI眼鏡要面對的是最不可控的現場變量,穩定性與時延往往比“花活”更重要。硬件把這些要求變成了每天都會發生的壓力測試,也把大模型的能力從一次性的展示,推向可持續的產品化與長期使用。
這也解釋了為什么星火X2才是評估科大訊飛產品能力的核心要素。大模型競爭已經不止是誰能回答得更漂亮,更關鍵的是誰能在國產算力約束下把底座做穩,再把底座能力壓進各種終端里跑得動、跑得久、跑得省。
MWC上那副40克的眼鏡、桌面上的AirNote2,以及會議場景里的同傳麥克風,把這條路徑用更具象的方式呈現出來:國產底座提供統一能力,軟硬一體完成場景落地,產品矩陣支撐規模交付,持續使用反哺底座迭代,最后形成從AI底座到產品化再到商業閉環的一條完整鏈路。