7月26日,一段中國外交部原副部長傅瑩和諾貝爾獎得主、“深度學習教父”杰弗里·辛頓(Geoffrey Hinton)關于AI的對話在網絡走紅。記者獲悉,兩個人交談中的“AI”,就來自于安徽——由科大訊飛研發的“語音同傳技術”。
01/
傅瑩和Geoffrey Hinton說了什么?
在這段對話里,傅瑩和辛頓握手后展開了一段關于“同傳”的對話:
傅瑩:杰弗里,今天你的演講我聽得非常清楚,屏幕上有實時中文翻譯字幕,AI一直在翻譯你的話。
杰弗里·辛頓:我看不到屏幕上(的中文實時翻譯),但我耳機里聽到的是人工翻譯。
傅瑩:所以,AI在聆聽你。(AIis listening to you!)
杰弗里·辛頓(笑):也許吧。
記者獲悉,傅瑩和杰弗里·辛頓的交談發生在7月26日召開的上海WAIC 2025(世界人工智能大會)現場,諾貝爾獎得主、“深度學習教父”杰弗里·辛頓(Geoffrey Hinton)教授在上海WAIC 現場分享他對人工智能安全倫理的深刻洞察。
2024 年諾貝爾物理學獎授予了約翰·霍普菲爾德(John J. Hopfield)和圖靈獎得主、AI教父杰弗里·辛頓(Geoffrey E. Hinton),"以表彰他們利用人工神經網絡進行機器學習的奠基性發現和發明"。
而這段對談就發生在主論壇結束之后,杰弗里·辛頓走出會場,恰好碰到傅瑩。
此外,兩個人交談中的“AI”,就來自于安徽——由科大訊飛研發的“語音同傳技術”。訊飛同傳產品經理張輝告訴記者,該技術正服務于上海WAIC 2025(世界人工智能大會)的3場主論壇和19場分論壇,可覆蓋15種語言。
02/
誰在傾聽Geoffrey Hinton?
張輝稱,訊飛的“語音同傳技術”在應用上表現為兩種。第一種是語音同傳成字幕,另一種是語音同傳成語音,“杰弗里·辛頓所在的主論壇,使用的是第一種語音同傳技術(將杰弗里·辛頓的英文語音同傳成中文字幕)。”
也就是說,杰弗里·辛頓的感覺并沒有錯:他在主論壇的演講同傳成字幕,但語音同傳仍然使用的是人工。
而傅瑩的“一語雙關”也很巧妙:AI在將杰弗里·辛頓的演講翻譯成中文字幕的同時,也在認真“傾聽”杰弗里·辛頓。
在傅瑩和杰弗里·辛頓對談的前一天,基于國產算力訓練的訊飛星火X1升級版剛剛上線。張輝告訴記者,上海WAIC 2025(世界人工智能大會)現場使用的語音同傳技術正是使用了星火同傳大模型端到端翻譯技術。
*測試集合來源:測試集合是根據訊飛翻譯機、訊飛同傳等真實業務場景隨機采樣構建的測試集;測試指標為翻譯綜合質量得分(分值0~100分)
張輝提到,杰弗里·辛頓的演講之所以被“清楚的翻譯”,可能主要基于兩點。
“以英文同傳中文為例,簡單來說,之前的語音同傳要經歷語音識別(將英文語音識別為英文文本)-機器翻譯(將英文文本翻譯成中文文本)-語音合成(將中文文本合成中文語音)三個階段,但使用大模型端到端技術后,一步到位,直接從英文語音到中文語音。”
這使得整個同傳系統效率更高、延遲更短、錯誤率更低。
張輝特別提到“首字響應速度的突破”。“過去使用翻譯工具,總需要等對方說完半句話才開始翻譯,現在中英同傳首字響應快至2秒,已達到人類高階同傳的行業標準線。”
另一方面,杰弗里·辛頓在上海的演講涉及到AI發展歷程、知識傳播特點、以及人類如何應對威脅,專業度很高。“而新版大模型恰恰在教育、醫療、企業應用、代碼、科研等行業大模型和智能體上取得了新的進步,覆蓋超8萬垂直領域專業詞匯,這使得‘語音同傳’也能夠相應勝任更復雜行業的場景和任務。”
03/
Geoffrey Hinton背后的AI翻譯為什么是訊飛?
十幾年前,杰弗里·辛頓的預言,只有科大訊飛和谷歌相信了。
2008年,學者鄧力和杰弗里·辛頓的合作拉開序幕,他們一起用一種新的方法處理語音問題,而且取得了不錯的結果。這種新方法就是后來顛覆AI領域的“深度學習”。
但鄧力和辛頓的新方法并不被業界和學界接受。就連鄧力在微軟的老板——曾任卡內基梅隆大學計算機系系主任的Peter Lee都不支持他,認為辛頓的方法“非常荒謬”。一直到2012年,鄧力在向微軟研究院資深研究者及公司高管講述深度學習進展時,依然被一位學者打斷:“神經網絡從未取得成功。”
2010年9月21日,受中科大信息科學技術學院院長李衛平邀請,鄧力回到合肥,他和俞棟一起在科大西區電三樓西側的一間會議室內作了一個關于“深度學習”的學術報告。
供職于科大訊飛研究院的一群年輕人參與了那場學術報告。這使得科大訊飛成為除微軟總部之外,首先詳細了解這一研究并著手跟進深度學習研究的團隊之一。
鄧力后來說:在深度學習剛剛被提出時,全世界只有兩家公司真的相信了。“其中一家是谷歌,另一家就是科大訊飛。”
2011年,科大訊飛上線中文語音識別深度學習系統,這是第一個中文DNN語音識別系統,領先百度一個身位。到2012年底,鄧力和辛頓合作的那篇近代語音識別歷史上被引用最多(超過11000次)的文章《Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups》發表后,深度學習在語音識別領域全面開花,勢不可擋。
谷歌后來花費了4400萬美元收購了多倫多大學的一家初創公司 DNNResearch。這家公司在當時不僅沒有任何產品,也壓根沒有生產產品的計劃。它只有三位員工杰弗里·辛頓與他的學生亞歷克斯·克里澤夫斯基(Alex Krizhevsky)、伊爾亞·蘇茨克維(llya Sutskever)。
伊爾亞·蘇茨克維后來離開谷歌,成為Open AI的聯合創始人和首席科學家,并參與主導了ChatGPT的研發。2022年的11月30日,Open AI的 ChatGPT橫空出世,而科大訊飛也在一周之后開啟了星火大模型的研發。
訊飛的AI同傳字幕為什么能展示在杰弗里·辛頓的背后?大模型當然功不可沒。在大模型時代,基于星火大模型的底座能力,科大訊飛在翻譯、多語言、多語種、語音同傳等技術方面持續取得突破性進展,星火大模型X1的升級,也支撐了星火同傳大模型的升級。
"訊飛星火X1大模型底座多語言能力持續拓展,在7月25日升級后已支持130+語種。"張輝告訴記者。
但更重要的是久久為功,是訊飛長期在語音識別、機器翻譯、文字轉寫領域積累出的一種綜合能力的體現。
訊飛在多語種技術和應用領域的積累和探索綿延二十年。去年6月,科大訊飛作為第一完成單位的《多語種智能語音關鍵技術及產業化》項目獲得國家科學技術進步獎一等獎;也是科大訊飛繼2002年和2011年分別獲得國家科學技術進步獎二等獎之后首次獲得國家科學技術進步獎一等獎;更是“深度學習”引發全球人工智能浪潮以來,過去十年人工智能領域首個國家科學技術進步獎一等獎。
十幾年前,杰弗里·辛頓的一篇論文點燃了“深度學習”的星火,點燃了AI波瀾壯闊的征程;當他靜靜坐在世界人工智能大會的會場時,“深度學習”在中國已經開枝散葉,正在為這個時代提供全球共濟的溝通橋梁。
中安在線版權所有 未經允許 請勿復制或鏡像
增值電信業務經營許可證:皖B2-20080023 信息網絡傳播視聽節目許可證:1208228 2009-2010年度全省廣告發布誠信單位