關于征集2025年AI+多語種翻譯方向儲備課題的通知
為貫徹落實《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023-2025年)》《北京市科技賦能文化領域創(chuàng)新發(fā)展行動計劃(2025-2027年)》,加快推動我市人工智能賦能多語種翻譯創(chuàng)新發(fā)展,現(xiàn)面向在京創(chuàng)新主體,圍繞AI+多語種翻譯方向,征集2025年儲備課題。
一、征集方向
(一)語音翻譯方向
1.研究內容
針對當前基于端到端翻譯的多語種語音翻譯大模型在多語種場景下存在的覆蓋語種有限、翻譯精度不足、實時翻譯效率低等問題,通過研發(fā)多語種端到端語音翻譯大模型技術及應用,融合語音到文本的跨模態(tài)端到端翻譯、流式意群切分和信息重組、流式語音合成以及系統(tǒng)級的自動調度等關鍵技術,建立基于端到端翻譯的多語種語音翻譯模型及應用,打造面向國際會議會展、企業(yè)出海、電視直播、多語種教學等領域的多語種語音翻譯解決方案,推動多語種語音翻譯技術的實用化和產業(yè)化,提升我國在多語種語音處理領域的技術水平和國際競爭力。
2.考核指標
(1)研發(fā)多語種端到端語音翻譯大模型,支持以中文、英語為核心,面向法語、俄語、西班牙語、阿拉伯語等聯(lián)合國官方語言,以及不少于10個非通用語種的語音輸入、實時翻譯及目標語言文本輸出和語音播報,實現(xiàn)端到端的多語種語音翻譯功能。
(2)在安靜環(huán)境(信噪比≥30dB)下,聚焦近場演講場景,單人演講、上課場景達到可用,多語種端到端大模型翻譯準確度不低于4.4分(以下均為5分制),內容完整度不低于4.4分,整體MOS評分不低于4.0分,其中中英方向不低于4.2分;端到端翻譯的多語種語音翻譯系統(tǒng)平均首響時間≤3s。
(3)構建多語種語音翻譯行業(yè)應用場景庫不少于3類,包括但不限于國際會議、會展演講、電視直播等場景,系統(tǒng)應具備歷史信息記憶機制和基于語音的信息檢索增強能力,高效融合術語庫和禁用語庫。
3.項目交付成果
多語種語音翻譯系統(tǒng)解決方案1套,集成多語種端到端語音翻譯大模型、相關硬件設備。
(二)文檔翻譯方向
1.需求目標
針對用戶在多格式文檔(如Word、Excel、PPT、PDF、圖片等)翻譯中面臨的格式解析困難、版式還原度低、專業(yè)領域翻譯準確性不足、高并發(fā)場景下效率低等問題,構建端到端文檔翻譯大模型。實現(xiàn)從文檔解析到譯文生成的端到端處理,提升多格式文檔翻譯效率、版式還原度及垂類領域專業(yè)性,滿足跨語種文件、科研文檔、法務合同、技術支持等場景的高精度翻譯需求。
2.考核指標
(1)研發(fā)基于端到端交互的多語種文檔翻譯大模型
支持以中、英為核心,面向法語、西班牙語、阿拉伯語、俄語等聯(lián)合國官方語言,以及不少于40種非通用語種的文檔結構解析、實時翻譯及目標語言的文檔原版式輸出(保留原文檔中段落、插圖位置類版式信息,以及句子級別的字號、字體、顏色等版式信息、公式信息等),實現(xiàn)從原始文檔(如 Word、PDF、圖片等)到終稿譯文的端到端處理,減少中間環(huán)節(jié)損耗。
(2)文檔格式支持
覆蓋Word(doc/docx)、Excel(xls/xlsx)、PPT(ppt/pptx)、PDF(含掃描件)、TXT、圖片(jpg/jpeg/png/bmp)等不少于13種格式。
解析成功率≥98%。
(3)譯文保留原文檔版式信息
段落結構還原度≥99%。
圖片/表格位置還原度≥98%。
公式/特殊符號還原度≥95%。
字體/字號/顏色還原度≥96%。
(4)翻譯質量與性能(5分制)
翻譯準確性評分≥4.4分。
內容完整度評分≥4.4分。
語言流暢度評分≥4.2分。
(5)術語庫干預效果
指定術語庫匹配準確率≥99%。
專業(yè)術語翻譯一致性≥98%(覆蓋科技、政治、法律等領域專屬術語)。
(6)單文檔翻譯速度
純文本文檔類≥2頁/秒。
圖文混合類≥1.5頁/秒。
圖片類≥1.5張/秒。
(7)穩(wěn)定性
系統(tǒng)連續(xù)穩(wěn)定運行≥99.9%。
歷史任務存儲與檢索響應時間≤2秒。
術語庫調用響應時間≤1秒。
(8)應用場景
構建多語種文檔翻譯行業(yè)應用場景庫不少于3類,包括但不限于會議演講稿、科研論文等場景,系統(tǒng)應具備歷史信息記憶機制和基于信息檢索增強能力,高效融合術語庫和禁用語庫。
(三)項目交付成果
多語種文檔翻譯系統(tǒng)解決方案1套,集成基于端到端交互的多語種文檔翻譯大模型。
二、評審方式
方向一:課題面向本市相關領域優(yōu)勢創(chuàng)新主體開展征集,征集結束后將于10個工作日內組織創(chuàng)新主體,面向會議同傳場景,以現(xiàn)有AI翻譯產品“賽馬”,經專家評估,評選優(yōu)勝團隊開展課題支持,并在“智領未來”北京人工智能品牌系列活動中全面推廣使用。
方向二:課題面向本市相關領域優(yōu)勢創(chuàng)新主體開展征集,征集結束后采用專家評審的形式對申報課題開展評審工作。
三、申報課題、申報單位及申報負責人要求
(一)申報課題
申報課題應具有較為明確的技術路線,具有清晰、可量化的目標及考核指標。每個方向擬支持課題1項,申請課題實施周期原則上不超過1年。
(二)申報單位
1.申報單位須為在北京地區(qū)注冊、具有獨立法人資格的單位。具有相應的科研能力和條件,具備健全的項目(課題)管理、財務管理、科研人員管理、科技成果與知識產權管理、檔案與保密管理等制度,擁有專業(yè)研究團隊和科研管理團隊,運行管理規(guī)范。
2.申報單位需符合《北京市科技計劃項目(課題)管理辦法》和《北京市科技計劃管理相關責任主體信用管理辦法》要求;近3年內在申請各級各類科研項目(課題)中無不良信用記錄,無行政處罰或違法記錄,無不良科研誠信記錄。
3.申報單位為企業(yè)的,需具備相應的資金配套能力,配套經費與財政科技經費比例不低于2:1。
(三)申報負責人
1.申報負責人應為申報單位的正式在職人員,具有良好的職業(yè)道德,無不良行為記錄。在課題申報時,負責人在課題實施期內在職,具有領導和組織開展創(chuàng)新性研究的能力,身體健康并能切實履行職責,有充足時間保證課題順利實施。
2.申報負責人需符合《北京市科技計劃項目(課題)管理辦法》和《北京市科技計劃管理相關責任主體信用管理辦法》要求。申報負責人作為負責人同期承擔北京市科委、中關村管委會課題原則上不超過1項,作為主要參加人員同期參與課題數(含擔任負責人的課題)原則上不超過2項。
四、申報方式
1.采取在線申報方式,申報單位通過法人一證通登錄“北京市科技計劃綜合管理平臺-在線服務系統(tǒng)”(https://mis.kw.beijing.gov.cn/)更新本單位信息后(以自然人賬號申報的,需綁定單位后再填報),點擊“項目申報”,選擇“北京市科學技術委員會、中關村科技園區(qū)管理委員會關于征集2025年AI+多語種翻譯方向儲備課題的通知”,點擊申報方向,完成課題申報材料填寫,主要包括:課題實施方案、項目課題簡表、負責人及申報單位承諾書(需簽字蓋章),并上傳申報課題所需的其他證明性材料?;虻卿洷本┦腥嗣裾T戶網站“政策兌現(xiàn)”欄目(https://zhengce.beijing.gov.cn)選擇相對應的項目進行申報。
2.申報系統(tǒng)將于2025年8月4日(星期一)14:30至8月15日(星期五)18:00期間開放,截止時間后系統(tǒng)自動關閉。申報單位需在系統(tǒng)開放期間完成本單位申報課題審核并統(tǒng)一提交,系統(tǒng)關閉后將不再受理。
五、咨詢服務
咨詢電話:廖老師010-88828855
技術支持電話:010-58858689、010-58858681、010-58858685、010-58858680
咨詢服務時間:9:00—11:30,13:30—18:00(工作日)
北京市科學技術委員會、中關村科技園區(qū)管理委員會
2025年8月4日
分享到: