金透社4月14日 | 2025日本大阪·关西世博会的主题是“构想焕发生机的未来社会”,作为本次中国馆“唯一大模型展项”,科大讯飞向世界递出了中国人工智能的“创新名片”。“AI猴哥”是怎么从“猴言猴语”变成“多国语言拥有者”?为了让“AI猴哥”实现更加丝滑的沟通交流,在星火多语种大模型的加持下,科大讯飞赋予了“AI猴哥”中、日、英三种语言能力,能与观众进行自由深度的多模态交互问答,也让全球观众能够更直观地了解孙悟空,了解中国文化。
其实,这是大阪世博会中国馆中展出的“人工智能大模型”展项,依托科大讯飞的人工智能技术,让家喻户晓的经典IP孙悟空“活”起来了,它不仅能在中国馆现场与观众跨次元交互对话,还能吟诗作画。
在形象方面,科大讯飞将中国经典美术电影《大闹天宫》中的孙悟空打造成了生动有趣的数字化孙悟空,依托于形象建模、语音合成、唇形预测、图像处理等AI核心技术,高度还原动画片中孙悟空的声音、形象,成功展现了一个栩栩如生的孙悟空。
在语音方面,科大讯飞拥有多年智能语音技术积累和优势,展项融合了高噪场景语音识别、多情感超拟人语音合成等国际领先的特色技术,在聚集众多观众的世博会现场,“AI猴哥”也能听清、听懂观众说出的问题,生动还原孙悟空惟妙惟肖的影视角色声线,与观众展开互动交流。
目前,星火多语种大模型首批支持中英以外的8个语种,包含日语、阿拉伯语、俄语、西班牙语、法语、葡萄牙语、德语及韩语,已在汽车、家电、办公、翻译等领域应用。