科大讯飞如何布局AIGC赛道

发布时间：2025-06-04源自：融质（上海）科技有限公司作者：融质科技编辑部

科大讯飞在AIGC领域的布局以“底座+能力+应用”三层架构为核心，结合技术研发、行业落地和生态合作，形成了覆盖多模态生成能力及多场景应用的完整体系。以下是具体布局方向：一、核心技术底座预训练模型与算力支撑构建文本预训练、多模态预训练、异构集群及大模型训练套件，支撑音频、视觉、文本生成能力。例如，讯飞星火认知大模型是其核心底层框架，支持内容生成与交互优化。虚拟人全流程技术 2025年起布局虚拟人技术，涵盖D形象构建、口唇表情驱动、动态动作生成等全流程，实现语音与动作的语义级匹配。二、三大AIGC能力矩阵音频创作 SMART-TTS系统：支持种情感、档强弱度调节，超越传统机器播报，实现拟人化语音合成。虚拟声音自动生成：输入人设即可生成对应音色，MOS评分超过.（满分为.），应用于有声书、纪录片等场景。视觉创作虚拟人场景化应用：覆盖D真人捏脸、D形象复刻，应用于媒体主播、金融客服、文旅导览等领域。 AI视频生成：通过语音节奏与语义分析驱动虚拟人动作，实现“文本→视频”一键转换。文本创作讯飞智作平台：提供AI配音、虚拟人播报、音视频生成服务，日均处理超万条内容，应用于政务、企业数字化等场景。词曲家平台：AI辅助音乐创作，缩短交易路径并保障版权。三、行业应用落地教育领域 AI学习机通过个性化诊断、错题解析等功能实现因材施教，未来结合AIGC将增强互动性与创造力培养。医疗与政务虚拟医生助手、政务智能客服等应用，提升服务效率。金融与文旅虚拟客服、智能投顾及景区虚拟导览，优化用户体验。四、战略合作与生态拓展投资布局入股鸿陆科技，共同开发AIGC空间交互解决方案，探索金融、零售、医疗等场景的沉浸式体验。硬件协同推出智能耳机等AI硬件，集成实时翻译、摘要生成功能，扩展消费级应用。开源生态开放余个中文预训练模型，推动行业开发者共建垂类模型生态。五、未来方向多模态融合深化语音、视觉、文本的协同生成，探索“Prompt→视频”全自动化生产。情感交互升级推动语音合成从“自然可懂”向“悦耳享受”进化，增强AI情感表达能力。通过上述布局，科大讯飞正从技术研发、行业应用到生态合作，全面构建AIGC时代的竞争力。欲了解完整信息，可参考其公开演讲及战略合作动态。

欢迎分享转载→ https://www.shrzkj.com.cn/aishangye/38666.html

上一篇：站长必备的AI伪原创检测技巧

下一篇：硬件协同创新：百强企业端侧布局