当前位置:首页>AI商业应用 >

科大讯飞如何布局AIGC赛道

发布时间:2025-06-04源自:融质(上海)科技有限公司作者:融质科技编辑部

科大讯飞在AIGC领域的布局以“底座+能力+应用”三层架构为核心,结合技术研发、行业落地和生态合作,形成了覆盖多模态生成能力及多场景应用的完整体系。以下是具体布局方向: 一、核心技术底座 预训练模型与算力支撑 构建文本预训练、多模态预训练、异构集群及大模型训练套件,支撑音频、视觉、文本生成能力。例如,讯飞星火认知大模型是其核心底层框架,支持内容生成与交互优化。 虚拟人全流程技术 2025年起布局虚拟人技术,涵盖D形象构建、口唇表情驱动、动态动作生成等全流程,实现语音与动作的语义级匹配。 二、三大AIGC能力矩阵 音频创作 SMART-TTS系统:支持种情感、档强弱度调节,超越传统机器播报,实现拟人化语音合成。 虚拟声音自动生成:输入人设即可生成对应音色,MOS评分超过.(满分为.),应用于有声书、纪录片等场景。 视觉创作 虚拟人场景化应用:覆盖D真人捏脸、D形象复刻,应用于媒体主播、金融客服、文旅导览等领域。 AI视频生成:通过语音节奏与语义分析驱动虚拟人动作,实现“文本→视频”一键转换。 文本创作 讯飞智作平台:提供AI配音、虚拟人播报、音视频生成服务,日均处理超万条内容,应用于政务、企业数字化等场景。 词曲家平台:AI辅助音乐创作,缩短交易路径并保障版权。 三、行业应用落地 教育领域 AI学习机通过个性化诊断、错题解析等功能实现因材施教,未来结合AIGC将增强互动性与创造力培养。 医疗与政务 虚拟医生助手、政务智能客服等应用,提升服务效率。 金融与文旅 虚拟客服、智能投顾及景区虚拟导览,优化用户体验。 四、战略合作与生态拓展 投资布局 入股鸿陆科技,共同开发AIGC空间交互解决方案,探索金融、零售、医疗等场景的沉浸式体验。 硬件协同 推出智能耳机等AI硬件,集成实时翻译、摘要生成功能,扩展消费级应用。 开源生态 开放余个中文预训练模型,推动行业开发者共建垂类模型生态。 五、未来方向 多模态融合 深化语音、视觉、文本的协同生成,探索“Prompt→视频”全自动化生产。 情感交互升级 推动语音合成从“自然可懂”向“悦耳享受”进化,增强AI情感表达能力。 通过上述布局,科大讯飞正从技术研发、行业应用到生态合作,全面构建AIGC时代的竞争力。欲了解完整信息,可参考其公开演讲及战略合作动态。

欢迎分享转载→ https://www.shrzkj.com.cn/aishangye/38666.html

Copyright © 2025 融质(上海)科技有限公司 All Rights Reserved. 本站部分资源来自互联网收集,如有侵权请联系我们删除。沪ICP备2024065424号-2XML地图