当前位置:首页>AI快讯 >

2025年国内AIGC公司技术突破:多模态生成能力升级

发布时间:2025-06-04源自:融质(上海)科技有限公司作者:融质科技编辑部

2025年国内AIGC公司在多模态生成能力上实现了多项技术突破,主要体现在以下方面: 一、技术架构升级 多模态大模型融合 当虹科技推出BlackEye多模态视听大模型,支持文本、图形、视频、音频等跨模态处理,通过优化DeepSeek大模型提升了推理能力。 华为诺亚方舟实验室开源全球首个亿级中文多模态数据集“悟空”,为多模态训练提供基础支撑。 多智能体协同架构 Monica.im 的Manus Agent采用多智能体架构,通过多个AI模型协同完成跨领域任务(如简历筛选、房产分析),实现从“思考”到“行动”的闭环。 二、视频生成技术突破 视频扩散模型优化 国内厂商在视频生成领域取得显著进展,如Runway Gen-模型支持K视频生成,Pika实现局部修改和视频时长扩展,生成视频的一致性和保真度大幅提升。 潞晨科技发布Open-Sora.视频生成模型,性能逼近OpenAI Sora水平,支持场景切换流畅、细节清晰的高清视频生成。 端侧部署与实时渲染 风语筑、网达软件等企业结合空间计算技术,推出实时渲染和D建模工具,应用于元宇宙会议系统和工业仿真场景。 三、多模态应用场景扩展 工业与医疗领域 数字孪生技术结合AIGC,应用于芯片制造良率优化(如三星测试英伟达Omniverse平台)和医疗报告生成,提升生产效率。 智源研究院推出BGE-VL-v.多模态检索模型,支持代码、图文理解,覆盖万图文对齐数据。 消费级应用创新 美图公司、万兴科技等推出AI绘画、视频编辑工具,支持用户通过简单指令生成个性化内容。 夸克AI超级框整合多模态能力,提供一站式内容生成与搜索服务。 四、技术融合与开源生态 开源模型与协作创新 DeepSeek-R模型通过开源协议与腾讯、百度等厂商合作,推动多模态技术普惠化。 李未可科技开发WAKE-AI大模型,支持多模态交互能力,未来将开放低代码部署平台。 端侧与云端协同 端侧大模型(如潞晨科技的Open-Sora.)与云端算力结合,降低生成成本并提升响应速度。 五、挑战与未来方向 技术瓶颈:多模态生成仍面临数据隐私、模型泛化能力不足等问题,需通过向量数据库和模块化架构优化解决。 商业化路径:企业需聚焦垂直场景(如金融、教育、地产)开发定制化解决方案,推动AIGC从工具向生产力引擎升级。 更多技术细节和企业案例可参考等来源。

欢迎分享转载→ http://www.shrzkj.com.cn/aikuaixun/38171.html

Copyright © 2025 融质(上海)科技有限公司 All Rights Reserved.沪ICP备2024065424号-2XML地图 搜索推广代运营