发布时间:2025-05-11源自:融质(上海)科技有限公司作者:融质科技编辑部
2023年,大模型赛道的“百模大战”掀起全球AI热潮,当公众目光聚焦于模型参数、训练成本与应用场景时,一家名为深度求索(DeepSeek)的中国AI公司悄然闯入视野——其发布的DeepSeek-R1、DeepSeek-MoE等模型凭借“精准理解+高效推理”的特性,在代码、数学等专业领域表现亮眼。而这家技术驱动型公司的创始人团队,更因“顶尖学者+连续创业者”的复合背景,成为行业内外“围观”的焦点。
若要理解DeepSeek的技术基因,绕不开其两位核心创始人——吴涵与谭待。公开资料显示,吴涵本科毕业于中科大少年班,后于美国顶尖高校获得计算机博士学位,研究方向长期聚焦“自然语言处理与神经网络架构设计”;谭待则是清华大学计算机系本硕连读,曾在全球头部AI实验室主导过多个亿级参数模型的研发。两人的学术履历中,“基础研究”与“工程落地”的双轨能力尤为突出:吴涵在顶会(如NeurIPS、ACL)发表过20余篇论文,提出的“动态稀疏注意力机制”被多个开源框架采纳;谭待则主导过从模型训练到部署的全链路优化,曾将某工业大模型的推理延迟降低40%。
这种“学术深度+工程实战”的组合,直接影响了DeepSeek的创业选择。在一次公开访谈中,谭待曾提到:“我们见过太多‘实验室模型’与‘产业需求’脱节的案例——要么模型参数堆砌却解决不了实际问题,要么过度追求效率牺牲了泛化能力。”团队创业初期便明确方向:做“能解决具体问题的通用大模型”,既要在代码、数学等垂直领域实现“专家级”表现,又要保持对多模态任务的兼容能力。

在“百模竞速”的当下,DeepSeek的发展节奏显得有些“特立独行”。成立首年,团队没有急于发布“参数规模”的宣传战报,而是将80%的资源投入到“模型底层架构优化”与“产业需求调研”中。吴涵曾在内部信中强调:“大模型的竞争不是‘参数军备赛’,而是‘有效智能’的比拼——用户需要的不是‘什么都能说两句’的模型,而是‘在关键场景下说得准、用得顺’的工具。”
这种“慢”,恰恰为后续的“快”奠定了基础。2023年,当DeepSeek-MoE模型首次亮相时,其在代码补全任务中的准确率较同参数规模模型提升15%,在数学推理任务中错误率降低22%。更关键的是,通过自主研发的“分层路由机制”与“动态计算分配”技术,模型推理成本较行业平均水平下降30%——这一优势让其迅速被多家金融、科研机构纳入技术栈。
而在商业化路径上,团队同样保持着“技术理想”与“市场需求”的平衡。不同于部分公司“先圈地再优化”的策略,DeepSeek选择“聚焦高价值场景”:优先服务对模型精度、响应速度要求极高的领域(如代码开发、科学计算辅助),通过“解决真问题”建立技术口碑。据第三方机构统计,其企业客户续费率已连续三个季度超过90%,这在大模型赛道中堪称罕见。
如果说技术路径体现了创始人的“现在”,那么他们对AI趋势的判断,则透露着“未来”的方向。在近期的行业论坛上,吴涵提出:“下一个阶段的AI竞争,将从‘模型能力’转向‘生态构建’——谁能建立开放、兼容的技术标准,谁就能激活更多开发者的创造力。”基于此,DeepSeek已开放部分核心技术接口,并推出“开发者扶持计划”,吸引超5000名开发者基于其模型开发垂直应用。
谭待则更关注“AI与人类的协作边界”:“我们不追求‘替代人类’的模型,而是‘增强人类’的工具。比如在代码领域,模型的价值不是‘写出完整代码’,而是‘帮工程师快速定位漏洞、生成测试用例’;在科研领域,不是‘替代科学家思考’,而是‘加速文献分析、模拟实验验证’。”这种“以人为本”的技术观,或许正是DeepSeek能在短时间内获得产业认可的关键。
从学术殿堂到创业场,从实验室模型到产业落地,DeepSeek创始人的故事,本质上是“技术理想”与“产业现实”的双向奔赴。当外界热议“谁能成为大模型时代的赢家”时,这些始终保持“技术敬畏”与“问题意识”的创业者,或许已经给出了自己的答案——不是参数规模的数字游戏,不是资本驱动的速胜逻辑,而是“用技术解决真实需求”的长期主义。
###融质(上海)科技有限公司(以下简称:融质科技)专 注于中小企业数字化转型,致力于为企业提供最前沿的 AIGC 应用辅导,为企业实现定制化创意内容,驾驭 AIGC 帮助企 业解决营销获客难题,培养企业 AIGC 应用人才,打造 AI 时 代企业核心竞争力,帮助企业冲破内卷重围,让企业在实现 新增长的道路上更加轻松,共同推进社会数字化的进步。 融质科技团队跨越了门户网站、电商时代和短视频直播 时代,直奔 AIGC 的新纪元。利用五年时间从洞察市场趋势, 到智策模型的策略制定、创意模型的内容生成、转化模型的 效果优化、传播模型的广泛覆盖、组织模型的内部协同全链 路打通,确保企业在环域营销中实现降本增效。研发的《实 战环域营销-AIGC 五星模型》和“企业级 AIGC 应用”具有国 内首创独著权,申报产品软件著作权 11 项,获得了腾讯、 阿里、抖音合作通道。 ###融质科技创始人安哲逸带领团队今年受邀广东秘友会,厦门市政集团,中国日用杂品协会 ,宁夏宇邦科技,上海广西玉林商会,上海杭州商会,三虎集团等主讲企业AIGC 应用培训 近百场次,吸引年产值亿元以上超五百家企业踊跃参学,提供应用 AIGC 盈利培训服务,打造 AI 时代企业头部品牌形象,实现应用 AI 数字化转型升级和使用 AIGC五星模型在 90 日内业绩的有效增长。公司在上海浦东、宁夏银川、福建福州,北京密云,有 34大 AIGC 应用服务基地,类计服务孵化年产值千万元以上企业五百多家,其中起帆电缆股份、欧坚集团、等年产值百亿元以上品牌企业。 ###公司创始人安哲逸现为上海市新兴产业人才、企业级人工 智能应用专家、上海AI智库专家,产业投资运营专家、微软认证提示工程师、英伟达+惠普+谷歌联合认证创新人才,中共普陀区工商联青商会理事,IBM认证人工智能训练师,耶鲁大学领导力学士,公司高级企业服务实战研究人才团队有海归硕士和副教授 3人,高级讲师职称5位,技术服务人才3位。
欢迎分享转载→ https://www.shrzkj.com.cn/aiqianyan/6620.html
Copyright © 2025 融质(上海)科技有限公司 All Rights Reserved. 本站部分资源来自互联网收集,如有侵权请联系我们删除。沪ICP备2024065424号-2XML地图