浦东软件园园企×AI“顶流”DeepSeek碰撞智慧火花

发布于: 2025-02-10
分类: 浦软聚焦

春节期间

国产大模型DeepSeek可谓风头无两

以迅猛之势闯入大众视野

频频刷屏,爆火出圈

最新消息显示

DeepSeek已获顶级域名认可

在浏览器输入ai.com

即可直接定向至其官网

新一代“国货之光”🔥🚀

已站在世界顶级AI行列

 

来自东方的神秘力量

进一步缩小技术差距

 

开源,一份给全球的大礼

降本,将是AI应用普及的前奏

免费商用、任意修改和衍生开发······

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

作为一款国产大语言模型,DeepSeek拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。成本方面,DeepSeek-R1模型训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。2024年底,DeepSeek发布新一代大语言模型V3,采用完全开源策略,不仅降低用户使用门槛,还促进了AI开发者社区的协作生态。

与DeepSeek的聊天

 

你如何看待国内目前的AI大模型,相较于国外厂商,我国企业有何优势?

中国AI大模型的发展正处于快速追赶国际领先水平的阶段,尽管在技术积累和算力基础设施上与OpenAI、Google等国际厂商仍存在差距,但国内企业在以下领域已形成显著优势:本土化场景的深度适配能力、政策驱动的创新生态、产业协同的创新模式、商业化路径的差异化。

总体而言,中国AI大模型正在形成“场景驱动-政策护航-产业协同”的创新三角,这种发展模式在智能制造、智慧城市等领域展现出独特竞争力。未来3-5年,随着MoE架构的普及和类脑计算的发展,国内企业有望在特定垂直领域实现技术反超。

包罗万象、性能与效率的“双优解”······

园区企业大咖这样说

 

跬智信息(Kyligence)联合创始人兼CEO韩卿:DeepSeek本身和其他大模型一样,均是当前AI技术的重要组成部分。它的火爆提升了用户的AI心智,提醒了行业“企业级AI应用是下一波热点”,并为企业带来“组织和管理模式变革”的警示。DeepSeek的出现不仅仅对于专业用户,更对普通用户带来了极大便利,能够进一步解答用户问的深度问题,从而真正解决其实际问题。从市场竞争角度而言,DeepSeek的开源策略非常成功,已在全世界带来了巨大影响,大量团队利用DeepSeek训练和蒸馏自己的模型,如同当初Linux、Spark等开源技术的全球浪潮,短时间内构建起庞大的生态体系,这将是DeepSeek未来非常大的竞争壁垒。

AI大模型当前已经到了一个非常好用的阶段,在很多方面已经远远超过单一人类。但在以下方面依然存在挑战:成本效率,当前使用满血DeepSeek的硬件成本还是偏高,蒸馏过的版本又可能在能力和输出方面面临挑战,轻量化一定是大模型发展的重要趋势。专业化,当前模型训练使用的是公开语料,在专业领域依然不足,期待大模型和相关公司合作,推出行业或者其他专业模型。

最近,跬智信息(Kyligence)在产品中也已成功接入DeepSeek,且可以对接从官方API到其他云厂商的服务、私有化部署的DeepSeek服务等,非常方便。我们认为真正的杀手级场景很快就会出来,就如当年4G普及起来后,各种应用和场景如雨后春笋般涌现,鼓励创新、鼓励尝试,期待更多更酷的AI应用场景。

金仕达研究院副院长兼总工程师李琦:作为国内首个完整公开推理过程的大模型,DeepSeek-R1凭借独创架构实现模型性能与训练效率的“双优解”,且开源可溯。其效能跃升显著,推理能力比肩国际顶尖模型,同时综合成本大幅度降低,支持私有化部署,确保了安全可控,为金融等强监管领域提供了安全落地的技术保障。

DeepSeek提供了一个高性能、低成本的模型基座,其高性能、低成本的特性有效解决了传统AI应用投入产出比低的痛点,使得智能合规、风险预警等复杂场景的快速落地成为可能。

作为深耕金融科技领域的技术服务商,金仕达基于多年AI实践经验,已完成DeepSeek模型的深度适配与本地化部署,并基于DeepSeek进行模型升级和研发多个智能体应用。这些智能体通过模块化设计无缝嵌入客户现有业务系统,既避免重复建设又确保数据安全,赋能金融客户实现全方位的智能化升级,迎接更加智慧的未来。

江原科技联合创始人、首席战略官刘江贤:本质上DeepSeek暂时冻结了大模型训练中“大算力出奇迹”的传言,用算法优化证实了科技创新的自主路径,训练端、推理端单位算力减少,但总体撬动了场景端的整体算力剧增。模型训练和大模型使用的算力门槛降低,会有更多人纷至沓来,对于应用端,大家可以相对轻松的私域部署,这是科技创新技术进步对社会进步的巨大推动。

作为国产、国造全供应链高端芯片研发商,DeepSeek的快速发展对江原科技来说是巨大利好,全国产算力芯片+国产开源基础大模型+信创应用场景的组合未来魅力无限。但智算中心、数据中心等之前算力芯片的量级消费场景如何继续赋能仍需冷静思考,重新评估整体解决方案;短暂冷静之后,算力将会展现出另一个更加有的放矢的旺盛需求场景。

观安信息助理副总裁邹武:在发展趋势方面,一是AI大模型将会更加普及,让普罗大众用得上,算法爱好者训得起;二是随着大模型的普及,必将催生出更多丰富的应用,包罗万象。

在应用场景方面,首先,解决人生活和工作需求,主要体现在智能手机端和PC端。其次,随着智能可穿戴设备的普及,多模态日趋成熟,大模型在智能可穿戴设备上的应用将会更加丰富。另外,随着IOT发展,大模型也会为万物互联的时代提供智能动力。

清昴智能商务负责人何逸豪:DeepSeek的出现给国内AI行业带来很大震荡,其市场竞争力强劲,给企业带来了很多改变和提升。各个云厂商、芯片厂商以及中间层企业都对DeepSeek进行快速适配,积极支持落地应用,改用DeepSeek作为主力大模型,开展业务。长远看来,DeepSeek如何继续保持良好势头,且进行持续性的创新和突破,有待考量。在使用体验上,受限于用户数量的暴增,DeepSeek经常遇到卡顿现象。

当前,DeepSeek的应用场景丰富,接下去可能会在命理、情感咨询甚至端侧场景有更多的赋能。未来随着科技的进步和发展,AI大模型会更加多样化、智能化,或许称之为“智脑”也不为过。大模型的格局也不会一成不变,这是人工智能行业的魅力所在,我们应该对这个行业始终抱有好奇和学习态度,积极接受和学习新鲜事物,保证不掉队。

三同技术CTO李佳栋:从整体看,DeepSeek是一个高效且功能强大的工具,从应用层面看,却没有带来质的突破,但其独特优势在于开源与开放性。通过为开发者提供灵活的定制化能力,DeepSeek促使了大型厂商的整体进步,推动了整个大模型领域的技术提升。

当前,三同技术已完成DeepSeek的本地部署,并正积极探索其在工业数字孪生领域的应用潜力。我们认为,DeepSeek未来的关键在于走出一条独特的发展路径,在自由开发模式下,与各行业的具体应用深度融合,推动行业定制化解决方案。基于这一理念,三同技术正结合自身在工业领域的深厚积累,探索DeepSeek在智能制造中的实际应用,以AI赋能中国高端制造业,实现更高效、更精准的智能化升级。

虚沅数创始人高海宁:DeepSeek对行业的影响有以下几个方面:一是技术平权后,优质的技术本身不再是高溢价的来源,AI企业要更多思考如何通过商业模式创新将最优质的技术价值更好地带给客户。二是虽然DeepSeek模型部署及优调对GPU的要求明显下降,但由于市场认知的广泛扩展,需求会大规模快速产生,对算力的需求会增长,包括AI PC也会快速普及。三是在使用体验上,DeepSeek-R1的蒸馏模型更擅长和逻辑推理以及知识相关的场景,对于多国语言翻译,尤其是小语种由于参数相对少的原因,效果不是很理想。

AI时代,人机交互方式是核心。除推理生成式模型,大模型还有很多领域有待全行业进一步深入探索,尤其是基于端到端的多模态模型。应用场景的需求相对丰富,如基于音/视频的实时生成与理解。

达创信息系统整合测试部门经理黄兴胜:DeepSeek的出现为全球其他国家提供了第二种选择,以低成本、高性能的技术优势,打破了AI训练的高成本壁垒,有助于推动AI技术的普及和深化。DeepSeek降低了市场对高端芯片的依赖程度,使得市场目光逐渐聚焦于芯片性价比和实用性。

DeepSeek的崛起对服务器研发制造商来说既是机遇也是挑战。我们需要积极融入这一产业生态,与上下游企业实现协同发展,共同推动产业的繁荣,抓住机遇,通过技术创新和市场策略调整赢得市场竞争主动权。

与DeepSeek携手同行

园企催生科技之花绽放

在上海浦东软件园这片创新沃土上,众多企业正与DeepSeek携手同行,共同绘制人工智能宏伟蓝图,让创新的种子生根发芽,绽放出璀璨的科技之花。

飞腾实现对DeepSeek全系列大模型端到端支持

2024年,DeepSeek-V2.5 236B大模型便已在飞腾腾云S5000C平台成功实现稳定运行。2025年春节期间,DeepSeek发布最新DeepSeek-V3和R1版本后,飞腾技术团队第一时间在AI实验室进行其在飞腾腾云S5000C平台和飞腾腾锐D3000上本地部署验证,形成整体解决方案,助力用户构建端到端国产平台DeepSeek大模型智算环境。

目前,飞腾腾云S5000C和飞腾腾锐D3000成功实现对DeepSeek全系列大模型的端到端支持,覆盖数据中心和终端场景,本地部署的推理效率与国外同类产品架构解决方案相当。

七牛云集成DeepSeek-R1 671b全参数模型

七牛云集成了DeepSeek-R1 671b全参数模型,通过领先的AI能力,为客户提供灵活、便捷、高质量的推理解决方案。

作为一站式场景化智能音视频APaaS平台,七牛云深谙用户对灵活性和便捷性的差异需求,为此提供两种部署方式:

✅ 通过API访问:只需调用七牛云公开或私有API接口,即可解锁DeepSeek-R1

✅ 私有化和本地部署:更深入私有化集成AI功能,保护数据隐私,通过七牛云专用云服务器,将DeepSeek-R1部署到服务器上

观安信息上线“DeepSeek版”安全智能体

依托观安信息GPT+大模型V2.0成熟的智能安全技术体系,观安GPT+大模型V2.0在极短时间内完成了现有安全产品与DeepSeek-R1模型深度集成,新增上线“DeepSeek-InfoGuard 32B”安全智能体。该智能体在Payload解读、告警研判、事件解读等业务场景表现出色,基于DeepSeek-R1千亿级通用大模型,通过领域蒸馏技术与多阶段对抗训练,全面提升了跨语言、跨协议的深度语义理解能力,实现了威胁感知准确率超98.5%,推理效率提升300%。

观安信息数据安全系列产品与DeepSeek的深度融合,不仅是技术能力的叠加,更是防御理念从“人工研判”升级为“智能进化”。继观安信息GPT+大模型V2.0上线“DeepSeek版”安全智能体后,观安信息数据安全系列产品同步上线“DeepSeek版”智能体服务,通过松耦合的方式集成DeepSeek先进的大模型能力,结合观安信息自有的数据安全治理技术,基于大批量仿真数据及攻击行为样本在多个应用场景的反复训练,实现了数据分类分级、风险识别、主动防御等核心场景的智能化升级。

PPIO派欧云接入DeepSeek全模型

作为一站式AIGC云服务平台,PPIO派欧算力云全面拥抱DeepSeek宇宙,致力于为开发者提供低成本、高可靠、好服务的开发模式。开发者只需一行代码即可轻松调用API,体验前沿AI技术。

与此同时,PPIO派欧云已为开发者一键解锁:

✅ 颠覆性开源模型DeepSeek-V3

✅ 推理新标杆DeepSeek-R1

✅ 蒸馏模型DeepSeek-R1-Distill-Llama-70B

清昴智能玄武智算云平台全面支持DeepSeek V3/R1模型

清昴智能玄武智算云平台现已全面支持DeepSeek V3/R1模型,并基于华为昇腾硬件实现高效部署,为各类人工智能应用落地高效赋能。

作为支持昇腾Atlas 900 PoD适配DeepSeek的首发平台,玄武智算云平台昇腾Atlas 300I DUO、昇腾Atlas 900 PoD支持R1蒸馏版本适配、昇腾Atlas 800T A2支持671B满血版本的适配和优化,为DeepSeek模型私有化及集群部署提供强有力的国产化解决方案。同时,该平台还为DeepSeek R1/V3系列模型针对企业级AI应用私有化部署场景,提供了灵活的算力扩展能力。

虚沅数推出全新升级“大语言魔方”架构

虚沅数紧跟技术浪潮,推出全新升级的“大语言魔方”架构,深度融合DeepSeek、豆包等国产顶尖模型,支持全场景私有化部署,为企业打造更安全、更灵活、更高效的AI解决方案。该架构构建“多模型协同矩阵”,性能更强、场景更广、安全可控。针对企业对数据安全的严苛需求,虚沅数提供开源大模型私有化部署方案,支持DeepSeek、Llama、GPT-J等20+主流框架,无缝对接企业私有数据仓库。

虚沅数自研的Agent可以根据用户具体使用场景由基础AI模型决定何时调用DeepSeek-R1,进一步进行推理和思考以帮助用户获得高质量结果。目前,虚沅数已发布基于公有云的全量DeepSeek模型接入服务(V3/R1),以及DeepSeek蒸馏模型的私有化部署服务。

道阻且长,行则将至。DeepSeek将成为全球AI发展历程中的一个重要里程碑,激励着更多科研人员和企业,在AI领域不断探索创新。作为科技发展和技术创新高地,上海浦东软件园将不断营造良好营商环境,助力园企在人工智能、大数据、云计算等高科技领域实现技术突破和产业升级,共同书写辉煌篇章。

 

 

 

来源|园区企业

编辑|邹杨

审核|姚远

校对|办公室

分享