中华网 china.com

湖北
English
湖北内容 国际表达
当前位置:湖北地方站首页 > 要闻 >

深度链接DeepSeek 湖北企业加速开拓AI生态圈

深度链接DeepSeek 湖北企业加速开拓AI生态圈
2025-02-18 10:34:59 来源:湖北日报

今年元宵佳节,在省博物馆举办的“钟鸣楚天元宵夜”主题灯会上,观众和文物精灵“楚铁”互动。(省文化和旅游厅供图)

湖北日报全媒记者张歆通讯员高翔

一家中国人工智能(AI)公司横空出世,引发全球科技界、资本界的剧震,它就是DeepSeek。

今年1月以来,DeepSeek浪潮席卷全球,引发世界互联网“大厂”巨大震荡,全球最大上市公司英伟达市值一夜之间缩水近五分之一;进入2月份后,这股浪潮开始触及各行各业。中国移动、中国电信、中国联通三家基础电信企业全面接入DeepSeek开源大模型;东风、岚图、吉利、长安等车企密集宣布与DeepSeek模型深度融合;广东多地政府部门开始在政务系统部署接入DeepSeek;QQ音乐AI助手接入了DeepSeek,用户可体验音乐问答、歌曲推荐、解析编曲等;百度旗下新搜索智能助手“文小言”在上线的学习类功能中接入DeepSeek-R1模型,优化拍照解题功能……

DeepSeek特点和优势如何,为何能迅速得到各行各业的青睐?AI(人工智能)的发展将会给公司与普通人的生活带来哪些改变?连日来,湖北日报全媒记者采访了省内大模型研究领域教授和AI从业者,请他们解读。

“专家团”技术路径受关注

DeepSeek由中国深度求索公司开发,总部位于杭州,其母公司是私募机构幻方量化,公司创始人梁文锋毕业于浙江大学信息与通信工程专业,国产、免费、开源、强大,是打在DeepSeek身上的标签。

强在哪里?学者称,相比于市面上已有的AI产品,DeepSeek在中文语境下的理解能力更强,能更好地处理中文的复杂表达,个人和企业均可免费使用,成本优势明显。

“DeepSeek更擅长中文输出,理解‘弦外之音’,更懂‘人情世故’,同时非常便宜。”AI从业者、泽霖智能创始人王强评价,在企业使用AI模型时,通常会多模型配合使用,经核算,DeepSeek每千tokens(模型处理的基本单位)模型输出费用仅为1.6分人民币(企业版),约为ChatGPT-4o的五分之一、OpenAI o1的二十六分之一,基本可以忽略不计。

华中科技大学计算机科学与技术学院教授魏巍称,DeepSeek采用稀疏混合专家(MoE)架构,后台好比多个专家团队,系统根据任务的不同,选择最合适的专家来处理,虽然模型总参数很多,但每次使用仅激活部分参数,减少不必要的计算开销,这使得在训练和推理过程中,DeepSeek对计算资源的需求大幅降低。

此外,在训练技术、缓存策略、量化技术等方面,DeepSeek通过精心设计,减少了显存需求,降低了硬件资源成本。

魏巍认为,DeepSeek在成本和开源方面带来积极变化,也向外界传递了信号,即在国外AI大模型不开源、计算资源有限、数据有限、资金有限的情况下,我国企业也能走通AI大模型的技术路径,甚至在数学推理、逻辑分析等方面的能力,优于国外同类产品。

据悉,AI研发需要计算机、数学、算法等多领域专业人才,依赖于高性能的计算机服务器、GPU集群以及大量的存储设备,还离不开高质量的数据,算法选择、模型评估、数据质量等,都是AI研发者必须攻克的难题。

“此前我国在AI研发上处于追赶的角色,现在可以同台竞争。”魏巍补充,人工智能研发仍然是一个复杂且具有挑战性的领域,需要持续的技术创新、大量的资源投入以及多方面的专业知识。DeepSeek的出现也会激发其他大模型研发企业以更短的时间推出更好用的产品,在市场博弈过程中,技术研发者之间会互相比较、借鉴、更新,进而带来技术的整体进步。

关键词:湖北

为您推荐