整个春节假期,一款名为DeepSeek的AI应用意外爆火,成为最炙手可热的技术新星。其日活用户数量迅速攀升,甚至数度导致服务器宕机,联网搜索功能一度无法使用。面对这“泼天的富贵”,DeepSeek正在全力以赴,努力接住这份来之不易的机遇。
上线20天日活突破2000万,DeepSeek成AI界新宠
根据国内AI产品榜的统计数据显示,DeepSeek应用上线仅仅20天,日活用户数量就突破了2000万大关。这一数据不仅令人咋舌,更彰显了DeepSeek对C端用户的强大吸引力。与全球知名的AI应用ChatGPT相比,DeepSeek在上线初期的日活增长速度更是遥遥领先,成为全球增速最快的AI应用之一。
然而,爆火带来的不仅仅是喜悦,还有前所未有的挑战。春节期间,DeepSeek应用多次陷入服务崩溃的状态,联网搜索功能曾在一段时间里无法使用。面对源源不断的新用户涌入,DeepSeek显得有些力不从心。业内人士分析指出,为了应对近期的大批用户并继续提升模型性能,DeepSeek亟需扩充算力基础设施,以满足更多用户的访问需求。
百万年薪“招兵买马”,DeepSeek求贤若渴
除了算力基础设施的扩充,DeepSeek还亟需扩充人才队伍。据公开资料显示,目前DeepSeek的员工数量大约为150人左右,与全球知名的AI研究机构OpenAI的1700名员工相比,规模显然较小。为了满足快速发展的需要,DeepSeek在招聘网站上放出了一系列职位,豪掷百万年薪聘请AI人才。
记者在某招聘平台看到,DeepSeek目前已放出了37个招聘职位,涵盖客户端研发工程师、深度学习研发工程师、全栈开发工程师、自然语言处理算法工程师、深度学习研究员等多种岗位。其中,深度学习研究员岗位的薪资水平为50—80k*14薪,工作地点为北京,招聘要求是在校或者应届的硕士生。这意味着,若按照最高月薪8万元计算,应届生入职DeepSeek,年薪就可达到112万元。此外,顶尖高校的在校生如果通过校招拿到了DeepSeek的Offer,在校实习期间就可以享受到与正式入职时相同的工资。
除了正式员工,DeepSeek还招聘了AGI大模型-数据百晓生实习生、深度学习-AGI实习生等实习岗位,实习工资为每天500元左右,中餐由公司提供,还可以享受80元的晚饭餐补。这一优厚的待遇吸引了众多在校生的关注,也为DeepSeek注入了新鲜血液。
海内外市场齐头并进,DeepSeek成全球新宠
值得注意的是,DeepSeek不仅在国内爆火,在海外多个国家也很受欢迎。据媒体报道,自今年初发布以来,DeepSeek迅速攀升至140个国家的苹果App Store下载排行榜首位,印度成为了这款应用新用户增长的最大“引擎”,其下载量占据了所有平台下载总量的15.6%。
为了加大国际业务方面的布局,DeepSeek在招聘时也明确标明了对于小语种专业的优先考虑。在AGI大模型-数据百晓生实习生岗位要求一栏,就明确标明了“小语种专业优先考虑”以及“涉猎广泛、博闻强识,对各行各业的知识都拥有强烈的兴趣”。
云厂商争相接入,DeepSeek“朋友圈”持续扩大
在应用日活飙涨的同时,国内外主要的云厂商和芯片厂商也近日接连宣布接入DeepSeek模型。海外市场方面,1月31日,微软的Azure云服务宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。同日,全球第一大云巨头亚马逊AWS也宣布DeepSeek-R1模型全面上线,英伟达则宣布NVIDIA NIM已经可以使用DeepSeek-R1模型。
国内方面也不甘示弱,2月1日,华为云宣布经过连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。腾讯云也在2月2日宣布,DeepSeek-R1大模型可一键部署至腾讯云HAI上,开发者仅需3分钟就能接入调用。紧接着,2月3日,阿里云、百度智能云也发文宣布正式接入DeepSeek-V3、DeepSeek-R1模型。至此,国内四大云巨头都已正式接入了DeepSeek,形成了强大的“朋友圈”。
业内人士分析指出,在大模型领域,OpenAI、Anthropic等市场上领先的玩家选择了闭源的封闭路线,而DeepSeek则选择了开源的开放路线。任何人都可以部署、修改、优化其模型,这就像是传统软件时代的Windows和Linux之争。DeepSeek代表的不仅是一个模型,更是一种新的行业范式与游戏规则。当云厂商们纷纷选择接入DeepSeek时,将有越来越多的企业选择这样的开源方案,从而形成DeepSeek“生态圈”。
中航证券研报力挺DeepSeek:国产科技新骄傲
中航证券近日发布研报表示,DeepSeek在基础模型训练和推理模型训练方面均有创新,有效克服了推高模型成本的FP8训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本。研报还指出,DeepSeek的研究表明,较大的基础模型发现的推理模式对于提高较小模型的推理能力至关重要。在大模型蒸馏技术的加持下,端侧小模型的普惠化指日可待。
此外,研报还强调,美国科技巨头英伟达NIM、微软Azure、亚马逊AWS等智能云平台已上线部署支持用户访问DeepSeek-R1模型。DeepSeek以创新的技术路线吸引了全球科技巨头,说明国产科技在开放创新的开源环境里具备强大的竞争力。未来,有望涌现出更多的普适技术,我国本土科技企业的价值理应被重估。
综上所述,DeepSeek的爆火并非偶然,而是其强大技术实力和创新精神的必然结果。面对这份“泼天的富贵”,DeepSeek正在全力以赴,努力接住这份来之不易的机遇。未来,随着人才队伍的不断扩充和“朋友圈”的持续扩大,DeepSeek有望成为全球AI领域的佼佼者,为国产科技争光添彩。