小刀锯大树!中国AI新创公司“DeepSeek”横空出世,硅谷巨头坐立难安!
成本低廉就是King!最近,一家名为深度求索(DeepSeek)的中国小型初创公司发布了一个新的人工智能(AI)系统,标榜成本低廉,性能可与OpenAI和谷歌等公司的尖端聊天机器人比肩,引起了矽谷(Silicon Valley)和《纽约时报》等多家西方媒体关注,矽谷形容DeepSeek为“来自东方的神秘力量”。
DeepSeek上月发布全新AI模型DeepSeek-V3首个版本,引起全球科网界关注,卖点是其使用次级GPU(图形处理器),表现却足与全球一线AI语言模型媲美,包括OpenAI的ChatGPT-4o。据悉,DeepSeek-V3的训练仅需不到600万美元的计算资源,这些计算能力来自Nvidia H800芯片。
DeepSeek的兴起
DeepSeek由梁文峰于2023年5月创立,他曾领导中国对冲基金幻方(High-Flyer Quant)。由于幻方完全承销了DeepSeek,这家初创公司可以自由地进行雄心勃勃的AI研究,而不会受到产生短期回报的压力。DeepSeek位于中国杭州,聚集了一支由中国大学顶尖毕业生组成的年轻团队,强调强大的技术技能而非传统的工作经验。
DeepSeek从创办第一天开始就以两个核心目标为导向:以透明、开源的方式推动通用人工智能(AGI);通过激进的定价和成本效益高的技术,使先进的AI更容易获得。这种开源精神和颠覆性定价让现有企业感到不安,促使OpenAI、Meta等AI巨头需要重新评估自己的成本、战略和研究方法。
DeepSeek如何引起轰动?
自2022年底OpenAI发布ChatGPT后,中国科技公司纷纷加快了人工智能聊天机器人的研发。DeepSeek的出现彻底改变了这一现象!该公司的DeepSeek-V3和DeepSeek-R1两款模型的性能与OpenAI和Meta的最先进技术不相上下,让硅谷的高管和美国科技公司工程师纷纷对这些模型赞誉有加。
此外,DeepSeek的成本效益远超其竞争对手。根据DeepSeek官方微信公众号的信息,最近发布的DeepSeek-R1使用成本比OpenAI的O1模型低20到50倍,具体取决于任务的类型。Scale AI CEO Alexandr Wang在接受CNBC采访时提到,DeepSeek拥有50,000块Nvidia H100芯片,而这些AI晶片早在2022年拜登政府时期就遭列出口管制措施,禁止出口给中国公司。
新闻来源:网易、看中国
*部分照片取自网络,内容谈谈网归有,若想参考请附加此文的链接。谢谢!照片如有侵犯版权问题请告知,谈谈网必定删除。