% B' N# g w0 d' D任何传播这种谣言的人,很可能并不从事人工智能工作——如果你不涉足该领域,却以为自己了解这个领域的一切,是荒谬且极其自负的。! R6 d" S/ G: Y" W. Q) O/ S
7 \; }0 c& w7 D R) O( g6 k' @* ^# Z
DeepSeek 的首个开源模型 DeepSeek-Coder,于 2023 年 11 月发布。当时是业界领先的代码 LLMs(编者注:专注于理解和生成代码的语言模型)。正如下面的图表所示,DeepSeek 在一年内持续发货,达到 R1:" @( n4 {) B. \, s. t
/ f# D$ K4 l1 o" y
. ~5 I9 U2 u: `, f K" v这不是一夜之间的成功,他们进步的速度也没有什么可疑之处。在人工智能发展如此迅速,且他们拥有一个明显高效的团队的情况下,一年内取得这样的进步在我看来是非常合理的。 8 M/ t6 m0 y' t( M9 W7 M/ _6 l- p- @, y1 L
如果您想知道哪些公司在公众视野之外,但 AI 领域内备受看好,我会推荐关注 Qwen(阿里巴巴)、YI(零一万物)、Mistral、Cohere、AI2。需要注意的是,它们没有像 DeepSeek 那样持续发布 SOTA 模型,但它们都**有潜力发布出色的模型**,正如它们过去所展示的那样。 0 z6 ^8 h. x5 K4 D7 o: d+ J ' f' p9 ?* A+ T, n3 C谣言 2:撒谎!这个模型的成本不是 600 万美元 ( |# c% a: C0 H+ ~这是一个有趣的问题。这类谣言认为 DeepSeek 想避免承认他们有非法的幕后交易来获取他们不应获得的计算资源(由于出口管制),从而在关于模型训练成本的真实性上撒谎。$ D8 J) |/ ]% {/ x2 O