13

读懂DeepSeek开源周:一场技术普惠的嘉年华,极限提升大模型效率

文/腾讯云技术专家方天戟 内容策划:刘子琪、郭晓静 编辑:郑可君 在 2025 年开年,DeepSeek 的发布,在全社会造成了轰动。这是因为,DeepSeek 通过一系列技术革新,大大降低了生成式 AI 的研发与使用成本,使得生成式 AI 有望在近期走入千家万户,从而帮助全社会提升工作效率。 20
9

545%!DeepSeek公布理论成本利润率

过去一周,DeepSeek 连续开放了 5 个 Infra 项目的源代码,正当大家以为这场开源盛宴已经结束。3 月 1 日,DeepSeek 的彩蛋来了!开源周 Day6,DeepSeek 官方团队在开发者社区 Github 和知乎给出了 DeepSeek-V3/R1 推理系统的技术解读。通过优化吞
5

DeepSeek-R1 后又一推理训练里程碑:用递归重构 Transformer

《AI 未来指北》课代表系列——AI 大事儿的最快、最全解读,本文关注大模型推理技术技术上最新的突破——通过改造 Transformer 模型,用递归的方法让 AI 自发涌现出推理能力。这一研究可能会对模型推理训练后续的范式产生深刻影响。 腾讯科技《AI 未来指北》特约作者:郝博阳 编辑:郑可君 从
4

GPT-4.5发布:比GPT-4提升10倍,但“并非前沿模型”

2 月 28 日消息,美国时间周四,OpenAI 宣布推出 GPT-4.5,这是其最新、最强大的大语言模型(LLM)的研究预览版,专为聊天应用设计。不过,这也是 OpenAI 迄今为止最昂贵的模型。 不过,GPT-4.5 仍然是一款传统的大型语言模型,而非“推理模型”。此前,OpenAI、DeepS
5

小米SU7 Ultra正式上市52.99万元,纽北限量版 81.49万元

今天有两条关于小米的大新闻。 上午,小米集团涨近 6%,总市值超 1.4 万亿港元,随即有媒体报道称雷军喜提 1 小时首富体验卡。但另一边,雷军在武大校友群里回应:「那是假新闻。」根据福布斯实时亿万富豪榜,目前钟睒位列第 26 位,雷军位列第 36 位。 这是第一条。 第二条是前一段时间疯狂「屠榜」
3

Figure机器人进厂打工,8小时速成物流分拣大师!自研VLA模型全面升级

新智元报道 编辑:编辑部 HNY Figure 公司继推出自研 VLA 模型 Helix 后,再度发力!最新展示的机器人包裹分拣技术,仅用 8 小时训练数据,就实现了超越人类的效率和精度。通过一系列架构优化,包括立体视觉、多尺度特征、自我校准和运动模式,Figure 机器人展现了惊人的学习和适应能力
1

“猫量子比特”实现容错量子计算新突破

科技日报北京 2 月 26 日电 (记者张梦然)美国亚马逊云科技量子计算中心团队在 25 日《自然》杂志的一篇论文中,演示了容错量子计算的新突破:一种对硬件需求更低的量子纠错系统。这一系统使用了“猫量子比特”(cat qubits)
20

DeepSeek-R2真的要来了,这次不是KFCVWO50

来自路透社的独家报道: - DeepSeek 原计划在 5 月初发布新一代 R2 模型,但已经开始考虑提前发布,这段时间 Grok 3、Claude 3.7、Qwen 2.5-Max 等竞品接连推出,还是有影响的; - 梁文锋在距离清华、北大两所高校步行可达的地段设立了北京办公室,非常乐于和实习生以
1

深海七千米有群“基建狂魔”?

科学家进行沉积物分析。图片来源:英国《自然·通讯》杂志 科技日报记者 张梦然 在阳光永远无法触及的太平洋底,日本海沟 7500 米深的黑暗世界里,一群“深海工程师”正用数百万年时间,在海底建造着令人惊叹的生态系统。最近,芬兰地质调查局的科学家就像深海考古学家,通过一管管来自地球深处的“时光胶囊”,揭
2

AI 编码王者:全球首个混合推理模型 Claude 3.7 降世

新智元报道 编辑:JHNY 【新智元导读】就在刚刚,Anthropic 祭出首个混合推理 Claude 3.7 Sonnet,堪称扩展思考模式的最强模型。在最新编码测试中,新模型暴击 o3-mini、DeepSeek R1,AI 编码王者出世了。 憋了大半年,Anthropic 终于放出大招——首款
2

微软AI通过“玩”游戏学会设计电游

研究团队分析 AI 模型设计游戏的能力。图片来源:英国《自然》杂志 科技日报讯 (记者张梦然)最新一期《自然》杂志报告了一个可协助电子游戏设计师迭代设计游戏的生成式人工智能(AI)工具。这个 AI 模型由微软研究团队开发,仅通过玩游戏的训练就能学会设计游戏,而其生成的稳健三维(3D)世界,遵循了电子
3

GPT等AI大语言模型,能够像人类一项思考推理吗?

撰文丨王聪 编辑丨王多鱼 排版丨水成文 人工智能(AI),特别是像 GPT-4 这样的大语言模型(LLM),在推理任务上表现出了令人印象深刻的性能。 但这些 AI 真正实现了对抽象概念的l理解吗?抑或是仅仅停留在了模式模仿层面? 最近,阿姆斯特丹大学和圣塔菲研究所的一项新研究表明,虽然 GPT 模型
1

华人学者联合英伟达推出最大生物学AI模型,完全开源

来源 | 生物世界 撰文丨王聪 编辑丨王多鱼 排版丨水成文 2025 年 2 月 19 日,生物学领域的一个重要里程碑诞生了! Arc 研究所的 Patrick Hsu 和 Brian Hie 团队联合斯坦福大学、加州大学伯克利分校、加州大学旧金山分校以及英伟达的科学家,发布了有史以来最大的生物学人
15

法国核聚变重大突破,等离子体运行1337秒刷新世界纪录!全球核电时代一步之遥

新智元报道 编辑:编辑部 JHs 等离子体持续时间新世界纪录诞生——1337 秒!继我国在上月突破 1000 秒大关后,国际核聚变领域取得新成果。人类有望迎来全新核电时代。 创纪录的1,337 秒! 2 月 12 日,法国 WEST 托卡马克装置,成功实现了创纪录的等离子体持续时间——超过 22 分
7

手掌大小芯片碾压全球算力!微软量子计算突破,构建全新物质状态

白交发自凹非寺 量子位公众号 QbitAI 想象一下,一个放在手掌上的芯片,能解决当今地球上所有计算机加起来都无法解决的问题。 Nature 报道:量子计算,再迎新突破——微软推出 Majorana 1,这是首款基于新型拓扑核心架构的量子芯片。 官方称,有望在数年内实现能够解决工业级别规模问题的量子
2

太字节(TB)数据“塞进”毫米级存储器

科技日报北京 2 月 19 日电 (记者张佳欣)美国芝加哥大学研究人员开发出一种创新性的存储技术,利用晶体内的单原子缺陷来表示数据存储中的二进制数“1”和“0”,将几个太字节(TB)的数据存储在边长仅为 1 毫米大小的晶体立方体中。相关论文发表在最新一期《纳米光子学》杂志上。 历史上,用于表示二进制
17

刚刚!DeepSeek梁文锋亲自挂名,公开新注意力架构NSA

机器之心报道 机器之心编辑部 DeepSeek 新论文来了!相关消息刚刚发布到就吸引了大量用户点赞、转发、评论三连。 据介绍,DeepSeek 的这篇新论文提出了一种新的注意力机制 —— NSA (Native Sparse Attention)。这是一个用于超快长上下文训练和推断的本地可训练的稀疏
8

复旦大学开源:200多行代码,超低成本复现 DeepSeek R1「Aha Moment」

来源:机器之心 本文是复旦大学知识工场实验室肖仰华教授、梁家卿青年副研究员科研团队的最新研究成果,他们用简洁的代码高效复现了 R1-zero 的自发反思能力。 在关于 DeepSeek 的文章中,我们会多次听到「Aha Moment」这个词。它指的是模型在训练过程中经历的一种顿悟时刻,表现为模型突然
> 返回新闻首页