nVIDIA

NVIDIA创造新技巧KVTC 内存应用量缩减20倍

NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。

黄仁勋罕有宣布长文:定义AI“五层架构” 预判将创造更多就业

3月10日,英伟达CEO黄仁勋于周二发表了一篇罕见的关于人工智能的长篇博客文章,指出当前的AI基础设施建设仍处于极早期阶段。他强调,尽管目前行业已经投入了数千亿美元,但未来仍需要数万亿美元的持续投资来完善数据中心和相关底层设施。这是他自2016年以来发表的第七篇公开长文,阐述了对AI发展速度、访问权限以及治理模式的看法。

NVIDIA辟谣RTX 50系列停产:全系正常供给 缺货是显存供给拖后腿

近日,关于NVIDIAGeForceRTX5070Ti等型号已停产的消息在网上传得沸沸扬扬,甚至有媒体援引华硕内部人士称相关产品已被列入EOL(生命周期结束)。对此,权威媒体Wccftech联合多方信源调查后确认:RTX50系列全线产品均未停产,也无任何型号被取消或降级计划。

一代神卡重出江湖 NVIDIA计算重启RTX 3060供给

据@hongxing2020最新透露,NVIDIA已通知其合作伙伴,RTX3060将在2026年第一季度重新投入生产。这一决策背后的推手正是席卷全球的DRAM短缺危机,新一代RTX50采用的GDDR7显存不仅成本飙升,且供应极度匮乏,导致其量产和售价面临巨大压力。

黄仁勋盛赞OpenClaw:堪比Windows影响小我计算

据《商业内幕》报道,英伟达CEO黄仁勋周一在GTC大会上盛赞了AI开源智能体OpenClaw,称企业无法忽视OpenClaw带来的变革时刻。“当今全球每一家企业都必须制定OpenClaw战略,制定智能体系统战略,”黄仁勋表示,“这是新的计算机形态。”

官方庆贺GeForce 3出生25周年 全球首款可编程着色器GPU

NVIDIA官方罕见地高调庆祝了一款GPU的生日,它就是GeForce3,已经发布整整25年了!GeForce3的特殊之处在于,它是全球首款支持可编程着色器的GPU,标志着显卡架构从固定功能管线,转向可编程管线的历史性飞跃。这一变革,在《上古卷轴3:晨风》《毁灭战士3》《马克思·佩恩》等众多开创性游戏的诞生中,发挥了关键作用,为现代游戏图形技术奠定了基础。

英伟达筹划推出整合Groq技巧的全新芯片 OpenAI是大年夜客户

英伟达计划发布一款专为OpenAI及其他客户定制的全新处理器,助力打造更快、更高效的工具。这是其业务的重大调整,或将重新定义AI竞赛格局。据知情人士透露,该公司正在为AI推理计算设计全新系统——这类计算负责让AI模型响应用户请求。这款新平台将于下月在圣何塞举办的英伟达GTC开发者大会上正式公布,将整合初创公司Groq设计的芯片。

NVIDIA宣布全新Rosa CPU 估计2028年宣布

NVIDIACPU处理器正在从内部自用,转向内外兼备,既自己用,也对外卖。这一转变就从当下的VeraCPU开始,基于Arm指令集、自研架构、72核心,结合空间多线程、高速互连等创新技术,号称IPC性能提升1.5倍、单线程性能无敌、多线程效率奇高。

RTX 3060显卡复生期近 回归7nm等旧工艺不太可能

由于内存涨价,今年的PC市场可能会出现以前想都不敢想的情况,停产多年的经典型号都要复活,AMD有锐龙75800X3D,NVIDIA也有RTX3060显卡归来。作为史上最成功的60系显卡,RTX3060其实也不算多远,目前的性能还很能打,1080p下畅玩主流3A游戏问题不大,光追和AI性能落后一些放在当前来看可能还是好事。