Zerostack – A Unix-inspired coding agent written in pure Rust
564 points • 2 days agoArticle Link

zerostack 是用 Rust 编写的极简编码代理,追求低内存占用和高性能。它支持多种 AI 提供商(包括 OpenRouter 、 OpenAI 、 Anthropic 、 Gemini 、 Ollama 及自定义提供商),提供文件操作、受权限控制的 bash 执行、会话管理和支持 Markdown 渲染的终端 UI 。代码量约 7,000 行,空会话内存占用约 8MB,工作时约 12MB,二进制体积约 8.9MB 。

OpenAI and Government of Malta partner to roll out ChatGPT Plus to all citizens
328 points • 2 days agoArticle Link

OpenAI 与 the Government of Malta 宣布了一项里程碑式合作——名为 "AI for All" 的计划,将为所有 Malta 公民免费提供一年的 ChatGPT Plus 使用权限。这是由国家政府推动的全球首例。 OpenAI 首席执行官 George Osborne 表示,他们将智能视为一种类似电力的普遍公共服务,应该不分背景、人人可及。此项计划的核心是一门由 the University of Malta 专门设计的 AI 素养课程。

Halt and Catch Fire
208 points • 2 days agoArticle Link

"Halt and Catch Fire"(HCF)最初是程序员之间的玩笑用语,用来形容那些会让 CPU 停止正常工作、必须重启才能恢复的机器码指令。尽管 AMC 的同名剧集讲的是计算机行业,这个术语本身却更早产生,源自工程师的笑话。它成了一个总称,用来指未记录或无效的操作码导致处理器死锁、用于模拟挂起的测试模式,以及真实存在的硬件缺陷。这种幽默沿袭了像 ADD 、 JMP 这类三字母汇编助记符的风格,类似的例子还有 EPI(Execute Programmer Immediately)和 DC(Divide and Conquer)。

Kioxia and Dell cram 10 PB into slim 2RU server
138 points • 2 days agoArticle Link

Kioxia 与 Dell 合作,推出了一款超高密度存储服务器:在仅 2RU 的机箱内集成了约 10 PB 的闪存容量。 Dell PowerEdge R7725xd 服务器配备 40 块 Kioxia LC9 E3.L 规格的 NVMe SSD,每块容量为 245.76 TB,总容量约为 9.8 PB;系统采用 AMD EPYC 9005 处理器,并可支持多达五块 400 Gbps 网卡以实现高速数据传输。 Dell 的 Arun Narayanan 指出,这一组合在不牺牲性能的前提下,提供了扩展 AI 基础设施所需的存储密度和能效。若在一个机架中部署 20 台此类服务器,理论总存储可达约 196 PB 。

HTML Lists
356 points • 2 days agoArticle Link

文章深入探讨了五种 HTML 列表类型,提醒开发者不要只局限于无序列表和有序列表。选择合适的列表更多是关于语义和含义,而不是仅仅为了视觉呈现。作者给出了一套决策框架:对用户输入字段使用控件列表;当顺序重要时使用有序列表;对键值对使用描述列表;对 UI 控件使用菜单;无序列表则作为默认的通用选择。

DeepSeek-V4-Flash means LLM steering is interesting again
273 points • 2 days agoArticle Link

LLM 引导技术因 DeepSeek-V4-Flash 的出现又重新受到关注。这款开源模型足够强大,在代理型编码任务上能与一些低端前沿模型竞争。由于引导需直接访问本地模型的内部激活值,过去对大多数工程师而言并不现实。 DeepSeek-V4-Flash 改变了这一局面,开发者 antirez 已在 DwarfStar 4(为该模型特别精简的 llama.cpp 分支)中加入了引导支持。尽管目前的实现还很基础,该项目仅上线八天,但值得持续关注。

SANA-WM, a 2.6B open-source world model for 1-minute 720p video
401 points • 2 days agoArticle Link

SANA-WM 是 NVIDIA 研究人员开发的一款 26 亿参数开源世界模型,能够从单张起始图像和相机轨迹生成高保真 720p 、最长可达一分钟的视频。该模型兼顾效率与质量:只需 64 块 H100 GPU 训练 15 天,推理时仅需单块 GPU 。其蒸馏版在 RTX 5090 上配合 NVFP4 量化,仅需 34 秒就能对一段 60 秒的 720p 视频完成去噪,使分钟级世界建模更容易普及。

Greek Alphabet Cards
153 points • 2 days agoArticle Link

一位居住在中国的父亲制作了一套希腊字母卡片,通过视觉联想帮助年幼的孩子学习希腊语。核心理念是把每个物体画成与其名称所对应的希腊字母在形状上相似,形成双重记忆:字母的形状联想起物体,物体的名称又反过来强化对字母的记忆。研究表明,这种方法比死记硬背能更快地让孩子掌握字母表。

Accelerando (2005)
331 points • 2 days agoArticle Link

Failed to crawl the webpage.

Δ-Mem: Efficient Online Memory for Large Language Models
238 points • 3 days agoArticle Link

本文提出了 δ-mem,一种轻量级的记忆机制,旨在帮助大型语言模型在长期助手和智能体系统中累积并重用历史信息。不同于扩展上下文窗口(既计算开销大又常常效果有限),δ-mem 在冻结的全注意力主干上增加了一个紧凑的在线联想记忆状态。该机制将历史信息压缩为固定大小的状态矩阵,并通过 delta 规则进行更新;在文本生成时,从该记忆读出信息,为主干的注意力计算提供低秩修正。