HN Hot Posts

CUDA Books

230 points • 1 day ago • Article Link

这是一份精选的 CUDA 编程书目，覆盖从入门到高级的资料，包含 C++ 与 Python 相关书籍，侧重架构、性能优化以及 2024–2026 年的最新出版物。书目按类别组织：初学者指南、核心架构、实战手册、高级优化、 Python 与高层 CUDA，以及近年出版物。

这是一份精选的 CUDA 编程书目，覆盖从入门到高级的资料，包含 C++ 与 Python 相关书籍，侧重架构、性能优化以及 2024–2026 年的最新出版物。书目按类别组织：初学者指南、核心架构、实战手册、高级优化、 Python 与高层 CUDA，以及近年出版物。

入门推荐包括 "CUDA by Example"（2010）、 "Learn CUDA Programming"（2019）和 "CUDA for Engineers"（2016），均以示例为主，适合初学者。核心架构类以 "Programming Massively Parallel Processors"（3rd ed., 2022）为代表，常被高校作为 GPU 架构的权威教材。

实战类有 "Programming in Parallel with CUDA"（2022），包含真实科学示例；"Professional CUDA C Programming"（2014），面向生产环境的多 GPU 与 streams 使用；以及 "GPU Parallel Program Development Using CUDA"（2018），侧重 cuBLAS 、 Thrust 等库的应用。高级参考如 "The CUDA Handbook"（2013）提供深入 API 细节，"CUDA Programming"（2013）覆盖并行算法与优化，"CUDA Application Design and Development"（2011）则面向研究型应用设计。

关注 Python 的书籍包括 "Hands-On GPU Programming with Python and CUDA"（2018），介绍 Numba 和 CuPy；以及 "GPU Programming with C++ and CUDA"（2024），涉及现代 C++20 与 Python 互操作。近年重要出版物（2022–2026）有多部更新版与专题书，如 "CUDA C++ Optimization"（2024）、 "CUDA C++ Debugging"（2024）和 "High-Performance Computing with C++26 and CUDA 13"（2026）。

由于 CUDA 变动快速，建议将这些书籍与官方免费文档 CUDA C++ Programming Guide（v13.x, 2026）配合阅读。欢迎通过 pull request 提交推荐，优先收录 2018 年以后的书籍或仍具大量示例代码的经典著作。该仓库属于 Awesome 系列，并附有关于 CUDA 工具、 GPU 资源与并行计算的相关列表。

60 comments • Comments Link

• 《 CUDA Programming: A Developer's Guide to Parallel Computing with GPUs 》被推荐为最佳入门书，而《 Massively Parallel Processors: A Hands-on Approach 》因大量错误和令人困惑的解释被批评，《 CUDA by Example 》则被认为过于简化并且对硬件架构抽象过度。

• 一本新的 CUDA 书正在开发中，采用自下而上的写作思路，从硬件工程入手，逐步深入 NVIDIA 硬件优化，覆盖除图算法之外的主要算法，基于一门成功的大学课程编写。

• 尽管推荐书籍中有一本出版于 2012 年，但它仍然适用，因为 GPU 硬件和 CUDA 语言没有发生根本性变化，它为通过其他资源学习现代特性提供了坚实基础。

• Warp 被推荐为基于 Python 的现代化 CUDA 开发替代方案，允许在 Python 中直接编写 CUDA kernel，学习曲线较平缓，但由于相对较新，尚难以进入书本教材。

• 人们对涵盖 cuTile 等新兴范式的资料表现出兴趣，这反映出当前教学资源在介绍 GPU 编程新技术方面存在空白。

• 越来越多的 NVIDIA 内部人员建议不要编写自定义 CUDA kernel，除非这是 NVIDIA 的全职工作，他们推荐使用更高级别的库；但也有人认为这种建议是推动供应商锁定的一种方式。

• 反对编写自定义 kernel 的建议被比作建议用 Python 代替 C，或用 Unreal 的授权而不是自己构建渲染引擎，强调了为特定需求选择合适工具的重要性。

• NVIDIA 未能为 sm120（非数据中心 GPU）发布可用的 kernel，尽管 Blackwell 已经发布，这表明 NVIDIA 并不总是平等地优先支持各个硬件细分市场，依赖其官方工具存在一定风险。

• 是否编写自定义 CUDA kernel 应基于具体需求：当高级库能满足需求时就使用高级库；但在学习、需要底层控制、进行微观优化或通过 kernel 融合减少内存流量时，编写自定义 kernel 仍然必要。

• 《 AI Systems Performance Engineering 》被提及为相关读物，虽然它并不专注于 CUDA，但表明更广泛的性能工程知识非常有价值。

• OLCF 的 CUDA 培训系列被推荐为良好的入门资源，覆盖基础内容，能让后续阅读更容易理解。

• 指向《 Programming Massively Parallel Processors 》第三版的链接已损坏，目前该书已出到第四版。

• 使用 LLM 提高即时生产力的做法引发了对通过传统书籍进行深入学习的质疑，这反映了行业更倾向于 prompt engineering 而非打牢基础编码技能的趋势。

• 大家普遍感到企业更青睐 prompt engineering 而不是传统编码技能，这在生产压力与深入技术学习之间造成了张力。

讨论显示，基础的 GPU 编程知识仍具有持久价值，但业界同时在推动更高级别的抽象和 LLM 驱动的生产力。虽然有几本书被推荐用于学习 CUDA，但共识是：出于优化和学习等特定用途，编写自定义 kernel 仍然重要，尽管供应商倾向于推广更高级别的库。社区对 Warp 、 cuTile 等新工具表现出兴趣，表明实践在不断演进，同时也对供应商锁定和 NVIDIA 对不同硬件支持不一致表示担忧。将 LLM 用于提高即时产能的压力与掌握 GPU 编程所需的深度、耗时学习之间存在明显冲突。

I don't think AI will make your processes go faster

661 points • 1 day ago • Article Link

作者认为，人工智能并不会自动加快组织流程，这挑战了仅靠引入 AI 工具就能提升吞吐量的普遍认知。重读 The Toyota Way 和 The Goal 后，作者指出流程优化常被过度简化并且方向错误：关键不在于盲目加速最慢的步骤，而是要弄清楚该步骤为何缓慢。

作者认为，人工智能并不会自动加快组织流程，这挑战了仅靠引入 AI 工具就能提升吞吐量的普遍认知。重读 The Toyota Way 和 The Goal 后，作者指出流程优化常被过度简化并且方向错误：关键不在于盲目加速最慢的步骤，而是要弄清楚该步骤为何缓慢。

作者用甘特图说明典型的项目进度，表面上看软件开发是耗时最长的环节，似乎成了显而易见的瓶颈，但真正的问题常常出在上游。漫长的开发周期往往源于需求不清或不完整，像"销售完成后给用户发送邮件"这种模糊需求若没有对邮件内容、异常处理和完成标准的明确规定，开发者就会把大量时间花在澄清问题上，而不是在实现功能上。

文章批判了那种指望 AI 生成代码就能绕开这些问题、让开发者转为项目经理的想法。实际上，AI 生成正确代码仍然需要极其详尽和精确的指令；AI 在编码上节省的时间常被对更详尽文档和领域专家密集指导的需求所抵消。这也反映了人类开发者长期以来对更清晰、更全面项目说明的渴望。

结论是，要加快流程，必须确保执行者拥有完成工作所需的一切条件，也就是为瓶颈提供高质量、可预测的输入。无论是法律审批还是软件开发，如果根本问题是信息不完整或不清楚，增加人手或 AI 工具都无济于事。流程自动化的第一步应是提升输入的质量与清晰度，而不是单纯追求更快的执行。

445 comments • Comments Link

模糊的需求一直是软件开发的瓶颈，而大语言模型（LLM）非但没有解决这个问题，反而在某种程度上放大了它。和人类开发者一样，LLM 也需要精确的指令来构建正确的产品；不同的是，人类团队通常会质疑模糊的需求，而 LLM 往往会欣然生成看起来合理但可能完全偏离目标的代码。

当面对模糊性时，LLM 的反应和人类开发者不同。对于"获取数据并交给用户"这样的含糊指令，人类会提出澄清性问题，而 LLM 更倾向于基于假设直接生成代码。这种行为在快速原型阶段可能有利，能让用户立刻看到具体成果并做出反馈；但在安全性、可维护性等终端用户不可见的关键问题上却很危险。

值得注意的是，较新的模型（如 ChatGPT 5.5）在收到模糊提示时开始主动提出澄清问题，询问数据来源、格式等要求。这是一种改进，但它仍然假定用户知道要回答哪些问题、哪些细节重要。

产品经理往往喜欢 LLM，因为这些工具不像人类开发者那样挑战模糊需求。程序员会追问边缘情况并要求明确性，但 LLM 接受模糊输入并生成看似令人信服的输出——问题只有在细致审查后才会显现。这造成了一种危险动态：糟糕的需求被转换成看起来合理但可能错误的实现。

问题的根源不仅在于需求是否明确。即便有良好的规格说明，LLM 仍可能给出模糊的解读。要靠这项技术替代对需求进行严密思考的承诺还远未实现。结果常常是一系列平庸的妥协，而非追求卓越的产品，因为技术本身无法在无人类引导的情况下弥合人类意图与实现之间的差距。

几十年前，Fred Brooks 在其 1986 年的论文《没有银弹》中就预见了这一模式。他描述了专家系统和自动化编程在窄领域内可能带来的初步前景，但在扩展时只能带来有限的生产力提升。当前对 LLM 的体验与他的预测非常吻合。

LLM 擅长从现有代码中复制模式，但要高效工作仍需要类似开发者的规格说明和任务拆解。当问题有大量训练数据支撑时，它们表现最佳。这意味着 LLM 最适用于已有解决方案的常见问题，而不擅长需要创造性思维的新挑战。

一个实际案例说明了 AI 辅助开发的潜力与局限。一位开发者使用 Claude 在几周内重建了一个 Hacker News 克隆，性能达到了生产版本的五分之一以内。但这过程需要对 AI 输出进行严格管理以防代码库变得不可读，最终成果仍缺失原始版本中大约一百个功能。

LLM 的价值在不同组织中差异很大。对于能为每个角色聘请专家的大公司来说，AI 带来的增益相对有限；但对小团队和独立开发者而言，能让一个人勉强担当多个角色，相较于完全没有能力来说，已是巨大的飞跃。

AI 对软件开发的最大影响可能并不是单纯加速编码，而是让组织能以更精简的方式运作、减少人员，从而缓解大型企业常见的角色错位和沟通问题。生产力提升更多来自组织结构的简化，而非单纯的编码速度提升。

当前用 AI 开发的方式更像瀑布式开发或自动补全，这两种模式都不是理想的协作方式。真正意义上的人机结对编程——人类与机器迭代并肩工作——仍然难以实现，但若能做到，有望同时提高速度与准确性。

实际使用 AI 编码助手的经验显示，其效用比炒作所宣称的要温和得多。开发者在最初用 AI 快速恢复对不熟悉语言的熟练度后，常会进入一个阶段：最后的 10% 工作往往占用 90% 的时间。整体提速 10%–20% 比较常见，虽然有价值，但远未达到革命性的程度。

总体上，讨论揭示了 AI 真正能力与膨胀期望之间的张力。 LLM 在某些方面确实能加速开发，尤其是对定义明确的问题和缺乏专业角色的小团队。但这项技术更多是放大了需求明确性和组织功能障碍的问题，而非解决它们。 AI 最成功的应用通常需要经验丰富的开发者提供严格监督和领域专业知识，把工具当作倍增器而非替代判断的人。更广泛的组织影响——通过简化结构来减少大型企业固有的错位——可能最终比单纯提升编码速度更为重要。

Apple Silicon costs more than OpenRouter

344 points • 1 day ago • Article Link

在苹果芯片上本地运行大型语言模型时，真正的成本不是电费，而是硬件。作者分析了在配备 64GB 内存的 M5 MacBook Pro 上运行 Gemma 4 31b 的经济性，该机零售价为 4299 美元。在满载功耗 50–100 瓦、电价约 0.18–0.20 美元 / 千瓦时的情况下，每小时电费约 0.02 美元；若全天满负荷推理，每天约 0.48 美元，几乎可以忽略。真正的开销是机器本身及其折旧速度。

在苹果芯片上本地运行大型语言模型时，真正的成本不是电费，而是硬件。作者分析了在配备 64GB 内存的 M5 MacBook Pro 上运行 Gemma 4 31b 的经济性，该机零售价为 4299 美元。在满载功耗 50–100 瓦、电价约 0.18–0.20 美元 / 千瓦时的情况下，每小时电费约 0.02 美元；若全天满负荷推理，每天约 0.48 美元，几乎可以忽略。真正的开销是机器本身及其折旧速度。

作者考虑了硬件使用寿命为 3 年、 5 年和 10 年的三种情形。以 5 年为中位数时，机器每小时成本约为 0.098 美元，合并电费后约为 0.12 美元 / 小时。关键在于这段时间内能处理多少 token 。对于类似 Gemma4:31b 这样的大模型，M5 Max 的速度大约在每秒 10 到 40 个 token 之间。按每秒 10 个 token 算，每小时能处理 36000 个 token，相应每百万 token 的成本在 1.61 到 4.79 美元之间（取决于寿命假设）。按每秒 40 个 token 且寿命为 10 年估算，每百万 token 的成本可降到约 0.40 美元。

相比之下，OpenRouter 上运行 Gemma4 31b 的价格约为每百万 token 0.38 到 0.50 美元。在最乐观的假设下，MacBook Pro 勉强能与云端价格持平；但在更现实的假设下，苹果芯片上的本地推理成本大约是从 OpenRouter 租用算力的三倍。而且 OpenRouter 的供应商通常能达到每秒 60 到 70 个 token，远快于 M5 Max 的本地表现。

从纯成本角度看结论很清楚：对于使用工作笔记本的人来说，他们的薪水远高于 token 成本（大约高出一千倍），因此付费使用 Anthropic 或通过 OpenRouter 租用算力比把一切都放在本地更划算。不过作者仍觉得值得惊讶的是，消费级笔记本居然能运行出接近 Anthropic Sonnet 级别性能的模型，哪怕目前在经济性上还不完全划算。

291 comments • Comments Link

• 前沿 AI 公司以巨额亏损价格出售推理服务，烧掉数千亿美元抢占市场份额，并在被迫提价前不计成本，这使个人在纯成本竞争中几乎没有胜算。

• 云服务商通过工业电价、批发硬件定价、多租户利用率和专用芯片获得远超个人设备的效率，使得消费级硬件在每 token 成本上几乎无法竞争。

• 整个推理栈受到风险资本补贴：例如 OpenRouter 以 13 亿美元估值融资，国内模型如 DeepSeek 和 Qwen 采取激进定价，因为北京系资本更看重市场份额而非利润率，这意味着当前的低价并非稳定均衡。

• Anthropic 和 OpenAI 等公司宣称"推理盈利"的说法站不住脚：他们往往忽视持续训练所需的投入、资本成本、折旧以及用户流失带来的费用，这些都需要数十亿美元，使得所谓"盈利的推理"不过是一种误导性的成本隔离。

• 用"种橙子"的比喻并不恰当：推理更像是在卖橙子，模型构建才是种植果园；真实的动态更像跑步机——停止训练就会过时，而不是一次性投资就一劳永逸。

• 本地推理在经济上合理的主要情形是硬件已被用于其他用途：在现有笔记本上运行模型的边际成本基本上只是电费，而不是再买一台新机器的全部花费。

• 本地模型的主要价值并非单纯节省成本，而是控制权、隐私、保密性、数据主权、抗中断能力，以及免受模型贬值或意外定价调整的影响；这些好处无法通过简单的每 token 成本比较体现。

• 对于典型的智能体工作负载，输入 token 往往占主导成本，通常比输出 token 高出约十倍。本地推理能使输入 token 成本几乎为零，且本地提示缓存更可靠，这显著改变了这些场景中对本地部署有利的成本计算。

• 将 MacBook Pro 与云服务直接比较存在缺陷，因为这种比较把整台笔记本的成本全部归于推理；而大多数用户本来就拥有硬件，笔记本还提供超出 token 生成的通用计算价值。

• 像 Qwen 3.6 27B 这样的中小型开源模型在许多基准上正缩小与大型前沿模型的差距，并能在消费级硬件上以可用速度运行，这使得本地推理成为有吸引力的选择，挑战了"云始终更好"的假设。

讨论揭示了本地与云 AI 推理之间，基于纯每 token 成本的经济学与更广泛价值考量之间的根本张力。从每 token 成本角度看，云推理凭借规模经济、工业化效率和大量风投补贴占优，使得当前定价长期看并不稳定，因此云端明显有优势。然而，参与者普遍强调，把比较简化为单纯成本对许多用户而言是失之偏颇的。隐私、数据主权、抗中断、对模型行为的控制以及避免被供应商锁定，都是云服务难以提供的重大非货币价值。更为细致的观点认为：当硬件已被占有、工作负载对隐私高度敏感或以输入密集型智能体任务为主时，本地推理最有意义；而在追求原始性能、访问最前沿模型或优先便利性的用户群体中，云端仍更具优势。共识是，选择不仅仅取决于经济性，而是高度依赖个人优先级——成本只是众多因素之一，还包括信任、保密性和长期可预测性。

Native all the way, until you need text

446 points • 1 day ago • Article Link

作者是位拥有近二十年 macOS 和 iOS 开发经验的资深工程师，坦率地分享了在用苹果原生框架构建富文本界面时遇到的局限。他尝试用纯 Swift 和 SwiftUI 实现一个支持 Markdown 的简单聊天功能，却屡屡受阻：SwiftUI 对基础界面足够，但在复杂文本处理上力不从心，像是无法从其原语上直接选中整个由 Markdown 组成的文档，这类限制是其设计所致。

作者是位拥有近二十年 macOS 和 iOS 开发经验的资深工程师，坦率地分享了在用苹果原生框架构建富文本界面时遇到的局限。他尝试用纯 Swift 和 SwiftUI 实现一个支持 Markdown 的简单聊天功能，却屡屡受阻：SwiftUI 对基础界面足够，但在复杂文本处理上力不从心，像是无法从其原语上直接选中整个由 Markdown 组成的文档，这类限制是其设计所致。

为此他尝试了其他原生方案，先从 NSTextView 和 TextKit 2 入手，但要把它们和现有的 SwiftUI 代码整合非常困难，而且流式文本（现代聊天的常见需求）会引起明显的 CPU 峰值。接着他试了成熟且性能优良的 NSCollectionView，却发现单元格会不可预测地闪烁，仍然是设计层面的问题。即便用纯 TextKit 2 做底层原型，性能能接受，但在文本流式传输和与现代开发实践的兼容性方面仍然捉襟见肘。

令他最沮丧的是，要把 macOS 上那些被期望的文本行为做齐做全，需要投入巨大的工程量：上下文菜单、词典查询、平滑的选区、无障碍支持和直观的文本交互等，可能要耗费数月时间。于是他试用了 WebKit 来渲染 Markdown，发现排版和可控性都很好。但最出乎意料的是最后一次实验：他生成了一个简单的 Electron 项目，本以为会有妥协，结果却发现文本操作、 Markdown 渲染和排版开箱即用且表现出色，性能甚至超过了他最好的原生实现。

基于这一系列经验，他不得不做出一个艰难的结论：即便在 SwiftUI 、 AppKit 、 TextKit 和 WebKit 都很精通的情况下，他也无法仅用苹果的原生工具构建一个功能齐全、面向长篇富文本且排版灵活的聊天界面。对于以长篇富文本和灵活排版为核心的应用——这是当下主流的界面模式——苹果原生 SDK 很可能不再是优势而成了限制。他同时承认 Swift 在性能关键场景下依然出色，但像 Electron 或 React Native 这样的框架通过原生互操作性能提供相当的性能，同时在文本处理和渲染模型上更胜一筹。最终，他的体会是：针对这个特定且关键的使用场景，基于 Web 的技术目前没有可行的原生替代方案。

301 comments • Comments Link

- 在经历了十多年针对 GPU 加速和复杂 Web 应用的实践与压力测试后，浏览器渲染引擎已经显著成熟，因此单纯以性能为由支持原生 API 的论点不再像过去那样有说服力。

- SwiftUI 受到性能方面的批评：有人指出，苹果自家的 System Preferences 在切换分区时会卡顿，尽管争论焦点在于这是 SwiftUI 的问题还是更广泛的原生开发问题。

- SwiftUI 与原生开发之间的差异很重要：正确设计的 Qt C++/QML 应用相比类似的 Web 应用，通常在性能和内存使用上有明显优势。

- 报道称，SwiftUI 在 xOS 26 中性能有所改善，而且大多数非平凡的 SwiftUI 应用都会结合使用 UIKit/AppKit 来补充 SwiftUI 尚不完善的功能。

- 跨平台的本地 UI 开发仍然充满挑战；对于希望其应用能在未来数十年内无需重写而保持原生体验的开发者，wxWidgets 被建议为更稳健的长期选择。

- 尽管浏览器引擎已成熟，原生应用与基于浏览器的应用在性能上仍存在显著差异，尤其是在旧款 Chromebook 等低功耗设备上，浏览器运行表现较差。

- SwiftUI 在对大型数据集的增量更新方面存在困难，这也是苹果历史上缺乏可用 SwiftUI 文本视图组件的原因之一，虽然后来在 2025 年随着增强型 TextEditor 的推出有所改善。

- 内存使用已成为优先选择原生 API 而非 Web 视图的主要原因之一：即便原始性能差距缩小，内存效率仍是显著的分水岭。

- 像 VS Code 这样的复杂应用在性能上仍低于原生应用的上限，说明简单的 Web 应用或许能匹配原生性能，但高要求的应用仍然受益于原生开发。

- V8 通过把 JavaScript 做到极快而非在浏览器中运行原生代码的路径取得成功；在渲染方面的类似进展也使得 Web 技术对大多数 GUI 需求（除去专门的硬件密集型应用）成为可行选择。

- 在性能和资源消耗方面，AppKit 仍优于 SwiftUI 和 Web 渲染，这表明老旧的苹果框架对高要求应用仍更为适合。

- 富文本渲染（包括恰当的双向文本支持、字形塑造、混合内容和自然选择）仍是软件中最难的问题之一，浏览器引擎是唯一能正确处理所有复杂性的实现。

- 在 macOS 上用 WebKit 渲染 Markdown 从技术上是合适的：Markdown 本质上会被转成 HTML，而 WebKit 是原生的 HTML 渲染器，但每个 WKWebView 实例都带来显著的内存和性能开销。

- Web 和原生 UI 工具包之间的成熟度差距源自投资模式：大量开发工作流向 Web 技术，因为它们"能直接工作"，形成了正反馈循环，导致原生框架受关注较少，难以完善。

- iOS 开发的历史背景很重要：即便在 Objective-C/UIKit 时代，实现段落中可点击链接这类基本任务也非常困难，开发者因此期待 SwiftUI 在文本处理方面能达到与 Web 相当的能力。

- HTML/CSS 依然是生产力和性能最强的 GUI 系统：Web 作为文档呈现机制的本质使其在文本密集型应用中具有天然优势。

- 对于需要流式传输 Markdown 并支持文本选择的 AI 聊天应用，原生方案仍存在问题：多个文本编辑组件在渲染时会出现卡顿和 UI 锁定，因而尽管有内存和性能代价，Web 视图成为更务实的选择。

- macOS 上的 TextKit 2 公共 API 存在重大问题，开发者不得不为一些本不应出现的问题做变通，部分人甚至在探索完全绕开 TextKit 的方案。

- 现代苹果开发栈在为聊天型 UI 设计架构时显得尴尬：NSTextView 不能自然地与 SwiftUI 整合，迫使开发者要么深度依赖 AppKit，要么与 SwiftUI 的数据模型抗争。

- 跨平台原生 GUI 开发相比 Web 开发仍属于利基市场；Chrome 代表了全球资金最充足的软件项目，这解释了为什么 Web 技术"能直接工作"，而原生框架在一致性和完善度上难以匹敌。

- Electron 在老旧硬件上表现欠佳；虽然原生 UI 框架自身也有问题，但追求高性能文本渲染的开发者可能需要降低对字体复杂性的要求，并避免带有 JavaScript 生态包袱的基于 JSON 的配置。

- 性能的定义因用例而异：一些开发者更看重流式传输时的稳定 FPS 和平滑滚动，而不是极致的内存效率，认为为节省数百兆甚至数 GB 内存而牺牲用户体验对日常使用数小时的应用并不划算。

- 原生移动开发的开发者体验仍然较差：像创建平滑滚动元素这样的简单任务可能需要数小时的变通和大量 Stack Overflow 研究，这也推动开发者转向虽有开销但更高效的 Web 技术。

讨论表明，原生技术与 Web 技术之间的性能差距在许多场景已明显缩小，但关键差异依然存在。浏览器渲染引擎已能处理许多原生框架仍在挣扎的复杂文本渲染与布局任务，尤其是富文本、 Markdown 和流式内容；但这并不意味着原生开发会过时，因为在低功耗设备上的内存效率和需要深度平台集成的专业应用仍倾向于原生做法。核心矛盾在于：Web 技术在文本处理能力和生态成熟度上占优，而原生开发在资源效率和平台集成上有优势。 SwiftUI 因性能问题和 API 不完整受到批评，但对一些场景来说它仍是方便的选择，并可在需要时由 AppKit/UIKit 补充。对于像 AI 聊天界面这样的文本密集型应用，Web 视图已成为务实之选，尽管在资源受限或需深度平台集成的环境中，原生开发仍然是首选。

Every AI Subscription Is a Ticking Time Bomb for Enterprise

410 points • 1 day ago • Article Link

目前，所有主要 AI 提供商在企业订阅上都在亏损，而且这是刻意为之。 OpenAI 、 Anthropic 、 Google 等公司在推行一场前所未有的行业性亏本策略，以远低于真实服务成本的价格出售强大 AI 能力。企业为这些订阅支付的费用与实际交付成本之间不是小幅差异，而是巨大的裂口；凡是把关键工作流程建立在这些补贴价格之上的组织，都站在悬崖边上。

目前，所有主要 AI 提供商在企业订阅上都在亏损，而且这是刻意为之。 OpenAI 、 Anthropic 、 Google 等公司在推行一场前所未有的行业性亏本策略，以远低于真实服务成本的价格出售强大 AI 能力。企业为这些订阅支付的费用与实际交付成本之间不是小幅差异，而是巨大的裂口；凡是把关键工作流程建立在这些补贴价格之上的组织，都站在悬崖边上。

数据很直白。 Claude Pro 每月 20 美元，但一个重度使用它做文档分析、撰写报告和处理数据的知识工作者，每周就可能消耗数百万 token 。按真实 API 费用计算，同样工作量每个席位每月要花 200 到 400 美元。据报道，微软在 GitHub Copilot 上每位用户每月亏损超过 20 美元，重度用户在 10 美元订阅下的实际成本可达 80 美元。有分析发现，Anthropic 用户每赚取 1 美元订阅收入，需消耗高达 8 美元的算力成本。 ChatGPT Plus 三年一直维持每月 20 美元，尽管模型能力和功能大幅提升，价格却未调整；那些在此期间锁定价格的企业买家拿到的是无法长期维持的便宜票。

所有主要厂商玩的都是同一套。 Google 把 Gemini Advanced 按消费级价格捆绑进 Google One，但对开发者却按真实 API 价格收费。 Meta 免费放出 Llama，完全靠广告收入补贴数亿次查询。 xAI 的 Grok 把 API 价压到每百万输入 token 0.20 美元，明显是以亏损换取市场份额的策略。行业普遍模式是：先用低价吸引采用、锁定企业、让 AI 成为日常工作负载，再慢慢处理账单。对企业而言，"以后"正在到来。据称 OpenAI 正从消费者业务向企业业务倾斜，因为企业端的单位经济稍好一些，而在冲刺 IPO 的过程中公司也错过了关键的营收和用户目标。

向智能体（agentic）AI 的转变，把原本就不合理的补贴算术变成了灾难性的账目。聊天机器人时代，token 消耗较可预测，一次对话可能只消耗几千 token；但智能体会自主长时间运行，token 消耗远超对话场景。有用户反映，在不到 90 分钟内就耗尽了五小时速率额度。 GitHub 决定在 2026 年 6 月 1 日改为按使用计费，正是因为扁平订阅在智能体负载下崩溃。当多个 AI 代理并行处理同一项目时，token 消耗不是对话使用的简单倍增，而是呈数量级增长，而相应席位的订阅价却没变。

大多数企业尚未做好准备。过去两年里，成千上万家公司已将 AI 订阅深度嵌入营销、工程、研发、客户成功和财务等业务流程。这些已不再是试验，而是支撑业务运转的核心流程，大部分公司仍按当前订阅价做预算。一个 50 人团队用 Claude Pro 每月只要 1000 美元，在损益表上只是个小数目；但按等量 API 使用计费，那支团队每月要花 1.5 万到 4 万美元。价格一旦调整，那些把 20 美元 / 月的 AI 视为永久廉价投入的公司，将面临未预算的巨额账单，而此时相关工作流程已深度嵌入、难以拆除。 KPMG 发现，美国企业预计未来 12 个月平均 AI 支出为 2.07 亿美元，几乎是上一年的两倍；高盛的调查也显示，许多大公司已经大幅超支其 AI 预算。

推动重新定价的机制已在运转。 OpenAI 和 Anthropic 都在为 IPO 做准备。据报道，Anthropic 年化收入已超过 300 亿美元，高于 2025 年底的 90 亿美元；OpenAI 的收入轨迹约为 250 亿美元。但成本端则更为严峻。 OpenAI 预计到 2029 年累计现金消耗为 1150 亿美元，并承诺到 2030 年投入 6650 亿美元的算力支出。 Oracle 在一个财年内举债 430 亿美元为 OpenAI 建数据中心。公司一旦上市，缩小订阅价与实际成本之间差距就成了生死问题：公开市场要利润、分析师要合理的单位经济、投资者要不依赖无尽融资的盈利路径。要最快弥合差距，最直接的办法就是涨价、设限或转为按用量计费。

信号已经很清楚。 GitHub 将自 6 月 1 日起改为按使用量计费，用基于 token 的 AI Credits 取代固定费用的高级请求额度。微软在四年内已两次上调 Microsoft 365 价格，最新一轮直接与 AI 基础设施成本挂钩。 OpenAI 推出了 100 美元的 Pro 层，定位为重度用户的"真实"价格；Anthropic 每月 200 美元的 Max 层也预示着补贴结束后真实使用成本的可能水平。正如一位行业高管所言，AI 领域的圈地竞争规模巨大，主导这一新世界的代价同样巨大。将这些服务货币化并回收投资，将迫使商业模式和定价快速发生重大变化。

企业领导者现在就必须行动：审计各团队的实际 token 消耗，而不仅仅统计席位数；建立情景模型，测算在当前价格的 2 倍、 5 倍或 10 倍下 AI 成本的走向；在技术栈中构建供应商可选性，避免单一提供商的定价变动一夜之间毁掉预算；并在账单到来前与财务团队进行坦诚对话。如今企业为 AI 支付的价格与 18 个月后将要支付的价格之间的差距，很可能成为多数公司历史上最具破坏性的成本跳增之一。补贴时代正在走向终结，倒计时已经开始，而大多数企业甚至还没开始这场对话。

396 comments • Comments Link

• 关于"AI 订阅是定时炸弹"的核心论点在多方面被质疑。评论者指出，本地运行最前沿的模型需要极高的硬件配置（例如 1.5–6 Ti 的显存），在可预见的未来，云端托管在成本效率上仍优于本地部署；此外，本地模型普遍落后领先模型 6–18 个月，尽管计算效率可能提升，但硬件成本的下限仍然很高。

• 对 AI 公司靠代币销售是否盈利存在重大争议。有人引用 Brad Gerstner 的话说代币并非亏本出售，但反对者指出这忽略了庞大的研发、训练与基础设施开销。有证据表明，高达 70% 的算力支出用于研发，像 Anthropic 这样的公司尽管估值高企，仍在不断烧钱。

• 对商业模式的批评主要集中在补贴获客：AI 实验室用低于成本的价格锁定企业客户，期望日后提价以收回成本。但也有人认为，这与其说是对企业的"定时炸弹"，不如说是投资者承担的风险——若市场无法整合或实现盈利，投资者可能永远收不回数万亿美元的投入。

• 企业的付费模式使"订阅"论述更复杂。许多公司通过按使用量计费的 API（如经由 Azure 或 Bedrock）结算，而非固定订阅费。订阅在中小企业或影子 IT 中更常见，但大型企业通常谈判基于使用量的合同。真正的风险在于那些把补贴性 AI 深度嵌入核心工作流、却没有为未来成本变化做规划的组织。

• 开源和中国的模型（如 GLM 、 Kimi 、 DeepSeek）被视为潜在竞争压力，但在西方企业中的采用受限于地缘政治、法律和信任问题。即便在技术上可比，这类模型仍因数据主权和监管风险而难以被广泛接受，造成可负担且值得信赖的替代方案缺口。

• 模型架构效率的提升（例如更小的激活参数、更好的量化方法）有望逐步降低成本。像 Qwen 27B A3B 这种性能接近更大模型的例子表明，性价比会提升，可能推动更多本地或边缘部署，进而减少对集中式提供商的依赖。

• 讨论中反映出对 AI 炒作的普遍怀疑。多人将原文斥为"AI 废话"——戏剧化、论证薄弱，甚至可能是 AI 生成，批评点包括措辞重复、缺乏证据，以及未能区分消费者订阅与企业计费模式。

• 有观察者将此与历史科技周期类比：先以低价抢占市场，再转为按量计费，类似云计算的发展路径。也有人警告，如果当前以股权驱动、持续融资为特征的模式在实现可持续收入前崩溃，可能引发更广泛的债务或资本危机。

• 讨论中还含有文化层面的批评：AI 生成的语言（如"load-bearing"、"the unlock"）在企业场景常被视为表演性信号，领导层鼓励使用但技术人员往往嗤之以鼻，反映了关于真实性、技能贬值和沟通商品化的紧张关系。

• 尽管对成本与可持续性有所担忧，许多人承认 AI 工具确实能带来显著价值——尤其是像 Claude Code 或 Codex 这样的编码助手——即便这些工具在一定程度上被补贴。企业面临的挑战是如何在不陷入对不透明且可能波动的定价模式的不可逆依赖下，战略性地利用这些工具。

• 总体来看，讨论显示出对原文耸人听闻框架的强烈怀疑，参与者强调 AI 经济的复杂性、消费者与企业计费的差异，以及模型效率的持续演进。尽管担忧供应商提价与锁定风险是合理的，很多人认为真正的风险更多落在投资者一方，尤其是在开源替代方案和硬件改进持续重塑格局的背景下。对话还反映出人们对 AI 生成内容和企业术语日益增长的厌倦，呼唤更实证、务实的讨论。

Mozilla to UK regulators: VPNs are essential privacy and security tools

800 points • 2 days ago • Article Link

the UK's Department for Science, Innovation and Technology 正在就帮助年轻人应对数字世界征求意见，尤其关注用户规避 Online Safety Act 所要求的年龄验证问题。该部正在考虑的一项建议是对虚拟专用网络（VPN）设置年龄门槛。 Mozilla 在回应中明确表示：VPN 是至关重要的隐私与安全工具，不应被限制，尤其不能限制年轻人使用。

the UK's Department for Science, Innovation and Technology 正在就帮助年轻人应对数字世界征求意见，尤其关注用户规避 Online Safety Act 所要求的年龄验证问题。该部正在考虑的一项建议是对虚拟专用网络（VPN）设置年龄门槛。 Mozilla 在回应中明确表示：VPN 是至关重要的隐私与安全工具，不应被限制，尤其不能限制年轻人使用。

Mozilla 的立场基于其核心使命：互联网应保持开放与可及，在线隐私与安全是基本人权。虽然 Mozilla 承认保护未成年人是当下最紧迫的挑战之一，但它认为，诸如强制年龄验证或限制 VPN 访问等生硬手段并不能切实提升安全，反而会损害所有用户的基本权利，且无法解决根本问题。

VPN 为各年龄段用户提供重要保护：通过隐藏 IP 地址来保护位置信息、减少追踪并防止基于 IP 的画像。人们使用 VPN 的理由多种多样，从远程连接学校或公司网络，到规避审查等均属合法需要。虽然这些工具对活动家、异见人士和记者等脆弱群体尤为关键，但它们同样能提升每个人的基本在线安全。

年轻人在网络上面临特殊脆弱性，包括被追踪、被定向投放广告，以及个人数据在未获充分同意或缺乏透明度的情况下被商业化收集和处理。随着越来越多年轻人从更早年龄开始使用数字技术，限制他们获得 VPN 等隐私保护工具，反而与培养他们安全且熟练上网的目标相悖。要让年轻人形成自主性和负责任的数字习惯，应在他们接触网络时教授最佳实践以及必要的安全与隐私工具。

Mozilla 认为，与其对 VPN 等技术设限，不如把精力放在解决在线危害的根源：追究平台责任、鼓励负责任地使用家长控制功能，并通过社会各界共同参与的方式投资数字技能教育、促进数字福祉。 Mozilla 已向 the UK's Department for Science, Innovation and Technology 提交完整回应，敦促决策者在保护年轻人的同时，不要破坏开放网络或削弱必要的隐私工具。

348 comments • Comments Link

• 澳大利亚政府一方面通过其 eSafety Commissioner 的指南鼓励使用 VPN，另一方面又在推进年龄验证法，而 VPN 正好能规避这些规定，暴露出其数字政策中的内在矛盾。

• 英国的《在线安全法案》名义上是保护儿童，实质上却转向了明确的"控制在线话语"。 Ofcom 在法案通过后的第二天就承认了这一意图，揭示了立法背后的威权动机。

• VPN 是重要的隐私工具，但各国政府越来越倾向于限制甚至禁止它们，因为 VPN 让公民能够绕过以儿童保护为名的监控基础设施；欧盟也在考虑类似的限制。

• Mozilla 提倡使用 VPN 存在利益冲突的疑虑——它同时也是 VPN 服务的经销商。尽管将基金会与公司分离可以缓解部分担忧，但更公开透明地处理两者关系更合乎伦理。

• 通过 JavaScript 浏览器指纹等数据融合技术，即便用户使用 VPN 也可能被去匿名化，这削弱了这些工具在对抗复杂追踪系统时的隐私保护作用。

• 互联网已从去中心化、用户驱动的空间，彻底变成由广告科技公司主导的掠夺性生态。这些公司雇佣心理学家和工程师，通过触发机制最大化用户成瘾和参与度，与早期危害较小的网络相比判若两界。

• 那些在互联网早期就接触网络的几代人并非"毫发无伤"：社交技能下降、 Gen Z 性行为减少以及普遍逃避成年责任等现象，挑战了互联网无害的说法。

• 历史表明，广泛的互联网限制往往在公众亲身感受到其影响之前就能获得支持。 HN 用户曾支持监管，直到身份验证要求让监控的实际影响变得具体可感。

• 英国精英阶层长期存在威权倾向，过去多被细微差别掩盖，但在新冠封锁期间暴露无遗。公众对保姆式国家政策的支持更多反映了对被统治的某种依赖，而非真正关怀民众福祉。

• 终结 PIPA 和 SOPA 的运动曾展示出对权力滥用的集体抵抗，但当前的数字监控基础设施表明，这种抵抗力已经削弱，或在企业与政府联合时显得无力。

讨论总体揭示了既定政策目标与实际执行之间的根本张力，儿童保护常被用作西方民主国家扩张监控基础设施的借口。参与者一致指出监管俘获的模式——像 Meta 这样的公司在表面上推诿责任的同时，却能左右政府行为。互联网从去中心化、用户驱动的空间演变为以广告技术为核心的掠夺性生态，带来了实质性的危害，使"互联网好 / 坏"的简单二元论不再成立。多数人认为，当代几代正面临前所未有的心理操纵，但关于这是否构成新的危机，还是仅是围绕新技术的又一轮道德恐慌，仍有分歧。讨论最终反映出对机构动机的深切怀疑；参与者注意到，所谓的保护性话语一旦立法通过，便很快让位于对言论的控制。

Tesla Solar Roof is on life support as it pivot to panels

318 points • 2 days ago • Article Link

Tesla 的 Solar Roof 曾被誉为能用美观一体化的太阳能瓦片取代整片屋顶、变革住宅太阳能的"革命性"产品。 Elon Musk 在 2016 年提出这一概念并许下宏愿，包括到 2019 年底实现每周安装 1,000 套，并声称其成本低于传统屋顶加传统太阳能板。不过近十年过去，Tesla 仅累计安装约 3,000 套 Solar Roof，已停止披露部署数据，并悄然将重心转向传统太阳能板。

Tesla 的 Solar Roof 曾被誉为能用美观一体化的太阳能瓦片取代整片屋顶、变革住宅太阳能的"革命性"产品。 Elon Musk 在 2016 年提出这一概念并许下宏愿，包括到 2019 年底实现每周安装 1,000 套，并声称其成本低于传统屋顶加传统太阳能板。不过近十年过去，Tesla 仅累计安装约 3,000 套 Solar Roof，已停止披露部署数据，并悄然将重心转向传统太阳能板。

承诺与现实之间的差距十分明显。该公司直到 2020 年才实现小规模量产，较原计划晚了三年；在 2022 年第二季度的峰值期，每周仅部署约 23 套，离每周 1,000 套的目标相差 97.7% 。自 2022 年第四季度起，整体太阳能部署量至少连续四个季度下降，到 2024 年第一季度，Tesla 直接从季度报告中删除了太阳能部署数据，此后几乎不再在公开场合提及 Solar Roof 。

现有 Solar Roof 业主的处境尤为令人沮丧。 Tesla 基本退出了直营安装，不再提供在线报价，而是把客户导向一小批第三方认证安装商。在部分地区（如 Florida），Tesla 甚至取消了太阳能项目，所有可用施工队都转去做维修。这种第三方模式导致结构性矛盾：安装方指责 Tesla 的设计问题，Tesla 又将责任推给安装方，客户成了夹缝中的受害者。客户服务投诉普遍存在，Tesla Energy 在 SolarReviews 上的评分仅为 2.5 分（满分 5 分），论坛里充斥着客户反映服务等待数月、难以联系支持团队的案例。

产品本身也存在未解决的技术问题。 Solar Roof 采用组串式逆变器，而非微逆或功率优化器，这意味着局部遮阴可能导致整条串路停产，竞争对手则通过组件级优化解决了这一问题。业主反映系统发电量比合同预估低 20% 甚至更多，而 Tesla 有时以天气为由拒绝服务请求。经济性自始便成问题：未计补贴的平均 Solar Roof 造价约为 106,000 美元，而传统屋顶加传统太阳能板约为 60,000 美元，导致 Solar Roof 的回收期在 15–25 年之间，而传统方案约为 7–12 年。 2023 年，Tesla 为一起客户指控其存在"诱饵调包"定价的集体诉讼以 600 万美元和解。

Tesla 自身的动作也证明了战略转向。官方 X 账号上最后一次专门发布 Solar Roof 的内容是在 2023 年 6 月，之后公司在社交媒体上更多推广 Powerwall 、 Megapack 及其新款传统太阳能板。财报电话会议上几乎听不到对 Solar Roof 的讨论；当能源工程副总裁在 2025 年第三季度财报会上发布新的住宅太阳能产品时，推出的也是 TSP-420 这种传统太阳能板，而非 Solar Roof 的更新。

如今 Tesla 已全面押注传统太阳能板。 TSP-420 于 2026 年初在 Gigafactory New York（位于 Buffalo）组装面世，采用 18 区域功率优化系统，恰好能解决困扰 Solar Roof 组串式逆变器的遮阴问题。 Elon Musk 在达沃斯宣布，Tesla 计划在美国建设每年 100 GW 的太阳能制造产能，并据称正洽谈购买价值 29 亿美元的中国太阳能设备以实现该目标。公司五年来首次扩充太阳能团队，并推出新的太阳能租赁产品，这些动作都集中在传统太阳能板的制造与推广上，而非 Solar Roof 瓦片。

从商业角度看，转向传统太阳能板可能是正确之举：制造成本更低、安装更快、消费者经济性更好。但这并不能抹去一个事实：Tesla 曾就产量、能源独立性和使用寿命等方面向 Solar Roof 客户做出具体承诺，随后却在未作公开说明的情况下悄然放弃。公司在数据变得尴尬时停止披露，改由第三方安装并将能源团队转向其他产品。 Solar Roof 尚未被官方宣告终止，但已被束之高阁，留下客户与承诺之间的空白，而 Tesla 则继续追逐下一个热点。

348 comments • Comments Link

Tesla 的太阳能屋顶在经济性上存在根本性问题。标价约为 10.6 万美元，比传统屋顶加太阳能面板的组合高出约 4.6 万美元，导致投资回收期长达 15–25 年，而传统太阳能系统通常只需 7–12 年即可回本。

该产品似乎是在 2016 年匆忙推向市场，主要用于证明 Tesla 收购 SolarCity 的合理性。 SolarCity 是 Elon Musk 的表亲经营的一家失败公司，收购后继续用股东资金推进开发。

客户服务长期表现不佳，Tesla Energy 在五分制评分中仅得 2.6 分。公司因诱饵式调价达成了约 600 万美元的集体诉讼和解；有客户合同价从 7.2 万美元翻至 14.6 万美元。

小瓷砖设计带来了重大技术挑战，包括大量连接点影响可靠性、需要专业劳动力的复杂安装，以及相比在现有屋顶上改装标准面板更高的成本。

标准太阳能板已变得非常便宜且高效，使得一体化屋顶在经济上难以竞争。在 United Kingdom，一个 9.2kW 系统的面板费用现在约为 1000 英镑，这使得手工铺装的太阳能瓷砖在大众市场上缺乏经济可行性。

一体化太阳能屋顶目前唯一看得通的用途，可能是那些受严格文物保护或 HOA 美学限制的地区。但即便普通太阳能屋顶通常也要十年才回本，Tesla 的高价仍难以自洽。

Sunstyle 、 Invisible Solar 和 Roofit.solar 等公司提供替代的一体化方案，采用更大尺寸的瓷砖或面板，可与屋面材料齐平安装，同时具备更好的经济性。

各地区的太阳能经济性差异很大。由于税收优惠，United Kingdom 的安装可在约 14 个月内回本；Ireland 的安装受益于政府补助；在 Australia，一套 6.6kW 系统的费用约为 4500–6000 美元。

从太阳能屋顶到自动驾驶再到隧道工程，Tesla 经常提前宣称革命性产品，这种模式更像是为影响股价而非等待产品成熟。

Tesla 的封闭生态系统策略也体现在 PowerWall 等产品上，获取实时数据通常需要通过定制 API 的复杂方式，限制了用户对自身能源数据的控制权。

总体讨论显示，公众普遍对 Tesla 太阳能屋顶的可行性持怀疑态度，认为其存在根本性的经济缺陷并伴随可疑的商业动机。共识是，尽管一体化太阳能屋顶在美观上有吸引力，但标准太阳能面板的快速商品化已使高端一体化解决方案对大多数消费者在经济上不合算。

多位评论者将太阳能屋顶的失败历史，与 Tesla 更广泛的商业惯例联系起来——包括仓促发布产品、糟糕的客户服务，以及限制用户自主权的封闭生态系统。同时讨论还强调，政府激励、电价和气候等地区因素会显著影响太阳能的经济性：在某些地区回收期不到两年，而在另一些地区则难以证明投资合理。

Fisker went bankrupt and owners built an open source car company from the ashes

175 points • 2 days ago • Article Link

当 Fisker Inc. 于 2024 年 6 月申请第 11 章破产时，大约 11,000 名 Ocean SUV 车主被留下来了——这些车售价在 40,000 到 70,000 美元之间，但正迅速失去维持其运行所需的软件功能。这家公司曾被视为特斯拉的竞争对手，拥有超过 31,000 个订单，潜在收入达 17 亿美元，但在负债超过 10 亿美元之前只生产了 11,000 辆车。问题出在架构上：Fisker 打造了 Cory Doctorow 所称的"软件定义汽车"，几乎每个子系统——从刹车和安全气囊到电池管理和车门锁——都需要定期连接 Fisker 的云端服务器。一旦这些服务器断联，车辆就会丧失关键功能，而不仅是娱乐系统。

当 Fisker Inc. 于 2024 年 6 月申请第 11 章破产时，大约 11,000 名 Ocean SUV 车主被留下来了——这些车售价在 40,000 到 70,000 美元之间，但正迅速失去维持其运行所需的软件功能。这家公司曾被视为特斯拉的竞争对手，拥有超过 31,000 个订单，潜在收入达 17 亿美元，但在负债超过 10 亿美元之前只生产了 11,000 辆车。问题出在架构上：Fisker 打造了 Cory Doctorow 所称的"软件定义汽车"，几乎每个子系统——从刹车和安全气囊到电池管理和车门锁——都需要定期连接 Fisker 的云端服务器。一旦这些服务器断联，车辆就会丧失关键功能，而不仅是娱乐系统。

随后发生的事情成为电动汽车史上最引人注目的案例之一。 Fisker Ocean 的车主们没有接受车辆将被废弃的命运，而是自发组建了 Fisker Owners Association（FOA），这个非营利组织迅速发展到约 4,000 名成员，既像汽车俱乐部，又像科技初创公司，甚至像一家独立汽车制造商。他们雇佣独立技术专家逆向分析 Fisker 的专有软件补丁，互相教授刷写固件的方法，组织替换零件的集中采购，通过团购把钥匙扣等关键配件的价格从约 1,000 美元大幅压低。在欧洲，他们还成立了"飞行医生"计划，技术熟练的成员前往帮助其他车主维修车辆。

这些技术工作进一步发展成真正的开源生态。在 GitHub 上，开发者 MichaelOE 逆向了 Fisker 官方移动应用的 API，构建了一个 Home Assistant 集成，把每个云 API 的值作为传感器暴露出来，该项目在 Apache 2.0 许可下已有 135 次提交和 20 个发布。社区成员发布了 Fisker Ocean 的 CAN 总线文件，包括用于过滤和处理的 DBC 文件，系统性地绘制了以 500 kbps 运行的多条 CAN 总线。 Majr Srour 记录了如何嗅探 CAN 流量并解码诊断故障码，目标是把诊断能力放进手机应用，让车主能自行扫描，而不再依赖已不存在厂家的经销商工具。

然而，社区的努力在 2024 年 10 月遭遇重大阻碍：Fisker 的剩余库存被卖给 American Lease，后者额外支付 250 万美元以获取 Fisker 专有源代码和云服务的访问权。 American Lease 通过与 FOA 的口头协议同意为私人 Ocean 车主延续联网服务，但双方并未签署正式合同。合作破裂发生在 American Lease 要求 FOA 承担 58% 的所有运营成本（包括 LTE 连接和 Microsoft Cloud 服务），却拒绝提供明细发票。后果是毁灭性的：车主失去了远程连接，云功能被削减，一项待执行的软件召回也被阻止。

Fisker Ocean 的遭遇并非个例。 Nikola 也申请破产，令其车主面临类似困境，Canoo 和 Arrival 则走向清算拍卖。分析师预计随着行业整合，会有更多电动汽车初创公司倒下。消费者维权人士正在推动结构性变革，包括设立强制性软件托管基金以在制造商消失时维持车辆软件运行、在破产程序中强制开源、以及强制共享维修数据。俄勒冈州的 Right to Repair 法案已经禁止使独立维修困难的"零件配对"，而大众、 BMW 和 Mercedes 等欧洲汽车厂商在 2025 年签署备忘录，共同开发一个开源的汽车软件平台。

问题不是是否会有更多电动汽车公司倒闭——这是不可避免的；问题是当它们倒闭时，是否已有机制能防止成千上万辆仍可使用的车辆变成电子垃圾。以太坊联合创始人 Vitalik Buterin 如此表述了这种担忧：汽车行业需要更多开源思维，令人悲哀的是"制造商一旦消失，汽车就变得无用"已经成了常态。 FOA 证明了一个有奉献精神的社区可以让被遗弃的电动汽车继续上路：逆向固件、绘制 CAN 总线、构建集成、运行移动维修服务。但车主不应被逼迫走这条路。行业需要强制性的软件托管和针对任何依赖云连接车辆的开源后备条款：如果制造商倒闭，软件应当向公众公开。下次有电动汽车初创公司倒闭时，车主不应再被迫变成黑客和零件中间人才能继续驾驶他们已经付钱购买的汽车。

65 comments • Comments Link

• Fisker 采用高度依赖云的汽车设计使其格外脆弱，但更广泛的问题是所有制造商都面临的软件依赖性——不仅仅是电动汽车——这需要像欧洲汽车制造商正在开发的开源汽车平台那样的系统性解决方案。

• 如果采用开源软件，Fisker 本可以被拯救：车主能够自行维护和更新车辆，即便公司倒闭也能维持一个可持续的生态系统。

• 文章的写作风格，尤其是如 "the irony reads" 之类的短语，被批评为 AI 生成的垃圾内容，这引发了关于 AI 在新闻业中作用的讨论，以及 AI 辅助内容是否还能算作优质新闻的争议。

• 刹车和转向等关键安全系统绝不应由仅有软件控制且没有机械后备——现实恐怖的例子表明，发动机熄火会让老旧车辆的刹车助力和转向助力失效。

• 现代汽车对软件和云连接的依赖带来了不可接受的风险，包括可能被强制进行空中下载更新，从而在未经车主同意的情况下改变车辆行为。

• Fisker 的困境凸显了一种反复出现的企业伤害客户的模式：这是 Fisker 第二次破产，车主再次被抛在一边，车辆失去支持。

• 对于车主能够控制和修改的软件可见车辆有着强烈需求，许多消费者愿意为避免企业监控和控制而支付溢价。

• 以 250 万美元收购 Fisker 源代码的租赁公司，主要是为了自身商业利益（租给 Uber 司机），而并非为了支持更广泛的车主社区。

• 现代车辆中不必要的软件激增导致了荒谬的复杂性和成本，例如记忆座椅这类功能需要多个电机并通过 CAN 总线集成，取代了简单的机械杠杆。

• AI 检测工具并不可靠，常产生误报——它们倾向于根据表面标记（比如 em dash 的使用）将人类撰写的内容误判为 AI 生成。

讨论揭示了汽车行业对软件与云连接日益依赖的深层担忧，Fisker 的倒闭成为软件依赖型车辆风险的警示故事。在主张更多开源解决方案以赋予车主控制权的人，与认为根本问题在于车辆中软件过多的人之间存在紧张。对话还触及 AI 在新闻业中的更广泛问题以及检测 AI 生成内容的挑战，参与者普遍对 AI 写作质量和 AI 检测工具的可靠性持怀疑态度。关于用软件控制关键系统的安全问题反复出现，参与者分享了亲身经历，强调从基本功能中移除机械后备的潜在危险。

A nicer voltmeter clock

366 points • 2 days ago • Article Link

作者重温了 2019 年的一个项目：他们制作了一台电压表时钟，用模拟面板电压表替代传统表盘来显示时、分、秒。虽然原作运行良好，但作者决定重新设计一版，更加优雅且文档更完善。新版选用了从 Amazon 购买的三只通用 90 度面板电压表，拆解后在自粘纸上定制印刷了刻度盘。小时表盘分为 13 格（0 到 12），分钟和秒钟表盘各为 61 格（00 到 60），因此指针可以连续移动而不是跳动。

作者重温了 2019 年的一个项目：他们制作了一台电压表时钟，用模拟面板电压表替代传统表盘来显示时、分、秒。虽然原作运行良好，但作者决定重新设计一版，更加优雅且文档更完善。新版选用了从 Amazon 购买的三只通用 90 度面板电压表，拆解后在自粘纸上定制印刷了刻度盘。小时表盘分为 13 格（0 到 12），分钟和秒钟表盘各为 61 格（00 到 60），因此指针可以连续移动而不是跳动。

外壳是与第一版最大的不同。作者没有手工拼装，而是用 CNC 铣床在枫木板上铣出前后面板。为实现无缝的弧形侧壁，他们在一块木板上切出内凹槽，使其更容易绕成型模板弯折。木板先加湿、夹紧定型并晾干，再用胶合板模板精确粘合到前后面板上。经打磨并喷涂一层硝化纤维素清漆后，成品外观干净光滑，带有凹陷的装饰纹理，巧妙地掩盖了电压表难看的塑料法兰。

电子部分相当简单，核心是一颗 AVR128DB28 微控制器，由外接电源适配器供电，并配有 8 MHz 晶振做时钟。三只电压表直接接到数字输出引脚，背部设有两颗按键用于校时。值得一提的是，设计不需要数模转换器；作者改用高频一位数字脉冲序列，借助表头机构的机械惯性和线圈的电感，使表针根据软件输出信号的占空比停在介于刻度之间的位置。代码精简且注释充分，利用定时中断推进一个 10 Hz 的计数器，主循环则计算并切换各表的占空比。

作者还附上了一段视频，记录了时钟在午夜前后的戏剧性翻转效果。在回应 Hacker News 的评论时，作者解释指针在过渡时的轻微下坠与弹跳是刻意为之，旨在增强视觉效果，并将这种表现手法与豪华腕表中的逆跳机构相类比——那类花巧往往能卖出高价。这个项目也体现了作者的理念：电子设计往往同样需要木工和实体制作方面的匠心，与电路设计和编程并重。

50 comments • Comments Link

• 一位制作者分享了自己制作类似模拟仪表钟的经历：在 Princess Auto 发现几只剩下的面板仪表，每只只要一美元多一点。尽管他做得没那么精致，但这些仪表能有效显示时间，而且会引起路人的小小好奇心。

• 一位从事模拟计算机项目的爱好者描述了用数字 LCD（通过 ESP32）和真实面板仪表来可视化模拟计算结果。他发现看到物理仪表与模拟计算同步移动，特别令人满足，也更有真实感。

• 一位专业家具制造者建议，拥有 CNC 路由器的创客空间能处理大部分木工活。他指出，如果绕过仪表周围的榫接，前面板就能简化为单面加工，可能用基本工具也能完成。

• 有评论者讨论了指针在切换时的过冲和跳动问题，其中一位解释说应逐渐降低 PWM 的占空比而不是瞬时改变以避免这种现象，另一位则担心反复的冲击会损坏便宜的面板仪表。

• 一个人幽默地指出，模拟仪表的自然跳动正是开发者经常试图用额外代码在数字显示上复制的，大家都很欣赏物理运动那种有机的质感。

• 一个技术性解释说明了 PWM（脉宽调制）如何用来控制等效电压：晶体管以某个占空比脉冲输出，从而模拟中间电压；而电子电压测量依赖于电容充电速率，这与模拟仪表靠机械弹簧和电磁铁的工作机制不同。

• 评论里也表达了对工艺的钦佩，有些人说这个项目激励他们去学 3D 建模或木工；也有人提到在过于雄心勃勃的建模项目中遇到困难，于是有人建议从 Tinkercad 等更简单的工具入门。

• 一位观察者最初以为秒针会更平滑地移动，怀疑 10Hz 的控制是否太慢；另一位对仪表不会在一天内真实升压感到些许失望，后来意识到 PWM 的方式其实能有效模拟这一点。

整体讨论展现出大家对模拟美学与数字控制交汇处的浓厚兴趣，参与者很看重面板仪表带来的触觉和物理化数据表现。技术话题集中在 PWM 的实现以及如何在实现真实模拟行为和延长设备寿命之间权衡。社区还给出实用建议，比如利用共享创客空间的设备，以及从更简单的工具和项目入手以降低门槛。反复出现的主题是：在纯数字显示无法复制的物理运算中，人们能找到特别的满足感。

MCP Hello Page

133 points • 2 days ago • Article Link

作者最近开始为其主要工作工具提供 MCP Server，这次体验很有意思，处在确定性系统与非确定性系统的交汇处。尽管作者认为 MCP 是个设计欠佳的规范，但真正的问题更现实：客户不断反馈服务器"不能用"。原因很简单：用户在浏览器中打开 MCP 端点 URL，会看到 401 Unauthorized 错误和一段原始 JSON 响应，便认为链接坏了，立刻提交工单；实际上他们应该把该 URL 粘贴到自己的 LLM 客户端中。入门引导时没人会想到这一步。

作者最近开始为其主要工作工具提供 MCP Server，这次体验很有意思，处在确定性系统与非确定性系统的交汇处。尽管作者认为 MCP 是个设计欠佳的规范，但真正的问题更现实：客户不断反馈服务器"不能用"。原因很简单：用户在浏览器中打开 MCP 端点 URL，会看到 401 Unauthorized 错误和一段原始 JSON 响应，便认为链接坏了，立刻提交工单；实际上他们应该把该 URL 粘贴到自己的 LLM 客户端中。入门引导时没人会想到这一步。

显而易见但代价高的解决方案是把服务器为每个 LLM 客户端打包成连接器或插件——既慢又繁琐，而且容易变成无休止的打地鼠游戏，尤其当越来越多客户在组织内部构建嵌入式客户端时。于是作者采取了更简单、略微取巧的办法：当收到 GET /mcp 请求且 Accept 头包含 text/html 但不包含 application/json 或 text/event-stream 时，服务器返回一页 HTML，说明用户正在用浏览器查看 MCP Server，需要把它添加到他们的客户端。这个小改动效果显著：支持工单大幅减少，客户成功团队更省心，客户上手更快，作者也不用再反复解释并非所有错误信息都是真正的错误。目前尚未观察到负面影响。

作者希望 MCP 规范能内置处理这类用户体验问题，但像当前 AI 时代的常态一样，大家还是快速推进，寄希望于 AI 能比错误积累得更快地修复问题。文章最初写于 2026 年 5 月 16 日，附带侧边栏列有作者主页上的若干个人统计和更新，涵盖从音乐收听习惯到跑步里程及近期写作项目。

49 comments • Comments Link

- 浏览器请求 /mcp 端点时返回一个 HTML 说明页，通过 HTTP 内容协商（Accept 头）来实现是合理的做法，而不是一种 hack，因为它能恰当地提示用户该资源不适合在浏览器中直接查看。

- MCP 规范在认证方面存在重大空白，过度依赖复杂且不常用的 OAuth 2.0/2.1 功能（如 DCR 和令牌交换）。虽然最近的修订有所改进，但网关可以通过处理令牌交换和访问控制来缓解服务器端的认证负担。

- MCP 中对"网关"的缺乏正式定义导致实现多样，但网关可以作为代理来管理认证、按角色暴露工具并执行上游令牌交换，从而简化后端认证流程。

- MCP Contributors 的 Discord 社区非常活跃，欢迎参与工作组共同改进规范，目前正通过 XAA/ID-JAG 和 CIMD 等标准来解决企业级需求。

- 部分用户即便未使用 VPN，也会因为 Cloudflare 的封锁而无法访问某些网站，说明安全策略可能过于激进，影响了正常访问。

- /mcp 端点的必要性存在争议：带有 Swagger 文档的 REST API 提供更大的灵活性，但 MCP 提供了一致性，对于没有现成 API 的工具仍然有用；也有人更倾向于通过系统提示来调用工具。

- 当客户端的 Accept 头包含 text/html 时返回 HTML 是一种务实的做法，类似 ipinfo.io 和 Kubernetes API 的内容协商方式，但如何处理带通配符（如 Accept: /）的客户端仍需考虑。

- MCP 规范起初设计欠佳且存在损坏链接，这反映了"更差即更好"的采用模式——先占和覆盖率往往胜过质量，这在历史上的技术采用中也曾多次出现。

- 可改进的用户体验细节例如为 MCP URL 提供"复制到剪贴板"按钮而不是可点击链接，以避免用户误点或直接在地址栏打开时产生混淆。

- 将 MCP 服务器打包为特定客户端的连接器违背了 MCP 作为通用协议的初衷，但鉴于当前客户端的限制，这种做法在短期内可能是必要的。