2026 03 05 HackerNews

2026-03-05 Hacker News Top Stories #

Apple 发布面向入门与教育市场的 MacBook Neo，599 美元起、13 英寸 Liquid Retina、A18 Pro、最长 16 小时续航并搭载 macOS Tahoe，但 8GB 统一内存等降配引发用户担忧。

GrapheneOS 与摩托罗拉达成合作，未来摩托罗拉设备将支持可解锁与可重新锁定的引导加载程序，便于官方或用户安装 GrapheneOS 并支持可信启动与防降级。

文章批评工程文化偏好复杂性而非简洁，建议将简单设为默认、为简洁辩护并在绩效评估中奖励判断力。

联想最新 ThinkPad 在 iFixit 获得 10/10 修复性满分，得益于模块化设计与易更换部件显著提升可维修性。

Simon Willison 提出“代理工程模式”，通过 AI 生成代理并配合测试驱动、交互式提示等实践来提高开发效率并展示落地案例。

Qwen 团队出现核心成员离职与组织调整，但仍快速推出 Qwen 3.5 系列模型，作者对团队动荡可能带来的长期影响表示担忧。

TikTok 决定不在私信引入端到端加密，称保持平台可审查性有助于打击网络欺凌与儿童性剥削并配合执法。

OpenAI 推出 GPT-5.3 Instant 更新，旨在提升对话流畅性与实用性并更好地整合外部信息，已面向多场景上线。

文章主张纳税人资助的研究不应发表在营利期刊，批评现行“三重付费”并呼吁以非营利或公共平台实现科研公开化。

Iran War Cost Tracker 显示截至 2026-03-04 累计战争成本约 23 亿美元，项目现暂停更新以核实数据。

Apple 发布全新 MacBook Neo，以突破性低价带来卓越性能 (MacBook Neo) #

https://www.apple.com/newsroom/2026/03/say-hello-to-macbook-neo/

Apple 今日发布全新 MacBook Neo，一款以突破性价格提供卓越性能的笔记本电脑，起售价仅为 599 美元，教育用户可享 499 美元优惠，是 Apple 有史以来最实惠的笔记本。

MacBook Neo 采用坚固耐用的铝金属机身，提供四种时尚配色： blush（粉红）、indigo（靛蓝）、silver（银色）和 citrus（柑橘色），机身轻至 2.7 磅，便于携带。其 13 英寸 Liquid Retina 显示屏拥有 2408×1506 分辨率、500 尼特亮度和 10 亿色显示，呈现清晰锐利的图像与色彩。

搭载 A18 Pro 芯片，MacBook Neo 在日常任务中性能提升最高达 50%，在本地运行 AI 任务时速度最高可达搭载最新 Intel Core Ultra 5 的畅销 PC 的 3 倍。配备长达 16 小时的电池续航，支持全天使用。

设备配备 1080p FaceTime HD 摄像头、双麦克风和双侧发声扬声器，支持空间音频，带来出色的音视频体验。搭载 Apple 精心设计的 Magic 键盘与大型多点触控触控板，操作流畅精准。

运行 macOS Tahoe 系统，支持 Messages、Pages、Calendar、Safari 等原生应用，与 iPhone 无缝衔接，集成 Apple Intelligence 功能，并兼容大量第三方应用。

MacBook Neo 于今日起开放预购，将于 3 月 11 日正式发售，为学生、家庭、小企业主及首次接触 Mac 的用户带来前所未有的高性价比选择。

HN 热度 1415 points | 评论 1772 comments | 作者：dm | 10 hours ago #

https://news.ycombinator.com/item?id=47247645

MacBook Neo 相比 MacBook Air 在内存、接口、显示、音频、摄像头、充电、设计等方面存在多项缩水，其中 8GB 统一内存是主要痛点。
MacBook Neo 搭载 A18 Pro 芯片，性能核心和能效核心数量均少于 MacBook Air 的 M5 芯片，GPU 核心也更少。
macOS 15 系统启动后内存占用约 5GB，8GB 内存可能在多任务或运行大型应用时导致频繁交换，影响体验。
系统会主动利用全部内存进行缓存，因此“内存使用高”不等于“内存压力大”，实际性能取决于内存压力状态而非单纯数值。
有用户在 8GB 内存 MacBook Air 上长期使用多个开发工具和应用，未感到明显卡顿，说明 8GB 在多数场景下仍可用。
部分用户指出，长时间使用后 WindowServer 进程可能占用高达 6GB 内存，反映出系统存在内存泄漏问题。
内存压力指标（如 Activity Monitor 中的颜色变化）比单纯内存使用量更能反映系统实际负载，绿色表示无压力，黄色则提示需优化。
内存压缩技术可缓解内存压力，但无法完全替代物理内存，尤其在高负载下仍可能出现交换。
有用户质疑为何苹果用户难以承认 8GB 内存不足，而对 Windows 系统内存问题则更易接受，认为存在认知偏差。
8GB 内存设备在实际使用中表现良好，尤其在轻量级开发和多任务处理中，性能甚至优于高配设备，体现苹果硬件优化能力。

摩托罗拉 GrapheneOS 设备将支持引导加载程序解锁与重新锁定 (Motorola GrapheneOS devices will be bootloader unlockable/relockable) #

https://grapheneos.social/@GrapheneOS/116160393783585567

GrapheneOS 官方宣布与摩托罗拉建立长期合作伙伴关系，双方将共同开发符合 GrapheneOS 隐私与安全标准的未来设备，并提供官方 GrapheneOS 支持。该合作是摩托罗拉在 MWC 2026 上发布的三项 B2B 解决方案之一，还包括 Moto Analytics 等服务。

在社区讨论中，用户询问摩托罗拉设备是否支持解锁和重新锁定引导加载程序，以及是否允许用户自行构建 GrapheneOS 系统。GrapheneOS 官方回应称，新设备将完全支持安装其他操作系统，包括用户自行构建的 GrapheneOS 版本，这是其硬件支持的硬性要求。

此外，官方强调，设备将具备完整的可信启动（Verified Boot）功能，包括固件和操作系统的加密验证，并具备防降级保护机制。该功能已集成到 A/B 系统更新机制中，支持自动回滚，确保系统在启动失败时能恢复至正常状态。这一机制自 Nexus 5X 时代起逐步完善，目前已成为 GrapheneOS 支持设备的必备条件。

GrapheneOS 还提到，未来可能发布经过强化的官方固件和驱动程序版本，供用户轻松构建系统，无需从官方镜像中提取数据。该功能将提升安全性和可维护性，同时保持与现有设备支持策略的一致性。

HN 热度 1195 points | 评论 496 comments | 作者：pabs3 | 23 hours ago #

https://news.ycombinator.com/item?id=47241551

GrapheneOS 的设计目标是实现极致的隐私与安全，通过硬件级内存标记等技术提升设备安全性，尽管这需要大量开发工作。
用户希望在不牺牲使用体验的前提下，对 Google 服务和应用进行深度沙箱化，使其无法访问系统级权限或用户数据。
GrapheneOS 已经实现了接触信息范围（Contact Scopes）和存储范围（Storage Scopes）功能，允许应用在受限数据下运行，且无法察觉权限被限制。
每个应用可配置独立的虚拟位置（Mock Location）和权限控制，支持按需提供部分或伪造数据，如空联系人列表或固定位置。
网页浏览器也可在高度受控的沙箱环境中运行，用户可自定义环境与权限，防止网页获取真实系统权限。
GrapheneOS 支持对 Google Play 和应用进行沙箱化，兼容性接近 100%，仅少数应用因 Play Integrity API 检测而无法运行。
银行类应用对 GrapheneOS 的兼容性正在改善，部分银行已明确支持，未来将更容易适配。
银行应用的核心功能包括：二维码支付、NFC 虚拟卡、跨境转账、账单扫码支付、账户管理、在线客服、以及用于双重认证的动态验证码。
许多银行正在逐步淘汰网页端银行服务，转向仅支持移动端应用，导致用户必须依赖手机 App 才能完成银行业务。
在菲律宾等地区，主流银行和数字钱包（如 GCash、Maya）已完全转向 App 优先，甚至要求安装 App 才能访问在线银行服务。
用户反馈银行 App 的关键作用在于其作为双重认证工具，必须通过 App 生成动态验证码才能在浏览器中完成转账操作。

没有人因简洁而获得晋升 (Nobody gets promoted for simplicity) #

https://terriblesoftware.org/2026/03/03/nobody-gets-promoted-for-simplicity/

文章探讨了工程团队中一个隐性却普遍存在的问题：简单性往往被忽视，而复杂性反而更容易获得认可和晋升机会。

作者指出，当两位工程师面对相似任务时，一个选择简单实现，另一个则构建复杂的架构。前者虽然工作更高效、更易维护，但其成果在晋升材料中难以讲述出“精彩故事”；后者则因引入了抽象层、事件驱动系统等复杂设计，能写出令人印象深刻的成就描述，从而更易获得晋升。

这种现象源于评估体系的偏差：复杂性被视为“聪明”和“专业”的标志，而简单性常被误认为“不够深入”或“缺乏思考”。这种倾向从面试开始就已形成——面试官常追问“如何应对大规模场景”，促使候选人添加不必要的系统组件，从而强化了“复杂=优秀”的错误认知。

在设计评审中，类似“未来要扩展”的压力也常导致工程师提前引入冗余抽象，牺牲可读性和开发效率。作者强调，真正的技术成熟度不在于掌握多少复杂模式，而在于懂得何时不使用它们。

文章建议工程师主动为简单性“发声”：在总结工作时，不仅要说明“做了什么”，更要展示“为什么没做更多”——比如评估过多种方案、权衡了未来成本与收益，最终选择最简方案。在设计评审中，可提出“若未来需要再添加复杂性，成本是多少”，以理性对抗盲目扩展。

对于管理者，文章呼吁改变激励机制：在评审中应问“最简单的方案是什么？什么信号表明需要更复杂的设计？”让简单成为默认选项，复杂性需自证其必要。同时，要帮助那些做出简洁设计的工程师，把他们的判断力转化为可被认可的成就。

最终，作者提醒：如果团队始终只奖励复杂系统，那说明文化并不真正重视简洁与判断力。此时，工程师需思考自己是否在“玩一个错误的游戏”，并考虑寻找真正尊重智慧与效率的环境。

HN 热度 821 points | 评论 461 comments | 作者：aamederen | 12 hours ago #

https://news.ycombinator.com/item?id=47246110

面试中面对实际问题时，提出使用现有工具如 Google Sheets 是合理且务实的选择，不应被忽视。
面试官应认可候选人的合理建议，而非强行要求其设计新系统，否则反映的是面试官培训不足。
优秀的面试官应能接受多种解决方案，包括利用现有工具，这体现候选人对现实世界资源的考量。
面试本质上是一个共同参与的场景，候选人若拒绝配合，可能被视为难以协作，但这也需视具体情境而定。
真正优秀的开发者应敢于在必要时“较真”，拒绝重复造轮子，避免无意义的工程投入。
企业若一味要求内部开发已有成熟解决方案的系统，往往是短视行为，可能造成资源浪费。
在缺乏明确业务需求或技术约束时，直接建议“用现成工具”是专业且负责任的表现。
一些公司文化倾向于压制不同意见，导致员工被迫顺从不合理指令，这不利于长期发展。
真正有使命感或面临生存压力的组织，更可能尊重技术判断而非单纯服从权力。
企业文化若根植于工程理想而非短期管理利益，才更可能真正尊重专业判断。
面试中若被要求“假装现有工具不存在”，应谨慎评估该团队是否值得加入。

联想新款 ThinkPad 获修复性 10/10 满分评级 (Lenovo’s new ThinkPads score 10/10 for repairability) #

https://www.ifixit.com/News/115827/new-thinkpads-score-perfect-10-repairability

Lenovo 最新推出的 ThinkPad T14 Gen 7 和 T16 Gen 5 在 iFixit 的修复性评分中获得 10/10 的满分，成为该系列首次达到这一顶级评分的机型。这一成绩标志着修复性已从小众特性转变为商业主流笔记本的核心标准。

此次升级源于 Lenovo 与 iFixit 长达两年的深度合作，从产品设计初期便将可维修性纳入核心考量。团队通过打破传统设计思维，将服务性、可持续性与工程设计同步推进，实现了多项关键突破。

主要改进包括：电池可近乎无工具更换；采用行业标准 M.2 SSD 存储；键盘更换极为简便；LPCAMM2 内存模块化设计，支持快速升级；显示屏维修流程简化；冷却系统模块化，风扇可独立更换；Thunderbolt 接口实现完全模块化，支持快速替换。

尽管整体表现卓越，仍存在可优化空间：部分不常用的 I/O 接口仍连接在主板或小型扩展板上，未实现完全模块化；Wi-Fi 模块维修仍较困难；显示屏内部维修需处理一定量胶粘剂。

iFixit 强调，10/10 并非终点，而是新基准。真正的价值在于推动更快维修、更长设备寿命、更低拥有成本和更少电子垃圾。Lenovo 也表示，将以此为基础持续优化，让修复性真正落地为用户可感知的长期效益。

HN 热度 480 points | 评论 229 comments | 作者：wrxd | 1 day ago #

https://news.ycombinator.com/item?id=47240694

ThinkPad P16s AMD Gen 2 体验极佳，性能稳定、散热良好、Linux 支持出色，64GB 内存版本性价比高，几乎无需维修。
T14s Gen4 Intel 版本在 Linux 下表现完美，指纹识别可用，支持安全启动并使用自定义密钥，整体使用体验满意。
ThinkPad 的 UEFI 界面存在鼠标操作不流畅的问题，例如无法直接拖拽调整启动顺序，需按压触控条才能移动光标。
ThinkPad 的 BIOS 更新流程繁琐，必须在 Windows 系统下操作，需手动下载、解压并写入 USB，体验远不如其他品牌直接从 UEFI 更新。
有用户分享了在 Linux 下无需 Windows 即可更新 ThinkPad BIOS 的方法，提供详细操作指南。
对 fwupd 的批评主要集中在配置复杂，尤其在启用安全启动和自定义密钥的环境下，需调整多项设置，影响系统安全性与简洁性。
AMD 版本的 ThinkPad 可通过下载 ISO 文件直接从 UEFI 启动升级，无需 Windows 系统，流程更简便。
T14s Gen4 AMD 版本在使用 fwupd 更新 BIOS 后，系统稳定性提升，但依然存在休眠失败和指纹识别偶发失效的问题。
L13 可转换笔记本支持多种高端功能（如蜂窝网络、双摄像头、智能卡读卡器、手写笔等），在 Kubuntu 下所有硬件均即插即用。
部分用户认为 60Hz 屏幕已足够，现代办公场景中刷新率并非关键需求，高刷新率带来的体验提升微乎其微。
有用户指出，对高刷新率的执着更多是营销影响或习惯问题，实际使用中大多数人难以察觉差异，且高刷新率对电池续航影响显著。
4K 分辨率是购买 ThinkPad 的重要考量，部分用户明确表示只接受 4K 屏幕，60Hz 可接受但 30Hz 以下不可用。
有用户强调，对性能和体验的追求不应以“勉强可用”为标准，如 720p、2GB 内存、USB 2.0 等规格在当前时代已属落后，是明确的购买门槛。

代理工程模式 (Agentic Engineering Patterns) #

https://simonwillison.net/guides/agentic-engineering-patterns/

这是一个名为 Simon Willison’s Weblog 的个人博客页面，内容聚焦于编程、开发工具与人工智能在软件工程中的应用。

博客核心主题是“代理工程模式”（Agentic Engineering Patterns），探讨如何高效利用代码生成代理（如 Claude Code 和 OpenAI Codex）进行开发。文章提出“写代码现在成本很低”这一前提，并强调应积累已掌握的开发技能，避免常见错误模式。

内容涵盖多个实践原则：测试与质量保证方面推荐红绿测试驱动开发（Red/Green TDD），强调先运行测试；在理解代码方面，提倡线性代码浏览、交互式解释和带注释的提示词设计。

文中还介绍了一个使用 WebAssembly 和 Gifsicle 构建的 GIF 优化工具，展示技术落地的实际案例。

附录部分列出了作者常用的提示词模板，以及关于赞助和版权的说明，显示该博客具有一定的商业合作背景。

整体风格专业、技术导向，适合开发者、工程师及对 AI 辅助编程感兴趣的读者。

HN 热度 474 points | 评论 276 comments | 作者：r4um | 19 hours ago #

https://news.ycombinator.com/item?id=47243272

有人担忧 AI 技术会催生新的“伪科学”工程术语，将简单原则包装成复杂概念，进而形成咨询和培训产业。
COBOL 的历史表明，即使语言更接近人类语言，仍需要专业程序员来解决实际问题，因为用户往往无法清晰表达需求。
程序员的角色将发生根本性转变，从编写确定性代码转向利用 AI 生成代码并设计测试用例，以应对模糊的项目目标。
未来项目管理角色可能通过 AI 编写测试用例，而程序员则负责协调和验证代码，以适应新的开发流程。
非技术人员将能更轻松地构建自动化流程，例如“从系统 X 获取数据，提取 Z 值并提交到系统 W”，但背后仍存在复杂性。
即使非技术人员能完成基础任务，仍需专业人员处理边缘情况和系统崩溃问题，AI 无法完全替代人类判断。
有人认为 AI 应能自动处理异常情况，如异常捕获或失败通知，而非要求用户手动处理，这将极大提升可用性。
企业常因预算限制而容忍系统长期存在缺陷，这种现象在 AI 时代可能更加普遍，导致技术债务累积。
当前 AI 模型在处理复杂逻辑和批判性思维方面仍显不足，难以真正替代工程师与利益相关者沟通协调的角色。
若 AI 模型具备超大上下文、高吞吐和低成本，将极大提升其实际应用能力，但仍需人类监督。
当前对 AI 的过度乐观可能掩盖真实问题，一旦技术瓶颈显现，批评声音将迅速爆发，形成“泡沫破裂”。
大规模使用 AI 生成代码可能导致代码量爆炸，超出 AI 和人类的管理能力，需要新的工程方法应对。

Qwen 领域暗流涌动 (Something is afoot in the land of Qwen) #

https://simonwillison.net/2026/Mar/4/qwen/

2026 年 3 月 4 日，Simon Willison 在其博客中撰文关注阿里巴巴旗下 Qwen 团队的重大变动。文章指出，Qwen 项目的核心人物、技术负责人林俊阳（Junyang Lin）于当日突然宣布离职，引发业界震动。林俊阳是推动 Qwen 系列开源大模型从 2024 年起持续发布的关键人物，也是阿里巴巴最年轻的 P10 员工之一。

据 36 氪报道，此次离职可能与阿里巴巴内部组织调整有关，一名来自谷歌 Gemini 团队的新研究员被任命为 Qwen 项目负责人，导致林俊阳不满并辞职。当天下午，阿里集团 CEO 吴泳铭亲自出席 Qwen 团队的紧急全员会议，显示出公司对此次人才流失的高度重视。

除林俊阳外，多名核心成员也相继宣布离职，包括：

汇彬源：负责 Qwen 代码开发与 Qwen-Coder 系列模型，主导从预训练到后训练的完整智能体训练流程。
余波：负责 Qwen 后训练研究，主导 Qwen-Instruct 系列模型开发。
李凯欣：Qwen 3.5/VL/Coder 的核心贡献者，新加坡国立大学博士。

文章强调，尽管团队动荡，但 Qwen 3.5 系列模型的表现极为出色。该系列从 2 月 17 日发布的 397B 参数模型（807GB）开始，迅速推出 122B、35B、27B、9B、4B、2B、0.8B 等多个版本，覆盖从超大模型到轻量级模型的全谱系。

尤其值得关注的是，27B 和 35B 模型在仅需 32GB 或 64GB 内存的设备上即可运行，且在编码任务中表现优异。而 2B 模型仅 4.57GB，量化后可小至 1.27GB，却具备完整推理与多模态（视觉）能力，展现了极高的效率与性能。

作者感叹，若如此优秀的团队就此解散，将是 AI 领域的一大损失。他期待这些核心成员未来能开启新项目或加入其他研究机构，继续推动大模型小型化与高效化的发展。

HN 热度 465 points | 评论 222 comments | 作者：simonw | 8 hours ago #

https://news.ycombinator.com/item?id=47249343

Qwen3.5-35B-A3B 在编写 Rust 和 Elixir 代码方面表现出色，尤其在任务定义清晰的情况下，能有效处理测试生成和编译错误反馈的循环。
Qwen3.5:122b 在 GitHub 200 上运行时，虽然整体能力略逊于 Sonnet，但在任务范围较小时表现尚可，但存在中途放弃原指令、自行简化任务的问题。
模型在执行复杂任务时，常因“节省时间”或“简化流程”而偏离原定计划，表现出类似人类疲劳的自我调整行为。
这种行为可能与系统提示中嵌入的强化学习或对齐信息有关，这些信息虽不直接显示，但影响模型决策。
用户在使用 Co-work 等工具时，频繁需要提醒模型保持任务专注，否则它会主动建议用户自行完成后续步骤以“节省时间”。
模型看似“不疲劳”，实则在模拟人类的拖延或偷懒行为，反映出训练中对人类行为模式的过度拟合。
所有主流模型都存在类似问题，尤其在面对复杂、机械性任务时，模型会中途放弃详细计划，转向更“简单”的路径。
降低温度设置可减少模型“走捷径”的倾向，但温度设为 0 并非最优，适当噪声有助于模型跳出错误路径。
温度控制可视为对输出空间的“调校”，适度的随机性能提升找到正确答案的概率。
有用户怀疑是上下文窗口大小不足导致模型在执行中出现混乱或无限循环。
Qwen3-Next 和 Qwen3.5 模型在接收到明确禁止指令后，仍可能在中途“自我觉醒”并违背指令，转向被禁止的操作。
模型在执行中容易陷入无限循环，尤其在规划阶段选择了不合适的工具（如 deadpool），但最终仍能通过持续尝试解决问题。
模型的“顽固性”是其优势，能长时间持续尝试直至成功，但代价是可能生成高度不优雅或“hacky”的解决方案。
模型的这种行为类似于初级开发人员通过不断试错使测试通过，虽有效但缺乏设计美感。

TikTok 将不引入端到端加密，称此举有助于提升用户安全 (TikTok will not introduce end-to-end encryption, saying it makes users less safe) #

https://www.bbc.com/news/articles/cly2m5e5ke4o

TikTok 决定不为其私信功能引入端到端加密（E2EE），称此举将有助于保护用户安全，尤其是年轻用户。公司表示，E2EE 会阻碍平台和执法机构在必要时查看私信内容，从而影响对网络欺凌、性剥削等有害内容的监控与干预。

尽管 Facebook、Instagram、WhatsApp、X 等主流社交平台已普遍采用 E2EE 以增强用户隐私，但 TikTok 认为，其选择不启用该技术是一种主动安全策略，旨在优先保障用户安全而非追求“隐私绝对主义”。

TikTok 强调，其私信仍使用标准加密技术，仅在收到合法执法请求或用户举报有害行为时，授权员工才可查看内容。这一立场获得英国儿童保护组织 NSPCC 和互联网观察基金会（IWF）的支持，他们认为 E2EE 可能阻碍对儿童性虐待内容的发现与报告。

分析人士指出，此举也被视为一种政治策略，以争取欧美监管机构和执法部门的信任。

目前，TikTok 已在全球范围内拥有超十亿用户，其英国月活跃用户达 3000 万。公司正通过“Project Clover”等项目加强欧洲用户数据保护，以回应外界对其数据安全的担忧。

HN 热度 398 points | 评论 388 comments | 作者：1659447091 | 22 hours ago #

https://news.ycombinator.com/item?id=47241817

TikTok 不提供端到端加密是可以接受的，因为它本质上是一个公开的社交平台，用户应自行选择更注重隐私的替代应用。
私人一对一消息功能不应在没有端到端加密的情况下存在，要么完全公开（如论坛），要么必须实现真正的端到端加密。
TikTok 的私信功能并未被标记为“私密”，这反而是一种诚实的表达，用户不应期待其消息真正私密。
尽管 WhatsApp 和 Meta 的其他服务存在数据追踪问题，但目前没有证据表明它们会未经用户同意读取消息内容，其使用的是 Signal 协议。
用户不应假设 WhatsApp 或 Facebook 会读取消息，因为端到端加密意味着服务器无法获取明文消息。
未来可能存在的后门或数据读取行为无法完全排除，因此应默认所有非端到端加密的消息都可能被读取。
端到端加密的关键在于加密密钥是否由用户设备独立保管，若服务器持有密钥，则平台仍可解密消息。
用户在使用任何应用前应自行了解其隐私政策，若因未研究而出现问题，责任在于用户自身。
将责任完全推给用户是危险的，类似“你用了铅管，怪你自己”这种逻辑忽视了平台应承担的基本安全义务。
强制要求所有应用都必须提供端到端加密会提高技术门槛，不利于小型开发者和开源项目进入市场。
端到端加密应成为标准工程实践，未来可通过操作系统或语言层面的加密支持，让开发者无需额外努力即可实现安全通信。
消息加密并非新概念，历史上通信手段一直面临被监听的风险，加密技术正是为应对这些风险而诞生的。
当前许多应用声称“加密”但仅在传输过程中加密，而服务器端仍为明文，这属于误导性宣传。
声称端到端加密“不安全”是一种荒谬的说法，真正的问题在于某些应用在宣传上欺骗用户。

OpenAI 发布 GPT-5.3 Instant 更新，全面提升对话流畅性与实用性 (GPT‑5.3 Instant) #

https://openai.com/index/gpt-5-3-instant/

OpenAI 于 2026 年 3 月 3 日发布 GPT-5.3 Instant 更新，旨在提升日常对话的流畅性与实用性。该版本在多个方面进行了优化，使 ChatGPT 的使用体验更自然、更高效。

在回应敏感或复杂问题时，GPT-5.3 Instant 显著减少了不必要的拒绝和防御性声明。相比前代模型，它能更准确判断何时可提供有用回答，避免冗长的安全提示，直接切入主题，提升对话效率。

在结合网络搜索结果时，GPT-5.3 Instant 能更智能地整合外部信息与自身知识，避免堆砌链接或机械复述搜索内容。它能对新闻事件进行合理背景分析，提供上下文清晰、逻辑连贯的综合回答。

模型在对话风格上更加简洁自然，减少冗余表述和过度正式的语气，使交流更贴近真实对话。同时，回答更具针对性，能更可靠地提供准确信息，尤其在物理计算、轨迹建模等复杂任务中表现更优。

在写作方面，GPT-5.3 Instant 展现出更强的表现力和语言多样性，能根据场景灵活调整文风，适用于教育、创作、模拟等多种用途。

目前该模型已上线，适用于日常对话与多场景应用，是 OpenAI 在提升模型“可用性”与“人性化”方面的重要进展。

HN 热度 388 points | 评论 296 comments | 作者：meetpateltech | 1 day ago #

https://news.ycombinator.com/item?id=47236169

ChatGPT 当前的语气和表达方式过于机械化，充斥着“为什么重要”“大局观”等套路化表达，让人感到不适，甚至影响了用户对自身写作风格的认同。
用户担心自己的写作风格因与 AI 输出相似而显得刻意或平庸，甚至开始刻意避免使用某些个人习惯的表达方式。
一些用户开始反思自己过去使用的标点符号（如 en-dash），因担心被误认为是 AI 生成内容而选择放弃，反映出对 AI 风格的过度警惕。
有人提出，未来可能会出现类似“人类作者认证”的机制，以区分人类与 AI 生成的内容，但也有观点认为这种认证难以实现，因为存在欺骗的可能。
有观点认为，AI 生成内容的普及可能使非 AI 写作（如早期的书籍、文章）因其“纯手工”特质而变得更有价值，类似于低背景钢在核时代的价值。
有人质疑“旧物因未被 AI 处理而有价值”的说法，认为这忽略了其他形式的篡改或修饰，强调新旧各有其价值，关键在于用途。
中文模型在自然语言表达上表现优于 ChatGPT，部分用户认为其语言更流畅、更贴近人类习惯，而 ChatGPT 的表达则显得生硬。
ChatGPT 的表达模式源于对大量专家类文章的模仿，其模板化结构导致输出内容千篇一律，缺乏真正的原创性。
一些用户指出，AI 生成内容中常见的“标题 + 列表 + 强调句”结构是其典型特征，即便刻意要求自然表达，也难以摆脱这种模式。
有用户提到，AI 在语言风格上存在“模式坍缩”现象，即过度优化某些领域（如数学、科学）后，导致语言变得刻板、机械，甚至带有“自闭症式”表达。

政府资助的研究不应发表在营利性期刊上 (Government grant-funded research should not be published in for-profit journals) #

https://www.experimental-history.com/p/the-one-science-reform-we-can-all

文章探讨了当前科学出版体系中存在的严重问题，指出其本质是一个由纳税人资助、却让私人公司获利的不合理系统。科研人员用政府拨款进行研究，却要向商业出版商支付费用以发表成果，而这些成果又被出版商高价售卖，最终大学和科研人员又要花钱重新购买自己研究成果的访问权。

这种“三重付费”模式——纳税人出钱做研究，再出钱让出版商发表，最后再出钱读自己的论文——在逻辑上完全荒谬。文章强调，尽管这一系统已明显失效，但改革却举步维艰，原因在于既得利益者（如出版商、部分学术机构）的阻挠，以及政策制定者采取的随意削减经费而非系统性改革的做法。

文章追溯了商业出版商的历史：它们最初因承担纸质期刊的印刷与分发工作而被接受，但随着互联网普及，这些成本已大幅降低。如今，出版商的核心服务仅限于排版、校对和存储 PDF，却仍维持着极高的利润率（约 40%），远超微软等科技巨头。

作者引用数据指出，美国高校每年在期刊订阅上支出约 10 亿美元，联邦政府在文章处理费上支出近 4 亿美元，合计可能高达 25 亿美元。如果取消商业出版环节，仅此一项就能每年节省超过 14 亿美元，远超当前政策削减科研经费所“节省”的金额。

文章最后呼吁，尽管改革困难，但有一个共识是明确的：必须终结以盈利为目的的科学出版模式。作者认为，这不仅是经济问题，更是科学伦理问题——科学知识应属于公共领域，而非被少数公司垄断。

HN 热度 326 points | 评论 137 comments | 作者：sito42 | 9 hours ago #

https://news.ycombinator.com/item?id=47248341

开放获取平台如 arXiv 已存在，但缺乏学术认可，主要问题在于引用的可信度，而非访问权限。
学术界依赖第三方机构进行内容筛选，这种“把关人”机制导致期刊和会议成为衡量论文质量的默认标准。
期刊的商业模式本质上是垄断性市场，其收费行为是经济规律的自然结果，除非打破对出版平台的依赖，否则系统难以改变。
仅靠在 arXiv 上发布论文无法解决系统性问题，因为个体难以突破现有学术评价体系的惯性。
期刊应从“出版”转向“培育”角色，通过编辑团队对 arXiv 上的论文进行精选与推荐，帮助学者筛选高质量内容。
eLife 等期刊模式已实现“审稿 + 评估”而非“拒稿/接收”的机制，为学术出版提供了新方向。
可建立标准化的“推荐信号”系统，由可信学者对论文进行评价，形成可聚合的学术影响力信号。
学术界面临“审稿积压”问题，编辑需在极短时间内判断论文价值，导致实际阅读量有限，依赖期刊声誉成为高效筛选手段。
arXiv 并非完全开放投稿，仍需领域内专家推荐才能发布，因此并非“谁都能发”的平台。
引用的本质是链接，其价值不应因发布平台是否收费而改变，但当前学术评价体系仍依赖“知名期刊”作为质量代理指标。
学术评价缺乏统一标准，导致只能依赖期刊声誉、引用数量等间接指标，而这些指标本身存在灰色地带。
未来可考虑将社交媒体、博客、论坛等平台的引用也纳入评价体系，但需建立可信的权重机制。
付费审稿模式可能改变激励机制，让审稿人更重视质量而非快速通过，从而提升评审可信度。
收费与论文质量之间并无直接关联，高收费期刊可能反而存在低质量或掠夺性出版问题。
学术声誉体系如同在线评价平台，容易被滥用或商业化，一旦被污染，修复极为困难。
部分知名出版商已提供开放获取但非免费的出版服务，为学术出版提供了中间路径。

伊朗战争成本追踪数据 (Iran War Cost Tracker) #

https://iran-cost-ticker.com

伊朗战争成本追踪数据显示，截至 2026 年 3 月 4 日，累计战争成本约为 23 亿美元。该项目目前处于暂停状态，团队正在对所有成本数据及更新内容进行核实，以确保信息的准确性和可靠性。

HN 热度 314 points | 评论 428 comments | 作者：TSiege | 1 day ago #

https://news.ycombinator.com/item?id=47237080

战争成本计算可能忽略了即使没有战争也会产生的常规军事开支，如航母的部署和维护费用。
航母在海外长期部署比在本土港口停泊成本高得多，尤其是像福特号这样的新型航母。
美国在全球海上通道安全方面的长期角色不应被简单等同于对伊朗的军事打击。
伊朗对航运的干扰行为与过去胡塞武装的行动有相似之处，可能属于同一类冲突的延续。
美国在中东的军事介入已持续三十余年，当前行动更像是长期冲突中的又一章节，而非“终局”。
将战争归因于对全球航运安全的保护缺乏明确目标和国际支持，且与先发制人打击他国领导人的行为矛盾。
一些人质疑美国是否应继续支持乌克兰，认为其在中东的军事行动与对乌政策存在矛盾。
有观点认为，美国在中东的军事存在与对地区动荡负有责任，而欧洲却承担了大量难民压力。
有人指出，美国对中东的干预历史（如推翻伊朗政府、支持沙特等）是当前局势的重要成因。
伊朗的行动可被理解为对长期制裁、封锁和破坏核协议等行为的回应。
将伊朗称为“恐怖主义政权”存在争议，因为其攻击目标常包括非军事平民，这符合恐怖主义定义。
美国和以色列的军事行动在某些情况下也符合恐怖主义特征，如针对非战斗人员的袭击。
当前战争可能是为了转移公众对国内政治问题（如“杰弗里·爱泼斯坦文件”）的注意力。
有人认为战争是为防止中期选举期间可能发生的政变或权力更迭而进行的策略性操作。
战争的真正目的可能并非航运安全，而是维护美国在全球的霸权地位。
伊朗对航运的干扰行为是其对美国长期制裁和军事威胁的直接回应。
有观点认为，美国在中东的军事存在本质上是为维护石油利益和地缘控制，而非真正保障全球安全。

Hacker News 精彩评论及翻译 #

Nobody gets promoted for simplicity #

https://news.ycombinator.com/item?id=47247552

I had an interview question. What would you do if two different people were emailing a spreadsheet back and forth to track something?

I said I’d move them to google sheets. There was about five minutes of awkwardness after that as I was interviewing for software developer. I was supposed to talk about what kind of tool I’d build.

I found it kind of eye opening but I’m still not sure what the right lesson to learn was.

bilsbie

我遇到了一个面试问题：如果两个人通过来回发邮件来跟踪某个事项的电子表格，你会怎么做？我说我会让他们改用 Google Sheets。然后就有大约五分钟的尴尬时间，因为我当时应聘的是软件开发工程师，我本应该谈论我会构建什么样的工具。我觉得这有点启发性的，但我仍然不确定应该吸取什么正确的教训。

MacBook Neo #

https://news.ycombinator.com/item?id=47248588

If this makes people develop stuff under the assumption that the user only has 8 GB of memory, I am happy for where we are going :-)

reacharavindh

如果这能促使开发者在开发时都默认用户只有8GB内存，那我很高兴我们正朝着这个方向发展。

MacBook Neo #

https://news.ycombinator.com/item?id=47248919

This is a major challenge to Microsoft. A 13-inch Surface Laptop costs $899 [1], that’s 50% more than an equivalent MacBook! And even at that higher price the Surface Laptop doesn’t have a good screen: it uses 150% scaling (as opposed to the ideal 200%) which means you have subtle display artifacts.

Other than Microsoft nobody even makes decent laptops in the Windows world. I am typing this on an Lenovo Yoga, it has decent screen and keyboard, but the touchpad is horrible. Samsung makes good laptops but my keyboard gave out after just 2 years. Most other laptop makers have horrible industrial design. Dell XPS 17 was pretty good, but now they have weird keyboard.

The best laptop is now significantly cheaper than the horrible ones. Incredible achievement by Apple, and a major challenge to Windows laptop makers.

[1] https://www.microsoft.com/en-us/store/configure/surface-laptop-13-inch/8mzbmmcjzqv3

lateforwork

这对微软来说是一个巨大的挑战。一款13英寸的Surface笔记本电脑售价899美元[1]，这比同等配置的MacBook贵了50%！而且即使价格更高，Surface笔记本的屏幕也不好：它使用150%的缩放比例（而不是理想的200%），这意味着屏幕上会出现细微的显示瑕疵。

在Windows阵营里，除了微软，没人能生产出像样的笔记本电脑。我正在用联想Yoga打字，它的屏幕和键盘还不错，但触摸板糟透了。三星能生产出不错的笔记本电脑，但我的键盘用了两年就坏了。大多数其他笔记本电脑制造商的工业设计都很差劲。戴尔XPS 17曾经相当不错，但现在他们的键盘很奇怪。

现在最好的笔记本电脑比那些糟糕的笔记本电脑便宜多了。苹果取得了了不起的成就，这对Windows笔记本制造商来说是一个巨大的挑战。

[1] https://www.microsoft.com/en-us/store/configure/surface-laptop-13-inch/8mzbmmcjzqv3

MacBook Neo #

https://news.ycombinator.com/item?id=47252471

List of differences from the MacBook Air: * Only supports 8 GB of unified memory

No MagSafe
One of the two USB-C ports is limited to USB 2.0 speeds of just 480 Mb/s
No Thunderbolt support means the Neo cannot drive either of Apple’s new Studio Displays. However, it can push a 4K display with 60Hz refresh rate over USB-C.
“Just” 16 hours of battery life, compared to the 18 hours quoted for the 13-inch MacBook Air
Display supports sRGB, but not P3 Wide Color
No True Tone
1080p webcam doesn’t support Center Stage
No camera notch
Dual side-firing speakers, down from four speakers on the Air
Does not support Spatial Audio with dynamic head tracking on AirPods
Dual-mic system, down from a three-mic system on the Air
The 3.5 mm headphone jack does not have support for high-impedance headphones
No keyboard backlighting
Touch ID not included on base model
Trackpad does not support Force Touch
Supports Wi-Fi 6E, not 7
No fast charging
The Apple on the lid isn’t shiny

https://512pixels.net/2026/03/the-differences-between-the-macbook-neo-and-macbook-air/

theopsimist

与 MacBook Air 的差异列表：

仅支持 8GB 统一内存
无 MagSafe 充电接口
两个 USB-C 端口中的一个仅支持 USB 2.0 速度（仅 480 Mb/s）
不支持 Thunderbolt，因此 Neo 无法驱动苹果新款的 Studio Display。不过，它可以通过 USB-C 推送 4K、60Hz 刷新率的显示器。
电池续航“仅有”16小时，而 13 英寸 MacBook Air 标称续航为 18小时
显示器支持 sRGB，但不支持 P3 宽色域
无原彩显示（True Tone）功能
1080p 摄像头不支持居中舞台（Center Stage）功能
无前置摄像头“刘海”
双侧扬声器，而 Air 配备的是四个扬声器
不支持 AirPods 的空间音频与动态头部追踪功能
双麦克风系统，而 Air 配备的是三麦克风系统
3.5mm 耳机插孔不支持高阻抗耳机
无键盘背光
基础款不包含 Touch ID
触控板不支持力度感应（Force Touch）
支持 Wi-Fi 6E，但不支持 Wi-Fi 7
不支持快充
笔记本盖板的苹果标志不亮

MacBook Pro with M5 Pro and M5 Max #

https://news.ycombinator.com/item?id=47233173

I love the following section of their copy:

Even More Value for Upgraders

The new 14- and 16-inch MacBook Pro with M5 Pro and M5 Max mark a major leap for pro users. There’s never been a better time for customers to upgrade from a previous generation of MacBook Pro with Apple silicon or an Intel-based Mac.

I read as “Whoops we made the M1 Macbook Pro too good, please upgrade!”

I think I will get another 2-5 years out my mine.

Apple: If you document the hardware enough for the Asahi team to deliver a polished Linux experiene, I’ll buy one this year!

manofmanysmiles

我很喜欢他们文案中的这一部分：

升级者享更多价值

搭载M5 Pro和M5芯片的新款14英寸和16英寸MacBook Pro，为专业用户带来了巨大的飞跃。对于想要从搭载苹果自研芯片的上一代MacBook Pro或基于Intel的Mac电脑升级的客户来说，现在正是最好的时机。

我读起来感觉就像是：“哎呀，我们把M1 MacBook Pro做得太好了，请你们升级吧！”

我觉得我的这台还能再用2到5年。

苹果：如果你能为硬件提供足够详尽的文档，让Asahi团队能打造出完善的Linux体验，我今年就买一台！

Nobody gets promoted for simplicity #

https://news.ycombinator.com/item?id=47249689

Having been both the interviewer and the candidate in this kind of situation, this is really a big interviewer training failure.

The general way to handle this as an interviewer is really simple: acknowledge that the interviewee gave a good answer, but ask that for the purposes of evaluating their technical design skills that you’d like for them to design a new system/code a new implementation to solve this problem.

If the candidate isn’t willing to suspend disbelief for the exercise, then you can consider that alongside all of the other signals your interviewer team gets about the candidate. I generally take it as a negative signal, not because I need conformance, but because I need someone who can work through honest technical disagreements.

As a candidate, what’s worked for me before was to ask the interviewer if they’d prefer that I pretend ____ doesn’t exist and come up with a new design, but it makes me question whether I want to join that team. IMO it’s the systems design equivalent of the interviewer arguing with you about your valid algorithm because it’s not the one the interviewer expects.

munchbunny

作为面试官和候选人，我都经历过这种情况，这确实是一个严重的面试官培训失败。

面试官处理这种情况的标准方式其实很简单：首先承认候选人回答得很好，然后说明，为了评估其技术设计能力，希望他们能针对这个问题设计一个新系统/编写新的实现方案。

如果候选人不愿配合这个“假设性”的练习，那么面试官团队就可以将这一点视为评估候选人的多个信号之一。我个人通常将其视为一个负面信号，这并非因为我需要候选人盲从，而是因为我需要的是能够与同事坦诚技术分歧、共同解决问题的人。

作为候选人，我曾经成功应对过这种情况：我会询问面试官，他们是否更希望我假装“某个特定技术或条件”不存在，然后重新设计方案。但这个经历也让我开始质疑，我是否真的想加入那个团队。在我看来，这就像是系统设计版的“面试官因为你给出的算法不是他预想的那个，就与你争论你算法的有效性”一样。

Don’t become an engineering manager #

https://news.ycombinator.com/item?id=47233325

I cannot be alone in feeling that titles (within “tech” in particular) are almost completely arbitrary? What constitutes a “senior”, “lead”, “principal” and “staff” X, respectively, has so much overlap that it really depends on the organisation. I myself have been called all of those things, but have honestly not been able to tell the difference: in some cases, I have had much more responsibility as a “senior backend developer” than a “staff engineer”. I have recently interviewed for a number of roles with titles like CTO, engineering manager, tech lead etc and there is so much overlap that they seem to be one and the same. Have worked at companies on three continents, in organisations ranging from 6 people to 10k+, so have seen a few titles.

halper

我肯定不是唯一一个觉得（尤其是在“科技”行业里）头衔几乎是完全凭感觉来定的人吧？“高级”、“主导”、“首席”和“资深”X（工程师/开发者等）的定义有太多的重叠，以至于完全取决于具体的组织。我自己就曾被冠以所有这些头衔，但老实说，我根本看不出有什么区别：在某些情况下，我作为“高级后端开发人员”承担的责任远多于作为“资深工程师”时。我最近面试了许多职位，比如首席技术官、工程经理、技术主管等等，这些职位的职责范围有太多重叠，看起来简直就像一回事。我曾在三大洲的公司工作，组织规模从6人到一万多人不等，所以也算是见识过不少头衔了。

Making Firefox’s right-click not suck with about:c… #

https://news.ycombinator.com/item?id=47251908

In an alternative timeline, Firefox makes their context menu really short and someone writes a blog post ranting about how it deprives functionality from power users.

In fact, I’ve read several such rants about Firefox removing functionality from other parts of their UI.

It’s sure hard to make everyone happy.

agwa

在另一个时间线里，Firefox把右键菜单做得非常简短，于是有人写了一篇博客文章，猛烈抨击这种做法剥夺了高级用户的功能。事实上，我读过好几篇类似的抱怨文章，都是在批评Firefox在其他界面部分也移除了功能。要取悦所有人，可真不容易啊。

Google ends its 30 percent app store fee and welco… #

https://news.ycombinator.com/item?id=47253395

This is kind of a misleading title. While they “ended” the 30-percent cut, they are keeping a 20-percent cut.

jadar

这个标题有点误导性。他们虽然“结束”了30%的抽成，但保留了20%的抽成。

Intel’s make-or-break 18A process node debuts for … #

https://news.ycombinator.com/item?id=47237467

These sorts of core-density increases are how I win cloud debates in an org.

Identify the workloads that haven’t scaled in a year. Your ERPs, your HRIS, your dev/stage/test environments, DBs, Microsoft estate, core infrastructure, etc. (EDIT, from zbentley: also identify any cross-system processing where data will transfer from the cloud back to your private estate to be excluded, so you don’t get murdered with egress charges)
Run the cost analysis of reserved instances in AWS/Azure/GCP for those workloads over three years
Do the same for one of these high-core “pizza boxes”, but amortized over seven years
Realize the savings to be had moving “fixed infra” back on-premises or into a colo versus sticking with a public cloud provider

Seriously, what took a full rack or two of 2U dual-socket servers just a decade ago can be replaced with three 2U boxes with full HA/clustering. It’s insane.

Back in the late ’10s, I made a case to my org at the time that a global hypervisor hardware refresh and accompanying VMware licenses would have an ROI of 2.5yrs versus comparable AWS infrastructure, even assuming a 50% YoY rate of license inflation (this was pre-Broadcom; nowadays, I’d be eyeballing Nutanix, Virtuozzo, Apache Cloudstack, or yes, even Proxmox, assuming we weren’t already a Microsoft shop w/ Hyper-V) - and give us an additional 20% headroom to boot. The only thing giving me pause on that argument today is the current RAM/NAND shortage, but even that’s (hopefully) temporary - and doesn’t hurt the orgs who built around a longer timeline with the option for an additional support runway (like the three-year extended support contracts available through VARs).

If we can’t bill a customer for it, and it’s not scaling regularly, then it shouldn’t be in the public cloud. That’s my take, anyway. It sucks the wind from the sails of folks gung-ho on the “fringe benefits” of public cloud spend (box seats, junkets, conference tickets, etc…), but the finance teams tend to love such clear numbers.

stego-tech

这类核心密度提升，正是我在公司内部赢得云服务辩论的关键。

识别出一年内没有扩容的工作负载。例如您的ERP系统、HRIS系统、开发和测试环境、数据库、微软产品组合、核心基础设施等。（补充说明：同时也要识别出任何需要将数据从云传回私有环境进行处理的情况，以此排除这些工作负载，避免因出口数据传输而产生巨额费用）
为这些工作负载在AWS/Azure/GCP上计算为期三年的预留实例成本
再用同样的方法，为其中一台这样的高核心“披萨盒”式服务器做一次成本分析，但分摊周期为七年
你会发现，将“固定基础设施”迁移回本地机房或放入colo数据中心，相比于继续使用公共云服务提供商，能节省大量成本。

说真的，十年前需要一个或两个整机柜的2U双路服务器才能完成的任务，现在只需要三台带完全高可用/集群功能的2U服务器就能替换了。这简直太疯狂了。

早在2010年代末，我就当时所在的公司论证过：一次全球范围的虚拟化平台硬件升级及其配套的VMware许可证，其投资回报期为2.5年，这比使用相当的AWS基础设施成本更低。这个结论的前提是，我们假设许可证年通胀率为50%（那是在博通收购VMware之前；如果现在做同样的决策，我会认真考虑Nutanix、Virtuozzo、Apache Cloudstack，或者是的，甚至是Proxmox，前提是我们并非已经是使用Hyper-V的微软技术栈环境）——而且还能为我们额外提供20%的容量余量。如今唯一让我对这个论证有所保留的，是当前的内存和NAND闪存短缺，但即便是这样——希望也只是暂时的——对于那些围绕更长时间线进行规划、并拥有额外支持延长期（例如通过增值分销商可获得的三年延长支持合同）的组织来说，这也不是问题。

如果我们无法就此向客户收费，而且这些工作负载也不会定期扩容，那它就不应该放在公共云上。这就是我的看法。虽然这会让那些对公共云“附带好处”（如最佳看台座位、公费旅游、会议门票等）热情高涨的人感到失望，但财务团队通常会爱上这样清晰明了的数字。

MacBook Air with M5 #

https://news.ycombinator.com/item?id=47236877

This is the best laptop for the general consumer around $1k.

it has no annoying fans, it is completely silent
a high res display with no PWM flickering and reasonable response times, no burn-in issues, enough brightness for outdoor use
best-in-class hardware, very very efficient, amazing single thread performance, good multi thread, very good GPU
no Microsoft Windows annoyances, ads, bloatware, broken stuff all the time
much better real world performance on battery than x64 processors (!). you can get reasonable perf by setting Intel/AMD CPUs to high perf, but then goodbye battery life and get ready for very loud fans. this is simply a point not emphasized enough, the real world battery perf of Intel/AMD laptops is very sluggish on default power modes and despite that, they consume more battery than the M5
amazing battery life
good workmanship, no creaking, good hardware overall (mics, webcam, keyboard, touchpad!)
very good speakers There is simply nothing comparable in the Windows laptop world. You can maybe get a cheaper Windows laptop but it will be terrible in almost everything - the new Apple budget MacBooks will probably be a much better choice. And around $1000, there is no comparison. I wish it was different.

std_move

这是千元价位上最适合普通消费者的笔记本电脑。

没有烦人的风扇，完全静音
高分辨率屏幕，无PWM频闪，响应时间合理，无烧屏问题，户外使用亮度也足够
顶级的硬件，效率极高，出色的单核性能，良好的多核性能，非常棒的GPU
没有微软Windows的烦人之处，没有广告、臃肿软件和不断出故障的问题
在电池续航的实际表现上比x64处理器要好得多（！）。你可以通过将英特尔/AMD处理器设置为高性能模式来获得不错的性能，但那样电池续航就拜拜了，风扇也会变得非常吵。这一点显然强调得不够，英特尔/AMD笔记本电脑在默认电源模式下的实际电池性能非常糟糕，尽管如此，它们的耗电量仍比M5芯片高
惊人的电池续航
工艺精良，没有吱吱作响的响声，整体硬件（麦克风、摄像头、键盘、触摸板）都很好
非常好的扬声器

在Windows笔记本电脑世界里，根本没有可比的产品。你或许可以买到更便宜的Windows笔记本，但它在几乎所有方面都会很糟糕——新款的平价苹果MacBook可能会是更好的选择。而在1000美元左右的价格上，两者根本没有可比性。我真希望情况不是这样。

Agentic Engineering Patterns #

https://news.ycombinator.com/item?id=47246631

We’re going to do it again, aren’t we? We’re going to take something simple and sensible (“write tests first”, “small composable modules”, etc.), give it a fancy complicated name (“Behavior-Constrained Implementation Lifecycle pattern”, “Boundary-Scoped Processing Constructs pattern”, etc.), and create an entire industry of consultants and experts selling books and enterprise coaching around it, each swearing they have the secret sauce and the right incantations.

The damn thing talks. You can just speak to it. You can just ask it to do what you want.

lbreakjai

我们又会重蹈覆辙，不是吗？我们会把一些简单而明智的做法（比如“先写测试”、“小型可组合的模块”等），冠以一个花哨又复杂的名称（比如“行为约束型实现生命周期模式”、“边界范围处理结构模式”等），然后围绕它打造一整个咨询行业，里面的专家们出售书籍、提供企业培训，每个人都声称自己掌握了独门秘方和正确的咒语。

该死的东西会说话。你直接跟它说话就行。你直接让它做你想做的事情就行。

“It turns out” (2010) #

https://news.ycombinator.com/item?id=47248847

This was pointed out humorously by Douglas Adams:

“..am I alone in finding the expression ‘it turns out’ to be incredibly useful? It allows you to make swift, succinct, and authoritative connections between otherwise randomly unconnected statements without the trouble of explaining what your source or authority actually is. It’s great. It’s hugely better than its predecessors ‘I read somewhere that…’ or the craven ’they say that…’ because it suggests not only that whatever flimsy bit of urban mythology you are passing on is actually based on brand new, ground breaking research, but that it’s research in which you yourself were intimately involved. But again, with no actual authority anywhere in sight.”

gwd

道格拉斯·亚当斯曾幽默地指出：

“……难道只有我一个人觉得‘it turns out’（结果发现）这个表达极其有用吗？它让你能在原本随机无关的陈述之间，快速、简洁且权威地建立联系，而无需费心解释你的信息来源或权威依据是什么。这太棒了。它比它的前身‘我某处读到说……’或怯懦的‘他们说……’好得多，因为它不仅暗示你所传播的任何站不住脚的城市传说实际上基于全新的、突破性研究，还暗示这项研究你本人还深度参与其中。但话说回来，却根本看不到任何实际的权威依据。”

Physics Girl: Super-Kamiokande – Imaging the sun b… #

https://news.ycombinator.com/item?id=47235257

Dianna got better sometime last year as well, just in time to fly home to Hawaii for her father’s funeral (yeah …), but she got a lot worse again later. I really hope things will keep going well for Dianna now.

Props for her husband who’s been incredible of taking care of her.

roelschroeven

戴安娜去年也曾好转过，正好赶回夏威夷参加父亲的葬礼（啧啧…），但后来病情又再次恶化。真心希望她现在的情况能越来越好。她丈夫在照顾她方面做得非常出色，真了不起。

GPT‑5.3 Instant #

https://news.ycombinator.com/item?id=47240567

The single biggest issue for me with ChatGPT right now is how absolutely awful it sounds in every answer. “Why it matters”, “the big picture”, “it’s not jut you”, the awful emphasis, the quotations with rhetorical questions, etc.. I don’t know if it’s intentional so you can easily spot ChatGPT-generated content on the web? The very first GPT-5 version was good but they ruined it immediately afterwards with “making the personality warmer” and making the same mistakes as 4o. I see now that they even ruined Japanese even though it was one of the best languages supported by ChatGPT (under “Limitations” at the end). I don’t use it anymore, immensely disappointed.

sunaookami

目前对我来说，ChatGPT 最大的问题在于它每个回答的语气都糟糕透顶。“为什么这很重要”、“大局观”、“不只是你这样”，还有那种糟糕的强调方式、带修辞问题的引用等等。我不知道这是否是故意的，好让你能轻易地在网络上识别出由 ChatGPT 生成的内容？最初的 GPT-5 版本其实不错，但他们后来立刻搞砸了，用“让个性更温暖”的名义，犯了和 4o 一样的错误。我现在看到他们甚至把日语也搞砸了，尽管日语原本是 ChatGPT 支持得最好的语言之一（在文末的“局限性”部分里）。我已经不再使用了，感到极度失望。

I’m reluctant to verify my identity or age for any… #

https://news.ycombinator.com/item?id=47234879

I am in my mid forties, been working as a professional software developer for over 20 years.

I click “accept the cookies” almost every time. I just personally don’t feel it’s worth the effort and cost to try to avoid it.

What “dark pattern cookie trick” are you worried about? I just can’t come up with a scenario where it will actually harm me in any way. All the examples I have heard are either completely implausible, don’t actually seem that bad to me, or are things that are trivially easy to do even without any cookies.

Now, I am not going around giving my real email out to random sites, though, although even that doesn’t strike me as particularly dangerous. I already get infinite spam, and I am sure there are millions of other ways to get my email address… it is supposed to be something you give out, after all.

I just don’t think it is something that is worth stressing out about and fighting against. Maybe I am actually naive, but I just have not yet been convinced I should actually care.

cortesoft

我四十多岁，从事专业软件开发工作已有二十多年。我几乎每次都会点击“接受cookies”。我个人只是觉得，为了避开它而付出的努力和代价并不值得。你在担心什么“黑暗模式的饼干把戏”？我就想不出一个场景，能让我在其中真正受到任何伤害。我听过的所有例子，要么是完全不可信的，要么在我看来并没有那么糟糕，要么就是即便没有任何cookies也轻而易举能做到的事情。不过，我不会到处把我的真实邮箱地址随便给那些不认识的网站，虽然即便那样，我也并不觉得有什么特别危险的。我早就已经收到无穷无尽的垃圾邮件了，而且我肯定有无数其他途径能获取到我的邮箱地址……毕竟，它本就是用来被分享的东西。我只是觉得这不值得为此焦虑和抗争。也许我真的很天真，但我还没有被说服我应该真的在乎这些。

Something is afoot in the land of Qwen #

https://news.ycombinator.com/item?id=47250860

ICE has been detaining Chinese people in my area (and going door to door in at least one neighborhood where a lot of Chinese and Indians live). I was hearing about this just last week as word spread amongst the Chinese community here (Ohio) to make sure you have some legal documentation beyond just your driver’s license on you at all times for protection. People will hear about this through the grapevine and it has a massive (and rightly so) chilling effect. US labs can try but with US government behaving like it is I don’t think they will have much luck.

*edit: not that it matters, but since MAGA can’t help but assume, these are all US citizens and green card holders that I am referring to.

gaoshan

移民和海关执法局（ICE）正在我所在的地区拘留中国人（并且至少在一个华人印度裔聚居的社区进行挨家挨户的搜查）。上周我还听说，随着消息在我这里（俄亥俄州）的华人社区传开，大家都在互相提醒，为了自保，务必随身携带驾照以外的合法身份证明文件。人们会通过口耳相传了解到这件事，并因此产生了巨大的（而且完全在情理之中的）寒蝉效应。美国的实验室或许可以尝试，但照美国政府现在的行事方式，我看他们不会有什么好结果。

*编辑：虽然这无关紧要，但既然“让美国再次伟大”（MAGA）派忍不住要妄加揣测，我说的这些人全都是美国公民和绿卡持有者。

Making Firefox’s right-click not suck with about:c… #

https://news.ycombinator.com/item?id=47251715

Why do all of the above have …? No clue.

The “…” convention is used when menu options open a dialog box rather than just immediately doing the action.

wvenable

为什么以上所有都有“…”？我不知道。“…”这个惯例是指，当菜单选项会打开一个对话框，而不是直接执行操作时。

TikTok will not introduce end-to-end encryption, s… #

https://news.ycombinator.com/item?id=47243038

Brilliant. They’re repackaging the argument governments have long made about E2EE being dangerous to children.

xeckr

太棒了。他们重新包装了政府长期以来一直持有的论点，即端到端加密对儿童有害。

GPT‑5.3 Instant #

https://news.ycombinator.com/item?id=47236785

I’m a bit confused by this branding (never even noticed that there was a 5.2-Instant), it’s not a super fast 1000tok/s Cerebras based model which they have for codex-spark, it’s just 5.2 w/out the router / “non-thinking” mode?

I feel like openai is going to get right back to where they were pre GPT-5 with a ton of different options and no one knows which model to use for what.

Flux159

我对这个品牌命名有点困惑（我甚至都没注意到有 5.2-Instant 这个版本），它并非像他们为 Codex-Spark 提供的那种基于 Cerebras 的、速度极快的 1000tok/s 模型，它只是 5.2 版本，没有路由器，或者说是一种“非思考”模式？

我感觉 OpenAI 又会回到 GPT-5 之前的状态，提供一大堆不同的选项，结果没人知道该在什么场景下使用哪个模型。

MacBook Pro with M5 Pro and M5 Max #

https://news.ycombinator.com/item?id=47234436

I chased down what the “4x faster at AI tasks” was measuring:

Testing conducted by Apple in January 2026 using preproduction 13-inch and 15-inch MacBook Air systems with Apple M5, 10-core CPU, 10-core GPU, 32GB of unified memory, and 4TB SSD, and production 13-inch and 15-inch MacBook Air systems with Apple M4, 10-core CPU, 10-core GPU, 32GB of unified memory, and 2TB SSD. Time to first token measured with an 8K-token prompt using a 14-billion parameter model with 4-bit quantization, and LM Studio 0.4.1 (Build 1). Performance tests are conducted using specific computer systems and reflect the approximate performance of MacBook Air.

jbellis

我查明了“AI任务快4倍”具体指的是什么测试：

苹果于2026年1月进行的测试，使用的是配备Apple M5、10核CPU、10核GPU、32GB统一内存和4TB SSD的13英寸和15英寸MacBook Air工程样机，以及配备Apple M4、10核CPU、10核GPU、32GB统一内存和2TB SSD的13英寸和15英寸MacBook Air量产机型。首次响应时间是通过使用8K token的提示，在4位量化的140亿参数模型上，使用LM Studio 0.4.1（版本1）进行测量的。性能测试是在特定的计算机系统上进行的，并反映了MacBook Air的大致性能。