2025 12 13 HackerNews

2025-12-13 Hacker News Top Stories #

  1. OpenAI 发布 GPT-5.2,显著提升专业任务、长上下文与工具调用能力并逐步向付费用户与开发者开放。
  2. 作者用超级电容和自制“假电池”修复并复活了诺基亚 N900,使其运行 Maemo Leste 并稳定作为网络收音机使用。
  3. 作者批评现代软件命名混乱,呼吁恢复以功能为导向的命名以降低认知成本。
  4. 作者的 Bear Blog 在验证一个 RSS 链接后被 Google 大规模取消索引,原因不明并已迁域寻求社区帮助。
  5. Rivian 公布自研芯片、R2 激光雷达路线图与通用无手驾驶计划,拟通过 OTA 与订阅服务推动智能出行平台化。
  6. 英国上议院拟立法禁止 16 岁以下使用 VPN 并要求服务商监控,遭到隐私与可行性方面的强烈批评。
  7. 第九巡回上诉法院认定苹果对 iOS 应用外部支付的限制具有阻碍性,允许收取合理“实际成本”费,Epic 宣称“苹果税”终结。
  8. Litestream 推出 VFS 插件,使 SQLite 可按需从对象存储读取页面以实现高效增量恢复与按时间点查询,适合只读审计与误操作恢复。
  9. React 团队披露 Server Components 中的拒绝服务与源码泄露漏洞并已发布修复,建议相关项目尽快升级受影响版本。
  10. 作者主张单一独立的 SVG 文件即可承载数据嵌入、前端计算与交互可视化,具持久性与可复现性,适合科研传播。

OpenAI 发布 GPT-5.2,当前最先进的前沿模型,专为专业工作与长期运行的智能体设计 (GPT-5.2) #

https://openai.com/index/introducing-gpt-5-2/

OpenAI 发布了 GPT-5.2,这是目前最先进的前沿模型,专为专业工作和长期运行的智能体设计。该模型在多项基准测试中表现卓越,尤其在经济价值高的任务中展现出显著优势。

GPT-5.2 Thinking 在 GDPval 评测中达到 70.9% 的胜率或平局,首次在 44 个职业的知识工作任务中达到或超过人类专家水平。其生成的演示文稿、电子表格等专业产出质量高,速度超过人类 11 倍,成本不足 1%。在投资银行建模任务中,平均得分从 GPT-5.1 的 59.1% 提升至 68.4%。

在编程领域,GPT-5.2 Thinking 在 SWE-Bench Pro 上取得 55.6% 的新高,涵盖四种编程语言,更具工业相关性。在 SWE-Bench Verified 中得分达 80%,在代码修复、重构和功能实现方面表现更稳定。它在前端开发方面尤其出色,能高效生成包含 3D 元素的复杂 UI,如海洋波浪模拟器、节日贺卡生成器等。

在科学与数学方面,GPT-5.2 在 GPQA Diamond(无工具)中达到 92.4%,AIME 2025 竞赛数学题中实现 100% 正确率,FrontierMath 与 ARC-AGI-2 任务中也大幅领先。

GPT-5.2 在长上下文理解、工具调用和视觉感知方面均有显著提升,支持更复杂的多步骤任务。已有多家知名公司(如 Notion、Box、Shopify、Zoom、Databricks、Hex 等)验证其在智能体任务、数据科学和文档分析中的卓越表现。

GPT-5.2 Instant、Thinking 和 Pro 版本已开始向 ChatGPT 付费用户逐步推出,API 版本对所有开发者开放。模型命名统一,价格按每百万 token 计费,具体定价信息可在官网查询。

总体而言,GPT-5.2 是目前最强大的 AI 模型,适用于专业工作、复杂项目执行和智能体自动化,大幅提升了 AI 在真实世界中的应用价值。


HN 热度 1159 points | 评论 1034 comments | 作者:atgctg | 1 day ago #

https://news.ycombinator.com/item?id=46234788

  • 当前大模型在多数个人使用场景下已接近人类水平,主要瓶颈在于缺乏足够可靠的事实依据,而非智能本身。
  • 模型常生成看似合理实则错误的信息,导致用户可能被误导,尤其在不关心的领域更易产生认知偏差。
  • 现有“验证”功能效果有限,无法有效解决模型虚构内容的问题,需更深层次的改进。
  • 更好的事实锚定能力比提升“智能”更为关键,应优先解决模型的可信度问题。
  • 仅提供置信度分数无法真正解决问题,因为分数本身也是基于训练模式生成的,未必反映真实准确性。
  • 大模型本质上是在高维语言统计空间中生成最可能的文本延续,而非真正“理解”或“知道”事实。
  • 人类大脑与大模型在信息处理机制上存在根本差异,人类在不知情时通常会坦承“不知道”,而模型则倾向于编造。
  • 人类不编造信息更多是受社会规范和惩罚机制影响,而非内在认知结构不同。
  • 模型的“幻觉”并非缺陷,而是其生成机制的必然结果,需通过引入外部知识源或工具链来改善。
  • 人类在面对未知时会主动拒绝回答,而模型则不会,这种差异揭示了其本质不同。
  • 该技术本质上是通过预测用户思维模式来生成回应,而非真正理解信息。
  • 将大模型视为“随机鹦鹉”是合理的,其价值在于激发用户思考,而非替代人类判断。
  • 该技术真正价值在于辅助有专业背景的人提升效率,而非取代人类。
  • 人类的直觉与模型的生成过程在机制上存在相似性,都是基于已有信息的最可能推断。
  • 模型生成内容的“灵感”性质对人类思维有启发作用,但需使用者具备批判性思维。

诺基亚 N900 亡灵复苏记 (Nokia N900 Necromancy) #

https://yaky.dev/2025-12-11-nokia-n900-necromancy/

作者收到朋友赠送的老旧诺基亚 N900 智能手机,由于电池老化无法开机,决定尝试“复活”它。他首先用超级电容替代电池,通过外部 5V 电源供电,成功让设备启动,验证了可行性。

随后,他设计了一个更紧凑的“假电池”方案,使用 10 个 47000μF 电容并 3D 打印外壳,使其能装入原电池仓。但因电容发热和焊接问题,设备曾因系统分区损坏而崩溃,幸而可通过 SD 卡启动,且已刷入 Maemo Leste 系统。

为简化供电,他尝试用原 USB 接口供电,但因接口老化,焊接点脱落,甚至撕裂了主板上的 5V 焊盘,导致 USB 功能彻底失效。

最终,他决定彻底改造:将原 micro-USB 接口替换为 USB-C 接口。通过手工打磨和粘合,将小型 USB-C 接口安装在原位,仅连接 5V 和 GND 两根线,未焊接 CC 引脚,因此仅支持 500mA 的“普通”供电,无法使用 PD 快充。

他将电源线引至电池仓,使用一个 3D 打印的“新电池”外壳,内部集成大电容、二极管、杜邦接头,并保留原电池的 BCM 控制模块。新电池结构紧凑,仅比原电池略高 0.25–0.5mm,仍可正常闭合后盖。

最终,N900 成功开机,可稳定运行,被用作网络收音机设备,借助 Open Media Player 实现新用途。整个项目体现了极客精神,也展示了老设备通过创意改造焕发新生的可能性。


HN 热度 458 points | 评论 179 comments | 作者:yaky | 1 day ago #

https://news.ycombinator.com/item?id=46239177

  • N900 是移动计算巅峰之作,具备强大的自由度和“赛博朋克”风格,能通过 BitTorrent 下载字幕并用编辑器查看,体现了无需许可的计算自由。
  • N950 是 N900 的真正继承者,拥有物理键盘和 N9 系统,虽未大规模发售,但被爱好者视为完美设备。
  • 有用户低价购入并修复了故障的 N950,转售获利,认为其设计精美,可惜未保留。
  • 当前 eBay 上全新未拆封的 N950 售价高达 5 万美元,反映出其收藏价值。
  • 一些用户在退役的 N900 上运行自托管服务器,证明其作为小型计算设备的实用性。
  • 与 iPhone 相比,N900 的功能对普通用户而言过于复杂,苹果凭借简洁易用的用户体验赢得市场。
  • 尽管 N900 功能强大,但其目标用户群体太小,无法支撑像诺基亚这样的巨头持续盈利。
  • 诺基亚的失败并非源于转向 Windows Phone,而是早已因缺乏软件生态而注定衰落。
  • N900 在部分市场销量尚可,但整体销售数据远低于 iPhone,无法改变其市场失败的命运。
  • 诺基亚高层意识到 N900 在北美市场难以与 iPhone 和黑莓竞争,因此未在北美发布。
  • N900 的成功在于其对普通用户同样友好,但被公司战略误判所扼杀。
  • 诺基亚的衰落是必然的,即便没有转向 Windows Phone,也难以与苹果和谷歌竞争。
  • N900 作为 Debian Linux 系统的嵌入式设备,适合运行个人项目和复古软件,如迷你计算机模拟器。
  • 现代设备如 GPD Pocket 4 提供了类似体验,具备 4G 支持,但尚未支持 5G。
  • 有人提出,现代可运行 Linux 的小型设备(如 GPD Win Max 2)已实现 N900 的理念,只是形态不同。
  • 现代技术已足够支持打造一款类似 N900 的设备,甚至可仅通过手机热点连接,无需独立蜂窝模块。
  • 问题不在于技术可行性,而在于如何将这类设备做成可持续的商业产品。
  • 诺基亚的失败是战略误判,而非产品本身问题,其硬件和系统设计在当时极具前瞻性。

程序员和软件开发者在命名工具时迷失了方向 (Programmers and software developers lost the plot on naming their tools) #

https://larr.net/p/namings.html

文章批评了现代软件开发领域在命名工具和库时普遍存在的问题,指出许多项目名称缺乏实际意义,仅基于随机名词、神话生物或虚构角色,导致开发者难以理解其功能。

作者引用理查德·斯托曼在 2022 年 EmacsConf 演讲中的观点,强调“有意义的名称”应帮助用户记忆其用途。对比其他工程领域如建筑、化学、机械等,这些领域的命名都具有明确的功能或逻辑关联(如“I-beam”因形状得名,“2,2,4-trimethylpentane”有精确化学定义),而软件领域却逐渐偏离这一原则。

文章回顾了早期软件工具的命名传统:grep(全局正则表达式打印)、awk(三位创建者姓名首字母)、sed(流编辑器)、cat(连接文件)等,名称均反映功能或来源。编程语言如 FORTRAN、COBOL、SQL、Lisp 也遵循类似逻辑。

然而,自 2010 年代起,一种“命名 meme”在开源社区蔓延。GitHub 和创业文化推动了对“酷”“有趣”名字的追求,导致大量无意义命名泛滥,如 Viper、Cobra、Melody、Casbin、Asynq 等,名称与功能毫无关联,增加了开发者认知负担。

作者指出,每个模糊的名称都带来“认知税”——开发者必须花时间查文档才能理解其用途。在团队协作或技术讲解中,这种混乱会严重干扰沟通效率。举例说明,当描述系统架构时,使用“Viper 管理配置,Cobra 处理 CLI,Melody 处理 WebSocket”等说法,如同医生说“在你的 Whisper 中安装 Butterfly 来改善 Thunderbeat”,令人费解。

针对常见辩解,作者逐一回应:

  • “名字好记有助于营销”:对开发者工具而言,功能清晰比营销更重要;
  • “描述性名字太无聊”:工程领域本就不追求趣味,清晰才是首要;
  • “只是好玩而已”:个人趣味带来全行业的认知成本;
  • “好名字都被占了”:可用前缀、命名空间或类比方式(如 magit)提升可读性。

文章最后呼吁进行“文化修正”:编程从企业主导向社区驱动转变是好事,但不应以牺牲清晰性为代价。应重建以功能为导向的命名规范,让工具名真正服务于理解与协作。


HN 热度 403 points | 评论 507 comments | 作者:todsacerdoti | 1 day ago #

https://news.ycombinator.com/item?id=46234806

  • GNU 的 Yacc 被重命名为 Bison,Pine 不是 Elm,UNIX 源自 UNICS 的双关语,这些命名都体现了早期开发者对命名的幽默与创意。
  • dd 命令的名称来源复杂,最初可能与 IBM 大型机的 JCL 语言中的 DD 语句有关,意为“数据定义”或“设备描述”,但其实际功能与名称关联较弱。
  • 关于 dd 的命名,存在多种误解,如“数据复制”“磁盘破坏者”“磁盘杜普”等,但这些说法均缺乏确凿依据,真实来源仍存争议。
  • C++ 的命名源于 C 语言的“后缀递增”操作符,而 C 语言本身是 B 语言的后继,B 又源自 BCPL,体现了语言演进的逻辑。
  • 现代工具如 Clang、LLDB、jq、fzf、loc 等命名清晰、简洁,符合命名应具有的直观性和功能性。
  • “mise-en-place”这一术语恰如其分地比喻了 mise 工具的功能,即为工作环境做好准备。
  • 一些工具如 Perl、Python、Java、Go、Pascal 等命名各有来源,有的源于文化(如 Monty Python)、有的源于产品(如咖啡豆)、有的源于技术背景(如 Pascal 数学家)。
  • Java 最初名为 Oak,因 Sun 公司营销人员觉得“Java”更具吸引力而更名,与语言本身无直接关联。
  • Git 的命名带有反主流文化的意味,象征着早期程序员对主流版本控制系统的反抗,具有鲜明个性。
  • GIMP 和 GTK 的命名是 GNU 不是 UNIX 的递归缩写,虽形式复杂但功能指向明确,体现了命名的自嘲与幽默。
  • 早期命名虽看似随意,实则蕴含历史背景与文化语境,不能简单归结为“失去命名逻辑”。
  • 命名的“合理性”不应以现代标准苛求历史工具,许多看似荒诞的名称背后都有特定语境与技术渊源。

Google 取消索引 Bear Blog,原因不明 (Google de-indexed Bear Blog and I don’t know why) #

https://journal.james-zhan.com/google-de-indexed-my-entire-bear-blog-and-i-dont-know-why/

作者 James Zhan 在使用 Bear Blog 搭建个人博客后,遭遇了 Google 完全取消索引其整个博客的异常情况。他的博客 blog.james-zhan.com 在发布初期正常被 Google 索引,且文章能快速出现在搜索结果中。然而在 10 月 14 日,他无意中尝试验证一个 RSS 链接( https://blog.james-zhan.com/feed/?type=rss),该链接并非网页页面,随后 Google 在 10 月 20 日通知其“部分页面索引失败”。

从那时起,除一篇外,所有博客文章均被 Google 从索引中移除,显示为“已爬取但未索引”。尽管作者多次提交站点地图、请求重新索引,问题仍未解决,至今验证状态仍停留在“进行中”。

作者排查了多个可能原因:域名问题(GoDaddy)、内容质量、内部链接结构、CSS 样式等,均被排除。他发现其他使用相同域名和 Bear Blog 的博客正常被索引,且内容更简略的博客也能被 Google 收录,说明内容质量并非主因。

在联系 Bear Blog 创始人 Herman 后,对方协助排查,确认网站代码、DNS、HTML/CSS 均无问题。最终确认问题与作者误操作验证非页面链接有关,但具体为何导致全站被取消索引仍不明确。

目前作者已将博客迁移至 journal.james-zhan.com,并完成跳转,但对 Google 的处理机制仍感到困惑。他希望通过本文引发讨论,寻找可能的解释或类似案例。


HN 热度 400 points | 评论 167 comments | 作者:nafnlj | 24 hours ago #

https://news.ycombinator.com/item?id=46239752

  • AI 摘要功能导致用户直接在搜索结果页阅读摘要,不再点击原始网页,造成点击率下降。
  • 搜索页面被恶意用户利用,通过在链接中嵌入垃圾内容查询参数,导致搜索引擎误认为网站推广诈骗信息。
  • 通过在搜索页面添加 robots noindex 元标签,阻止搜索引擎索引该页面,从而恢复流量和点击率。
  • 搜索结果页面被外部网站链接并被爬虫抓取,导致垃圾内容被索引,与缓存无关,而是链接传播问题。
  • Google 的 AI 摘要功能可能被恶意利用,通过链接传播查询参数,使搜索引擎误将垃圾内容视为事实。
  • 搜索页面若允许用户输入并显示查询内容,需避免被搜索引擎索引,否则可能被滥用为垃圾信息传播渠道。
  • Google 在 9 月调整了点击和展示数据的统计方式,导致前后数据不可比,影响流量分析准确性。
  • AI 摘要功能推动了广告和付费内容在搜索结果中的优先展示,进一步削弱了用户点击真实网页的意愿。
  • 建议 Google 让 AI 摘要中的内容可点击,并链接到具体来源,以提升信息可信度和用户点击意愿。
  • DuckDuckGo 和 Kagi 等搜索引擎在 AI 摘要中提供可点击的引用来源,用户体验更佳。
  • AI 摘要功能发布后,引用来源的呈现方式变差,缺乏编号和与具体陈述的关联,影响信息溯源。

Rivian 发布自研芯片、R2 激光雷达路线图及通用无手驾驶功能 (Rivian Unveils Custom Silicon, R2 Lidar Roadmap, and Universal Hands Free) #

https://riviantrackr.com/news/rivian-unveils-custom-silicon-r2-lidar-roadmap-universal-hands-free-and-its-next-gen-autonomy-platform/

Rivian 在 2025 年 12 月 11 日举办首届“自主驾驶与 AI 日”,全面展示了其下一代自动驾驶平台的最新进展。

核心亮点包括:

  • 发布首款自研芯片 RAP1,采用 5nm 工艺,具备 1600 亿次稀疏 INT8 TOPS 算力,专为 Gen 3 自动驾驶计算机设计,并配套自研 AI 编译器与平台软件。
  • R2 车型将搭载新一代 Autonomy Compute Module 3(ACM3)自动驾驶计算机,预计 2026 年底推出,初期不配备激光雷达(LiDAR),但官方确认未来将通过软件升级添加,用于增强感知系统的冗余与精度。
  • Rivian 构建了“大型驾驶模型”,基于自学习数据闭环训练,采用类似大语言模型(LLM)的训练方式,结合强化学习优化驾驶行为,逐步实现从点对点自动驾驶到“无手驾驶”乃至个人化 Level 4 自动驾驶。
  • Gen 2 R1T 与 R1S 将通过软件更新获得“通用无手驾驶”功能,覆盖美加地区超 350 万英里带清晰车道线的道路,显著扩展现有辅助驾驶范围。
  • 2026 年将推出“Autonomy+”订阅服务,一次性支付 2500 美元或每月 49.99 美元,持续提供功能升级。
  • 推出“Rivian 统一智能”平台,整合车辆数据、云端模型、服务系统与用户功能,支撑预测性维护与智能诊断。
  • 2026 年将上线新一代“Rivian 助手”,支持上下文理解与日程管理,Gen 2 车型将实现部分离线运行,R2 车型则可完全离线运行,提升响应速度与隐私保护。
  • 服务端引入 AI 驱动的专家系统,帮助技师快速精准诊断问题,未来也将集成至移动端,提升自助诊断能力。

评论区讨论热点:

  • 多位用户质疑是否会对现有车型(如 Gen 1 R1T/R1S)进行硬件升级(如加装 LiDAR 或新计算模块),但普遍认为可能性极低,Rivian 更倾向于推动新车销售。
  • 部分用户对“Rivian 助手”优先集成 Google 日历等非核心功能表示失望,认为应优先优化 CarPlay、音乐等基础体验。
  • 有用户担忧 Rivian 是否能兑现技术承诺,避免“永远在开发中”的“空气功能”问题。
  • 也有观点认为,Rivian 正通过快速迭代推动用户换车周期,形成持续订阅与硬件更新的商业模式。

整体来看,Rivian 正从车辆制造商向“智能出行平台”转型,强调自研芯片、AI 系统与数据闭环,构建全生命周期的智能体验。


HN 热度 386 points | 评论 606 comments | 作者:doctoboggan | 1 day ago #

https://news.ycombinator.com/item?id=46234920

  • 自动驾驶功能未来很可能以订阅模式提供,这有助于持续开发和维护,且可能与保险捆绑,提升商业可行性。
  • 自动驾驶与保险捆绑销售更具吸引力,即使价格略高,也能为用户提供更全面的保障,尤其对当前保险费用较高的人群。
  • 即使自动驾驶未达到 100% 水平,90% 的自动化也能显著降低事故率,使捆绑保险模式具备现实基础。
  • 高频但低严重性的事故(如停车场刮蹭)在自动驾驶普及后仍难以完全避免,技术对复杂交通环境的改善有限。
  • 保险本质上是资本管理,若科技公司缺乏足够储备金,可能因重大事故导致破产,引发公众强烈反弹。
  • 大型科技公司如谷歌拥有雄厚资金,足以应对潜在巨额索赔,但可能通过法律手段规避责任,而非直接赔付。
  • 保险公司通常通过再保险来分散极端风险,形成复杂的再保险链条,以防止系统性崩溃。
  • 自动驾驶车辆若因软件缺陷导致大规模事故,将带来前所未有的系统性风险,远超传统交通事故的随机性。
  • 软件更新应分区域、分场景逐步推送,以降低大规模故障风险,这是行业普遍做法。
  • 即使采用渐进式更新策略,仍存在系统性失败的可能性,不能完全排除风险。
  • 保险公司面临的风险类型正在变化,自动驾驶的软件缺陷可能引发全车队同时故障,类似自然灾害的集中性冲击。
  • 汽车本身成本较低,但人员伤亡或重大财产损失的赔偿金额极高,对保险公司构成巨大压力。
  • 保险公司在面对大规模自然灾害(如飓风、火灾)时,也需依赖再保险机制来管理风险。

英国上议院拟立法禁止 16 岁以下人群使用虚拟私人网络 (UK House of Lords attempting to ban use of VPNs by anyone under 16) #

https://alecmuffett.com/article/134925

英国上议院正试图通过一项草案,禁止 16 岁以下人群使用虚拟私人网络(VPN)。该提案要求 VPN 服务提供商必须监控并有效执行对未成年人的使用禁令,且若服务面向或被大量英国用户使用,将被认定为“相关 VPN 服务”。这一措施被批评为不切实际且荒谬,因为 VPN 技术可由个人自行搭建,监管难度极大,如同试图禁止 DIY 行为。此外,该禁令可能波及 Tor 项目等隐私保护工具,严重威胁网络自由与隐私权。

文章指出,此类政策反映出各国保守派试图在“儿童安全”名义下过度干预网络自由,实则加剧了对公民数字权利的侵蚀。作者认为,真正的网络保护应基于教育与技术赋能,而非强制封锁与监控。该议题引发广泛争议,相关讨论在 Fediverse 等平台持续发酵。


HN 热度 377 points | 评论 415 comments | 作者:nvarsj | 1 day ago #

https://news.ycombinator.com/item?id=46236738

  • 英国上议院拟议的法案不仅包含禁止 16 岁以下使用 VPN 的规定,更关键的是要求所有在英国销售的设备必须安装防篡改的系统软件,以防止儿童色情内容的录制、传输和观看。
  • 该法案可能迫使科技公司如苹果在设备中强制植入政府控制的软件,严重威胁计算机用户对设备的自主控制权。
  • 有人认为这标志着计算机自由的终结,一旦通过,将导致个人对计算机的控制权被法律剥夺,且这种趋势可能蔓延至全球。
  • 有人提出,若政府强制推行此类控制,将催生地下组织和非法硬件交易市场,但这些资源有限,难以长期维持。
  • 有人认为,唯一长期可行的解决方案是实现半导体制造的去中心化,使个人能够在家中制造自由的计算机硬件,以摆脱对大型制造厂的依赖。
  • 有人反驳称,实现个人制造芯片在物理上不现实,但可以借鉴过去通过进口中国设备绕过区域限制的做法。
  • 有人指出,英国的官僚体系倾向于扩大自身权力,而儿童色情内容(CSAM)成为控制数字世界的绝佳借口。
  • 有人认为这并非英国特有的文化问题,而是全球范围内左翼与右翼政治力量在数字控制上的共同趋势,美国因宪法限制而暂时例外。
  • 有人反驳称,英国保守党并非左翼,而是右翼且具有威权倾向,其政策如《调查权力法案》和《在线安全法案》均体现了对公民自由的侵蚀。
  • 有人指出,英国保守党在执政期间推行了大规模财政紧缩政策,削减公共部门规模,而非扩大政府权力,因此称其为“左翼”是误解。
  • 有人认为,目前唯一明确反对该法案的政党是改革党(Reform Party),其他政党均支持此类扩张性监管措施。
  • 有人强调,美国宪法中的自由主义价值观是其与其他国家不同的关键,但这一优势正面临挑战。

Epic 庆祝法院胜诉,称“苹果税”时代终结 (Epic celebrates “the end of the Apple Tax” after court win in iOS payments case) #

https://arstechnica.com/tech-policy/2025/12/epic-celebrates-the-end-of-the-apple-tax-after-appeals-court-win-in-ios-payments-case/

苹果在 iOS 支付争议案中败诉,其上诉被美国第九巡回上诉法院几乎全部驳回。2025 年 4 月,法官尤文娜·冈萨雷斯·罗杰斯裁定苹果“故意违反”2021 年法院命令,该命令要求开放 iOS 应用内支付渠道。此次上诉法院确认,苹果此前对使用外部支付方式的开发者收取 27% 费用的行为具有“阻碍性”,违反了禁令。

法院还指出,苹果对引导用户使用外部支付链接的设计限制过于宽泛,仅需确保内部与外部支付选项呈现方式相似即可。同时,法院认定苹果在合规问题上存在“恶意”,拒绝采纳可行的合规方案,并驳回其以律师-客户特权为由拒绝提交内部文件的主张。

尽管上诉法院未完全禁止苹果收取费用,但允许其基于“实际成本”收取“合理费用”,以保障用户安全与隐私。Epic 游戏创始人蒂姆·斯威尼表示,这类费用应仅为“数十至数百美元”,仅用于覆盖应用审核的人力成本,远低于当前的 30%“苹果税”。

斯威尼认为,这一判决标志着“苹果税”在美国已终结,将推动全球 iOS 平台支付方式的真正竞争。他预测,到 2026 年底,通过网页支付方式绕过 App Store 将成为主流,Epic 推出的 Epic Web Shops 也将迎来大规模采用。

目前,许多开发者此前因担心苹果报复而犹豫不决,如今这一顾虑已消除,预计将出现快速转型。苹果方面尚未对此回应。


HN 热度 361 points | 评论 246 comments | 作者:nobody9999 | 9 hours ago #

https://news.ycombinator.com/item?id=46245398

  • 每个可编程设备的制造商都不应阻止购买者重新编程设备。
  • 重新编程 GPS 模块、GSM 模块以及汽车中的许多部件在法律和合同上都是被禁止的。
  • 有人认为重新编程 GPS 接收器并不会使其变成干扰器,制造干扰器的难度并不因设备可重新编程而降低。
  • 限制重新编程是为了防止设备被用于非法目的,如制造导弹,但这种风险在不可重新编程的设备上同样存在。
  • 重新编程设备不应被普遍禁止,除非其行为本身违法;禁止重新编程是过度宽泛的限制。
  • 无线电硬件不应被轻易重新编程以超过规定的功率限制,这是合理的。
  • 对于医疗设备如起搏器,应强制公开源代码,以确保安全性和可审查性。
  • 无线电频谱资源有限,广播行为必须受到监管,防止干扰公共通信。
  • 通过监管制造商来控制设备的无线电功能,比依赖用户自律更有效。
  • 限制用户修改设备的软件,是为了防止未经授权的操作,如改变频率、功率或调制方式。
  • 重新编程设备以超过合法范围操作无线电功能,应被严格禁止,这类似于交通法规中的限速。
  • 限制设备的软件修改,是制造商在申请设备认证时必须遵守的规定,以确保符合监管要求。

Litestream VFS (Litestream VFS) #

https://fly.io/blog/litestream-vfs/

Litestream 是一个为 SQLite 提供备份与恢复功能的开源工具,由 Fly.io 的 Ben Johnson 主导开发。它允许用户将 SQLite 数据库的备份存储在对象存储(如 AWS S3)中,并支持直接从远程存储读取数据,无需下载整个数据库文件。

文章通过一个“三明治评分”数据库的示例,演示了如何使用 Litestream VFS(虚拟文件系统)插件,在本地通过 SQLite 命令行直接查询远程备份数据。只需加载 Litestream 插件并指定 VFS 为 litestream,即可连接到 S3 中的备份,执行查询操作,甚至在不下载完整数据库的情况下完成查询。

当生产环境发生误操作(如错误地将所有三明治评分设为 1 星)时,Litestream 支持即时点恢复(PITR)。通过设置 PRAGMA litestream_time = '5 minutes ago',可以查询数据库在某一时间点的状态,实现快速数据恢复,而无需完整还原。

核心技术基于 LTX 格式,这是一种专为 SQLite 设计的数据传输格式,支持“压缩”机制。LTX 能自动跳过冗余的页面版本,仅保留每个页面的最新状态,显著提升恢复速度。备份按时间分层存储:每日全量快照 + 多级增量变化集(从每小时到每 30 秒),支持高效定位目标时间点的数据。

Litestream VFS 的实现依赖于 SQLite 的 VFS 接口。它不替换 SQLite,而是作为插件运行,仅接管读取操作。当 SQLite 请求读取某个页面时,VFS 通过预先构建的页面索引(来自 LTX 文件的元数据)计算出远程文件的精确偏移量,并利用 S3 的 Range 请求头直接下载所需数据块,实现按需读取,极大节省带宽和时间。

该功能适用于需要快速查询生产数据、进行数据审计或恢复误操作的场景,尤其适合不想直接登录生产服务器、又希望安全、高效访问历史数据的开发者。尽管 VFS 需要额外加载插件,但原生 Litestream 功能(如自动备份)仍可独立使用,不影响现有应用。


HN 热度 354 points | 评论 82 comments | 作者:emschwartz | 1 day ago #

https://news.ycombinator.com/item?id=46234710

  • Litestream VFS 利用了作者自己开发的 Go SQLite VFS 模块,实现了对 SQLite 数据库的透明读取和点对点恢复功能。
  • 该工具让开发者可以轻松地在生产环境中通过 SQL 查询历史数据,而无需手动操作命令行或恢复整个数据库。
  • 使用方式简洁,只需设置环境变量和加载扩展,即可在 SQLite 命令行中通过 PRAGMA 语句指定时间点进行查询。
  • 对于 macOS 用户,需手动指定 libsqlite3.dylib 路径和 sqlite3_litestreamvfs_init 初始化函数名。
  • 在 Bun 环境中使用 bun:sqlite 时,需正确设置自定义 SQLite 路径并加载扩展,且环境变量必须在运行时直接设置,不能通过 dotenv 加载。
  • Litestream VFS 会每秒自动轮询远程备份,实时同步数据,无需额外代码即可感知外部更新。
  • 该方案适用于只读场景,如网站从 S3 读取 SQLite 数据库,但若数据库由外部任务(如 cron)主动更新,可能不完全符合预期。
  • 有用户建议使用 ZeroFS 作为替代方案,它支持 S3 作为后端,与 SQLite 集成良好,且无需复杂配置。
  • 该 VFS 模块也可在 Go 语言中通过 ncruces/go-sqlite3 驱动程序使用,提供更程序化的 API,但需注意连接池中时间点设置的副作用。
  • Litestream 本身并非为库设计,集成到其他项目中需要处理依赖、版本兼容和稳定性问题,部分开发者已选择 fork 以适应需求。

React Server Components 中的拒绝服务与源码泄露漏洞 (Denial of service and source code exposure in React Server Components) #

https://react.dev/blog/2025/12/11/denial-of-service-and-source-code-exposure-in-react-server-components

React 团队于 2025 年 12 月 11 日发布安全通告,披露了 React Server Components 中的两个新漏洞,均与此前一周披露的严重漏洞相关。尽管这些漏洞不支持远程代码执行,但依然具有较高风险,需立即升级。

其中一项为高危拒绝服务攻击(DoS),编号为 CVE-2025-55184 和 CVE-2025-67779(CVSS 7.5)。攻击者可通过构造恶意 HTTP 请求,在反序列化过程中触发无限循环,导致服务器进程挂起并耗尽 CPU 资源。即使应用未自定义 Server Functions,只要使用 React Server Components,仍可能受影响。此前发布的部分补丁存在缺陷,版本 19.0.2、19.1.3、19.2.2 仍存在风险,现已通过 19.0.3、19.1.4、19.2.3 版本修复。

另一项为中危源码泄露漏洞(CVE-2025-55183,CVSS 5.3)。攻击者可利用恶意请求,从 Server Function 中泄露其源代码。若函数参数被字符串化并返回,攻击者可能获取包含敏感信息(如数据库密钥)的函数源码。但运行时环境变量(如 process.env.SECRET)不会被泄露,且暴露范围限于函数内部代码,受打包工具内联策略影响。

受影响的包包括 react-server-dom-webpack、react-server-dom-parcel、react-server-dom-turbopack 的多个版本(19.0.0 至 19.2.2)。建议所有使用这些包的项目立即升级至 19.0.3、19.1.4 或 19.2.3。

受影响的框架与构建工具包括 Next.js、React Router、Waku、@parcel/rsc、@vite/rsc-plugin 和 rwsdk,相关项目需同步更新。

尽管部分托管平台已部署临时缓解措施,但不应依赖,仍需尽快升级。

React Native 用户如未使用 monorepo 或 react-dom,无需额外操作;若使用 monorepo,仅需更新受影响的 Server DOM 包,避免版本冲突。

安全研究人员在漏洞披露后持续发现新问题,体现了安全响应的积极循环。此次漏洞由 Andrew MacPherson、RyotaK 和 Shinsaku Nomura 报告,感谢其贡献。


HN 热度 335 points | 评论 213 comments | 作者:sangeeth96 | 1 day ago #

https://news.ycombinator.com/item?id=46236924

  • React Server Components 使开发者难以判断代码在客户端还是服务器端运行,增加了开发困惑。
  • App Router 的设计导致常见功能如访问 Headers 变得不可靠,代码运行环境不明确,造成开发体验下降。
  • 许多用户怀念旧版 Pages Router 的清晰结构,认为 App Router 的复杂性破坏了开发体验。
  • 社区呼吁 Vercel 应长期支持 Pages Router,或由社区 fork 维护一个稳定版本。
  • TanStack Router/Start 被推荐作为替代方案,因其更注重开发体验和路由逻辑的清晰性。
  • TanStack Router 存在文档差、功能不稳定、频繁破坏性更新等问题,影响使用体验。
  • 有人认为 Pages Router 的文件系统路由在大型项目中难以维护,App Router 的代码化路由更可持续。
  • Next.js 的发展方向受 Vercel 商业利益驱动,与社区需求存在偏差,导致开发者不满。
  • React Server Components 能有效减少对 REST 或 GraphQL 的依赖,简化数据获取流程。
  • RSC 通过组件层级直接连接数据库,实现更自然的数据流,但需权衡协议复杂性。
  • 尽管 RSC 有安全风险和复杂性,但其能减少外部依赖,提升开发效率和一致性。
  • RSC 的数据获取方式本质上是将 HTTP 协议的复杂性转移到框架内部的私有协议,存在潜在风险。
  • 一些开发者认为 RSC 的设计引入了不必要的复杂性,建议简化为标准的 route.ts 文件。
  • 有观点认为应移除 RSC 的“use server”等机制,避免潜在的开发陷阱和安全风险。

一个 SVG 就够了 (An SVG is all you need) #

https://jon.recoil.org/blog/2025/12/an-svg-is-all-you-need.html

本文探讨了 SVG(可缩放矢量图形)作为一种强大且被低估的工具,在科学出版与知识共享中的潜在价值。作者回顾了自己 20 年前在剑桥大学做博士后时开发的一个 SVG 交互式可视化项目,用于展示真菌网络生长的实验数据。这个 SVG 文件至今仍能在现代浏览器中正常运行,证明了该格式极强的持久性。

文章强调,一个独立的 SVG 文件即可实现完整功能:嵌入或加载数据、进行前端计算、生成可视化,并通过滑块、按钮等元素实现交互式探索,无需服务器支持,仅需静态网页服务器即可部署和分享。

作者将 SVG 与 Anil 提出的“四大支柱”(永久性、可追溯性、权限管理、可放置性)进行对照,指出 SVG 在这些方面均表现优异。例如,SVG 是纯文本格式,便于版本控制;可绑定 DOI,确保永久可访问;数据与代码分离,便于权限管理;且天然具备空间表达能力,适合制作地图等可视化内容。

此外,随着浏览器计算能力的显著提升,如今完全可以在 SVG 中实现复杂的数据分析流程,而无需依赖外部计算资源。作者认为,SVG 应成为科学传播与知识共享工具箱中的重要一员,与 Jupyter 笔记本、Marimo、Forester 等工具并列,推动研究工作的开放、可复现与可重用。


HN 热度 327 points | 评论 138 comments | 作者:sadiq | 1 day ago #

https://news.ycombinator.com/item?id=46235959

  • SVG 曾被视为 Flash 的替代品,理论上可实现 Flash 的所有功能,但因缺乏优秀的创作工具而未能成功。
  • Steve Jobs 以 iPhone 不支持 Flash 为由,推动了 HTML 和 JavaScript 成为网页标准,间接导致 Flash 的衰落。
  • Flash 的衰落部分归因于其对内存和电池的高消耗,以及安全漏洞频发,成为恶意软件的主要传播途径。
  • Adobe 在收购 Macromedia 后未能持续优化 Flash 的性能与安全性,导致其最终被市场淘汰。
  • Flash 的消亡虽然终结了大量网络游戏和艺术创作生态,但也终结了滥用其技术导致的糟糕用户体验。
  • SVG 在现代浏览器中渲染性能仍不理想,尤其在动画和复杂图形处理方面表现不佳。
  • 浏览器对 SVG 的支持不一致,不同平台和浏览器间渲染结果差异大,难以保证跨平台一致性。
  • SVG 缺乏文本自动换行和字体嵌入功能,若未将文字转为路径,可能导致显示异常或无法编辑。
  • SVG 编辑工具匮乏,Linux 平台仅有 Inkscape 可用,且处理复杂图像时容易崩溃。
  • SVG 支持嵌套引用,但多层嵌套引用在多数渲染器中无法正常显示。
  • 有开发者希望将 AI 技术应用于舞蹈软件,实现从视频自动提取并生成 choreography 功能。
  • 有人建议将舞蹈软件与经典舞蹈作品(如 Bob Fosse 的《The Rich Man’s Frug》)结合,实现智能化编舞。
  • 一位开发者因面试时提到“高中时跳过 Crip Walk”而获得工作机会,体现了对舞蹈文化的独特理解。
  • 有用户指出软件界面上“Start free tiral”应为“trial”,可能是文字玩笑或笔误。

Hacker News 精彩评论及翻译 #

Programmers and software developers lost the plot … #

https://news.ycombinator.com/item?id=46239164

GNU’s version of Yacc is called Bison. Pine Is Not Elm (even though that was never an official acronym). UNIX was UNICS which was a pun on MULTICS. I couldn’t for the life of me tell you what dd stands for. nano is a copy of pico which was the “PIne COmposer”. Postfix is a completely opaque portmanteau of post (as in mail) and “bug fix”. C++ is “C incremented”, and C is the successor of B, which is the successor of BCPL.

Developers haven’t “lost the plot”, we never had it in the first place.

Inversely, Clang, LLDB, jq, fzf, loc are modern projects perfectly in line with the author’s notion of a good name. “mise-en-place” is the perfect metaphor for what mise does.

pdpi

GNU的Yacc版本叫做Bison。Pine Is Not Elm(尽管这从未是官方的缩写全称)。UNIX最初叫UNICS,这是对MULTICS的戏仿。我无论如何也说不清 dd 代表什么。nano 是 pico 的一个复刻版,而 pico 是 “PIne COmposer” 的缩写。Postfix 是一个完全晦涩的混成词,由 post(邮件)和 “bug fix” 组合而成。C++ 的意思是 “C 加一”,而 C 是 B 的继任者,B 又是 BCPL 的继任者。

开发者们并没有“偏离方向”,我们一开始就没有方向。

反之,Clang、LLDB、jq、fzf、loc 这些现代项目,则完全符合作者对好名字的定义。“mise-en-place” 这个词对 mise 的功能而言,是一个完美的比喻。


Programmers and software developers lost the plot … #

https://news.ycombinator.com/item?id=46237424

grep (global regular expression print), awk (Aho, Weinberger, Kernighan; the creators’ initials), sed (stream editor), cat (concatenate), diff (difference). Even when abbreviated, these names were either functional descriptions or systematic derivations.

If you asked someone unfamiliar with unix tools what they thought each of these commands did, diff is the only one which they would have even the slightest chance of guessing. It’s ridiculous to complain about “libsodium” and then hold up “awk” as a good name.

plorkyeran

grep(全局正则表达式打印),awk(Aho、Weinberger、Kernighan;创建者名字的首字母),sed(流编辑器),cat(连接),diff(差异)。即使这些名字是缩写,它们要么是功能描述,要么是系统性的衍生。如果你问一个不熟悉Unix工具的人,他们认为这些命令各自是做什么的,diff是唯一他们有一点点机会猜对的。抱怨“libsodium”却把“awk”当作好名字是荒谬的。


EFF launches Age Verification Hub #

https://news.ycombinator.com/item?id=46236900

This keeps coming up and we keep having the same debates about what Age Verification isn’t.

For the folks in the back row:

Age Verification isn’t about Kids or Censorship, It’s about Surveillance

Age Verification isn’t about Kids or Censorship, It’s about Surveillance

Age Verification isn’t about Kids or Censorship, It’s about Surveillance

Without even reaching for my tinfoil hat, the strategy at work here is clear [0 1 2]. If we have to know that you’re not a minor, then we also have to know who you are so we can make any techniques to obfuscate that illegal. By turning this from “keep an eye on your kids” to “prove you’re not a kid” they’ve created the conditions to make privacy itself illegal.

VPNs are next. Then PGP. Then anything else that makes it hard for them to know who you are, what you say, and who you say it to.

Please, please don’t fall into the trap and start discussing whether or not this is going to be effective to protect kids. It isn’t, and that isn’t the point.

0 https://www.eff.org/deeplinks/2025/11/lawmakers-want-ban-vpns-and-they-have-no-idea-what-theyre-doing

1 https://www.techradar.com/vpn/vpn-privacy-security/vpn-usage-at-risk-in-michigan-under-new-proposed-adult-content-law

2 https://hansard.parliament.uk/Lords/2025-09-15/debates/57714CE6-0CE4-49F6-B028-E271D5100F7F/OnlineSafetyAct2023VirtualPrivateNetworks

pksebben

年龄验证的话题一而再地被提起,我们总在争论它到底不是什么。 给后排的朋友们: 年龄验证不是为了保护儿童或审查内容,而是为了监控。 年龄验证不是为了保护儿童或审查内容,而是为了监控。 年龄验证不是为了保护儿童或审查内容,而是为了监控。 即便我不是什么阴谋论者,这里的策略也十分清晰 [0 1 2]。如果我们必须确认你不是未成年人,那么我们就必须知道你是谁,这样他们才能让任何隐藏身份的技术都变成非法行为。通过将这个议题从“看好你的孩子”转变为“证明你不是孩子”,他们创造了让隐私本身都成为非法行为的条件。 下一个就是VPN,然后是PGP,再然后是任何能让他们难以知道你是谁、你在说什么、以及你和谁说话的其他技术。 求求你们,别掉进这个陷阱,去争论这是否能有效保护孩子。它并不能,而且重点也不在这里。


Programmers and software developers lost the plot … #

https://news.ycombinator.com/item?id=46236775

This would be career suicide in virtually any other technical field.

This article would certainly disagree with you:

https://en.wikipedia.org/wiki/List_of_U.S._Department_of_Defense_and_partner_code_names

the Golden Gate Bridge tells you it spans the Golden Gate strait.

Is that even a meaningful distinction? Does anyone think, “Gee, I’d really like to cross the Golden Gate strait?” or do they think “I want to get to Napa?”.

The Hoover Dam is a dam, named after the president who commissioned it, not “Project Thunderfall” or “AquaHold.”

It was actually called the “Boulder Canyon Project” while being built, referred to as “Hoover Dam” even though finished during the Roosevelt administration, officially called “Boulder Dam”, and only later officially renamed to “Hoover Dam”.

The fact that Herbert Hoover initiated the project tells you nothing meaningful about it. Would “Reitzlib” be a better name than “Requests”?

If you wrote 100 CLIs, you will never counter with a cobra.

But out in the real world, you could encounter a Shelby Cobra sports car, Bell AH-1 Cobra chopper, USS Cobra (SP-626) patrol boat, Colt Cobra handgun, etc.

No chemist wakes up and decides to call it “Steve” because Steve is a funny name and they think it’ll make their paper more approachable.

When you open your medicine cabinet, do you look for a jar labeled “acetylsalicylic acid”, “2-propylvaleric acid”, or “N-acetyl-para-aminophenol”? Probably not.

It’s a bad sign when all of the examples in an article don’t even agree with the author’s point.

munificent

在几乎所有其他技术领域,这都等同于职业自杀。

这篇文章肯定会不同意你的观点: https://en.wikipedia.org/wiki/List_of_U.S._Department_of_Defense_and_partner_code_names

金门大桥告诉你它横跨金门海峡。

这甚至算得上是有意义的区别吗?有人会想,“天啊,我真的很想穿越金门海峡吗?”还是会想“我想去纳帕谷?”。

胡佛大坝是一座大坝,以其委托建设的总统命名,而不是“雷暴瀑布项目”或“水坝固位器”。

它实际上在建期间被称为“博尔德峡谷项目”,尽管在罗斯福政府时期完工,但当时仍被称为“胡佛大坝”,官方名称是“博尔德大坝”,后来才正式更名为“胡佛大坝”。

赫伯特·胡佛发起这个项目的事实并不能告诉你任何有意义的信息。“Reitzlib”会是比“Requests”更好的名字吗?

如果你写了100个命令行界面,你永远不会遇到一条眼镜蛇。

但在现实世界中,你可能会遇到一辆谢尔比眼镜蛇跑车、贝尔AH-1眼镜蛇直升机、USS眼镜蛇(SP-626)巡逻艇、柯尔特眼镜蛇手枪等等。

没有哪个化学家会一觉醒来,决定称之为“史蒂夫”,因为史蒂夫是个有趣的名字,他们觉得这会让他们的论文更易于理解。

当你打开药箱时,你会寻找标有“乙酰水杨酸”、“2-丙基戊酸”或“N-乙酰-对氨基酚”的罐子吗?大概不会。

当一篇文章中所有的例子甚至都不支持作者的论点时,这就是一个不好的迹象。


GPT-5.2 #

https://news.ycombinator.com/item?id=46237160

I suppose this is as good a place as any to mention this. I’ve now met two different devs who complained about the weird responses from their LLM of choice, and it turned out they were using a single session for everything. From recipes for the night, presents for the wife and then into programming issues the next day.

Don’t do that. The whole context is sent on queries to the LLM, so start a new chat for each topic. Or you’ll start being told what your wife thinks about global variables and how to cook your Go.

I realise this sounds obvious to many people but it clearly wasn’t to those guys so maybe it’s not!

onraglanroad

我想,在这里提这个也挺合适的。我现在碰到了两个不同的开发者,他们都抱怨自己用的那个大语言模型给出的回答很奇怪,结果一问才知道,他们是在用一个会话处理所有事情——从晚上要做什么菜,到给老婆买什么礼物,再到第二天要解决的编程问题,全都在一个会话里聊。

别这么做。因为每次提问时,整个对话上下文都会被发送给大语言模型,所以每个话题都最好开始一个新的聊天。不然你就会被建议问问你老婆对全局变量的看法,以及怎么烹饪一盘围棋。

我知道这对很多人来说可能显而易见,但显然那两个家伙没意识到,所以也许这个建议并不是多余的。


The highest quality codebase #

https://news.ycombinator.com/item?id=46233056

Claude is really good at specific analysis, but really terrible at open-ended problems.

“Hey claude, I get this error message: <X>”, and it’ll often find the root cause quicker than I could.

“Hey claude, anything I could do to improve Y?”, and it’ll struggle beyond the basics that a linter might suggest.

It suggested enthusiastically a library for <work domain> and it was all " Recommended " about it, but when I pointed out that the library had been considered and rejected because <issue>, it understood and wrote up why that library suffered from that issue and why it was therefore unsuitable.

There’s a significant blind-spot in current LLMs related to blue-sky thinking and creative problem solving. It can do structured problems very well, and it can transform unstructured data very well, but it can’t deal with unstructured problems very well.

That may well change, so I don’t want to embed that thought too deeply into my own priors, because the LLM space seems to evolve rapidly. I wouldn’t want to find myself blind to the progress because I write it off from a class of problems.

But right now, the best way to help an LLM is have a deep understanding of the problem domain yourself, and just leverage it to do the grunt-work that you’d find boring.

xnorswap

Claude非常擅长具体分析,但在处理开放式问题上却非常不擅长。 “嘿Claude,我遇到了这个错误信息:<X>”,它通常能比我更快地找到根本原因。 “嘿Claude,有什么办法可以改进Y吗?”——对于这类问题,它就难以深入,超不过代码检查器(linter)可能会建议的那些基本内容。 它曾热情地推荐了一个用于 <工作领域> 的库,并对它推崇备至。但当我指出这个库曾被考虑过却因其 <某个问题> 而被拒绝时,它立刻就理解了,并写下了详细的说明,阐述了该库为何存在那个问题以及为何因此而不适用。 当前的LLMs在“天马行空的思考”和“创造性解决问题”方面存在一个显著的盲点。它非常擅长处理结构化问题,也非常擅长转换非结构化数据,但在处理非结构化问题时却表现不佳。 这种情况很可能会改变,所以我不想让这个想法成为我根深蒂固的成见,因为LLM领域的发展似乎非常迅速。我可不想自己因为某个问题领域就把它一笔勾销,从而对它的进步视而不见。 但就目前而言,帮助LLM最好的方法是,你自己要对问题领域有深入的理解,然后只是利用它来完成那些你会觉得枯燥的繁重工作。


GPT-5.2 #

https://news.ycombinator.com/item?id=46236896

Only downsides are in the polish department

What an understatement. It has me thinking „man, fuck this“ on the daily.

Just today it spontaneously lost an entire 20-30 minutes long thread and it was far from the first time. It basically does it any time you interrupt it in any way. It’s straight up data loss.

It’s kind of a typical Google product in that it feels more like a tech demo than a product.

It has theoretically great tech. I particularly like the idea of voice mode, but it’s noticeably glitchy, breaks spontaneously often and keeps asking annoying questions which you can’t make it stop.

solarkraft

唯一的缺点就是打磨不到位。 这可真是轻描淡写了。它天天都让我想骂一句“去他妈的”。 就在今天,它突然丢失了整个长达20-30分钟的对话记录,而且这远不是第一次了。基本上,你以任何方式打断它,它都会这样。这简直就是数据丢失。 它有点像一个典型的谷歌产品——感觉它更像一个技术演示,而不是一个真正的产品。 理论上,它的技术很棒。我特别喜欢语音模式的理念,但它有明显的小毛病,还经常莫名其妙地崩溃,而且老是问一些烦人的问题,你也没法让它停下来。


GPT-5.2 #

https://news.ycombinator.com/item?id=46241936

In my experience, the best models are already nearly as good as you can be for a large fraction of what I personally use them for, which is basically as a more efficient search engine.

The thing that would now make the biggest difference isn’t “more intelligence”, whatever that might mean, but better grounding.

It’s still a big issue that the models will make up plausible sounding but wrong or misleading explanations for things, and verifying their claims ends up taking time. And if it’s a topic you don’t care about enough, you might just end up misinformed.

I think Google/Gemini realize this, since their “verify” feature is designed to address exactly this. Unfortunately it hasn’t worked very well for me so far.

But to me it’s very clear that the product that gets this right will be the one I use.

svara

根据我的经验,对于我个人使用它们的大部分场景而言,最好的模型已经近乎完美,其作用本质上就是一个更高效的搜索引擎。

如今,最能带来差异化的并非“更高的智能”(无论这意味着什么),而是更好的事实根基。

当前一个突出问题是,模型会为阐述的内容编造出看似合理实则错误或具误导性的解释,而验证其说法的过程反而会耗费时间。如果某个话题你不够关心,结果可能就是被错误信息所误导。

我认为谷歌/ Gemini已经意识到了这一点,因为他们推出的“验证”功能正是为了解决这个问题。不幸的是,到目前为止,这个功能对我来说效果并不理想。

但我非常清楚,哪家产品能把这个做好,我就会用哪家。


UK House of Lords attempting to ban use of VPNs by… #

https://news.ycombinator.com/item?id=46238036

On a related note, they built their digital ID so that third parties could verify attributes (it’s NOT just a single-service login across government + a linking ID across government services, which is how it was sold by the BBC).

They’re pretty close to completely de-anonymising the internet for UK citizens. Say they introduce an Australian-style social media ban for under 16s, then requires all social media to link their accounts to digital IDs for this verification.

Naturally the only remaining loophole is if a UK citizen manages to avoid being flagged as British ever by using a VPN, so I expect they will focus on that going forwards. Keep in mind the UK already arrests and imprisons vast numbers of people for speech offences, there’s no slippery-slope argument here because the UK is already at the bottom of the slope as an ultra-authoratitarian anti-speech nation.

baazaa

另一方面,他们建立数字ID的初衷,是允许第三方验证用户的各项属性信息(而并非像BBC所宣传的那样,仅作为跨政府单一服务登录及关联政府服务账户的工具)。他们几乎已经完全去匿名化了英国公民的网络。假如他们效仿澳大利亚,禁止16岁以下用户使用社交媒体,那么所有社交平台都将被要求将账户与数字ID绑定以进行验证。显然,唯一剩下的漏洞在于,英国公民能否通过使用VPN来规避其英国身份的识别。因此,我预计他们未来将重点打击这一点。请记住,英国早已因言论罪逮捕和监禁了大批民众,因此根本不存在“滑坡谬论”一说,因为这个极端反言论的威权国家早已滑到了深渊的底部。


Going Through Snowden Documents, Part 1 #

https://news.ycombinator.com/item?id=46237098

This comment section is strange, a lot of people trying to discredit Snowden, saying he shouldn’t have released the files, should be in prison, etc. 12 years ago this was HUGE news and had a major impact on the internet and everyone thanked Snowden for these documents! I certainly am thankful. Disappointed in my country that they literally said that “spying between friends is a no-go” but then did nothing and intimidated journalists and legalized it instead. And thanks to the author for giving the documents another look, found it very interesting. There is also part 2: https://libroot.org/posts/going-through-snowden-documents-part-2/

sunaookami

这个评论区很奇怪,很多人试图抹黑斯诺登,说他本不该公开那些文件,应该被关进监狱等等。12年前,这可是爆炸性新闻,并对互联网产生了重大影响,当时所有人都感谢斯诺登公开了这些文件!我也对此深表感谢。对我的国家感到失望,他们明明说了“朋友之间搞间谍活动是不行的”,但之后却什么也没做,反而恐吓记者,并将其合法化了。感谢作者再次审视这些文件,我觉得非常有趣。还有第二部分:https://libroot.org/posts/going-through-snowden-documents-part-2/


GPT-5.2 #

https://news.ycombinator.com/item?id=46235173

Is it me, or did it still get at least three placements of components (RAM and PCIe slots, plus it’s DisplayPort and not HDMI) in the motherboard image[0] completely wrong? Why would they use that as a promotional image?

breakingcups

是我眼花了吗,还是主板图片[0]里至少有三个组件的位置(内存槽、PCIe槽,还有一个端口是DisplayPort而不是HDMI)完全搞错了?他们为什么要用这种图来做宣传?


Google de-indexed Bear Blog and I don’t know why #

https://news.ycombinator.com/item?id=46241861

Traffic to my blog plummeted this year and you can never be entirely sure how it happened. But here are two culprits i identified.

  1. Ai overview: my page impressions were high, my ranking was high, but click through took a dive. People read the generated text and move along without ever clicking.

  2. You are now a spammer. Around August, traffic took a second plunge. In my logs, I noticed these weird queries in my search page. Basically people were searching for crypto and scammy websites on my blog. Odd, but not like they were finding anything. Turns out, their search query was displayed as an h1 on the page and crawled by google. I was basically displaying spam.

I don’t have much control over ai overview because disabling it means I don’t appear in search at all. But for the spam, I could do something. I added a robot noindex on the search page. A week later, both impressions and clicks recovered.

Edit: Adding write up I did a couple weeks ago https://idiallo.com/blog/how-i-became-a-spammer

firefoxd

我博客的流量今年暴跌,你永远无法完全确定原因。但我发现了两个罪魁祸首。

  1. AI 概述:我的页面浏览量和排名都很高,但点击率却大幅下降。人们读了生成的文本就直接走了,根本没点击。

  2. 你成了垃圾信息发布者。大约在八月,流量再次暴跌。在我的日志中,我注意到搜索页面上有一些奇怪的查询。基本上,人们正在我的博客上搜索加密货币和诈骗网站。很奇怪,但他们好像也没找到什么。结果发现,他们的搜索查询被显示为页面上的 H1 标题,并被 Google 爬取了。我基本上是在展示垃圾信息。

我无法完全控制 AI 概述,因为禁用它意味着我根本不会出现在搜索结果中。但对于垃圾信息问题,我做了些处理。我在搜索页面上添加了 robot noindex 标签。一周后,浏览量和点击量都恢复了。

编辑:附上我几周前写的一篇文章 https://idiallo.com/blog/how-i-became-a-spammer


Denial of service and source code exposure in Reac… #

https://news.ycombinator.com/item?id=46237795

React Server Components always felt uncomfortable to me because they make it hard to look at a piece of JavaScript code and derive which parts of it are going to run on the client and which parts will run on the server.

It turns out this introduces another problem too: in order to get that to work you need to implement some kind of DEEP serialization RPC mechanism - which is kind of opaque to the developer and, as we’ve recently seen, is a risky spot in terms of potential security vulnerabilities.

simonw

React Server Components 总是让我感到不舒服,因为它们使得在查看一段 JavaScript 代码时,很难推导出哪些部分将在客户端运行,而哪些部分将在服务器上运行。

事实证明,这还引入了另一个问题:为了实现这一点,你需要实现某种深序列化的 RPC(远程过程调用)机制——这对开发者来说是不透明的,而且正如我们最近看到的,在潜在的安全漏洞方面,这是一个风险点。


The Walt Disney Company and OpenAI Partner on Sora #

https://news.ycombinator.com/item?id=46232000

buried the lede:

As part of the agreement, Disney will make a $1 billion equity investment in OpenAI, and receive warrants to purchase additional equity.

I say this with no snark or disdain: Sam has mastered the art of the flywheel.

Re licensed ai videos, if anyone wants to see the perspective the C-suites are being sold on, check out this episode of Belloni’s The Town, in which they discuss the vision for AI + IP https://overcast.fm/+AA4DU9JreIE

postalcoder

埋了关键信息:

根据协议,迪士尼将对OpenAI进行10亿美元股权投资,并获得购买额外股权的认股权证。

我这么说没有丝毫讽刺或不敬:山姆已经掌握了飞轮效应的艺术。

关于AI视频的再授权问题,如果有人想了解高管们被兜售的是什么观点,可以看看Belloni的《The Town》这一集,他们在其中探讨了AI与IP(知识产权)的愿景 https://overcast.fm/+AA4DU9JreIE


Getting a Gemini API key is an exercise in frustra… #

https://news.ycombinator.com/item?id=46227859

I was recently (vibe)-coding some games with my kid, and we wanted some basic text-to-speech functionality. We tested Google’s Gemini models in-browser, and they worked great, so we figured we’d add them to the app. Some fun learnings:

  1. You can access those models via three APIs: the Gemini API (which it turns out is only for prototyping and returned errors 30% of the time), the Vertex API (much more stable but lacking in some functionality), and the TTS API (which performed very poorly despite offering the same models). They also have separate keys (at least, Gemini vs Vertex).

  2. Each of those APIs supports different parameters (things like language, whether you can pass a style prompt separate from the words you want spoken, etc). None of them offered the full combination we wanted.

  3. To learn this, you have to spend a couple hours reading API docs, or alternatively, just have Claude Code read the docs then try all different combinations and figure out what works and what doesn’t (with the added risk that it might hallucinate something).

Ozzie_osman

我最近和孩子一起(在轻松的氛围中)用代码编了一些游戏,我们需要一些基础的文本转语音功能。我们在浏览器里测试了谷歌的Gemini模型,效果很好,所以决定把它们集成到应用里。这里有一些有趣的发现:

  1. 你可以通过三种API访问这些模型:Gemini API(结果发现它只用于原型设计,并且有30%的时间会返回错误)、Vertex API(稳定得多但缺少一些功能),以及TTS API(尽管提供的是同样的模型,但性能非常差)。它们还需要不同的密钥(至少,Gemini和Vertex是这样的)。

  2. 每个API支持的参数都不同(比如语言、是否能独立于要朗读的文字传递风格提示等)。没有哪一个API能提供我们想要的所有功能组合。

  3. 要搞懂这些,你得花几个小时读API文档,或者,就让Claude Code去读文档,然后尝试各种不同的组合,看看哪些有效哪些无效(不过这也带来了它可能会产生幻觉的风险)。


The Walt Disney Company and OpenAI Partner on Sora #

https://news.ycombinator.com/item?id=46232634

I actually straight up don’t think they give a shit anymore.

I think decorum works in an environment where decorum is the norm, but we have entered a political moment where that is no longer the case. And I think that this kind of thing bleeds so heavily into culture that they no longer give a shit about having their characters next to it.

They have enough plausible deniability; they did not create the content. I think that’s enough for them, in this moment.

podgietaru

老实说,我觉得他们根本不在乎了。

我觉得体面这种东西,只有在人人都讲体面的环境里才管用,但我们已经进入了一个不再讲体面的政治时刻。而且我觉得这种风气已经深深渗透到文化中,所以他们根本不介意自己的角色跟这些东西放在一起了。

他们有足够的否认空间——毕竟他们没有创作这些内容。我觉得,在当下,这已经足够了。


French supermarket’s Christmas advert is worldwide… #

https://news.ycombinator.com/item?id=46231255

OP is the original upload, but the agency reposted it with English subs after it got popular outside of France: https://www.youtube.com/watch?v=iLERt5ZkpQ4

jsheard

原上传者发布了原视频,但在视频在法国以外的地区走红后,该机构又发布了带英文字幕的版本:https://www.youtube.com/watch?v=iLERt5ZkpQ4


Fedora: Open-source repository for long-term digit… #

https://news.ycombinator.com/item?id=46244011

To avoid misunderstandings, this repository is about a project at Cornell University named the Flexible Extensible Digital Object Repository Architecture (FEDORA), not a Red Hat one.

fodmap

为避免误解,本仓库是关于康奈尔大学的一个项目,名为 Flexible Extensible Digital Object Repository Architecture (FEDORA),而不是 Red Hat 的那个。


The Walt Disney Company and OpenAI Partner on Sora #

https://news.ycombinator.com/item?id=46231943

This will not end well for Disney, there were certain historical characters removed from Sora 2 because people kept making racist videos that are hard to censor, and it became increasingly unhinged. This feels like another circular investment where Disney is hoping to make money back I’m sure. On the other hand, assuming they do the freemium stuff, I look forward to making a few videos of my daughters favorite Disney princesses “talking” to her.

giancarlostoro

这对迪士尼来说不会有好结果。在《王国之心2》中,某些历史角色被移除,就是因为人们不断制作难以审查的种族歧视视频,而且情况愈演愈烈。这感觉像是迪士尼又一次在循环投资,我确信他们是希望能把钱赚回来。另一方面,假设他们采用免费增值模式,我期待着为我女儿制作一些她最喜欢的迪士尼公主们“开口”对她说话的视频。


Rubio stages font coup: Times New Roman ousts Cali… #

https://news.ycombinator.com/item?id=46228088

Calibri was supposedly easier to read by people with disabilities. While this itself is debatable, that’s not the reasoning behind the font switch. The mere attempt at making life easier for disadvantaged people is labeled DEI and as such cannot be tolerated by this administration.

praptak

据称,Calibri字体更容易让残障人士阅读。尽管这一点本身尚有争议,但这并非字体更换背后的真正原因。仅仅是为弱势群体提供便利的尝试,就被贴上了DEI(多元化、公平与包容)的标签,而这在此届政府看来是绝不能容忍的。


Google releases its new Google Sans Flex font as o… #

https://news.ycombinator.com/item?id=46247559

Where possible, I’ve stopped picking fonts that don’t distinguish lowercase l and uppercase I. Words virtually always have redundancy (or context in the sentence) and it’s fine in 98% of cases, but too often someone sends a token, password, name, or other string where you need to copy it out to another application to see it and just… why? Why bother?

I/O test for Sans Flex: https://snipboard.io/wXCQq5.jpg

It passes the O0 distinction but not the Il one

Example of a font that passes, Ubuntu: https://fonts.google.com/specimen/Ubuntu?preview.text=10%20I%252FO%20tasks%20languish (custom license but looks similar to GPL in that you can do what you want besides relicensing it as proprietary or removing credits)

Another one, Nunito Sans, using the Open Font License: https://fonts.google.com/specimen/Nunito+Sans?preview.text=10%20I%252FO%20tasks%20languish

IBM Plex Sans is another Open Font License option: https://fonts.google.com/specimen/IBM+Plex+Sans?preview.text=10%20I%252FO%20tasks%20languish (it has an unusual capital Q style though)

lucb1e

在可能的情况下,我已经不再选用那些无法区分小写字母“l”和大写字母“I”的字体了。单词几乎总是带有冗余(或句子中的上下文),在98%的情况下这都没问题,但太频繁地有人会发来一个令牌、密码、姓名或其他字符串,你需要把它复制到另一个应用程序里才能看清,然后……何必呢?何必这么麻烦呢?

Sans Flex 的 I/O 测试:https://snipboard.io/wXCQq5.jpg

它通过了 O 和 0 的区分,但没有通过 I 和 l 的区分

一个通过测试的字体示例,Ubuntu:https://fonts.google.com/specimen/Ubuntu?preview.text=10%20I%252FO%20tasks%20languish (采用自定义许可证,但类似于 GPL,除了将其重新授权为专有软件或移除署名外,你可以随意使用)

另一个是采用开放字体许可证的 Nunito Sans:https://fonts.google.com/specimen/Nunito+Sans?preview.text=10%20I%252FO%20tasks%20languish

IBM Plex Sans 是另一个采用开放字体许可证的选择:https://fonts.google.com/specimen/IBM+Plex+Sans?preview.text=10%20I%252FO%20tasks%20languish (不过它的大写字母 Q 风格有些特别)