2026 04 19 HackerNews

2026-04-19 Hacker News Top Stories #

  1. 作者将多服务从 DigitalOcean 迁至 Hetzner,大幅降本并提速,按降 TTL、rsync、MySQL 复制与反代切换等步骤实现零停机并完成 CentOS7→AlmaLinux 9.7 升级。
  2. smolvm 提供亚秒级冷启动、单文件打包与默认隔离网络的便携虚拟机,旨在以类容器易用性取代 Docker,并关注 k3s 与未来直播迁移等能力。
  3. 月球尘埃极细尖锐且与氧接触迅速反应散发似火药气味,致“月球花粉症”等刺激风险,未来任务需更强过滤、密封与除尘。
  4. 社区对比显示升级至 Opus 4.7 后平均请求体积与成本统计上升约三成,同时强制自适应思考让输出更短引发质量争议且无法关闭。
  5. Kdenlive 2025 年多次更新并规划 26.04 功能,用户称其功能强与门槛低但稳定性受质疑,部分更偏好更简洁且略稳的 Shotcut。
  6. 日本铁路的领先源于企业结构与土地/交通政策协同(含私铁“轨道+地产”模式),并以严禁路边停车和购车需车位证明等制度支撑高密度公共出行。
  7. 该区间计算器以不相交区间并集进行运算并采用全精度向外舍入,能正确处理含零除法与函数逆等传统区间算术难题。
  8. iTerm2 因 SSH 集成误信终端转义致本地命令被拼接执行,甚至“cat readme.txt”即可触发 RCE,补丁未入稳定版提醒谨慎查看不受信文本。
  9. B-52 的星象跟踪仪采用机电角度计算机以齿轮、电机与同步器实现三角运算,将星历转为本地方位与高度以驱动自动锁星并输出导航定位。
  10. Amiga Graphics Archive 收藏展示 Amiga 图形与技术史料,并对 68000 系列“16/32 位”称谓与架构特性提供背景讨论。

1. 从 DigitalOcean 迁移到 Hetzner (Migrating from DigitalOcean to Hetzner) #

https://isayeter.com/posts/digitalocean-to-hetzner-migration/

这篇文章详细介绍了作者将服务器从 DigitalOcean 迁移到 Hetzner 的全过程,重点强调了迁移过程中实现零停机时间的策略和技术细节。作者因土耳其里拉贬值导致美元计价的基础设施费用大幅上涨,决定寻找性价比更高的服务器,最终选择了 Hetzner 的 AX162-R 服务器,月费用从 1432 美元降至 233 美元,每年节省约 1.4 万美元,同时硬件配置更强大。

迁移涉及的系统包括 30 个 MySQL 数据库(248GB 数据)、34 个 Nginx 虚拟主机、GitLab EE、Neo4j 图数据库、Supervisor 后台任务管理、Gearman 任务队列及多个活跃的移动应用。旧服务器运行 CentOS 7,迁移时升级到 AlmaLinux 9.7 以获得更好的安全支持。

迁移策略分为六个阶段:1)在新服务器上完整安装并配置所有服务,确保配置一致;2)使用 rsync 同步网站文件;3)通过 MySQL 主从复制实现数据库实时同步,避免停机;4)降低 DNS 记录 TTL,加快切换速度;5)将旧服务器的 Nginx 配置改为反向代理,保证 DNS 切换期间请求无中断;6)切换 DNS 指向新服务器,旧服务器保留一周后关闭。

数据库迁移是最复杂的部分,作者使用 mydumper/myloader 工具利用多线程并行导出导入,极大缩短了时间。迁移过程中遇到 MySQL 从 5.7 升级到 8.0 带来的 mysql.user 表结构不匹配问题,通过强制升级和删除 sys 数据库解决。设置复制时遇到重复键错误,表明数据导出分两步完成导致冲突,具体解决方案未详细说明。

整体迁移过程保证了服务持续可用,避免了传统迁移中常见的停机风险,且显著降低了成本,提高了性能。作者建议对于稳定运行的工作负载,考虑专用服务器替代云服务,以获得更优的价格性能比。


HN 热度 667 points | 评论 341 comments | 作者:yusufusta | 11 hours ago #

https://news.ycombinator.com/item?id=47815774

  • 迁移服务器时常用的方法包括降低 DNS TTL、使用 rsync 同步网站文件和证书、复制数据库、通过修改/etc/hosts 测试新服务器、关闭旧服务器的定时任务、将旧服务器的 Nginx 转换为反向代理等。
  • 复杂的服务器迁移变得更简单,部分原因是有工具可以重写或替代过时的库和服务,从而提高了跨服务商的流动性。
  • 许多系统依赖大量“胶水代码”,这些代码往往是专有且难以替换的,增加了迁移的难度。
  • 运行自己的专用实例(如 Kubernetes、Postgres 等)可以减少对云服务专有胶水的依赖,实现更灵活的架构。
  • 有些遗留系统因安全风险或复杂性而迟迟未迁移,导致旧服务仍在使用老旧环境。
  • 有观点质疑部分评论和帖子可能是由 AI 或相关公司进行的“水军”操作,目的是制造恐慌或炒作 AI 技术。
  • AI 在代码生成方面表现良好,适合写模板代码,但处理复杂逻辑时仍需人工复核和修正,当前 AI 技术尚无法完全覆盖复杂开发需求。
  • AI 技术的应用引发了行业内的担忧和转型,但也有人认为这种变化是不可避免且正在进行中的。

2. 展示 HN:Smol 机器——亚秒级冷启动的便携式虚拟机 (Show HN: Smol machines – subsecond coldstart, portable virtual machines) #

https://github.com/smol-machines/smolvm

该网页介绍了 smolvm,这是一个命令行工具,用于本地管理和运行定制的 Linux 虚拟机,具备亚秒级冷启动、跨平台支持(macOS 和 Linux)以及弹性内存使用等特点。用户可以将状态化虚拟机打包成单个文件(.smolmachine),实现跨平台的快速恢复。

主要功能包括:

  • 运行临时虚拟机执行命令,支持网络配置和交互式 Shell。
  • 通过硬件隔离的虚拟机沙箱运行不可信代码,默认关闭网络,防止代码外泄,支持网络访问白名单设置。
  • 打包成独立可执行文件,无需安装或运行时下载,启动速度快于 200 毫秒。
  • 持久化虚拟机支持开发环境,安装的软件包可在重启后保留。
  • 支持 SSH 代理转发,安全使用主机的 SSH 密钥,密钥不会进入虚拟机。
  • 使用简单的 TOML 格式 Smolfile 声明环境,实现虚拟机配置的可复现性。

安装方式包括通过脚本安装或从 GitHub Releases 下载。示例命令展示了如何运行命令、交互式使用虚拟机、限制网络访问、打包 Python 环境以及管理持久虚拟机等操作。该工具适合沙箱运行不可信代码、打包便携环境和安全开发等多种场景。


HN 热度 443 points | 评论 134 comments | 作者:binsquare | 1 day ago #

https://news.ycombinator.com/item?id=47808268

  • 该项目旨在用虚拟机替代 Docker 容器,实现类似容器的易用性和亚秒级启动时间。
  • 传统微型虚拟机通常不支持运行完整的 Kubernetes 集群,用户关心是否支持 k3s 等轻量级 Kubernetes。
  • 直播迁移(live migration)是类似系统中常被忽视但非常重要的功能,适用于需要不停机迁移的传统和长时运行工作负载。
  • 直播迁移技术复杂且难以实现,通常需要底层超管支持,目前开源项目可能在未来一年内逐步实现。
  • 直播迁移的典型应用场景包括主机维护时迁移数据库虚拟机、带缓存状态的 Web 应用迁移、长时间批处理任务迁移等。
  • 直播迁移需要考虑内存快照、存储同步和网络连接的短暂中断,用户需根据自身应用特点决定可接受的停机时间。
  • 目前 smolvm 支持停止虚拟机后打包迁移,磁盘文件可保留,但内存快照和无停机迁移仍有难度。
  • 直播迁移可以在无共享网络存储的情况下,通过复制所有磁盘数据实现。
  • 代码开发中约有 50% 由 AI 辅助完成,但核心功能仍需人工实现。

3. 所有 12 位登月者都患有“月球花粉症”,因为尘埃闻起来像火药(2018) (All 12 moonwalkers had “lunar hay fever” from dust smelling like gunpowder (2018)) #

https://www.esa.int/Science_Exploration/Human_and_Robotic_Exploration/The_toxic_side_of_the_Moon

该网页是欧洲航天局(ESA)官方网站的内容汇总页面,涵盖了 ESA 的组织介绍、成员国信息、科学探索、空间安全、应用项目以及技术支持等多个方面。

页面首先介绍了 ESA 作为欧洲通往太空的门户,致力于推动欧洲航天能力的发展,并确保航天投资惠及欧洲及全球公民。随后列出了 ESA 的 23 个成员国,展示了 ESA 与各国国家机构的合作。

在科学与探索板块,介绍了太阳系探索、空间科学、人类与机器人探测任务,以及著名航天员名单和多个重要航天任务,如 Juice、Euclid、Webb、Solar Orbiter 等。页面还包含最新的科学新闻和视频,如火星火山灰扩散、月球与地球的美景,以及国际空间站上的 3D 金属打印技术突破。

空间安全部分重点介绍了保护地球生命和轨道基础设施的措施,包括小行星防御、空间碎片管理、空间天气监测等。相关任务如 Hera 小行星探测和 Flyeye 自动小行星观测望远镜也有详细报道。

应用板块展示了利用航天技术服务地球的项目,如地球观测、气象、卫星导航(Galileo、EGNOS)、安全通信及商业化平台。最新动态包括卫星展示、云和气溶胶观测卫星 EarthCARE 的媒体邀请等。

技术支持与发展部分涵盖了航天器制造、测试中心、设计设施、先进概念团队以及航天运输系统(Ariane、Vega、Space Rider)等内容。页面还介绍了 ESA 的地面站、操作系统及最新的技术新闻和活动。

整体来看,该网页内容丰富,涵盖 ESA 的组织结构、成员国合作、科学探索成果、空间安全策略、应用项目进展及技术支持,旨在全面展示 ESA 在推动欧洲及全球航天事业中的多方面努力和最新动态。


HN 热度 436 points | 评论 255 comments | 作者:cybermango | 1 day ago #

https://news.ycombinator.com/item?id=47808913

  • 月球尘埃闻起来像火药味,是因为尘埃长期未接触氧气,暴露在空气中后发生快速氧化反应。
  • 宇航员报告外太空闻起来像臭氧味,可能是空气锁首次暴露于真空环境时表面产生的化学反应。
  • 阿波罗 11 号担心月球尘埃在加压时可能自燃,曾做过氧气吹过测试以确保安全。
  • 如果尘埃自燃,计划是丢弃所有样本并清理舱内,但发生概率被认为极低。
  • 清理月球尘埃可能需要特殊设备,但由于登月舱质量限制,装备有限。
  • 人类航天的重要性在于宇航员能即兴应对突发状况,这是技术无法替代的。
  • 月球表面含有丰富的氧元素,但主要以矿物形式存在,不是自由氧气。
  • 月球尘埃主要是二氧化硅玻璃,化学性质稳定,不易进一步氧化。
  • 月球尘埃中含有少量金属硫化物和碳氢化合物,硫化物氧化后释放类似火药燃烧的二氧化硫气味。
  • 太阳风中含有少量氧离子,月球表面也会受到一定程度的氧暴露。
  • 真空环境中水蒸气和溶解氧可能与尘埃反应,产生臭氧味。
  • 低重力环境下灭火方式不同,水珠不会漂浮但能从远处浇灭火焰。
  • 月球尘埃长期未接触氧气,每次进入舱内都相当于一次新的化学实验。

4. Opus 4.6 与 Opus 4.7 的匿名请求令牌比较 (Anonymous request-token comparisons from Opus 4.6 and Opus 4.7) #

https://tokens.billchambers.me/leaderboard

该网页展示了社区对比 Opus 4.6 和 Opus 4.7 两个版本在实际请求中的匿名请求令牌(token)变化情况。页面通过 425 次提交的平均数据,显示了请求令牌数量和请求成本均有约 37.4% 的增长,平均请求大小从 369 增加到 495。

页面列出了最近 50 次匿名对比的详细数据,包括每次提交的 ID、请求令牌变化百分比、请求成本变化百分比以及具体的成本数值。数据表明,绝大多数请求在升级到 Opus 4.7 后,令牌数量和成本都有不同程度的提升,部分请求成本增长甚至超过 50%。

整体来看,网页主要用于展示社区用户在使用 Opus 4.6 与 4.7 版本时,令牌使用量和成本的变化趋势,帮助用户了解新版本在实际应用中的资源消耗情况。页面还提供了提交请求的匿名 ID,确保数据的匿名性和透明度。


HN 热度 402 points | 评论 411 comments | 作者:anabranch | 8 hours ago #

https://news.ycombinator.com/item?id=47816960

  • Opus 4.7 相比 4.6 在推理成本上降低了近一半,但生成的输出 token 更少,总体成本略低于 4.6,4.5 的成本则更低。
  • Opus 4.7 强制启用自适应思考机制,导致模型思考较少且输出 token 减少,用户反馈质量下降且出现基础错误。
  • 自适应思考机制使模型有时会懒于深入推理,出现“敷衍”回答,需要用户多次明确要求模型认真思考和检查边缘情况。
  • 关闭自适应思考(如 4.6 版本中可设置)能显著提升模型质量和细致度,但 4.7 版本不支持关闭该机制。
  • 在复杂任务中,4.6 关闭自适应思考表现更佳,4.7 虽然恢复能力更强,但仍需用户多次引导才能得到满意结果。
  • 有用户质疑当前的基准测试是否偏向于大规模复杂任务,忽视了小任务的准确性和精细度。
  • 4.7 版本的 token 消耗明显加快,用户在使用中更快达到使用限制,且努力设置对控制消耗帮助有限。
  • 通过调整提示语让模型“退一步重新评估”或“换个角度思考”比直接要求理由更有效,能避免模型陷入局部最优解。

5. Kdenlive 现状 (State of Kdenlive) #

https://kdenlive.org/news/2026/state-2026/

该网页是关于 Kdenlive 视频编辑软件 2025 年的发展总结及未来规划的详细报告。2025 年,Kdenlive 团队在持续开发、协作和社区支持下取得了显著进展,重点在于新功能添加、界面优化、性能提升和稳定性保障。

主要发布版本包括:

  • 25.04.0 版本引入了自动遮罩工具和基于 SAM2 模型的背景移除插件,重写了 OpenTimelineIO 导入导出功能,实现与其他编辑软件的项目交换,音频波形生成性能提升 300%。
  • 25.08.0 版本以稳定性为主,修复了超过 15 个崩溃问题,重设计了音频混音器,改进了标记和导向线功能,优化了标题编辑器。
  • 25.12.0 版本聚焦用户体验和界面打磨,新增首次启动欢迎屏幕和最近项目快速启动,推出更灵活的窗口停靠系统,重塑了项目监视器中的音频波形界面。

未来计划包括即将发布的 26.04 版本,将支持监视器镜像、动画过渡预览及自动调整过渡时长等新功能,提升多显示器协作体验。此外,还将支持批量调整剪辑播放速度、直接从时间线导入剪辑、始终以鼠标位置缩放时间线和为序列生成音频缩略图。

路线图中提到将继续完善 MLT 多媒体框架,计划支持 10/12 位色彩、播放优化和 OpenFX 特效,重构字幕系统,开发高级修剪工具。关键帧系统也在重构中,将引入 Dopesheet 功能,实现多效果参数的独立关键帧管理。

团队方面,2025 年有 38 位贡献者参与代码贡献,其中约半数为首次贡献者,核心团队由 8 名活跃成员组成。团队还举办了多次线下冲刺活动,如阿姆斯特丹和柏林冲刺,讨论技术改进、产品管理和未来规划。

此外,团队正在努力使 Kdenlive 支持微软 Visual Studio 编译,以便未来能通过微软商店发布,并在 Windows 持续集成中运行单元测试。

整体来看,Kdenlive 在 2025 年实现了功能创新与稳定性提升的平衡,社区活跃,未来发展方向明确,致力于为用户提供更高效、灵活和专业的视频编辑体验。


HN 热度 331 points | 评论 110 comments | 作者:f_r_d | 13 hours ago #

https://news.ycombinator.com/item?id=47815118

  • Kdenlive 功能比 iMovie 等基础编辑器强大,但学习曲线和硬件要求远低于 DaVinci Resolve,适合普通用户使用。
  • 结合 OBS 录屏和 Audacity(或 Tenacity)录音,能组成一个强大的开源视频制作工具链。
  • Kdenlive 作为免费且高质量的软件,用户选择它更多是出于喜好而非无奈。
  • 有用户之前误以为 Kdenlive 只是 KDE 套件的一部分,未尝试过,计划在下一个项目中试用。
  • Kdenlive 界面和功能设计适中,类似 Kate/Kdevelop 在编辑器中的定位。
  • Kdenlive 支持将预览窗口移动到第二显示器,类似 Final Cut Pro 的多屏操作体验。
  • 有用户指出 Kdenlive 存在稳定性问题,长期崩溃可能导致项目丢失,不适合重要或专业项目。
  • DaVinci Resolve 虽然功能强大且相对稳定,但对硬件有较高要求,且部分视频格式需要先转换。
  • 有用户表示相比 Premiere Pro,Kdenlive 崩溃次数更少,且 Premiere 在稳定性方面也存在问题。
  • Shotcut 与 Kdenlive 基于相同底层技术,Shotcut 界面更简洁且稳定性稍好,Kdenlive 功能更丰富,用户应根据需求选择。
  • Premiere Pro 作为最早的视频编辑软件之一,因历史悠久被视为行业标准,但并非唯一选择。
  • Avid Media Composer 在电影和电视行业中占有领先地位,Premiere Pro 在其他市场更受欢迎。
  • DaVinci Resolve 和 Final Cut Pro X 在专业视频编辑领域也有显著市场份额。
  • Kdenlive 更适合业余爱好者和偶尔使用者,不是专业级软件的替代品。
  • 备份和快照功能对于避免因软件崩溃导致的项目丢失至关重要。
  • 近年来 Kdenlive 稳定性有所提升,用户体验较五年前有明显改善。

6. 为什么日本拥有如此出色的铁路系统 (Why Japan has such good railways) #

https://worksinprogress.co/issue/why-japan-has-such-good-railways/

这篇文章探讨了日本铁路系统为何如此出色,并指出其成功主要归功于良好的公共政策,而非文化因素。日本铁路占乘客出行总里程的 28%,远超法国、德国和美国。日本铁路网络由多家私营公司组成,其中最大的 JR 东日本载客量超过除中国和印度外的所有国家铁路系统总和。

文章回顾了日本铁路的发展历程:铁路于 1872 年引入日本,最初国有化为日本国铁(JNR),但仍允许私人铁路存在。战前,日本私营电气铁路快速发展,逐渐从城市电车升级为重轨城际铁路,这些私营铁路至今仍活跃,尤其在东京、大阪和名古屋等大都市圈。1988 年,日本国铁被拆分为六个区域性铁路公司,形成了日本铁路集团(JR)。

日本铁路的另一个显著特点是“铁路引领城市发展”的商业模式。铁路公司不仅经营铁路,还涉足房地产、商业、医疗、娱乐等多个领域,通过多元化经营捕获铁路带来的溢价价值。例如,东急公司不仅运营铁路,还拥有住宅、办公楼、医院、超市和娱乐设施,形成了完整的城市生态系统。这种模式最早由阪急铁路在 1950 年代开创,推动了城市的整体发展。

总体来看,日本铁路系统的成功在于合理的企业结构、土地利用政策、交通法规、优质的私有化模式和有效监管,这些政策经验具有全球借鉴意义。文化因素虽被普遍认为影响日本铁路表现,但文章强调,真正的关键是制度设计和公共政策。


HN 热度 292 points | 评论 282 comments | 作者:RickJWagner | 12 hours ago #

https://news.ycombinator.com/item?id=47815395

  • 日本禁止在公共道路或人行道上停车,购车前必须证明有私人停车位,这有效节约了空间资源。
  • 日本街道狭窄,行人和自行车与车辆共用道路,街边停车会造成严重拥堵。
  • 街边停车使郊区环境恶化,车库堆满杂物导致车辆不得不停在街上,影响交通和行人通行。
  • 美国现代郊区街道常被停车占用,阻碍人行道使用,影响行人安全和便利。
  • 日本人通常在家或目的地停车场停车,公共交通使用率高,开车多用于远郊或大件购物。
  • 美国城市中心大量地面停车场浪费土地资源,若改为商业、住宅或公园等用途,有助于提高城市密度和公共交通效率。
  • 日本大城市虽有良好铁路系统,但也有高速公路穿城而过,交通管理复杂。
  • 美国铁路建设成本高昂且进度缓慢,管理和腐败问题严重,停车资源与铁路建设问题关联不大。
  • 美国长期忽视铁路建设,优先发展公路系统,导致公共交通状况恶化,形成恶性循环。
  • 美国政府对公路建设投入充足,公路网络广泛,但近年来公路建设速度放缓。

7. 展示项目:我制作了一个支持不相交区间并集运算的计算器 (Show HN: I made a calculator that works over disjoint sets of intervals) #

https://victorpoughon.github.io/interval-calculator/

该网页介绍了一个名为“区间计算器”的工具,由 Victor Poughon 开发,支持对区间及区间并集进行算术运算。区间表示一组连续的数值,例如[a, b]表示从 a 到 b 的所有数。区间并集则是多个不相交区间的集合,如[a, b] U [c, d]。

区间并集算术是对传统区间算术的扩展,优势在于它在包含零的区间除法中仍然封闭,能处理更复杂的运算。例如,2 除以[-2, 1]的结果是[-∞, -1] U [2, +∞]。该方法保证了从输入区间中任意选取实数代入表达式,结果必定落在输出区间内,适合表示不确定性。

网页详细介绍了区间计算器的语法和用法,包括区间、并集、加减乘除、指数运算及多种数学函数(如对数、三角函数、绝对值等)。支持常数如 π 和无穷大,且允许区间嵌套和区间边界的算术运算。

该工具还提供了全精度模式,利用 IEEE 754 双精度浮点数的外向舍入,确保计算结果区间包含真实值,解决了浮点数精度问题。全精度模式下,输入数字被解释为包含最接近浮点值的最小区间,输出显示完整小数位;关闭时,输入为零宽度区间,输出保留四位有效数字。

网页还提及了该计算器的开源性质,鼓励用户反馈问题并支持开发者。未来计划包括拆分全精度模式设置、增加历史结果变量、支持区间交集运算、优化并集运算优先级及支持空并集输入等功能。


HN 热度 291 points | 评论 50 comments | 作者:fouronnes3 | 23 hours ago #

https://news.ycombinator.com/item?id=47812341

  • 标准区间算术在处理包含零的区间除法时表现不佳,使用不连续区间的并集能更准确表达结果。
  • 通过对不连续区间的并集进行算术运算,可以实现更完整的函数逆运算,如平方函数的真正逆运算。
  • 实现区间并集算术时,需解决浮点数舍入误差,作者通过位级操作实现了向外舍入以保证结果准确。
  • 该项目基于 TypeScript 实现,依赖最小,适合交互式计算和测试区间并集算术的实现。
  • 该方法与 IEEE 1788 区间算术标准的关系尚不明确,作者未深入研究该标准。
  • 支持多值函数(如反三角函数的多值解)在该系统中实现难度较大,但会是有价值的扩展。
  • 用户输入的数字被解释为包含最接近的 IEEE 754 浮点数的最小区间,确保数值的包容性。
  • 该项目的代码测试覆盖率很高,尤其是区间除法部分测试复杂。
  • 有建议在界面上明确区间端点是否包含,使用不同括号表示开闭区间以提高可读性。
  • 该项目未支持开区间,主要实现的是闭区间的并集,支持开区间会显著增加代码复杂度。
  • 不同地区对区间符号的习惯不同,如美国常用圆括号表示开区间,法国等地用方括号或其他符号。
  • 有人建议将计算结果中的公式支持点击复制,方便用户继续操作。
  • 该项目为区间算术的研究和应用提供了一个实用的工具,适合进一步探索和扩展。

8. 如果你使用 iTerm2,执行“cat readme.txt”命令并不安全 (“cat readme.txt” is not safe if you use iTerm2) #

https://blog.calif.io/p/mad-bugs-even-cat-readmetxt-is-not

本文介绍了 iTerm2 终端模拟器中的一个严重安全漏洞,该漏洞允许通过执行“cat readme.txt”命令导致任意代码执行。iTerm2 的 SSH 集成功能通过一个名为 conductor 的远程脚本与本地终端通信,使用终端转义序列作为协议载体。然而,漏洞在于 iTerm2 错误地信任了来自终端输出的 conductor 协议消息,攻击者可以伪造这些消息,使 iTerm2 误以为与真实的 conductor 会话通信。

攻击原理是,恶意文件中包含伪造的 DCS 2000p 和 OSC 135 终端序列,诱使 iTerm2 启动 conductor 协议流程,并发送命令。攻击者设计的 sshargs 参数被用作后续命令的一部分,最终导致 iTerm2 将恶意代码作为本地命令执行。利用该漏洞的 PoC 文件包括一个恶意脚本和一个包含伪造协议消息的文本文件,用户在特定目录下执行“cat readme.txt”时触发漏洞。

该漏洞的根本原因是 PTY(伪终端)机制的混淆,iTerm2 将本应发送给远程 conductor 的命令错误地发送到了本地 shell,导致恶意代码被执行。漏洞于 2026 年 3 月底被报告并在次日修复,但修复尚未推送到稳定版本,存在一定的安全风险窗口。

文章还提及了披露时间的争议,认为在补丁未广泛部署前公开漏洞可能带来风险,呼吁更合理的披露策略。整体来看,该漏洞揭示了终端模拟器在处理复杂协议时的信任边界问题,提醒用户和开发者关注终端安全。


HN 热度 288 points | 评论 176 comments | 作者:arkadiyt | 1 day ago #

https://news.ycombinator.com/item?id=47809190

  • 漏洞披露前发布博客提高了漏洞的可见性,虽然补丁尚未进入稳定版本,但公开的提交信息已经足够让攻击者开发利用代码。
  • 公开提交代码后,漏洞信息已经“泄露”,继续隐瞒只会帮助攻击者,减少整体安全性。
  • 传统的漏洞披露等待期可能会逐渐失效,因为 AI 技术能快速从公开代码中推断出漏洞利用方法。
  • AI 工具虽然能快速发现漏洞,但人们仍需了解漏洞的具体细节,包括发生位置和利用方式。
  • 公开漏洞信息有助于推动快速修复和发布,但也带来新的挑战和风险。
  • 攻击者通常是资源丰富、专业化的团队,不应低估他们利用公开信息的能力。
  • 即使是高级攻击者能利用公开信息,也不应让所有人都轻易获得漏洞利用细节,避免扩大攻击面。
  • 公开补丁的动机是为了让更多人知晓并采取防护措施,促进安全标准的普及。
  • 通常做法是先将补丁私下提供给发行版和终端用户,再公开提交代码,但这与开源发布的理念存在矛盾。

9. B-52 轰炸机星象跟踪仪内的机电角度计算机 (The electromechanical angle computer inside the B-52 bomber’s star tracker) #

https://www.righto.com/2026/04/B-52-star-tracker-angle-computer.html

本文介绍了 B-52 轰炸机上用于星象导航的电机机械角度计算机——Angle Computer。早在 GPS 普及之前,飞机主要依靠天文导航,通过观测星星、太阳或行星的位置来确定航向和位置。天文导航虽然准确且不易被干扰,但手动操作复杂耗时。1960 年代初,B-52 配备了自动星象跟踪系统,利用 Angle Computer 进行三角函数计算,实现自动导航。

Angle Computer 内部结构复杂,通过机械装置模拟“天球”,指针代表星星位置,通过同步电机读取方位角和高度角,向导航系统传输数据。该计算机是 Astro Compass 系统的一部分,Astro Compass 能自动锁定星星,提供精确到十分之一度的航向信息,并辅助导航员通过“位置线”技术确定飞机位置。

Astro Compass 系统包括安装在机身顶部的 Astro Tracker 光学设备,带有稳定平台和旋转棱镜,确保望远镜准确指向目标星星。系统由 19 个部件组成,包括放大器、计算机和控制面板,导航员通过主控面板输入时间、星体位置等数据,调整旋钮选择参数。星体数据来源于美国政府出版的《空中天文年鉴》,该年鉴提供太阳、行星、月亮及恒星的精确位置。

文章还介绍了天文导航中的坐标转换问题。星体位置以全球坐标系表示,但导航系统需要本地坐标系中的方位角和高度角,这涉及复杂的球面三角计算。通过计算导航三角形,系统将天文数据转换为飞机所在位置的角度信息,辅助导航员进行精确定位。整个系统体现了当时电机机械技术在航空导航中的创新应用。


HN 热度 248 points | 评论 72 comments | 作者:NelsonMinar | 8 hours ago #

https://news.ycombinator.com/item?id=47817132

  • 早期机械计算设备多用于海军火控,输入多为人工操作,后来逐渐实现传感器自动输入和输出控制。
  • 机械计算机体积庞大,结构复杂,包含齿轮、凸轮和解析器,输入输出均为电信号。
  • 这类设备在军用导弹和飞机导航中有重要应用,类似于地面导弹的制导计算机。
  • 相关历史资料和培训视频能帮助理解这些机械计算机的工作原理。
  • 机械计算机设计复杂且要求严格,缺乏现代 CAD 工具,设计难度极高。
  • 硅谷的许多技术发展与军事合同密切相关,军方资金支持科研项目。
  • 早期微处理器在军用飞机中的应用存在被过度宣传的情况。
  • 机械设备的复杂性和简洁性令人着迷,但实际工作多为枯燥的测试和标准制定。
  • 机械导航设备需要进行精确的环境测试,如高低温循环和振动测试。
  • 天文罗盘等设备通过螺旋搜索模式定位星体,搜索范围较大,确保能找到目标。
  • 科技发展与军事用途密不可分,但应关注其社会影响和历史背景。
  • 回顾历史时应理性看待,不应美化战争相关技术的应用。

10. 阿米加图形档案 (Amiga Graphics Archive) #

https://amiga.lychesis.net/

该网页是一个专注于 Commodore Amiga 家用电脑图形作品的档案和展示网站。Amiga 于 1985 年发布,凭借其复杂的定制芯片,具备当时无可比拟的图形处理能力,使得许多其他个人电脑无法实现的图形效果成为可能。网站收录了大量使用 Amiga 制作或为 Amiga 设计的图形作品,包括艺术作品、游戏画面、标志、出版物和场景作品。

网站内容涵盖多个专题和文章,如显示技术、游戏公司、屏幕模式等,帮助用户深入了解 Amiga 图形的技术背景和发展。页面还列出了多个更新记录,展示了近年来不断添加的珍贵图像资源,包括来自不同艺术家和杂志的作品,以及色彩循环动画等特殊技术的应用。

此外,网站提供了社交媒体链接,方便用户关注最新动态。所有展示的图像版权归原作者所有,网站也欢迎用户反馈和建议。整体来看,该网站是 Amiga 图形爱好者和研究者的重要资源库,既保存了历史,也展示了丰富的视觉艺术成就。


HN 热度 229 points | 评论 69 comments | 作者:sph | 18 hours ago #

https://news.ycombinator.com/item?id=47813566

  • Amiga 通常被称为 32 位机器,因为其寄存器和操作是 32 位,且拥有平坦的 32 位地址空间,虽然 68000 CPU 本身的地址线未完全支持。
  • 由于 68000 的数据总线是 16 位,且地址总线为 24 位,部分人认为 Amiga 更适合称为 16 位或 16/32 位机器。
  • 硬件厂商和市场推广更注重总线宽度,因此将 68000 系列机器称为 16 位或 16/32 位以区分真正的 32 位 CPU。
  • Amiga 早期型号如 A1000、A2000、A500 采用 16 位芯片组和 24 位地址总线,部分程序因使用指针高位导致兼容性问题。
  • 68020 及以后的 CPU 才是真正的 32 位 CPU,Amiga 1200 开始使用 68020,开始强调 32 位特性。
  • 68000 指令集是 32 位的,但内部实现细节如总线宽度和地址线限制使得称其为 16 位也有一定合理性。
  • 在 80 年代,Amiga 和 Atari ST 等机器通常被归类为 16 位机器,之前的机器如 C64 被认为是 8 位。
  • 现代 CPU 即使有部分总线或地址线限制,仍被称为 64 位系统,说明总线宽度不应作为唯一判定标准。
  • 不同地区和时期对 Amiga 的位数称呼存在差异,英国和意大利等地早期多称其为 16 位机器。

Hacker News 精彩评论及翻译 #

Anonymous request-token comparisons from Opus 4.6 … #

https://news.ycombinator.com/item?id=47817610

We dropped Claude. It’s pretty clear this is a race to the bottom, and we don’t want a hard dependency on another multi-billion dollar company just to write software

We’ll be keeping an eye on open models (of which we already make good use of). I think that’s the way forward. Actually it would be great if everybody would put more focus on open models, perhaps we can come up with something like the “linux/postgres/git/http/etc” of the LLMs: something we all can benefit from while it not being monopolized by a single billionarie company. Wouldn’t it be nice if we don’t need to pay for tokens? Paying for infra (servers, electricity) is already expensive enough

dakiol

我们放弃了Claude。很明显这是一场向底线竞赛,我们不想在写软件时对另一家数十亿美元的公司产生强烈依赖。

我们会继续关注开源模型(我们已经在很好地利用它们)。我认为这才是未来的方向。其实如果每个人都能更多关注开源模型,那会非常棒,也许我们能打造出类似于“Linux/Postgres/Git/HTTP等”那样的LLM(大型语言模型),让我们都能受益,同时不被某个亿万富翁公司垄断。如果不用为代币付费,那该多好?基础设施(服务器、电力)的费用已经够贵了。


I’m spending months coding the old way #

https://news.ycombinator.com/item?id=47811531

I am this very term teaching 18-year-old students 6502 assembly programming using an emulated Apple II Plus. They’ve had intro to Python, data structures, and OO programming courses using a modern programming environment.

Now, they are programming a chip from the seventies using an editor/assembler that was written in 1983 and has a line editor, not a full-screen one.

We had a total of 10 hours of class + lab where I taught them about assembly language and told them about the registers, instructions, and addressing modes of the chip, memory map and monitor routines of the Apple, and after that we went and wrote a few programs together, mostly using the low-resolution graphics mode (40x40): a drawing program, a bouncing ball, culminating in hand-rolled sprites with simple collision detection.

Their assignment is to write a simple program (I suggested a low-res game like Snake or Tetris but they can do whatever they want provided they tell me about it and I okay it), demo their program, and then explain to the class how it works.

At first they hated the line editor. But then a very interesting thing happened. They started thinking about their code before writing it. Planning. Discussing things in advance. Everything we told them they should do before coding in previous classes, but they didn’t do because a powerful editor was right there so why not use it?…

And then they started to get used to the line editor. They told me they didn’t need to really see the code on the screen, it was in their head.

They will of course go back to modern tools after class is finished, but I think it’s good for them to have this kind of experience.

apricot

本学期我正在教18岁的学生使用模拟的Apple II Plus进行6502汇编编程。他们之前学过Python入门、数据结构和面向对象编程课程,使用的是现代编程环境。

现在,他们要用一个上世纪七十年代的芯片编程,使用的是1983年编写的编辑器/汇编器,这个编辑器是行编辑器,而不是全屏编辑器。

我们总共有10小时的课程和实验时间,我教他们汇编语言,讲解芯片的寄存器、指令和寻址方式,Apple的内存映射和监控例程。之后我们一起写了几个程序,主要用的是低分辨率图形模式(40x40):一个绘图程序,一个弹跳球,最终实现了手工绘制的精灵和简单的碰撞检测。

他们的作业是写一个简单的程序(我建议像贪吃蛇或俄罗斯方块这样的低分辨率游戏,但他们可以自由发挥,只要告诉我并获得批准),演示他们的程序,然后向全班解释程序的工作原理。

一开始他们很讨厌行编辑器。但随后发生了一件非常有趣的事。他们开始在写代码前思考代码,开始做计划,提前讨论。这些都是我们之前课程里告诉他们应该在编码前做的事情,但因为有强大的编辑器支持,他们之前从没这么做过,想着反正有编辑器,为什么不直接用呢?……

然后他们慢慢适应了行编辑器。告诉我其实不需要一直看屏幕上的代码,代码都在他们脑子里。

课后他们当然会回到现代工具上,但我觉得让他们有这种经历是很好的。


All 12 moonwalkers had “lunar hay fever” from dust… #

https://news.ycombinator.com/item?id=47809790

I recall an article from a long time ago that basically said “astronauts report” the moon smells like spent gunpowder and outer space smell like… I think it was ozone.

What they were actually reporting was the smell of the airlocks after they returned from their excursions. The moon has no atmosphere, so it has been accumulating dust from billions of years of asteroid impacts that have never come in contact with oxygen. Many of the chemicals in the dust are oxidative and so when it is exposed to air for the first time it rapidly oxidizes just like gunpowder!

And I think the outer space report was from space walks, and the explanation was that the first time the airlock itself was exposed to hard vacuum, the surfaces of the airlock would have a reaction that left a scent of ozone.

corysama

我记得很久以前有一篇文章,大致内容是“宇航员报告”月球闻起来像用过的火药味,太空闻起来像……我记得是臭氧味。

他们实际上报告的是从月球活动回来后空气锁里的气味。月球没有大气层,因此积累了数十亿年来陨石撞击产生的尘埃,这些尘埃从未接触过氧气。尘埃中的许多化学物质是氧化性的,所以当它首次接触空气时,就像火药一样迅速氧化!

我认为关于太空的报告是来自太空行走,解释是空气锁第一次暴露在真空中时,空气锁表面发生了反应,留下一种臭氧的气味。


NASA Force #

https://news.ycombinator.com/item?id=47807801

Two things:

  • I like the rolling Moon animation very much.

  • This seems like a clever way of getting talent involved during a budget squeeze, presumably with the hope that some of those they attract will still be around after this congress and the agency can stabilize once again. I guess it’s also a neat kind of try-before-you-buy for both sides. NASA is prestigious and one of the very few places one could do purely science-focused aerospace engineering, but it’s still a government job under all the gold leaf and atomic robots.

EDIT: Good Lord, I get the cynicism but at least someone at NASA HR is trying new things to keep the lights on.

scrumper

两点:

  • 我非常喜欢那个滚动的月亮动画。

  • 这似乎是一种在预算紧缩期间让人才参与进来的聪明方法,估计也希望借此吸引到的一些人能够在本届国会结束后依然留下来,帮助机构再次稳定。我猜这也是双方都能“先试用后购买”的一种不错方式。NASA很有声望,是为数不多可以专注于纯科学航天工程的地方之一,但毕竟它仍然是一个政府工作,尽管外面铺满了金箔和“原子机器人”。

补充:天哪,我理解这种愤世嫉俗,但至少NASA的人力资源部门有人在尝试新办法保持运转。


Hyperscalers have already outspent most famous US … #

https://news.ycombinator.com/item?id=47807926

This tweet shows it as a percentage of US GDP:

https://x.com/paulg/status/2045120274551423142

Makes it a little less dramatic. But also shows what a big **’n deal the railroads were!

timmg

这条推文显示了作为美国GDP百分比的数据:

https://x.com/paulg/status/2045120274551422

这样看起来没那么夸张了。但也显示了铁路当时是多么重要的大事!


“cat readme.txt” is not safe if you use iTerm2 #

https://news.ycombinator.com/item?id=47810518

At the time of writing, the fix has not yet reached stable releases.

Why was this disclosed before the hole was patched in the stable release?

It’s only been 18 days since the bug was reported to upstream, which is much shorter than typical vulnerability disclosure deadlines. The upstream commit ( https://github.com/gnachman/iTerm2/commit/a9e745993c2e2cbb30b884a16617cd5495899f86 ) has way less information than this blog post, so I think releasing this blog post now materially increases the chance that this will be exploited in the wild.

Update: The author was able to develop an exploit by prompting an LLM with just the upstream commit, but I still think this blog post raises the visibility of the vulnerability.

KerrickStaley

截至发稿时,修复尚未推送到稳定版本。

为什么在稳定版本修复漏洞之前就公布了这个问题?

从漏洞报告给上游开始到现在才过去18天,这远远少于典型漏洞公开的时间期限。上游的提交(https://github.com/gnachman/iTerm2/commit/a9e745993c2e2cbb30b884a16617cd5495899f86)提供的信息远不如这篇博客详细,所以我认为现在发布这篇博客实际上大大增加了该漏洞在实际环境中被利用的风险。

更新:作者仅凭上游提交内容,利用大型语言模型就能开发出漏洞利用代码,但我仍然认为这篇博客提高了该漏洞的曝光度。


Measuring Claude 4.7’s tokenizer costs #

https://news.ycombinator.com/item?id=47807499

LLMs exist on a logaritmhic performance/cost frontier. It’s not really clear whether Opus 4.5+ represent a level shift on this frontier or just inhabits place on that curve which delivers higher performance, but at rapidly diminishing returns to inference cost.

To me, it is hard to reject this hypothesis today. The fact that Anthropic is rapidly trying to increase price may betray the fact that their recent lead is at the cost of dramatically higher operating costs. Their gross margins in this past quarter will be an important data point on this.

I think the tendency for graphs of model assessment to display the log of cost/tokens on the x axis (i.e. Artificial Analysis’ site) has obscured this dynamic.

louiereederson

大型语言模型(LLMs)存在于一个对数性能/成本的前沿线上。目前还不清楚Opus 4.5及以上版本是否代表了这一前沿线上的一个层级跃升,还是仅仅处于该曲线上的某个位置,尽管性能更高,但推理成本的回报正在迅速递减。

对我来说,今天很难否定这个假设。Anthropic迅速提高价格的事实,可能暴露出他们近期领先地位是以显著更高的运营成本为代价的。他们上个季度的毛利率将是一个重要的数据点。

我认为,模型评估图通常在x轴上展示成本/令牌的对数(例如Artificial Analysis网站),这掩盖了这一动态。


Isaac Asimov: The Last Question (1956) #

https://news.ycombinator.com/item?id=47805326

This is one of those stories, just like the SR-71 “ground speed check” story, that every single time I see it posted I just have to read the entire thing again. I love it.

jasongill

这是那种故事,就像SR-71“地面速度检测”的故事一样,每次看到有人发出来,我都必须把全文再读一遍。我非常喜欢它。


It’s OK to compare floating-points for equality #

https://news.ycombinator.com/item?id=47815131

Is there any constant more misused in compsci than ieee epsilon? :)

It’s defined as the difference between 1.0 and the smallest number larger than 1.0. More usefully, it’s the spacing between adjacent representable float numbers in the range 1.0 to 2.0.

Because floats get less precise at every integer power of two, it’s impossible for two numbers greater than or equal to 2.0 to be epsilon apart. The spacing between 2.0 and the next larger number is 2*epsilon.

That means abs(a - b) <= epsilon is equivalent to a == b for any a or b greater than or equal to 2.0. And if you use < then the limit will be 1.0 instead.

Epsilon is the wrong tool for the job in 99.9% of cases.

hmry

在计算机科学中,还有哪个常数比IEEE的epsilon被误用得更多的吗?:)

它被定义为1.0和比1.0稍大的最小数之间的差值。更有用的是,它表示在1.0到2.0范围内相邻可表示浮点数之间的间距。

因为浮点数在每个2的整数次幂处精度都会降低,所以对于大于或等于2.0的两个数,不可能相差一个epsilon。2.0和下一个更大的数之间的间距是2倍的epsilon。

这意味着对于任何大于或等于2.0的a或b,abs(a - b) <= epsilon 相当于 a == b。如果使用 <,则限制将变为1.0。

在99.9%的情况下,epsilon都是不合适的工具。


Show HN: Smol machines – subsecond coldstart, port… #

https://news.ycombinator.com/item?id=47808326

Hello, I’m building a replacement for docker containers with a virtual machine with the ergonomics of containers + subsecond start times.

I worked in AWS previously in the container space + with firecracker. I realized the container is an unnecessary layer that slowed things down + firecracker was a technology designed for AWS org structure + usecase.

So I ended up building a hybrid taking the best of containers with the best of firecracker.

Let me know your thoughts, thanks!

binsquare

你好,我正在构建一个用虚拟机替代Docker容器的方案,兼具容器的易用性和亚秒级启动时间。

我之前在AWS从事容器相关工作,也接触过Firecracker。我意识到容器是一个不必要的层,反而会拖慢速度,而Firecracker是为AWS的组织结构和使用场景设计的技术。

所以我最终打造了一个混合方案,结合了容器和Firecracker的优点。

欢迎告诉我你的看法,谢谢!


Claude Design #

https://news.ycombinator.com/item?id=47808702

On Notes on the Synthesis of Form, Alexander defines design as the rationalization of the forces that define a problem. You’ll won’t find a better definition. But people tend to think design is the synthesis and its results. This misunderstanding of the role of design and the designer is responsible for all the unfit designs we encounter on a daily basis. Anyone equipped with a synthesis tool and feeling empowered to quickly and cheaply generate forms will almost inevitably become blind to the very nature of the underlying problems they set to solve. They’ll be fitting the problem to the available forms. They’ll skip the understanding, the conversations, the conflicts and disagreements, and happily and wrongly assume a design problem can be solved hermetically, in isolation. They’ll think quality is a factor of aesthetics, when in truth, aesthetics is an effect; nevertheless these effects is all they’ll have control over, as it’s all the tool can do. The tool will hinder their ability to be rational; to see the inner structures; to find the hidden but essential semantics; to create the ontologies that’ll support not only the immediate synthesis, but that will sustain the evolution of the design over its lifetime. They’ll be denied the enlightenment that comes with gradual, slow construction; the only place and moment where innovative ideas reveal themselves. They’ll be impoverished and confuse output with agency. I feel sorry for anyone that will think using tools equals doing design, because of the truly marvelous human experiences that they’ll miss, and that could never be replaced by the shallow pride of empty achievement.

pilgrim0

在《形式的综合笔记》中,亚历山大将设计定义为对定义问题的各种力量进行合理化。你找不到比这更好的定义。但人们往往认为设计就是综合及其结果。这种对设计及设计师角色的误解,是我们每天遇到各种不合适设计的根源。任何掌握综合工具并觉得自己能够快速且廉价地生成形式的人,几乎不可避免地会对他们试图解决的根本问题的本质视而不见。他们会将问题套用到现有的形式上。他们会跳过理解、交流、冲突和分歧,错误且愉快地认为设计问题可以孤立地、密封地解决。他们会认为质量是美学的一个因素,而实际上美学是一种效果;然而这些效果却是他们唯一能控制的,因为这正是工具所能做到的。该工具将阻碍他们理性思考的能力;阻止他们洞察内在结构;发现隐藏但关键的语义;构建不仅支持当前综合,还能维持设计在整个生命周期中演进的本体论。他们将失去随着缓慢而渐进的构建过程而来的启迪;这是创新思想得以显现的唯一时空。他们将陷入贫乏,混淆产出与能动性。我为那些以为使用工具就等同于做设计的人感到遗憾,因为他们将错过许多真正美妙的人类体验,而这些体验永远无法被空洞成就感的浅薄自豪所替代。


NASA Force #

https://news.ycombinator.com/item?id=47808070

NASA Force technologists inside the systems that power American spaceflight, aeronautics, and scientific discovery.

Am I an idiot or does their leading sentence make absolutely no sense?

tiberone

NASA的技术专家们在支撑美国航天飞行、航空以及科学探索的系统内部工作。

我是笨了吗,还是他们的开头句子完全没有意义?


Why Japan has such good railways #

https://news.ycombinator.com/item?id=47817240

Japan is one of the only countries to have privatized parking. In Europe and North America, vast quantities of parking space is socialized: municipalities own the streets and allow people to park on them at low or zero cost. Initially with the intention of encouraging the provision of more parking spaces, Japan made it illegal to park on public roads or pavements without special permission. Before someone buys a car, they must prove that they have a reserved night-time space on private land, either owned or leased.

This is got to be a huge factor. Making everyone pay for “free parking” through inefficient use of space is such a waste. I strongly recommend everyone to read Donald Shoup’s “The High Price of Free Parking”.

vantassell

日本是少数几个实现停车位私有化的国家之一。在欧洲和北美,大量的停车空间是社会化的:市政当局拥有街道,允许人们以低价或免费在街上停车。日本最初是为了鼓励提供更多停车位,才规定未经特别许可,不得在公共道路或人行道上停车。在买车之前,必须证明自己拥有一个私人土地上的夜间停车位,或是拥有或租赁的。

这一定是一个很大的因素。让所有人都为“免费停车”付费,却通过低效的空间利用浪费资源,实在太可惜了。我强烈推荐大家阅读唐纳德·舒普的《免费停车的高昂代价》。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47802834

I can’t notice any difference to 4.6 from 3 weeks ago, except that this model burns way more tokens, and produces much longer plans. To me it seem like this model is just the same as 4.6 but with a bigger token budget on all effort levels. I guess this is one way how Anthropic plans to make their business profitable.

During the past weeks of lobotomized opus, I tried a few different open weight models side by side with “opus 4.6” on the same issue. The open weights outperformed opus 4.6, and did it way faster and cheaper. I tried the same problem against Opus 4.7 today and it did manage to find one additional edge case that is not critical, but should be logged. So based on my experience, the open weight models managed to solve the exact problem I needed fixed, while Opus 4.7 seem to think a bit more freely at the bigger picture. However Opus 4.7 also consumed way more tokens at a higher price, so the price difference was 10-20x higher on Opus compared to the open weights models. I will use Opus for code review and minor final fixes, and let the open weights models do the heavy lifting from now on. I need a coding setup I can rely on, and clearly Anthropic is not reliable enough to rely on.

Why pay 200$ to randomly get rug-pulled with no warning, when I can pay 20$ for 90% of the intelligence with reliable and higher performance?

EmanuelB

我看不出这版4.6和三周前有什么区别,唯一不同的是这个模型消耗了更多的token,生成了更长的计划。对我来说,这个模型似乎和4.6没啥两样,只是增加了所有努力层级的token预算。我猜这可能是Anthropic想让他们的业务变得盈利的一种方式。

在过去几周使用被阉割的opus期间,我在同一问题上尝试了几款不同的开源权重模型与“opus 4.6”作对比。开源权重模型表现得比opus 4.6更好,且速度更快、成本更低。今天我用同样的问题测试了Opus 4.7,它确实找到了一个额外的边缘案例,虽然不关键,但应该被记录下来。所以根据我的经验,开源模型解决了我需要修复的那个具体问题,而Opus 4.7似乎在更宏观的层面上思考得更自由。但Opus 4.7消耗了更多的token,价格也更高,因此在价格上,Opus比开源权重模型贵了10到20倍。我会用Opus来做代码审查和一些小的最终修正,让开源权重模型从现在起承担繁重的工作。我需要一个可以依赖的编码环境,很明显Anthropic还不够可靠,不能成为依赖对象。

为什么我要花200美元,却可能毫无预警地被“割韭菜”,而我20美元就能获得90%的智能水平,而且性能更稳定更高效呢?


Discourse Is Not Going Closed Source #

https://news.ycombinator.com/item?id=47802484

Open source creates a useful urgency: when your code is public, you assume it will be examined closely, so you invest earlier and more aggressively in finding and fixing issues before attackers do.

This should be the mentality of every company doing open source.Great points made.

dhruv3006

开源带来了有益的紧迫感:当你的代码是公开的,你会假设它会被仔细审查,因此你会更早、更积极地投入到发现和修复问题中,防止攻击者先行利用。

这应该是每个做开源的公司的心态。观点很棒。


State of Kdenlive #

https://news.ycombinator.com/item?id=47815642

Kdenlive hits the perfect sweet spot for me. It’s much more capable than basic editors like iMovie, but doesn’t have the overwhelming learning curve (or steep hardware requirements) of DaVinci Resolve. Like others have mentioned, pairing it with OBS for screen recording and Audacity for audio makes for an incredibly powerful, 100% FOSS media creation stack. It’s amazing to see how far open-source video editing has come.

visiohex

Kdenlive 对我来说正好达到了完美的平衡点。它比像 iMovie 这样基础的编辑软件功能强大得多,但又没有 DaVinci Resolve 那样令人望而生畏的学习曲线(或高硬件要求)。正如其他人提到的,将它与 OBS 进行屏幕录制和 Audacity 用于音频录制相结合,构成了一个极其强大且完全开源的媒体创作工具链。看到开源视频编辑发展到现在的程度,真是令人惊叹。


Claude Design #

https://news.ycombinator.com/item?id=47808894

This is a really verbose way to say that using generative AI has a detrimental effect on the user because one deprives themselves of the learning experience.

bauerd

这句话长篇大论地说明了使用生成式人工智能对用户有害,因为这样会剥夺他们学习的机会。


Claude Design #

https://news.ycombinator.com/item?id=47808004

For my agency this won’t replace Figma or designers. It’s just a really useful tool to express yourself and communicate intent.

Before these tools, when a client wanted a specific section built, we’d spend hours hunting references across the web. The output always ended up feeling like a mesh of 2-3 sites, never fully unique. Then we’d burn more time explaining the intent to the client’s designers and devs, usually with multiple rounds because words don’t convey layout well.

Now we throw a quick mockup together in Claude or Lovable and send it. The designer gets the idea in 30 seconds instead of a 45-minute call, then pushes it further with their own taste and the client’s branding.

It’s not replacing designers. Most clients don’t know what they want until they see it. These tools collapse that feedback loop from weeks to minutes, so the designer actually spends their time on the parts that need human taste, not on decoding a vague brief.

Growtika

对我的代理机构来说,这不会取代Figma或设计师。它只是一个非常有用的工具,帮助表达自己和传达意图。

在有这些工具之前,当客户想要建造某个特定部分时,我们会花费数小时在网上寻找参考资料。结果总是感觉像是拼凑了2-3个网站,永远无法做到完全独特。然后我们还得花更多时间向客户的设计师和开发人员解释意图,通常要经过多轮,因为文字无法很好地传达布局。

现在我们只需在Claude或Lovable里快速做个草图并发送。设计师在30秒内就能理解想法,而不是一通45分钟的电话,然后他们用自己的品味和客户的品牌进一步完善。

这并不是取代设计师。大多数客户直到看到效果才知道自己想要什么。这些工具把反馈周期从几周缩短到几分钟,让设计师真正把时间花在需要人类审美的部分,而不是解读模糊的需求说明。


Michael Rabin has died #

https://news.ycombinator.com/item?id=47815482

Thank you Michael Rabin for your excellent work. Rest in Peace.

Rabin Fingerprinting is one of my favorites of his contributions. It’s a “rolling hash” that allows you to quickly compute a 32-bit (or larger) hash at every byte offset of a file. It is used most notably to do file block matching/deduplication when those matching blocks can be at any offset. It’s tragically underappreciated.

I’ve been meaning to write up a tutorial as part of my Galois Field series. Someday..

Thank you again!

xorvoid

感谢迈克尔·拉宾的卓越贡献。愿他安息。

拉宾指纹算法是他贡献中我最喜欢的之一。这是一种“滚动哈希”,能够让你快速计算文件中每一个字节偏移位置的32位(或更大)的哈希值。它最著名的应用是用于文件块匹配/去重,特别是当匹配的块可以出现在任意偏移位置时。这个算法非常优秀,但却被严重低估了。

我一直打算作为我的伽罗瓦域系列的一部分写一篇教程。总有一天会写的……

再次感谢您!


NASA Force #

https://news.ycombinator.com/item?id=47809177

They had these kinds of programs for a long time, but many of the engineers were vilified and the programs disbanded as soon as this administration took office. I’m not sure why someone would sign up to work for a government that has no respect for its employees (or a company for that matter) if they already have gainful employment.

In fact, a bunch of NASA labs were recently closed where folks with this exact skillset could do these exact jobs. Why re-post under a different skin and expect a different result?

sailfast

这类项目已经存在很长时间了,但许多工程师被污蔑,这些项目在本届政府上任后很快就被解散了。我不明白如果有人已经有稳定工作,为什么还会选择去为一个不尊重员工(或者说公司)的政府工作。

事实上,最近关闭了很多NASA实验室,那些具备这类技能的人本可以在那里做这类工作。为什么要换个名义重新发布招聘,期待会有不同的结果呢?


Hyperscalers have already outspent most famous US … #

https://news.ycombinator.com/item?id=47811382

GDP adjustments are warranted, but it is more stark than both the estimates suggest.

The megaprojects of the previous generations all had decades long depreciation schedules. Many 50-100+ year old railways, bridges, tunnels or dams and other utilities are still in active use with only minimal maintenance

Amortized Y-o-Y the current spends would dwarf everything at the reported depreciation schedule of 6(!) years for the GPUs - the largest line item.

manquer

GDP的调整是合理的,但比这两个估算所显示的更为明显。

上一代的大型项目都有几十年的折旧周期。许多有着50到100年以上历史的铁路、桥梁、隧道或水坝及其他公用设施仍在使用,仅需很少的维护。

按年摊销,目前的支出按照报告中GPU折旧期仅6年(!)计算,将远远超过所有其他项目。


The “Passive Income” trap ate a generation of entr… #

https://news.ycombinator.com/item?id=47801287

You rarely see anything more than a couple hundred bucks a month. There are notable exceptions, but unfortunately a lot of those notable exceptions are scammy, spammy business models.

I suspect this is largely sampling bias.

I host meetups for indie founders, and several attendees earn their living through solo businesses. When I go to conferences like Microconf, I meet lots more.

The problem with measuring financial success by who posts about it on HN is:

  • The more someone is making at their solo business, the less they want to blab about it and attract competitors.

  • The people earning at the low end are more desperate for people to see what they’re doing so they can pick up new customers, so they’re more likely to talk about their work.

  • The more successful founders are busier and spend less time posting on HN.

mtlynch

你很少会看到有人每月收入超过几百美元。虽然有一些显著的例外,但不幸的是,其中很多例外都是欺诈性、垃圾邮件式的商业模式。

我怀疑这很大程度上是抽样偏差。

我主持独立创始人的聚会,几位参与者靠个人业务谋生。每当我参加像Microconf这样的会议时,我会遇到更多这样的人。

用谁在HN上发布内容来衡量财务成功存在的问题是:

  • 个人业务收入越高的人,越不愿意大肆宣扬,避免吸引竞争者。

  • 收入较低的人更渴望有人关注他们的工作,以便吸引新客户,因此他们更可能谈论自己的工作。

  • 更成功的创始人更忙,花在HN上的时间更少。


Traders placed over $1B in perfectly timed bets on… #

https://news.ycombinator.com/item?id=47818861

You’d have to be spectacularly stupid to bet on these kinds of things without having insider knowledge, because you ought to know good and damn well by now that the people with insider knowledge are DEFINITELY betting on them.

beaviskhan

如果没有内部消息而去赌这种事情,那你得蠢到家了,因为你现在应该非常清楚,有内部消息的人绝对在下注。


Amazon is discontinuing Kindle for PC on June 30th #

https://news.ycombinator.com/item?id=47817057

Combined with the announcement that they’re killing the old Kindles as well…this is 100% about preventing people from liberating DRM from their books. Full stop. They are closing each and every remaining hole.

AdmiralAsshat

结合他们宣布淘汰老款Kindle的消息来看……这100%是为了防止人们破解他们书籍中的数字版权管理(DRM)。毫无疑问。他们正在关闭每一个剩余的漏洞。