2026 04 23 HackerNews

2026-04-23 Hacker News Top Stories #

  1. Framework Laptop 13 Pro 以后向兼容的模块化与开源部件实现旧机少量更换即升级,配合高规格屏幕与新平台面向开发者,虽价格偏高但因可维修性获认可。
  2. Ursa Ag 推出无 ECU 的“无技术”拖拉机,价格约为同级一半、便于自修并走直销/小经销模式,借维修权趋势切入且计划至 2026 年显著扩产。
  3. OpenAI 发布 ChatGPT Images 2.0,大幅提升图像生成并倡导多步骤拆解复杂任务,但仍受数学/逻辑与潜在版权争议限制,同时展示其在模型、隐私与企业/教育方案的布局。
  4. wsl9x 让 Windows 9x 与现代 Linux 应用并行运行且无需虚拟化,复用老硬件并被视为对 coLinux 思路的巧妙继承。
  5. SpaceX 以 100 亿美元购入 600 亿美元收购期权结盟 Cursor,凭其分发与自有巨量算力瞄准顶级编码/知识工作 AI,虽估值存疑但被认为风险收益比可观。
  6. Meta 在美员工设备采集鼠标键盘与偶发截屏用于训练可模仿人机操作的 AI,称不用于绩效却引发隐私与合规争议,且欧盟监管更严格。
  7. Anthropic 疑将 Claude Code 自 Pro 计划移除且沟通不透明,用户信任受损并出现退订,社区认为其正转向企业 API 与重塑定价。
  8. Qwen3.6-27B 在多项编码基准超越前代并逼近旗舰水平,量化后可本地高效运行,体现自托管模型对闭源方案的快速追赶。
  9. GitHub CLI 开始收集可选关闭的伪匿名遥测并提供日志自查,以优化产品优先级,同时引发“遥测驱动”与“用户反馈驱动”的取舍争论。
  10. 谷歌发布第八代 TPU:训练向的 8t 与低延迟推理向的 8i 以液冷与高速互连提升性能能效,面向代理式工作流并将于年内上线云端。

1. Framework 笔记本 13 Pro (Framework Laptop 13 Pro) #

https://frame.work/laptop13pro

介绍了 Framework Laptop 13 Pro 这款开发者笔记本电脑的详细信息。该笔记本搭载 Intel Core Ultra Series 3 处理器,配备 LPCAMM2 内存和高性能电池,续航可达 20 小时,支持高达 64GB 内存和 8TB PCIe Gen 5.0 NVMe 存储,适合重负载工作。机身采用 CNC 铝合金材质,坚固耐用且兼容多代主板。

该笔记本支持 Linux 系统,预装 Ubuntu 并获得认证,同时兼容多种 Linux 发行版,且提供良好的社区支持。屏幕为 13.5 英寸 2880x1920 分辨率触摸屏,具备 30-120Hz 可变刷新率和最高 700 尼特亮度,适合编程和办公使用。触控板采用四个压电执行器,反馈灵敏且可调节,键盘拥有 1.5 毫米键程,手感舒适且多种布局可选。

Framework Laptop 13 Pro 支持模块化扩展,用户可根据需求更换端口扩展卡、升级主板、内存和存储,方便维修和升级。机身轻薄,仅重 1.4 公斤,厚度 15.85 毫米,配备 Dolby Atmos 音效,保证音质清晰。硬件层面设有物理隐私开关,确保摄像头和麦克风安全。

此外,Framework 开放设计文件和固件,鼓励用户自定义和改造。预装系统无冗余软件,用户可自由选择操作系统,体现对用户隐私和使用自由的尊重。整体而言,这是一款高性能、可定制、易维修且支持 Linux 的开发者笔记本电脑。


HN 热度 1426 points | 评论 732 comments | 作者:Trollmann | 1 day ago #

https://news.ycombinator.com/item?id=47852177

  • Framework 笔记本的新升级部件可以向后兼容旧设计,用户只需购买部分新部件即可升级,体现了设计的用心和对用户的尊重。
  • 保持零部件兼容性是 Framework 实现其可维修性承诺的关键,否则会失去其独特价值。
  • Framework 的零部件是开源的,其他厂商也可以继续生产,延长产品生命周期。
  • Framework 笔记本价格偏高,但用户愿意为其维修友好和模块化设计买单。
  • 13 Pro 版本与旧款高度兼容,用户可以通过更换少量部件实现升级,体现了公司对使命的坚持。
  • 用户对 haptic 触控板的看法分歧,有人认为它提升了使用体验,有人更喜欢带有实体按键的传统触控板。
  • MacBook 的触控板软件表现优异,Linux 用户则希望有类似的驱动支持以改善体验。
  • 新款电池体积更大,需要配合新的底壳使用,升级时需注意兼容性。
  • Framework 提供升级套件,用户可以选择只更换部分部件而非整机升级。
  • “热插拔”一词被误用,实际更换主板、电池、内存等部件时需断电操作。

2. 阿尔伯塔初创公司以半价出售无技术拖拉机 (Alberta startup sells no-tech tractors for half price) #

https://wheelfront.com/this-alberta-startup-sells-no-tech-tractors-for-half-price/

这篇文章介绍了一家名为 Ursa 的阿尔伯塔省初创公司,该公司生产并销售无技术化的拖拉机,其价格约为同类品牌的一半。Ursa Ag 的拖拉机采用经过重新制造的 1990 年代柴油发动机,特别是 12 阀的康明斯发动机,这种发动机以其机械喷油系统而闻名,完全没有电子控制单元(ECU)和专有软件。这种设计使得拖拉机的维修更加简单,农民可以自己修理,而不必依赖需要专业技术和工具的经销商。

Ursa Ag 的 150 马力和 180 马力型号的起售价分别为 129,900 加元(约 95,000 美元)和 199,900 加元(约 146,000 美元),相比之下,像约翰迪尔(John Deere)等大品牌的同类产品价格高得多。这家公司并不打算提供最先进的技术,而是专注于满足那些渴望简单、可靠设备的农民的需求。

文章提到,约翰迪尔因其设备复杂性而引发了 “维修权” 争议,这让多农民意识到他们在购买带有专有代码的机器时失去了多少控制权。Ursa Ag 利用这一点,提供一种新选择,让农民们可以拥有一台全新且易于维护的拖拉机,且具有良好的保修服务。

尽管 Ursa Ag 的经销网络尚小,且主要通过直销方式进行,但公司创始人道格・威尔逊(Doug Wilson)表示,2026 年的生产将超过其迄今为止的总产量,显示出公司对需求的强烈信心。尽管美国市场对 Ursa Ag 表现出浓厚的兴趣,威尔逊承认他们还没有在美国建立分销渠道,但预计会在不久的将来有所改变。

文章还指出,许多农民选择购买 30 年前的设备,正是因为新设备的复杂性和高昂的价格,而 Ursa Ag 提供的拖拉机则是从头开始制造这种选择。虽然大制造商拥有成熟的供应链和经销网络,Ursa Ag 依靠的是其重新制造的康明斯发动机和一种让农民能快速解决设备问题的价值主张。总体而言,这家公司正试图通过简单和高效的解决方案来满足农民的需求。


HN 热度 1126 points | 评论 390 comments | 作者:Kaibeezy | 7 hours ago #

https://news.ycombinator.com/item?id=47865868

  • 老式的 Massey Ferguson 135 拖拉机操作感强,机械感十足,没有复杂电子设备,维护和修理相对简单。
  • 老拖拉机的离合器很重,需要很大力气踩下去,部分原因是为了传递高扭矩,且当时技术限制导致离合器设计较为原始。
  • 现代拖拉机离合器可能更轻便,采用机械连杆、气动或液压辅助,但成本和复杂度更高。
  • PTO 轴(动力输出轴)非常危险,容易导致衣物被卷入,操作时必须严格遵守安全规程。
  • 老式拖拉机启动和操作有一定难度,有时需要用车辆拖拉启动,且需要手动排气和燃油线路。
  • 老式拖拉机耐用性强,即使长时间缺乏维护仍能工作,零部件易于获取和维修。
  • 驾驶老拖拉机是一种独特体验,能感受到机械的力量和直接反馈,现代机器缺少这种感觉。
  • 由于离合器重,长时间踩离合器会很累,驾驶时常用空挡等待以减少疲劳。
  • 老式拖拉机换挡不频繁,常常选择一个档位完成任务,操作相对简单。

3. ChatGPT 图像生成 2.0:图像生成技术的新时代 (ChatGPT Images 2.0) #

https://openai.com/index/introducing-chatgpt-images-2-0/

OpenAI 发布 ChatGPT Images 2.0,这是图像生成技术的一个全新时代。文章发布于 2026 年 4 月 21 日,强调了新版本在图像生成能力上的显著提升,用户可以通过 ChatGPT 体验这一新功能。

网页内容还涵盖了 OpenAI 的多个方面,包括研究成果、产品介绍、商业应用、开发者支持以及公司信息。具体内容包括最新的 GPT-5 系列模型、安全隐私策略、企业和教育解决方案、API 平台及其定价和登录入口等。

此外,网页提供了丰富的资源链接,如开发者论坛、帮助中心、新闻动态、直播、播客等,方便用户深入了解和使用 OpenAI 的技术和服务。整体来看,网页不仅介绍了 ChatGPT Images 2.0 的发布和功能,还展示了 OpenAI 在人工智能领域的广泛布局和持续创新。


HN 热度 1000 points | 评论 917 comments | 作者:wahnfrieden | 1 day ago #

https://news.ycombinator.com/item?id=47852835

  • 复杂的图像生成任务更适合分解成多个子任务,由模型分别完成再组合,而非一次性完成。
  • 目前的模型在数学计算和复杂逻辑推理方面表现有限,难以完全满足复杂指令。
  • 通过多步骤代理流程,模型可以更好地完成分步任务和图像拼接。
  • 训练数据中包含的版权受保护内容可能导致生成的图像与原作高度相似,存在版权争议。
  • 模型生成的部分宝可梦图像与官方素材相似度较高,但也有部分图像存在差异。
  • 版权问题复杂且法律界限模糊,大型公司可能通过协议解决版权纠纷,小型创作者维权困难。
  • 使用网络搜索辅助生成图像可能导致直接引用现有图片,增加版权风险。
  • 目前模型的内容审核和版权保护机制仍有不足,存在生成敏感或违规内容的风险。
  • 随着模型能力提升和成本降低,评估其在复杂任务中的表现变得更加合理。

4. Windows 9x Linux 子系统 (Windows 9x Subsystem for Linux) #

https://social.hails.org/@hailey/116446826733136456

该网页展示了 Hailey 在 Mastodon 社交平台上发布的一条动态,介绍了她开发的“Windows 9x 子系统 Linux”(Windows 9x Subsystem for Linux,简称 wsl9x)。该项目允许用户在 Windows 9x 系统上同时运行 Windows 和 Linux 应用程序,采用现代 Linux 内核与 Windows 内核协同工作,且不依赖硬件虚拟化技术,因此即使是老旧的 486 电脑也能运行。

动态发布于 2026 年 4 月 22 日,获得了大量点赞和评论。网友们纷纷表达了对该项目的惊叹和赞赏,认为这是延长老旧计算机实用寿命的创新方案。有人将其与早期的 coLinux 项目进行比较,认为 wsl9x 是一种更先进、更巧妙的实现方式。还有用户讨论了该项目与 WSL(Windows Subsystem for Linux)不同版本的技术差异,认为 WSL1 在某些方面优于 WSL2。

评论区还提及了相关技术历史和个人使用体验,显示出该项目在技术爱好者和复古计算机社区中引发了广泛关注和热烈讨论。整体来看,这是一项结合了复古计算机技术与现代开源软件的创新黑客项目,既有趣又实用,展现了作者深厚的技术功底和创造力。


HN 热度 858 points | 评论 199 comments | 作者:sohkamyung | 13 hours ago #

https://news.ycombinator.com/item?id=47861270

  • 在 WSL 出现之前,运行未修改的 Linux 二进制文件的最佳方式是 CoLinux 和 flinux,CoLinux 类似 WSL2,flinux 类似 WSL1。
  • Cygwin 是通过本地 POSIX 二进制文件在 Windows 上实现的,避免了内核级别的复杂性,但缺乏方便的命令行包管理器。
  • Cygwin 比 CoLinux 更早出现,但存在 DLL 版本冲突问题,尤其是多个程序包含不同版本的 cygwin1.dll 时。
  • Cygwin 的主要问题是进程 fork 速度慢,脚本需要尽量避免频繁启动新进程。
  • Windows 系统启动和销毁进程开销大,Cygwin 无法解决这个根本问题。
  • Cygwin 缺乏真正的预 emptive 信号机制,信号处理是合作式的,导致某些软件运行不佳。
  • 使用 Cygwin 的 bash 本身并不慢,问题在于典型 bash 脚本频繁调用外部命令导致 fork 开销大。
  • Cygwin 的 DLL 和依赖问题对软件分发带来挑战,通常建议用 MingW 构建可分发的二进制文件。
  • 早期 Cygwin 运行速度慢,尤其是处理大量文件操作时,Linux 环境下速度快得多。
  • Java 在早期被认为表现不佳且缺乏统一的 UI 工具包,但现在依然缺乏统一的 UI 框架。
  • 跨平台 UI 工具包如 Qt、GTK 和 wxWidgets 各有优缺点,wxWidgets 能使用本地控件实现原生外观,支持多种语言绑定。

5. SpaceX 表示已达成以 600 亿美元收购 Cursor 的协议 (SpaceX says it has agreement to acquire Cursor for $60B) #

https://twitter.com/spacex/status/2046713419978453374

该网页显示用户当前浏览的浏览器未启用 JavaScript,提示用户需要启用 JavaScript 或切换到支持 JavaScript 的浏览器以继续使用 x.com 平台。页面提供了帮助中心链接,列出了服务条款、隐私政策、Cookie 政策、版权信息及广告信息等相关链接。

网页底部显示版权归 X 公司所有,年份为 2026 年。页面还提示用户不要错过平台上的最新动态,鼓励用户登录或注册账号以便查看和发布内容。

页面主体内容包含一条来自 SpaceX 官方账号的推文,介绍了 SpaceX 与 Cursor AI 的合作。两者将共同打造世界上最优秀的编码和知识工作人工智能。合作结合了 Cursor 领先的产品和对专业软件工程师的分发能力,以及 SpaceX 拥有的百万 H100 等效的 Colossus 训练超级计算机资源,目标是构建最有用的 AI 模型。

此外,推文透露 Cursor 已授予 SpaceX 今年晚些时候以 600 亿美元收购 Cursor 的权利,或者支付 100 亿美元用于双方的合作工作。该推文发布于 2026 年 4 月 22 日,获得了大量浏览和互动。


HN 热度 790 points | 评论 945 comments | 作者:dmarcos | 1 day ago #

https://news.ycombinator.com/item?id=47855293

  • SpaceX 购买了一个价值 600 亿美元的期权,实际支付了 100 亿美元,如果 Cursor 估值低于 600 亿美元可以放弃,估值高则获得极大收益,服务价值也很高,风险较小。
  • Cursor 作为一个 IDE 产品并不算特别优秀,尤其相比 JetBrains 等竞争对手。
  • Cursor 在 AI 插件集成和文件访问管理上有独特优势,解决了 Copilot 等工具在某些任务中遇到的问题。
  • 开发一个优秀的 AI 工具集成和上下文管理系统并不容易,但这类“工具套件”未来可能被模型提供商整合,存在不确定性。
  • 600 亿美元的估值看起来过高,但这只是期权投资,实际收购可能通过股票交换完成,符合创业投资的常见模式。
  • 100 亿美元的期权费用仍然被认为过高,尤其是针对一个工具套件。
  • AI 相关投资受到市场情绪驱动,存在一定的非理性成分。
  • Cursor 的收入快速增长,商业价值可能超过代码本身的技术价值。
  • Cursor 团队的工具集成经验对 SpaceX 未来的 AI 产品(如 Grok)有重要价值。
  • AI 工具的开发越来越依赖复制已有工具的功能,前沿大模型公司更有优势。
  • 复杂度高并不直接等同于高价值,估值应考虑护城河和市场潜力。
  • 目前市场上有免费或开源的类似工具,但生态系统和用户体验是关键。
  • 有观点认为在 IDE 中集成 AI 过于复杂,AI 辅助代码生成应有更合适的独立界面。
  • 文件访问权限和系统管理策略影响 AI 工具的表现,不同环境体验差异明显。
  • Cursor 的年收入增长迅速,未来估值达到 600 亿美元并非完全不合理。

6. Meta 开始捕捉员工鼠标移动和键盘输入以训练人工智能 (Meta to start capturing employee mouse movements, keystrokes for AI training) #

https://www.reuters.com/sustainability/boards-policy-regulation/meta-start-capturing-employee-mouse-movements-keystrokes-ai-training-data-2026-04-21/

Meta 公司正在美国员工的电脑上安装新的追踪软件,记录鼠标移动、点击和键盘输入,以用于训练其人工智能模型。这项名为“模型能力计划”(Model Capability Initiative,MCI)的工具会在与工作相关的应用和网站上运行,并偶尔截取员工屏幕内容,目的是提升 AI 在模拟人类与计算机交互方面的表现,如选择下拉菜单和使用键盘快捷键。

Meta 正积极将 AI 整合进工作流程,推动员工使用 AI 代理完成日常任务,并计划通过这些技术实现更高效的运营。公司首席技术官安德鲁·博斯沃斯表示,未来 AI 代理将主要承担工作,员工的角色则转为指导和监督,帮助 AI 不断改进。Meta 强调收集的数据仅用于模型训练,不会用于员工绩效评估,并承诺保护敏感内容。

此次举措反映出科技行业利用 AI 技术重塑劳动力结构的趋势。Meta 计划从 5 月 20 日起裁员 10%,并可能在今年晚些时候继续裁员。类似地,亚马逊和金融科技公司 Block 也进行了大规模裁员。

然而,这种对员工的实时监控引发了隐私和法律方面的担忧。专家指出,美国联邦法律对员工监控限制较少,通常只要求告知员工;但欧洲法律则更严格,部分国家甚至禁止此类监控,认为其违反数据保护法规。整体来看,员工监控的加强显著改变了职场权力平衡,向雇主倾斜。


HN 热度 768 points | 评论 509 comments | 作者:dlx | 1 day ago #

https://news.ycombinator.com/item?id=47851948

  • 员工被大规模监控会极大影响隐私和工作氛围,员工难以进行非工作相关的交流。
  • 这种监控行为虽然令人讽刺,但在科技公司中已逐渐成为常态,许多公司将员工的邮件、聊天记录等数据用于 AI 训练。
  • 在发达和文明国家,这类监控行为通常是非法的,但在美国缺乏相应的法律保护,情况可能会恶化。
  • 公司将员工视为资产,知识产权被用于 AI 训练,员工的个人形象和数据权利被剥夺,未来可能引发知识产权和隐私权的冲突。
  • 员工在工作中使用的设备和账户上的数据通常归公司所有,个人数据隐私保护有限。
  • 各国对员工个人数据和工作成果的保护政策不同,例如法国允许个人数据存在工作电脑但需标记,且公司访问需有员工代表在场。
  • 许多工作合同中包含放弃个人肖像权和知识产权的条款,员工应注意合同中的“moonlighting”(兼职)政策以保护个人项目权益。
  • 在某些国家和地区,员工在非工作时间和非公司设备上完成的工作成果受法律保护,但具体规定因地而异。
  • 公司对员工的监控和数据使用缺乏透明和合理的限制,可能导致员工被当作机器对待,缺乏基本的人文关怀和保护。

7. Anthropic 将从 Pro 计划中移除 Claude Code 功能? (Claude Code to be removed from Anthropic’s Pro plan?) #

https://bsky.app/profile/edzitron.com/post/3mjzxwfx3qs2a

该网页内容主要围绕 Anthropic 公司对其 Claude Code 产品订阅政策的变动展开讨论。根据网页内容,Anthropic 似乎已经从其每月 20 美元的“Pro”订阅计划中移除了 Claude Code 功能,这一点可以从其定价页面上看出。部分用户确认新订阅用户无法通过网页应用访问 Claude Code,但现有的 Pro 用户仍然可以使用该功能,尤其是在命令行界面(CLI)中,功能暂时未受影响。

用户社区对此变化反应不一,有人猜测这可能与之前关于 Claude 安全风险的报道有关,认为公司可能以“模型过于危险”为由限制访问,以维护其作为“伦理替代品”的形象。也有用户表示,如果这一变动属实,他们将考虑取消订阅,因为 Claude Code 是他们认为最有价值的功能之一。

此外,有用户指出,年付订阅用户可能因“祖父条款”而暂时保留访问权限,但未来可能会受到影响。部分用户在不同地区的体验也有所差异,有的仍能正常使用该功能。整体来看,Anthropic 可能正在调整其产品策略,准备在近期正式宣布并推送相关 API 和订阅计划的变更。


HN 热度 658 points | 评论 616 comments | 作者:JamesMcMinn | 1 day ago #

https://news.ycombinator.com/item?id=47854477

  • Anthropic 的“Head of Growth”称此次调整是“测试”,但未解释文档变更的原因,导致用户不满。
  • 官方表示若变动影响现有订阅用户,会提前通知,但未明确新用户的定价,令用户难以做出购买或推荐决策。
  • 有用户因信任危机选择取消订阅,认为 Anthropic 管理产品的方式不支持其工作流程。
  • 目前大厂 AI 服务缺乏确定性保障,难以被严肃的职场环境接受,且个人用户私自使用 AI 工具的现象普遍。
  • 本地推理技术亟需发展,因当前云端服务不稳定且缺乏严肃的服务等级协议。
  • Copilot 因按提示计费且性价比高,被部分用户视为更优选择,尽管其上下文限制较多。
  • 有用户同时订阅多款 AI 编码工具,表示对任何单一产品都不忠诚。
  • Anthropic 更侧重企业 API 用户,逐步减少面向个人用户的 Pro 或 Max 计划。
  • 企业用户普遍认为 API 成本可能高于直接雇佣开发者,影响其采用决策。
  • 在某些机构,AI 工具虽能提升产出,但成本上升和收益有限,最终成本可能成为决定性因素。
  • 企业管理层更倾向于固定员工成本而非按需 API 使用费用。
  • 大型企业通过 AWS Bedrock 使用 Claude,愿意为每位工程师支付高额费用。
  • 有观点认为 AI 模型能提升开发效率,但其价值不应简单等同于开发者薪资比例。
  • AI 工具更多被视为开发效率的倍增器,而非替代开发者。
  • 软件定价最终由市场竞争决定,不会长期维持在接近开发者薪资节省的水平。
  • 竞争激烈将促使编码 AI 工具价格下降,当前软件工程领域的高成本不具备持续性。

8. Qwen3.6-27B:旗舰级 27B 密集模型中的编码能力 (Qwen3.6-27B: Flagship-Level Coding in a 27B Dense Model) #

https://qwen.ai/blog?id=qwen3.6-27b

Qwen 团队最近发布了 Qwen3.6-27B,这是一个拥有 270 亿参数的密集型多模态模型,旨在满足社区对高性能编码能力的需求。与之前的旗舰模型 Qwen3.5-397B-A17B 相比,Qwen3.6-27B 在所有主要的编码基准上都表现出色,超越了后者,显示出其在编码任务上的领导地位。

Qwen3.6-27B 不仅支持多模态思维模式,还支持非思维模式,使其能够处理文本、图像和视频数据,从而实现多模态推理、文档理解和视觉问答等功能。这种模型采用了密集架构,避免了复杂的 MoE(Mixture of Experts)路由,使得部署变得更加简单,非常适合开发者使用。

在性能方面,Qwen3.6-27B 在多个编码基准测试中取得了显著提升。例如,在 SWE-bench Verified 基准上,Qwen3.6-27B 的得分为 77.2,超过了 Qwen3.5-397B-A17B 的 76.2;在 SWE-bench Pro 上分别为 53.5 与 50.9;在 Terminal-Bench 2.0 上为 59.3 与 52.5;在 SkillsBench 上为 48.2 与 30.0。即使与规模更大的模型相比,Qwen3.6-27B 在推理任务中也表现出色,例如在 GPQA Diamond 测试中获得了 87.8 的分数,竞争力相当强。

Qwen3.6-27B 现已在 Qwen Studio 上线,用户可以通过 API 访问,也可以从 Hugging Face 和 ModelScope 下载模型权重。该模型旨在与多个第三方编码助手兼容,包括 OpenClaw、Claude Code 和 Qwen Code,以优化开发工作流程和提高上下文感知的编码体验。

此外,Qwen3.6-27B 还提供了 API 的使用示例,支持 “preserve_thinking” 功能,适合用于需要保留思维内容的任务。用户需要设置相应的环境变量并遵循 API 文档来实现这些功能。

总体而言,Qwen3.6-27B 作为一个新一代的密集型多模态模型,不仅在编码性能上超越了许多同类产品为开发者提供了方便的部署和集成方案,标志着多模态 AI 模型的一次重要进步。


HN 热度 601 points | 评论 303 comments | 作者:mfiguiere | 10 hours ago #

https://news.ycombinator.com/item?id=47863217

  • Qwen 3.6-27B 模型在 16.8GB 量化版本下表现优秀,能在 32GB 内存机器上运行,生成速度约为 25.57 tokens/s。
  • 有观点认为“鹈鹕骑滑板车”的测试可能是模型训练集中的内容,导致表现异常好。
  • GLM 5.1 模型在生成复杂 SVG 图像(如北弗吉尼亚负鼠)方面表现优于 Qwen 3.6 和其他模型,但其模型体积远大(1.51TB)。
  • “鹈鹕测试”被认为可能被模型训练时“特别对待”,可能是因为该测试内容在近期数据中较为常见。
  • 有人担心讨论过度集中在“鹈鹕 SVG”测试上,影响了对 Qwen 模型本身的深入讨论。
  • Qwen 模型可在 Mac 上通过 llama-server 运行,且生成质量足以值得进一步研究。
  • 有用户表示喜欢“鹈鹕-自行车”测试,因为它对模型帮助生成 TikZ 代码的能力有较好预测性。
  • 有观点认为“鹈鹕测试”可能已经成为一种被优化的指标,存在“古哈特定律”效应。
  • 训练数据中可能存在针对特定测试的“定向优化”或“Whack-a-mole”式训练,导致模型在某些测试上表现突出。
  • 由于 Hacker News 和博客内容被持续纳入训练语料,模型可能无意识地优化了对这些内容的表现。
  • 有人建议使用扩散模型生成 SVG 再提取矢量图形,以提升生成质量。
  • 评价模型时应关注实际应用体验和日常任务表现,而非仅依赖玩具测试或指标。
  • 近期本地模型(如 Gemma 4 和 Qwen 3.6)在自托管环境下性能显著提升,逐渐缩小与 Claude 等闭源模型的差距。
  • 本地模型仍存在偶尔偏离正确方向的问题,Opus 模型在稳定性方面表现较好。
  • 现代本地模型需要较高显存(如 RTX 5090 的 29/32GB)支持,配合合适的工具链(如 Ollama 和 ACP 协议)使用体验更佳。

9. GitHub CLI 现收集伪匿名遥测数据 (GitHub CLI now collects pseudoanonymous telemetry) #

https://cli.github.com/telemetry

该网页详细介绍了 GitHub CLI(命令行工具)收集的匿名遥测数据及其用途。遥测数据帮助 GitHub 团队了解用户如何使用不同功能,从而优化产品设计和优先级。例如,通过分析新子命令的使用情况,团队可以判断功能的受欢迎程度和改进方向。

用户可以通过设置环境变量或 CLI 配置开启“日志模式”,在该模式下,遥测数据不会发送给 GitHub,而是以 JSON 格式打印到标准错误输出,方便用户查看具体发送内容,增强透明度。

网页还说明了用户如何选择退出遥测数据收集,同样支持通过环境变量或配置项关闭,且环境变量优先级更高。遥测数据发送到 GitHub 内部分析系统,具体数据处理遵循 GitHub 的隐私政策。

此外,页面提醒用户,GitHub CLI 支持安装官方及第三方扩展,这些扩展可能会单独收集使用数据,用户需查看相应扩展的文档了解其遥测政策。该页面仅涉及 GitHub CLI 的客户端数据收集,不包含 GitHub Copilot 及其 CLI 的遥测内容。


HN 热度 386 points | 评论 285 comments | 作者:ingve | 11 hours ago #

https://news.ycombinator.com/item?id=47862331

  • 收集遥测数据可以帮助团队了解功能的实际使用情况,从而优先处理和评估功能是否满足用户需求。
  • 没有分析数据就开发产品相当于盲目操作,用户的实际使用行为和他们口头表达的需求往往有很大差异。
  • 通过与用户交流和结合经验进行思考,也能做出比单纯依赖数据更好的产品决策。
  • 遥测数据提供的是精确且实时的用户行为信息,远比耗时的用户访谈和调查更高效。
  • 仅依赖遥测数据可能忽视用户的真实反馈和具体问题,公共论坛上的用户意见也很重要。
  • 遥测数据无法解释用户行为背后的原因,需要结合用户访谈等定性方法。
  • 使用数据时需谨慎,避免因为某些功能使用频率低就轻易删除,忽视功能的重要性。
  • 遥测数据和用户访谈应结合使用,单独依赖任何一方都会导致认知盲区。
  • 许多团队会对数据指标进行深入讨论,确保衡量的内容符合真实需求,避免盲目追求增长。

10. 我们的第八代 TPU:面向智能代理时代的两款芯片 (Our eighth generation TPUs: two chips for the agentic era) #

https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

谷歌发布了第八代定制张量处理单元(TPU),包括两款专用芯片:TPU 8t 和 TPU 8i。TPU 8t 专注于大规模模型训练,旨在加速复杂模型的开发过程;TPU 8i 则专注于低延迟推理,支持快速协作的人工智能代理运行。这两款芯片通过定制硬件设计,实现了更高的性能和能效,能够满足 AI 代理在推理、执行多步骤工作流和持续学习方面的新需求。

这代 TPU 是在与谷歌 DeepMind 合作下开发,针对不断演进的模型架构和大规模 AI 工作负载进行了优化。TPU 系列芯片在机器学习超级计算领域树立了标准,采用了定制数值计算、液冷技术和专用互连等多项先进技术。第八代 TPU 是谷歌十多年技术积累的结晶,体现了软硬件协同设计带来的显著性能提升和能效改进。

这些新芯片将支持从前沿模型训练到大规模推理的各种 AI 任务,预计今年晚些时候正式推出。包括 Citadel Securities 在内的领先机构已经开始使用 TPU 来推动其尖端 AI 应用的发展,展示了 TPU 在实际应用中的强大能力和广泛潜力。


HN 热度 370 points | 评论 181 comments | 作者:xnx | 11 hours ago #

https://news.ycombinator.com/item?id=47862497

  • Gemini 3 系列模型在效率上表现突出,体积可能远小于 Opus 和 GPT-5 级别模型,但推理和执行能力尚未完善,尤其在工具调用和代理任务上表现较弱。
  • Gemini 3 Pro 在多语言能力上表现优异,尤其是在人文学科和小众语言方面领先其他模型,但在数学和代理任务上较弱。
  • Anthropic 的 Claude 系列曾在多语言和通用能力上表现出色,但近年来因策略调整,优先优化代码生成,导致多语言能力下降。
  • 现代大模型普遍存在语言连贯性问题,如随机语言切换和自我纠正导致的幻觉,且这些问题与引入推理能力相关。
  • 目前的多语言基准测试难以捕捉模型在创意写作和语言风格多样性上的真实表现,尤其是对方言和俚语的处理能力。
  • Google 更注重将 AI 用于增强或替代传统搜索,拥有庞大用户基础,具备更好的商业化潜力。
  • Gemini-cli 在工具调用和代码生成方面表现不佳,可能是模型本身或使用环境的问题,整体体验不及其他同类工具。

Hacker News 精彩评论及翻译 #

Meta to start capturing employee mouse movements, … #

https://news.ycombinator.com/item?id=47855523

Couldn’t have happened to a more deserving group of people. My irony detector is sparking so badly I think it’s about to blow.

Blackthorn

这件事发生在这群更配得上的人身上简直再合适不过了。我的讽刺雷达快要爆表了。


Meta to start capturing employee mouse movements, … #

https://news.ycombinator.com/item?id=47853043

This is going to be a huge chilling factor for employees. You’d no longer be able to disent, or discuss anything non-work related with even the slightest expectation of privacy.

Yes they could have accessed logs before but there’s a difference between directed checking after incidents and active surveillance at scale.

dagmx

这对员工来说将是一个巨大的寒蝉效应。你将无法再以任何隐私的期待,去解脱或讨论任何与工作无关的事情。

是的,他们以前可能也能查看日志,但在事件发生后有针对性地检查,与大规模主动监控是两码事。


Windows Server 2025 Runs Better on ARM #

https://news.ycombinator.com/item?id=47858177

Windows developer here. After reading this post, my gut instinct is that this is due to something called ‘segment heap’.

A bit of backstory: there are two, totally independent implementations behind the Windows heap allocation APIs (i.e. the implementation code behind RtlHeapAlloc and RtlHeapFree, which are called by malloc/free). The older of the two, developed uring the Dave Cutler era, is known as the “NT heap”. The newer implementation, developed in the 2010s, is known as “segment heap”. This is all documented online if anyone wants to read more. When development on segment heap was completed, it was known to be superior to the NT heap in many ways. In particular, it was more efficient in terms of memory footprint, due to lower fragmentation-related waste. Segment heap was smarter about reusing small allocations slots that were recently free’d. But, as ever, Windows was very serious about legacy app compat. Joel Spolsky calls this the ‘Raymond Chen camp’. So, they didn’t want to turn segment heap on universally. It was known that a small portion of legacy software would misbehave and do things like, rely on doing a bit of use-after-free as a treat. Or worse, it took dependencies on casting addresses to internal NT heap data structures. So, the decision at the time was to make segment heap the default for packaged executables. At that time, Windows Phone still existed, and Microsoft was pushing super hard on the Universal platform being the new, recommended way to make apps on Windows. So they thought we’d see a gradual transition from unpackaged executables to packaged, and thus, a gradual transition from NT heap to segment heap. The dream of UWP died, and the Windows framework landscape is more fragmented than ever. Most important software on Windows is still unpackaged, and most of it runs on x64.

Why does this matter? Because segment heap is also enabled by default on arm. Same logic as the packaged vs unpackaged decision. Arm64 binaries on Windows are guaranteed not to be ancient, unmaintained legacy code. Arm64 windows devices have been a big success, and users widely report that they feel more responsive than x64 devices.

A not insignificant part of why Windows feels better on arm is because segment heap is enabled by default on arm.

I’d be interested to see how this test turns out if you force segment heap on x64. You can do it on a per-executable basis via creating a DWORD value named FrontEndHeapDebugOptions under HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Image File Execution Options<myExeName>.exe, and giving it a value of 8.

You can turn it on globally for all processes by creating a DWORD value named “Enabled” under HKLM\SYSTEM\CurrentControlSet\Control\Session Manager\Segment Heap, and giving it a value of 3. I do this on my dev machine and have encountered zero problems. The memory footprint savings are pretty crazy. About 15% in my testing.

kh9000

我是个 Windows 开发者。看完这篇帖子后,我的直觉是问题出在所谓的“段堆”(segment heap)上。

简单介绍一下背景:Windows 堆分配 API(即 RtlHeapAlloc 和 RtlHeapFree,它们被 malloc/free 调用)背后其实有两个完全独立的实现。较早的那个是在 Dave Cutler 时代开发的,被称为“NT 堆”;较新的一个是在 2010 年代开发的,称为“段堆”。如果有人想了解更多,可以在网上找到相关文档。段堆开发完成时,被认为在多个方面优于 NT 堆,特别是内存占用更高效,因为它减少了由内存碎片产生的浪费。段堆能更智能地重用最近释放的小块内存。然而,Windows 一向非常重视旧版应用的兼容性。Joel Spolsky 把这称为“Raymond Chen 阵营”。因此,不希望段堆成为普遍默认。因为部分老旧软件会出问题,比如故意利用已释放内存(use-after-free)来实现某些功能,更糟的是,它们依赖于将地址强制转换成 NT 堆的内部数据结构。于是,那时的决策是将段堆作为“打包可执行文件”的默认堆类型。当时 Windows Phone 还存在,微软极力推动通用平台(UWP)作为 Windows 应用的新推荐方式,他们认为将逐步从未打包的可执行文件过渡到打包应用,也就是逐步从 NT 堆过渡到段堆。但 UWP 最终没能成气候,Windows 框架的生态比以往更加分散。Windows 上最重要的软件仍然未打包,大多数仍运行在 x64 架构上。

为什么这很重要?因为段堆在 ARM 上默认启用,原因和打包与未打包应用的区别类似。在 Windows 上运行的 Arm64 程序基本不会是非常陈旧的、无人维护的遗留代码。Arm64 Windows 设备取得了巨大的成功,用户普遍反映相比 x64 设备有更好的响应速度。

Windows 在 ARM 上感觉更好的一个重要原因,就是默认启用了段堆。

我很想看到如果你在 x64 上强制启用段堆,这个测试结果会怎样。你可以通过在注册表路径 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Image File Execution Options<myExeName>.exe 下创建一个名为 FrontEndHeapDebugOptions 的 DWORD 键,赋值为 8,针对单个可执行文件开启它。

或者你也可以在全局范围内开启,为 HKLM\SYSTEM\CurrentControlSet\Control\Session Manager\Segment Heap 路径下新建一个名为 Enabled 的 DWORD 值,赋值为 3。我在开发机上这样做了,完全没遇到啥问题。节省的内存开销非常惊人,我测试中大约节省了 15%。


SpaceX says it has agreement to acquire Cursor for… #

https://news.ycombinator.com/item?id=47857025

I just want to make the observation that this whole SpaceX IPO is turning out entirely unlike the CDOs that led to the 2008 financial crisis. There’s no mixing of AAA level assets with a bunch of subprime stuff and then getting someone to buy it all as AAA. Not at all similar. Completely different. Will turn out just fine this time.

qzw

我只是想指出,这次SpaceX的首次公开募股完全不像导致2008年金融危机的那些CDO。没有将A级资产和大量次级贷款混合,然后让别人把它们当作A级资产购买。完全不同。这次会一切顺利。


SpaceX says it has agreement to acquire Cursor for… #

https://news.ycombinator.com/item?id=47856926

So SpaceX bought a $60B Option on Cursor, plus a bunch of services, for $10B.

If strike date comes and Cursor is in fact worth less than $60B… they can move to acquire it for that price. Or just let it “expire”. And if it’s worth more, they get a savage good deal. If the services were worth $8B anyway, it’s hard to lose.

It seems less crazy to me through this lens. A straight acquisition, today, at $60B would in fact be crazy.

Lonestar1440

所以SpaceX花了100亿美元买了Cursor价值600亿美元的期权外加一堆服务。

如果到期日时Cursor实际上价值低于600亿美元……他们可以选择以这个价格收购它,或者让期权“过期”。如果价值更高,他们就获得了一个极其划算的交易。如果那些服务本身价值80亿美元的话,这几乎没有亏损。

通过这个角度来看,这事似乎没那么疯狂。要是今天直接以600亿美元收购它,确实会很疯狂。


Making RAM at Home [video] #

https://news.ycombinator.com/item?id=47858989

I only buy free-range artisanal DRAM at the DRAM farmer’s market.

readitalready

我只在DRAM农贸市场购买散养手工制作的DRAM。


SpaceX says it has agreement to acquire Cursor for… #

https://news.ycombinator.com/item?id=47856489

Why would Elon do this if he knows full well the names X-Code and Codex are already taken?

yungbeto

如果埃隆明知道X-Code和Codex这两个名字已经被占用,他为什么还要这么做?


ChatGPT Images 2.0 #

https://news.ycombinator.com/item?id=47860768

Every cent you spend on this, remember: The people who made this possible are not even getting a millionth of a cent for every billion USD made with it (they are getting nothing). Same with code; that code you spent years pouring over, fixing, etc. is now how these companies make so much money and get so much investment. It’s like open source, except you get shafted.

lionkor

你花在这个上的每一分钱都要记住:那些让这一切成为可能的人,连每赚取十亿美元所得的一百万分之一分钱都得不到(他们什么也得不到)。代码也是一样;你花了多年时间研究、修复的代码,如今成了这些公司赚取巨额利润和获得大量投资的工具。就像开源项目,只不过你吃了哑巴亏。


San Diego rents declined following surge in supply #

https://news.ycombinator.com/item?id=47857786

Incredible. So what you’re saying is… we should just build more housing? Who would have thought that was the answer?

exabrial

难以置信。你的意思是……我们应该多建些住房?真没想到这竟然是答案。


Nobody got fired for Uber’s $8M ledger mistake? #

https://news.ycombinator.com/item?id=47862687

Firing people for bad architectural decisions is generally a terrible idea - especially decisions that shipped and ran in production for several years.

This article also doesn’t make a convincing case for this being a huge mistake. Companies like Uber change their architectural decisions while they scale all the time. Provided it didn’t kill the company stuff like this becomes part of the story of how they got to where they are.

Related: the classic line commonly attributed to original IBM CEO Thomas John Watson Sr:

“Recently, I was asked if I was going to fire an employee who made a mistake that cost the company $600,000. No, I replied, I just spent $600,000 training him. Why would I want somebody to hire his experience?”

https://blog.4psa.com/quote-day-thomas-john-watson-sr-ibm/

simonw

因为架构决策不当而开除员工通常是个糟糕的主意——尤其是那些已经上线并运行了好几年的决策。

这篇文章也没有令人信服地证明这是一个巨大的错误。像Uber这样的公司在扩展过程中经常会改变他们的架构决策。只要没有导致公司崩溃,这类事情反而成为他们成长历程的一部分。

相关的经典话语,通常归于IBM创始人兼首任CEO托马斯·约翰·沃森(Thomas John Watson Sr):

“最近有人问我,是否会开除一个因犯错让公司损失60万美元的员工。我回答说,不会,我刚刚花了60万美元培训他。为什么我要让别人用钱雇佣他的经验?”


Changes to GitHub Copilot individual plans #

https://news.ycombinator.com/item?id=47855822

I don’t understand why anyone would want to deal with Microsoft as a vendor if they don’t have to.

It can bill to our Azure sub and I don’t have to go through the internal bureaucracy of purchasing a new product/service from a new vendor.

Marsymars

我不明白如果不是必须,为什么有人愿意把微软当作供应商。

它可以直接记在我们的Azure订阅上,我也不用经历公司内部采购新产品/服务时的繁琐流程。


Framework Laptop 13 Pro #

https://news.ycombinator.com/item?id=47852762

My heart sank when they said 13 pro and then to see that so much is backwards compatible was amazing. It’s quite refreshing to see a company live up to their mission so well.

tuckerman

当他们说13 Pro时,我的心沉了下去,但看到这么多功能向后兼容,真的很惊喜。看到一家公司如此好地践行他们的使命,真是令人耳目一新。


5x5 Pixel font for tiny screens #

https://news.ycombinator.com/item?id=47866819

1x5 can also work if you take advantage of subpixel rendering https://www.msarnoff.org/millitext/

FelipeCortez

如果利用亚像素渲染,1x5 也能起作用 https://www.msarnoff.org/millitext/


SpaceX says it has agreement to acquire Cursor for… #

https://news.ycombinator.com/item?id=47859629

What’s crazy is that a company that sells an IDE (that’s not even a particularly good one compared to competitors like JetBrains) integrating some AI plugins could be worth more than $60B…

rob74

疯狂的是,一家销售集成开发环境(而且与 JetBrains 这样的竞争对手相比,这个产品甚至不算特别出色)的公司,仅仅因为整合了一些 AI 插件,市值竟然可能超过 600 亿美元……


Alberta startup sells no-tech tractors for half pr… #

https://news.ycombinator.com/item?id=47867092

Up until a year ago I was regularly using a Massy Fergusson 135 [0] (Perkins Diesel version), made sometime in the 1970s. It was wonderful! So amazing to drive and use. Clunky and heavy, but you really really felt like you were using a machine. In low gears, if you put you foot down on the accelerator the engine would roar, and your speed would barely change!

And there was no fancy technology in it at all. If I was in the forest and had forgotten the key, I’d just reach behind the dashboard and hot-wire it. The air filter was basically a shisha-pipe that bubbled the incoming air through wire wool and engine oil.

Its fuel gauge didn’t work either. You just had to take a look in the tank, or quickly react as soon as the revs started dropping. I ran it dry a few times and had to sit there with a spanner in one hand and YouTube into the other, while trying to bleed all the fuel lines. But they were all on the outside of the vehicle, which made it comparatively easy I imagine.

I’ve never actually driven a modern tractor, so don’t know how it compares. I imagine the clutch is easier on the knees these days!

Anyway, this just felt like the place to share this.

[0] https://en.wikipedia.org/wiki/Massey_Ferguson_135

adamcharnock

直到一年前,我还经常使用一台 Massey Ferguson 135(配备 Perkins 柴油发动机版本),大约是1970年代制造的。它非常棒!开起来和使用起来都令人惊叹。虽然笨重而沉闷,但你真的能感受到自己在操控一台机器。在低速档时,如果你踩下油门,发动机会咆哮,而速度几乎没有变化!

而且它里面根本没有什么复杂的技术。如果我在森林里忘了带钥匙,我只需伸手到仪表盘后面,直接热接线启动。空气滤清器实际上就是一个水烟管,空气通过钢丝绒和机油被气泡过滤。

它的油表也不工作。你只能直接观察油箱,或者在发动机转速开始下降时迅速反应。我几次用尽燃油,不得不一手拿着扳手,一手看着YouTube视频,边试图排气燃油管。但那些管线都装在车体外面,我想这相对来说还算容易。

我实际上从没开过现代拖拉机,所以不清楚区别如何。我想现在的离合器对膝盖可能更友好吧!

无论如何,这里感觉是分享这些的好地方。


Windows 9x Subsystem for Linux #

https://news.ycombinator.com/item?id=47863886

Is this person a wizard?

To me, this seems an impossible feat.

But I wonder how it seems to people who understand how it works?

I’m reminded of this joke:

Two mathematicians are talking. One says a theorem is trivial. After two hours of explanation, the other agrees that it is indeed trivial.

andai

这个人是个巫师吗?

对我来说,这似乎是不可能完成的壮举。

但我想知道懂得其原理的人怎么看?

这让我想起了这个笑话:

两个数学家在聊天。一个说定理很简单。经过两个小时的解释,另一个才同意这确实很简单。


ChatGPT Images 2.0 #

https://news.ycombinator.com/item?id=47856144

So during my Nano Banana Pro experiments I wrote a very fun prompt that tests the ability for these image generation models to follow heuristics, but still requires domain knowledge and/or use of the search tool:

Create a 8x8 contiguous grid of the Pokémon whose National Pokédex numbers correspond to the first 64 prime numbers. Include a black border between the subimages.

You MUST obey ALL the FOLLOWING rules for these subimages:

  • Add a label anchored to the top left corner of the subimage with the Pokémon’s National Pokédex number.
    • NEVER include a # in the label
    • This text is left-justified, white color, and Menlo font typeface
    • The label fill color is black
  • If the Pokémon’s National Pokédex number is 1 digit, display the Pokémon in a 8-bit style
  • If the Pokémon’s National Pokédex number is 2 digits, display the Pokémon in a charcoal drawing style
  • If the Pokémon’s National Pokédex number is 3 digits, display the Pokémon in a Ukiyo-e style The NBP result is here, which got the numbers, corresponding Pokemon, and styles correct, with the main point of contention being that the style application is lazy and that the images may be plagiarized: https://cdn.bsky.app/img/feed_fullsize/plain/did:plc:oxaernim5mj2mmy3ytrvb42n/bafkreigussguihcycvzm3aaosw4gzvgwhibwmjiknkkatfcaeajapmrqca

Running that same prompt through gpt-2-image high gave an…interesting contrast: https://cdn.bsky.app/img/feed_fullsize/plain/did:plc:oxaernim5mj2mmy3ytrvb42n/bafkreidgbmtivl33ohwgbvylnvqzo2uz43zkuwu65cg42wkk7b7up7emje

It did more inventive styles for the images that appear to be original, but:

  • The style logic is by row, not raw numbers and are therefore wrong

  • Several of the Pokemon are flat-out wrong

  • Number font is wrong

  • Bottom isn’t square for some reason

Odd results.

minimaxir

在我进行Nano Banana Pro实验时,我写了一个非常有趣的提示,用来测试这些图像生成模型是否能够遵循启发式规则,同时仍需要领域知识和/或使用搜索工具:

创建一个8x8连续的网格,包含国家图鉴编号对应于前64个质数的宝可梦。子图之间应有黑色边框。

你必须遵守所有以下对子图的规则:

  • 在子图左上角添加标签,标签内容为宝可梦的国家图鉴编号。
    • 标签中绝对不包含“#”符号
    • 文字左对齐,白色,字体为Menlo
    • 标签背景颜色为黑色
  • 如果宝可梦的国家编号是1位数,宝可梦形象应采用8-bit风格
  • 如果是2位数,采用炭笔画风格
  • 如果是3位数,采用浮世绘风格

NBP结果在这里,编号、对应宝可梦和风格基本正确,主要争议点是风格运用比较敷衍,且图片可能存在抄袭问题:https://cdn.bsky.app/img/feed_fullsize/plain/did:plc:oxaernim5mj2mmy3ytrvb42n/bafkreigussguihcycvzm3aaosw4gzvgwhibwmjiknkkatfcaeajapmrqca

用gpt-2-image high运行同样的提示,则得到一个…有趣的对比:https://cdn.bsky.app/img/feed_fullsize/plain/did:plc:oxaernim5mj2mmy3ytrvb42n/bafkreidgbmtivl33ohwgbvylnvqzo2uz43zkuwu65cg42wkk7b7up7emje

它为图像采用了更具创意的原创风格,但:

  • 风格逻辑按行划分,而非按原始编号,因此不正确
  • 多个宝可梦完全错误
  • 数字字体错误
  • 不知道为什么底部不成正方形

结果很奇怪。


Claude Code to be removed from Anthropic’s Pro pla… #

https://news.ycombinator.com/item?id=47856452

They later said: https://twitter.com/TheAmolAvasare/status/2046725498592722972

When we do land on something, if it affects existing subscribers you’ll get plenty of notice before anything changes. Will hear it from us, not a screenshot on X or Reddit.

If you don’t want things like this spreading through screenshots of X and Reddit, don’t run “tests” like this in the first place!

(Also “if it affects existing subscribers” is a cop-out, I need to know the pricing of Claude Code for NEW subscribers if I’m going to adopt it at a company with a growing team, or recommend it to other people, write tutorials etc.)

simonw

他们后来表示:

“当我们确定了方案,如果会影响现有订阅用户,你们会在任何变更发生前收到充分通知。消息会由我们直接告知,而不是通过X(推特)或Reddit上的截图传出。”

如果你们不希望这种消息通过X和Reddit的截图传播,那就不要一开始就做这样的“测试”!

(而且“如果影响现有订阅用户”这说法是推脱。如果我要在一个不断壮大的团队里采用Claude Code,或者推荐给别人、写教程等,我需要知道新订阅用户的定价情况。)


Claude Code to be removed from Anthropic’s Pro pla… #

https://news.ycombinator.com/item?id=47856164

Anthropic’s “Head of Growth” claims this is a “test”: https://x.com/TheAmolAvasare/status/2046724659039932830

This does not explain the changes to documentation.

rideontime

Anthropic 的“增长负责人”声称这是一次“测试”:https://x.com/TheAmolAvasare/status/2046724659039932830

这并不能解释文档的更改。


3.4M Solar Panels #

https://news.ycombinator.com/item?id=47863904

Liquid-cooled computers have one major benefit; usually, your computer ages over time, and there’s a long period where it’s still barely fast enough but you wish you had something nicer. A liquid-cooled workstation prevents you from needing to manage this grey area by catastrophically failing at unexpected intervals.

everdrive

液冷电脑有一个主要优点;通常你的电脑随着时间推移会老化,会有一段很长的时间性能刚好够用,但你又希望拥有更好的设备。液冷工作站可以避免你在这段灰色地带挣扎,因为它不会在意想不到的时间突然发生灾难性的故障。


SpaceX says it has agreement to acquire Cursor for… #

https://news.ycombinator.com/item?id=47856297

knee-jerk is that it’s weird, but makes sense:

  • X will have a total of ~2GW of GPU sometime this year largely not doing much outside of ‘grok is this true’

  • despite no longer being in vogue with consumer devs Cursor still has a lot of developer data that can assist in building a model

  • Cursor have decent enterprise relationships (while for xAI it is ~zero) and that’s where the real revenue for llms + agents is

  • Cursor are paying retail for tokens and competing against the frontier model co’s who are also their suppliers. Not sustainable (hence their in-house composer model).

  • Cursor the product covers the gamut from lovable-style prompt-to-app, an IDE, cli and bugbot

  • X are using “x bucks” to pay for a potential later acquisition which are arguably overvalued based on the space x IPO hype

Option there to give X a window to make it work, otherwise walk away with a $10B breakup fee for access to it’s data

nikcub

第一反应是这很奇怪,但又说得通:

  • X 今年某个时候将拥有总共约 2GW 的 GPU,主要用于“理解这是否真实”的工作,没做太多别的事情。

  • 尽管在消费者开发者中不再流行,Cursor 依然拥有大量开发者数据,可以帮助构建模型。

  • Cursor 有不错的企业关系(而 xAI 几乎没有),而企业才是大语言模型和智能代理真正的收入来源。

  • Cursor 以零售价购买代币,并与同样是其供应商的前沿模型公司竞争,这种模式不可持续(所以他们开发了自家内部的 composer 模型)。

  • Cursor 的产品涵盖了从可爱风格的提示到应用程序、集成开发环境、命令行界面和错误机器人等全部内容。

  • X 正用“x币”支付,可能是为了日后收购,基于 X IPO 热度,这些估值有些被高估。

这给了 X 一个窗口期去让这项合作奏效,否则就以 100 亿美元的分手费退出,获得访问数据的权利。


Laws of Software Engineering #

https://news.ycombinator.com/item?id=47847689

Remember that these “laws” contain so many internal contradictions that when they’re all listed out like this, you can just pick one that justifies what you want to justify. The hard part is knowing which law break when, and why

conartist6

请记住,这些“法则”包含了许多内部矛盾,当它们全部列出来时,你可以随意选择其中一条来为你想要辩护的事情辩解。困难的部分是知道在何时、为何违反哪条法则。


SpaceX says it has agreement to acquire Cursor for… #

https://news.ycombinator.com/item?id=47856898

Every time Musk does anything these days, it further reveals the shell game he’s playing with his companies. This is going to be an Enron type of story eventually. I truly wish I had a choice to pull my tax money out of this particular subsidy.

jesse_dot_id

如今每次马斯克做什么事,都更加暴露出他在公司间玩的这个空壳游戏。最终这将成为一个类似安然的故事。我真希望我能选择不把我的税款投入到这个特定的补贴中。


GitHub CLI now collects pseudoanonymous telemetry #

https://news.ycombinator.com/item?id=47862823

Why we collect telemetry

…our team needs visibility into how features are being used in practice. We use this data to prioritize our work and evaluate whether features are meeting real user needs. I’m curious why corporate development teams always feel the need to spy on their users? Is it not sufficient to employ good engineering and design practices? Git has served us well for 20+ years without detailed analytics over who exactly is using which features and commands. Would Git have been significantly better if it had collected telemetry, or would the data not have just been a distraction?

a2128

为什么我们收集遥测数据

……我们的团队需要了解功能在实际中的使用情况。我们利用这些数据来确定工作的优先级,并评估功能是否满足了真实用户的需求。 我很好奇,为什么企业开发团队总觉得有必要监视用户?仅仅采用良好的工程和设计实践难道还不够吗?Git 在过去20多年里一直运行良好,并没有详细分析究竟是谁在使用哪些功能和命令。如果 Git 收集了遥测数据,会变得明显更好吗?还是这些数据只会成为一种干扰?