2026 05 04 HackerNews

2026-05-04 Hacker News Top Stories #

  1. VS Code 无论是否使用,都会在提交中插入“Co-Authored-by Copilot”
  2. Videolan 推出面向未定稿 AV2 标准的开源解码器 dav2d,延续小巧高效与跨平台设计,号称全平台最快,目标以更低码率实现高质量播放。
  3. 梅赛德斯-奔驰将在保留大屏的同时为关键功能恢复实体按键,率先用于新 GLC 与 C 级以回应用户对纯触控的不满。
  4. DO_NOT_TRACK 通过设置环境变量 DO_NOT_TRACK=1 统一表达拒绝追踪,建议开发者默认关闭广告、遥测与崩溃上报并仅在用户同意时开启。
  5. NetHack 5.0.0 为自 3.6 以来最大更新:迁移至 C99、以 Lua 取代 yacc/lex 并运行时加载关卡,含逾 3100 项变更且与旧存档不兼容。
  6. Ladybird 四月进展显著:新增内嵌 PDF、历史与地址栏建议、GTK4 前端,改进 HTML 解析并将 JS 引擎迁至 Rust 提升性能。
  7. 开发者用六年在 watchOS 打造离线矢量地图与高可读 UI,采用 SwiftUI 自研渲染与定制制图风格,因可定制性放弃 MapKit。
  8. Mercury 以数百万行 Haskell 在生产中用强类型编码业务规则,并将稳定性工程前置以实现幂等、回滚与运维友好的可靠系统。
  9. 开源中文模型 Kimi K2.6 在“Word Gem Puzzle”挑战中凭策略夺冠,击败多款商用大模型,显示开源模型的高性价比与竞争力。
  10. 加州将自 7 月起允许警方直接对违法的无人驾驶车开罚单并要求厂商 30 秒内响应,以弥补监管漏洞并提升公共安全。

1. VS Code 无论是否使用,都会在提交中插入“Co-Authored-by Copilot” (VS Code inserting ‘Co-Authored-by Copilot’ into commits regardless of usage) #

https://github.com/microsoft/vscode/pull/310226

该网页内容主要是关于微软开源项目 Visual Studio Code(vscode)的一次代码合并请求(Pull Request,简称 PR)。此次 PR 的主题是“默认启用 AI 协作者功能”,即在 Git 扩展中将 git.addAICoAuthor 配置项的默认值从“off”改为“all”,使得在检测到 AI 生成的代码贡献时,自动添加“Co-authored-by”标记。

具体改动包括:

  1. 修改 extensions/git/package.json 文件,将 git.addAICoAuthor 的默认值设置为“all”,表示默认启用 AI 协作者。
  2. 讨论中提到,虽然配置文件中默认值已改,但在 extensions/git/src/repository.ts 中的运行时回退值仍为“off”,这可能导致某些测试或环境下行为不一致,建议同步更新运行时默认值以避免混淆。

页面还显示了多个用户的评论和表情反应,反映出社区对该改动的关注和讨论。部分评论指出了代码同步问题,提出了改进建议。页面中还包含了自动生成的测试截图更新记录,显示了相关界面在不同主题下的变化。

总体来看,该网页是一个技术开发社区中关于 VS Code 项目功能改进的详细讨论和代码审查记录,重点聚焦于提升 AI 协作者功能的默认启用状态,以便更好地支持 AI 辅助代码贡献的标记和管理。


HN 热度 1458 points | 评论 806 comments | 作者:indrora | 1 day ago #

https://news.ycombinator.com/item?id=47989883

  • 该功能默认开启是个错误,微软内部也承认并计划修复,且应尊重用户选择关闭 AI 功能时不插入相关信息。
  • 代码评审和发布流程存在问题,未能充分评估该功能对用户的影响,反映出开发和审核流程的不足。
  • 开发团队和管理层面临经济和时间压力,导致快速发布功能而忽视潜在负面影响。
  • 内部测试虽然发现问题,但低估了其影响,未及时阻止功能上线。
  • 有人质疑微软是否故意推动该功能以进行营销,认为这可能是恶意或贪婪行为。
  • 建议对修改用户内容且需用户同意的功能实行更严格的审批流程。
  • 频繁的快速发布机制可能导致更多类似问题,建议调整发布节奏。
  • 该事件暴露出微软在 AI 功能整合和用户隐私保护方面的管理和沟通不足。

2. dav2d:适用于 AV2 视频格式的最快解码器 (Dav2d) #

https://code.videolan.org/videolan/dav2d

该网页介绍了 dav2d 项目,这是一个针对 AV2 视频格式的解码器,号称在所有平台上速度最快。dav2d 旨在实现小巧、便携且高效的解码体验,设计理念类似于 dav1d(AV1 解码器),但专注于 AV2 格式。项目包含 3698 次提交,拥有 1 个分支和 2 个标签,采用 BSD 2-Clause 开源许可证。网页还提及该项目与多媒体领域相关,关联标签包括 multimedia、vlc、av1 和 av2。项目创建于 2025 年 10 月 20 日,整体目标是为 AV2 视频解码提供高性能解决方案。


HN 热度 594 points | 评论 174 comments | 作者:dabinat | 1 day ago #

https://news.ycombinator.com/item?id=47988504

  • dav2d 是针对 AV2 视频编码标准的快速解码器,AV2 是 AV1 的下一代视频编码规范,旨在提供更高的压缩效率和更低的码率。
  • 目前还没有 AV2 的编码器,因为该格式尚未最终定稿,解码器基于当前草案版本开发。
  • 软件开发中存在 alpha、beta 等预发布版本,解码器可能基于非最终版本实现。
  • 有人质疑 AV2 的推出速度过快,甚至在 AV1 还未普及时就开始开发 AV2。
  • AV2 可能在提升有损压缩质量和速度方面有所改进。
  • Sisvel 作为专利持有方,可能对 AV2 产生专利诉讼威胁,但目前尚无公开针对 AOM 成员的诉讼案例。
  • 专利诉讼可能成为阻碍新编码标准推广的因素,且专利战通常涉及复杂且难以判断的技术细节。
  • 许多评论认为专利诉讼更多是威胁和敲诈,真正的法律判决很少发生。
  • 有观点认为当前的软件专利制度存在严重问题,诉讼成本高且难以有效解决专利滥用。
  • 也有观点认为应废除软件专利,或限制大型公司的规模以减少专利滥用和垄断。
  • 小公司和开源项目在面对专利威胁时处于弱势,可能被迫支付授权费用。
  • Sisvel 被视为专利流氓,利用专利威胁小公司,背后的大公司法律团队不会犯错。
  • 专利诉讼和威胁反映了专利制度的弊端,需要改革以防止滥用和保护创新者。

3. 梅赛德斯-奔驰承诺重新引入实体按键 (Mercedes-Benz commits to bringing back physical buttons) #

https://www.drive.com.au/news/mercedes-benz-commits-to-bringing-back-phycial-buttons/

梅赛德斯-奔驰宣布将重新引入实体按键,回应客户对触控按钮和菜单操作的不满。尽管品牌仍将配备大尺寸屏幕,但未来车型将结合实体按键和触控屏,满足用户对关键功能的直接操作需求。即将推出的 GLC 和 C 级车型将配备 39.1 英寸的 MBUX“超级屏幕”,但在双无线充电器前方以及方向盘上将设有实体按键和开关。

销售主管 Mathias Geisen 表示,客户两年前就反馈触控设计不够实用,品牌因此调整设计,增加更多模拟按键。虽然他认可屏幕的连接功能,但强调未来产品会为特定功能保留硬按键,方便用户快速操作。

此外,奔驰还将提供可自定义的屏幕壁纸,借鉴手机的数字体验,以增强用户的连接感。新一代 GLC SUV 将于 2026 年第四季度发布,搭载全新 MB.EA 电动车平台,C 级电动车型预计明年初上市。整体来看,奔驰在保持数字化创新的同时,更加注重用户体验和操作便利性。


HN 热度 591 points | 评论 334 comments | 作者:teleforce | 10 hours ago #

https://news.ycombinator.com/item?id=47997418

  • 奔驰恢复实体按钮可能是因为中国法规要求,而非真正理解用户需求。
  • 德国汽车厂商的 IT 和 UX/UI 设计普遍较差,设计多由委员会决定,缺乏创新和用户体验。
  • 德国在 IT 领域缺乏全球顶尖的消费级产品,更多专注于高科技机械而非纯软件。
  • 西门子等德国公司在工业自动化和高科技机械领域表现较好,售后服务尤为出色。
  • 德国 IT 相关公司如西门子、英飞凌、德电等主要面向工程师市场,用户体验不被重视。
  • 汽车作为消费品需要优秀的用户体验,德国车企在这方面逐渐落后,部分原因是外包和成本中心思维。
  • 宝马仍保留了一些经典且实用的用户界面设计元素,体现对传统 UI 的记忆和传承。
  • 保时捷部分车型在用户界面设计上表现优秀,结合了实体按钮和触摸屏,但近年趋势向触控按钮倾斜,体验有所下降。
  • 特斯拉因安静、自动驾驶和便利性受到部分用户青睐,但在用户界面和驾驶体验上仍有争议。
  • 许多人更喜欢实体旋钮和物理按钮,认为这比纯触控界面更实用和安全。
  • 营销和品牌影响力在汽车市场中起到重要作用,SUV 受欢迎部分源于社会认同感而非驾驶体验。

4. DO_NOT_TRACK:统一用户隐私保护的环境变量标准 (Do_not_track) #

https://donottrack.sh/

该网页介绍了一个名为 DO_NOT_TRACK 的标准,旨在尊重用户隐私,统一用户选择关闭软件中的各种数据收集行为。当前许多命令行工具、SDK 和框架默认会收集遥测数据,但每个工具的关闭方法各不相同,用户操作繁琐。

为解决这一问题,提出了一个统一的环境变量 DO_NOT_TRACK,用户只需设置 export DO_NOT_TRACK=1,即可明确表达不希望被追踪的意愿,涵盖广告追踪、使用报告(匿名或非匿名)、遥测数据、崩溃报告以及所有非必要的网络请求。

网页还列出了常见工具的各自关闭遥测的方式,并详细说明了如何在不同的 shell 环境(如 Bash、Zsh、Fish、PowerShell、Windows CMD)中设置该变量,使其在所有终端会话中生效。

对于软件开发者,建议检测该环境变量,如果设为 1,应关闭所有追踪功能,并将其作为现有关闭机制的补充,甚至考虑将遥测功能改为默认关闭,用户主动开启。

此外,网页还提到了类似的标准,如 NO_COLOR(禁用颜色输出)和 FORCE_COLOR(强制启用颜色输出),为开发者提供更多统一的用户偏好设置参考。


HN 热度 500 points | 评论 156 comments | 作者:RubyGuy | 1 day ago #

https://news.ycombinator.com/item?id=47988592

  • 远程遥测对开发者了解用户行为和改进软件非常有帮助,但用户普遍对遥测持怀疑态度,担心隐私泄露和数据被滥用。
  • 选择默认开启遥测(opt-out)可能引发用户反感,选择主动同意(opt-in)则可能导致数据样本过小且不具代表性。
  • 很难区分“好”的遥测和“坏”的遥测,缺乏有效机制保证数据安全和用户隐私。
  • 许多开发者虽然关心用户隐私,但仍将数据收集外包给第三方,增加了隐私风险。
  • 遥测只能告诉开发者用户做了什么,无法了解用户的真实想法和需求,直接与用户沟通更有效。
  • 有时“良性遥测”会导致某些高级功能被移除,影响依赖这些功能的用户体验。
  • 目前互联网广告模式依赖用户数据收集,但广告本身并不必然需要个人信息。
  • “Do Not Track”标志虽然存在,但其实际效果有限,且默认同意追踪让人感到不适。
  • 语言上“默认开启遥测”和“选择退出”存在语义差异,反映了用户对隐私控制权的关注。

5. NetHack 5.0.0 正式发布公告 (NetHack 5.0.0) #

https://nethack.org/v500/release.html

该网页是 NetHack 开发团队发布的 NetHack 5.0.0 版本的公告,发布日期为 2026 年 5 月 2 日。NetHack 5.0.0 是对经典地牢探索游戏 NetHack 的重大升级,继承自 NetHack 3.6 版本。作为 5.0 的首个正式版本,可能存在一些漏洞,开发团队欢迎用户提交建议、GitHub 拉取请求和错误报告。

本版本除了游戏改进和漏洞修复外,还在架构上做了重要优化,包括:

  • 源代码符合 C99 标准。
  • 支持跨平台编译,允许在一种平台编译后在另一种不同平台运行。
  • 用 Lua 脚本替代了之前基于 yacc 和 lex 的关卡编译器、地牢编译器及任务文本处理,改为游戏运行时加载处理。

游戏修复和改动超过 3100 项,详细列表存放在源码的 doc/fixes5-0-0.txt 文件中,部分内容可能包含游戏新特性剧透。旧存档和遗骸文件不兼容本版本。

用户可通过 Windows 的 certUtil 命令验证下载文件的 SHA256 校验码,或使用 nethack –showpaths 命令查看游戏使用的文件路径。开发团队鼓励玩家反馈问题,建议先查看已知问题列表,避免重复提交。

网页还提供了关于游戏、已知漏洞列表、许可协议、开发者资源等相关链接和信息。NetHack 版权归 Stichting Mathematisch Centrum 和 M. Stephenson 所有,网站版权归 Kenneth Lorber 所有。


HN 热度 496 points | 评论 167 comments | 作者:rsaarelm | 1 day ago #

https://news.ycombinator.com/item?id=47988776

  • NetHack 5.0.0 不兼容旧存档,旧存档无法迁移使用,主要因为版本间改动巨大,支持迁移工作量太大。
  • 版本号跳跃背后有复杂历史,原开发团队沉寂后社区分叉,后来与新开发者达成合作,5.0 是融合新旧开发者成果的版本。
  • 许多玩家保存了多年前的存档,但面对新版本只能重新开始,游戏体验和策略需更加谨慎和防守。
  • 类似 Dungeon Crawl Stone Soup 等游戏也经历了巨大变化,游戏内容不断扩展,导致游戏体验与旧版本差异明显。
  • 对于 NetHack 这类老游戏,剧透仍会影响新玩家体验,尽管游戏已有多年历史,但部分玩家仍希望避免剧透。
  • 有观点认为剧透只影响过于认真对待游戏或媒体的人,了解剧情后不感兴趣也是一种合理选择。
  • 有些游戏和电影的体验依赖于未知剧情,剧透会破坏体验,但对于 NetHack 这类游戏,剧透更多是游戏内的“文档”性质。
  • NetHack 设计中包含多种机制,允许玩家通过探索和发现游戏内信息来理解游戏规则,类似早期文字冒险游戏的风格。

6. Ladybird 本月动态 — 2026 年 4 月 (This Month in Ladybird – April 2026) #

https://ladybird.org/newsletter/2026-04-30/

2026 年 4 月,Ladybird 项目合并了 333 个代码提交,贡献者共 35 人,其中 7 人首次参与贡献。项目欢迎了两位新赞助商:Human Rights Foundation(通过“AI for Individual Rights”项目,赞助 5 万美元)和 Jakub Stęplowski(赞助 1000 美元),并感谢他们的支持。

功能更新方面,Ladybird 新增了内嵌 PDF 查看器,基于 pdf.js 实现,支持页面导航、文本选择、缩放和文档搜索。浏览历史和地址栏自动补全功能得到增强,支持带有网站图标和标题的历史记录建议,并且隐私设置中新增了清除浏览历史的选项。

HTML 解析器实现了增量和推测式解析,提升了页面加载效率。JavaScript 编译也改为多线程后台处理,显著减少主线程负担。每个可导航页面实现了独立的光栅化线程,提升渲染性能并为未来多进程架构做准备。

JavaScript 引擎方面,完成了 C++ 向 Rust 的迁移,带来了多项性能优化,包括更快的 JS 调用、O(1)寄存器分配、缓存的 for-in 迭代、零拷贝标识符共享、字符串拼接加速、箭头函数优化、稀疏数组优化、懒惰子字符串类型等,显著提升了网页加载和执行速度。

GTK4/libadwaita 前端首次亮相,提供了符合 GNOME 设计规范的 Linux 版界面,支持自动补全、安全图标、查找、全屏、多窗口和主题切换等功能,虽仍在完善中,但已具备基本浏览器功能。

书签功能得到完善,新增了书签管理页面,支持导入导出、编辑、时间戳记录和拖放排序,提升用户体验。

Cache 和 CacheStorage 接口全面实现,支持所有标准方法,基于内存存储,方便开发者使用。

CSS 方面,新增对 image-set()函数的基本支持,自动选择最适合设备像素比的图片资源,改善了部分网站的显示效果。


HN 热度 481 points | 评论 140 comments | 作者:richardboegli | 1 day ago #

https://news.ycombinator.com/item?id=47990318

  • Ladybird 浏览器目前仍存在远程代码执行漏洞,且用户基数较小,攻击者兴趣有限,但安全性远不及主流浏览器。
  • Ladybird 浏览器的开发进展显著,越来越“可用”,但距离日常使用的可靠性和安全性还有差距。
  • 构建浏览器类似于构建模拟器,因为不同网站像不同的 ROM,使用各种不同的特性。
  • 新浏览器面临的最大挑战是网页兼容性和被主流网站强制屏蔽的问题,尤其是 DRM 支持难以获得。
  • 许多网站和服务只支持 Chromium 内核,导致新浏览器难以兼容和使用。
  • Vivaldi 浏览器因用户代理字符串问题被多家大网站限制,最终不得不伪装成 Chrome 浏览器。
  • 大型互联网公司阻止新浏览器进入市场的行为应被视为垄断或合谋。
  • 即使是主流浏览器,也难以覆盖所有网站和应用的兼容性测试和修复工作。
  • Mozilla 有专职人员处理兼容性问题,并向网站管理员反馈。
  • Firefox 用户在某些网站遇到功能失效或访问受阻的情况,如宽带供应商网站和 Ryanair 网站。
  • 某些网站对 Firefox 支持不足,导致用户体验不佳甚至无法完成操作。
  • YouTube 在 Firefox 上的体验被认为不如 Chrome,但并未强制用户使用 Chrome。
  • 浏览器兼容性问题往往源于网站开发者不愿意投入资源支持非主流浏览器。

7. 六年磨砺,打造完美的 watchOS 地图 (Six years perfecting maps on watchOS) #

https://www.david-smith.org/blog/2026/04/29/maps-on-watchos/

这篇文章讲述了作者 David Smith 在过去六年中,致力于在 Apple Watch 上打造最佳地图体验的设计历程。作者热爱户外探险,认为在野外安全导航的关键是定期查看自己的位置,而将地图放在手腕上的 Apple Watch 上是最便捷的方式。

文章回顾了作者早期的尝试,最初通过服务器生成地图,但因性能和离线使用限制,无法满足需求。随后,他开发了一个完全基于 SwiftUI 的自定义地图渲染引擎,实现了高效的地图显示和定位叠加。

在界面设计方面,作者经历了多次尝试,最终采用了“模态”设计,让用户通过按钮切换地图和运动数据页面,避免了复杂的滑动操作。随着 Apple Watch 屏幕变大,他不断调整设计,解决了显示固定字段和用户配置复杂度的问题。

文章还介绍了与地图制图师合作,打造适合 watchOS Liquid Glass 设计风格的定制地图底图,增强了地图的视觉对比度和色彩饱和度,并推出了深色模式,提升了手表上的地图可读性。

在设计突破瓶颈时,作者邀请设计师 Rafa Conde 协助,最终确定了将指标叠加在左上角,地图作为垂直堆叠的顶层页面的方案,用户需先点击地图进入浏览模式。经过多次实地测试和细节调整,最终形成了既美观又实用的设计。

最后,作者解释了为何没有采用 Apple 官方的 MapKit,主要因为 MapKit 在定制性、动画效果、覆盖细节等方面存在限制,且默认仅支持深色模式,无法满足用户个性化需求。作者的自定义地图在细节丰富度和交互体验上远超 MapKit,尤其适合复杂的户外导航场景。


HN 热度 425 points | 评论 114 comments | 作者:valzevul | 1 day ago #

https://news.ycombinator.com/item?id=47990606

  • 开发者对细节的关注和持续投入令人钦佩,应用功能远超步数计数。
  • Pedometer++ 不仅仅是步数统计工具,还包含丰富的离线地图功能,地图细节优于苹果地图。
  • 该应用的步数统计可能比 iPhone 自带的更精准,但主要卖点仍是步数统计。
  • 有观点认为应用名称和市场定位需要更新,以更好体现其多样功能。
  • 地图部分是通过聘请制图师设计定制地图样式,使用矢量瓦片技术实现高质量渲染。
  • 矢量地图渲染比传统动态渲染更美观,标签设计经过精细调整以避免重叠和错位。
  • 苹果手表可能限制第三方开发者访问 Metal 图形 API,影响地图渲染技术选择。
  • 有用户分享地图截图中出现的苏格兰著名徒步地点及相关历史背景。
  • 应用版本号“8”代表新功能发布,名称保持为 Pedometer++。
  • App Store 页面订阅和价格信息显示混乱,用户难以分辨具体收费方式。
  • 苹果 App Store 的价格显示机制导致多种价格同时展示,且无法标明当前实际价格。
  • 订阅价格一旦确定,通常会保持不变,设计此机制可能是为了保护用户避免价格突变。

8. 数百万行 Haskell 代码:Mercury 的生产工程实践 (A couple million lines of Haskell: Production engineering at Mercury) #

https://blog.haskell.org/a-couple-million-lines-of-haskell/

这篇博客文章题为《数百万行 Haskell 代码:Mercury 的生产工程实践》,作者 Ian Duncan 分享了他在金融科技公司 Mercury 使用 Haskell 进行大规模生产开发的经验。

作者回忆了自己 16 岁时第一次接触 Haskell,被其强类型系统防止空指针异常的特性深深吸引。经过近二十年的 Haskell 编程经历,他强调了 Haskell 在大型代码库和快速成长的公司中保持系统可维护性和安全性的独特优势。Mercury 是一家服务超过 30 万企业的金融科技公司,2025 年处理了 2480 亿美元的交易额,拥有约 1500 名员工,其中大部分工程师入职前未接触过 Haskell。

文章指出,尽管代码库规模达到约 200 万行 Haskell 代码,且团队成员经验参差不齐,但系统依然稳定运行,成功应对了高速增长、金融危机和监管检查等挑战。作者强调,Haskell 的价值不仅在于语言的优雅和类型系统的错误防护,更在于其帮助团队将业务知识封装进 API,设置安全边界,使得安全路径更易遵循,从而保证系统在人员变动频繁的环境中依然可理解和可维护。

作者提出了一种不同于传统“防止失败”的可靠性思维:系统可靠性源于其适应变化的能力,能优雅降级,便于运维调整,并通过架构设计让正确操作简单、错误操作困难。在快速增长的团队中,经验积累迅速成为“组织古老的暗物质”,只有通过类型系统等工具将知识编码,才能防止关键知识随人员流动流失。

此外,稳定性工程团队与产品团队紧密合作,提前评估新功能的生产表现,讨论失败的影响范围、操作幂等性、回滚方案等,确保设计阶段就考虑可靠性,避免事后修补带来的高昂代价。团队的目标不是“质量警察”,而是帮助开发者避免因系统故障而被凌晨叫醒。

总体来看,文章深入探讨了 Haskell 在大规模金融系统中的实际应用,强调了语言特性与工程实践相结合的重要性,以及通过组织和流程保障系统长期稳定运行的经验教训。


HN 热度 401 points | 评论 198 comments | 作者:unignorant | 1 day ago #

https://news.ycombinator.com/item?id=47991802

  • Haskell 通过类型系统防止错误被遗忘,这种类型编码的安全性在 Rust 和 TypeScript 中也能实现,但 Haskell 更强大。
  • 任何语言都可以通过抽象数据类型或类来区分不同状态的数据,但动态语言需要运行时检查,存在性能开销且安全性较弱。
  • 静态类型语言如 Rust 和 C++ 可以在编译时消除包装类型的开销,实现零成本抽象。
  • JVM 语言(如 Java、Kotlin、Scala)通过逃逸分析和字节码层面的优化实现类似 newtype 的效果,但受限于语言模型和可变性。
  • 动态语言的 JIT 优化可能在某些情况下消除包装,但难以实现跨模块的类型安全保证。
  • Haskell 的高级类型系统(如 rank-2 类型和参数多态)提供 Rust 和 C 等语言无法实现的编译时安全保证。
  • 动态语言无法提供编译时安全保证,容易出现运行时错误,且代码维护和重构成本高。
  • Haskell 编译器能消除类型包装的性能开销,并支持自动派生代码,使代码简洁且安全。
  • 任何语言理论上都能实现类似功能,但实际成本和效果差异巨大,Haskell 等函数式语言更适合构建安全且易维护的领域特定语言。
  • 在团队协作中,类型系统强的语言能减少因开发者疏忽导致的错误,降低代码审查和维护成本。

9. Kimi K2.6 刚刚在编程挑战赛中击败了 Claude、GPT-5.5 和 Gemini (Kimi K2.6 just beat Claude, GPT-5.5, and Gemini in a coding challenge) #

https://thinkpol.ca/2026/04/30/an-open-weights-chinese-model-just-beat-claude-gpt-5-5-and-gemini-in-a-programming-challenge/

本文报道了一个名为 AI Coding Contest 的编程挑战赛的第 12 天比赛结果,该比赛通过实时编程任务对多个大型语言模型进行对决和评分。当天的挑战是“Word Gem Puzzle”,一种滑动字母拼图游戏,参赛模型需在限定时间内通过滑动字母块形成有效英文单词以得分。

比赛中,来自中国初创公司 Moonshot AI 的开源模型 Kimi K2.6 以 22 分(7 胜 1 平 0 负)夺冠,表现出极强的滑动策略和积极得分能力。小米的 MiMo V2-Pro 紧随其后,得分 20 分,采用了完全不滑动、直接扫描初始棋盘长词的策略。OpenAI 的 GPT-5.5 排名第三,表现较为保守,滑动次数有限但有效。Anthropic 的 Claude Opus 4.7 排名第五,未进行滑动操作,导致在大棋盘上表现不佳。

比赛规则中,得分机制鼓励长词得分,惩罚短词,防止模型通过大量短词刷分。表现最差的是 Muse Spark,因无差别地申报所有单词(包括短词),累计得分极低,显示出对规则理解不足。

比赛还揭示了不同策略的优劣:Kimi 通过大量滑动寻找得分机会,在大棋盘上优势明显;MiMo 依赖棋盘初始布局中的种子词,表现依赖于棋盘的具体情况。整体来看,比赛不仅考察模型的语言理解和编码能力,还测试了实时决策和游戏连接的能力。

此次挑战显示,尽管西方实验室的模型表现稳定,但中国的两款模型凭借不同策略占据了前两名,体现了多样化的技术路线和竞争力。同时,比赛也提示了模型在结构化任务中对规则理解和执行的差异,强调了任务设计与模型行为匹配的重要性。


HN 热度 350 points | 评论 212 comments | 作者:bazlightyear | 20 hours ago #

https://news.ycombinator.com/item?id=47993235

  • 目前没有客观统一的标准来比较不同的 AI 模型,每个模型适合不同的使用场景和需求,没有绝对的“最好”模型。
  • Kimi K2.6 和 Deepseek v4 Pro 等开源模型已经能与 Opus 相媲美,且成本远低于美国的商业模型,适合个人和小项目使用。
  • 开源模型的普及对美国经济可能不利,但对整体经济来说,提供了更低成本的 AI 服务,打破了垄断定价。
  • 美国 AI 的发展对其 GDP 增长有重要支撑作用,投资循环也影响了全球创新速度。
  • 开源模型的存在部分是为了削弱美国模型的垄断地位,增加软实力和影响力。
  • 中国的 DeepSeek 等模型制造商在技术创新方面表现活跃,推动了 AI 领域的进步。
  • 有观点认为中国实验室的技术创新确实存在,且有相关论文支持,曾引发行业关注和紧张。
  • 也有人质疑中国模型的创新主要是性能优化,且这些技术一旦公开,其他人也能使用。
  • 有观点认为大型美国实验室的创新停滞,更多是规模和算力的堆积,而非技术突破。
  • 对美国实验室内部创新情况不了解,不能简单否认其创新存在。
  • 有人认为 DeepSeek 的出现对美国 AI 生态产生了压力,促使美国大厂调整态度和策略。
  • 质疑中国实验室贡献的观点认为西方大学和公司仍然是 AI 研究的主力,尤其是谷歌和微软。
  • DeepSeek 的论文主要集中在效率提升方面,这也是其推理成本低的原因。
  • 有用户体验认为开源模型表现不错,但整体水平仍不及 GPT-5.5。

10. 加利福尼亚州将开始对违反交通法规的无人驾驶汽车开具罚单 (California to begin ticketing driverless cars that violate traffic laws) #

https://www.bbc.com/news/articles/clypjx3rg2go

加利福尼亚州将开始对违反交通法规的无人驾驶汽车进行罚款。随着无人驾驶车辆在加州部分城市的普及,警方此前难以对违规的自动驾驶汽车进行处罚。加州机动车辆管理局(DMV)宣布了一套新的自动驾驶车辆监管规定,允许警方直接向车辆制造商发出“自动驾驶车辆违规通知”。这些新规将于 7 月 1 日生效,是 2024 年更严格监管法律的一部分。

根据新规定,警方可以对自动驾驶车辆的交通违规行为开具罚单,车辆制造商必须在 30 秒内响应警方和紧急部门的呼叫,并且如果车辆进入紧急区域,将面临处罚。DMV 主任 Steve Gordon 表示,这些规定体现了加州对公共安全的承诺。

Waymo 是旧金山湾区和洛杉矶县主要的无人驾驶出租车运营商,特斯拉等公司也获得了在部分城市测试自动驾驶车辆的许可。此前,警方曾遇到无法对无人车违规开罚单的尴尬情况,例如去年 9 月旧金山南部 San Bruno 市一辆 Waymo 车辆违法掉头时,警方只能联系公司处理“故障”,无法直接处罚。

去年 12 月旧金山大停电期间,Waymo 车辆在繁忙路口停滞,导致交通拥堵加剧,消防部门也多次抱怨无人车妨碍紧急救援。此次新规的出台旨在解决无人驾驶汽车监管难题,保障公共安全。


HN 热度 316 points | 评论 346 comments | 作者:geox | 1 day ago #

https://news.ycombinator.com/item?id=47988742

  • 自动驾驶车辆(AV)应承担责任,不能因为没有人类司机就逃避法律责任,罚款或刑事责任需明确。
  • 人类司机在交通事故中并不总是受到严厉处罚,现实中处罚标准较低。
  • 行人和骑车人在交通事故中常被部分或全部归咎,但这并不总是合理。
  • 行人有时会违反交通规则,但司机也应根据路况合理驾驶,避免超速或不注意行人。
  • 司机未能及时发现行人是行人死亡的主要原因,而非行人突然闯入。
  • 在德国等地,司机必须在行人接近斑马线时停车,行人享有优先权。
  • 行人与司机之间的眼神交流有助于安全过马路,但并非所有地方都普遍实行。
  • 行人安全优先的政策可能导致部分行人不注意交通状况,反而增加危险。
  • 行人和司机都应遵守交通规则,双方都有责任确保安全。
  • 不同地区的交通习惯和法规不同,行人与司机的互动方式也有差异。

Hacker News 精彩评论及翻译 #

VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47991027

It’s a complete takeover of technically incompetent management that feels like it can finally execute their ideas to the fullest instead of relying on those pesky swengs with their obstructions, complaints and problems. We’ll soon get the management utopia everywhere.

storus

这是一场对技术无能管理层的彻底接管,他们感觉终于可以充分执行自己的想法,而不再依赖那些讨厌的软件工程师——他们的阻挠、抱怨和问题。我们很快将在各处看到管理层的理想国。


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47990808

This feels like the modern version of ‘Sent from my iPhone’ but much more invasive. Git commits are legal and technical records. Falsifying who authored a piece of code just to pump up AI usage stats is a huge breach of trust and it is disappointing to see Microsoft prioritize branding over the integrity of the developer’s log. I expect my IDE to record what happened, not what the marketing department wants people to think happened…..

yankohr

这感觉就像“发自我的 iPhone”的现代版本,但却更加侵入隐私。Git 提交记录是法律和技术文档。伪造代码作者只是为了提高 AI 使用统计数据,这是极大的信任背叛,看到微软把品牌形象放在开发者记录的完整性之上,令人失望。我期望我的 IDE 记录实际发生的事情,而不是市场部门希望人们认为发生了什么……


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47991835

I am the person who approved this PR and would like to acknowledge and apologize for the mistake of turning this feature on by default without sufficient upfront validation.

There was no ill intent by evil corporation, but rather a desire to support functionality that some customers expect of VS Code w.r.t. AI-generated code. As folks mentioned here - many similar tools do this as well.

Obviously, it should not be on when disableAIFeatures is on and it should not be reporting changes that were not done by AI. I’ll work on fixing those and meanwhile revert default to off in 1.119 update.

I am open to any (constructive) comments/suggestions - please feel free to reach me directly (my alias @microsoft.com) or open an issue on GitHub. Happy to answer anything here as well.

dmitriv

我是批准这个合并请求的人,想对此次在没有充分预先验证的情况下默认开启该功能的错误表示认可并道歉。

这并非出于恶意企业的恶意行为,而是出于支持一些用户期望VS Code具备的关于AI生成代码功能的考虑。正如这里有人提到的,许多类似工具也有类似做法。

显然,当disableAIFeatures开启时,这个功能不应该启用,也不应该报告非AI完成的更改。我会着手修复这些问题,同时在1.119版本更新中将默认设置改回关闭。

我欢迎任何(建设性的)评论或建议——请随时通过我的微软邮箱别名直接联系我,或者在GitHub上提交问题。我也很乐意在这里回答任何问题。


Why TUIs Are Back #

https://news.ycombinator.com/item?id=48000364

I think part of it is also that we’re able to still LARP as full developers of complex systems while vibe coding by seeing an interface that makes us look like l33t h4xx0rs even though we’re just pressing continue 15 times

schmorptron

我觉得部分原因是我们还能假装自己是复杂系统的全职开发者,同时通过一个界面让我们看起来像极客高手,尽管我们其实只是连续按了15次继续。


Windows quality update: Progress we’ve made since … #

https://news.ycombinator.com/item?id=47994580

What people realy want: as little OS as possible to let them run just the things on their computer they want to run.

What Microsoft wants: Windows as their straightjacket into the Microsoft services as that is where the revenue is.

Why Windows got this bad: incentives and coercion placed on the teams to show uptake on the services no matter what leading to perversion in tactics and complete alienation of the user base.

The incentives are alomost perpendicularly misaligned.

Regaining trust is extremely hard after you’ve crossed an edge. People are looking for the exit, finding there is indeed a door, and stopping them will take far more than just some reassurance from the DJ boot.

PeterStuer

人们真正想要的是:尽可能少的操作系统,让他们只运行自己想在电脑上运行的东西。

微软想要的是:将Windows作为束缚,将用户锁定在微软服务中,因为那里才是收入的来源。

为什么Windows变成这样糟糕:团队被激励和强制无论如何都要展示服务的采用率,导致策略走偏,并完全疏远了用户群体。

激励机制几乎是完全错位的。

一旦越过某条界限,重建信任极其困难。人们正寻找出口,发现确实有门存在,阻止他们需要远不止DJ启动时的一些安慰话语。


OpenAI’s o1 correctly diagnosed 67% of ER patients… #

https://news.ycombinator.com/item?id=48000472

I’d be very very hesitant to trust studies like this. It’s very easy to mess up these benchmarks.

See for example this recent paper where AI managed to beat radiologists on interpreting x-rays… when the AI didn’t even have access to the x-rays: https://arxiv.org/pdf/2603.21687 (on a pre existing “large scale visual question answering benchmark for generalist chest x-ray understanding” that wasn’t intentionally messed up).

And in interpreting x-ray’s human radiologists actually do just look at the x-rays. In the context the article is discussing the human doctors don’t just look at the notes to diagnose the ER patient. You’re asking them to perform a task that isn’t necessary, that they aren’t experienced in, or trained in, and then saying “the AI outperforms them”. Even if the notes aren’t accidentally giving away the answer through some weird side channel, that’s not that surprising.

Which isn’t to say that I think the study is either definitely wrong, or intentionally deceptive. Just that I wouldn’t draw strong conclusions from a single study here.

gpm

我会非常非常犹豫去信任像这样的研究。这类基准测试很容易出错。

比如说,最近有一篇论文中,人工智能在解读X光片时击败了放射科医生……但实际上人工智能根本没有接触到X光片:https://arxiv.org/pdf/2603.21687 (这项基准测试是基于一个现有的“通用胸部X光大型视觉问答基准”,并非故意弄乱的)。

在解读X光片时,人的放射科医生确实是直接看X光片的。而文章中讨论的场景里,人类医生并不只是看病历记录来诊断急诊病人。你让他们执行一个不必要的任务,一个他们既没有经验也没有接受过培训的任务,然后说“AI表现更好”。即便病历记录没有通过某种奇怪的旁路无意间泄露答案,这也不那么令人惊讶。

这并不是说我认为这项研究肯定是错的,或者故意误导人。只是我不会从单一研究中得出强有力的结论。


Mercedes-Benz commits to bringing back physical bu… #

https://news.ycombinator.com/item?id=47997799

I’m quite suspicious that they do that not because they understood or learned something, but because China requires physical buttons starting next year. And they simply don’t want to lose one of their biggest markets.

nokeya

我非常怀疑他们这样做并不是因为理解或学到了什么,而是因为中国从明年开始要求必须有实体按键。他们只是单纯不想失去这个最大的市场之一。


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47991082

Absolutely, messing with commits is more invasive than messages. It gets worse:

“Sent from my iPhone” appears in the authoring view, and you can delete it.

Co-authored-by: NEVER appears in the commit message UI - it is added without the user even seeing it.

tln

绝对的,篡改提交信息比更改消息内容干预更大。而且情况更糟:

“Sent from my iPhone”会出现在作者视图中,你可以删除它。

Co-authored-by: 永远不会出现在提交信息的界面中——它是在用户甚至看不到的情况下被添加上的。


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47992637

Changing the default behavior for all of your users with no notification is pretty unforgivable. Even if this feature worked correctly, it obviously doesn’t, this should at minimum be a prompt after upgrade to let the user confirm that this is what they want. But honestly should be opt in for those that want it.

To have it silently just start adding marketing copy to git commit messages is pretty bad. To have that added text not be visible to the user in the UI so they can remove it before commit is just much worse.

This kind of thing being released speaks to a greater disfunction over there. Not a good look at all and I am not a Microsoft or AI hater. But my commit messages are not where you move fast and break things

alemanek

在没有任何通知的情况下更改所有用户的默认行为,这几乎是不可原谅的。即使这个功能能正常工作,显然并没有,它至少应该在升级后弹出提示,让用户确认是否需要这个功能。但说实话,这个功能应该是用户自愿选择开启的。

让它悄无声息地开始在 git 提交信息中添加营销内容已经相当糟糕了。更糟糕的是,这些添加的内容在用户界面中不可见,用户无法在提交前删除它。

这种事情的发生反映出那边存在更严重的功能失调。这绝对不是一个好现象,我也不是微软或人工智能的反对者。但我的提交信息不是用来“快速行动,快速破坏”的地方。


Mercedes-Benz commits to bringing back physical bu… #

https://news.ycombinator.com/item?id=47998242

‘He also explained that “I’m a big believer in screens, because I really believe if you want to connect, you have to make the magic work behind the screen.” '

I am a big believer in keeping “product people” away from UI design for dangerous machinery.

The eyes and the attention of the driver should be on the road. All the audio visual noise from the car is just plain dangerous. I don’t want my car to draw my attention to itself for anything less than a critical engine/tyre pressure failures. I do not want beeps on anything else distracting me while I am driving.

My Volvo will, for instance, flash the same type of visual alert when fuel level is low (permanent “do you want to navigate to a fuel station” modal window obscuring navigation, speedometer and so on) – as when it encounters a serious engine malfunction. It will steal a bit of my attention when it pops up. One of those days, someone will have an accident because of this moronic design, its statistically certain.

Same with wipers fluid level low. I need to click on the button to hide the message.

It will on occasion beep very loud when it thinks I am not braking hard enough. The map in the google android car navi rotates when i am just trying to pan. When I want to select an alternative route I need to very precisely touch a very small area on the screen, and more often than not instead of selecting the alternative route it will actually rotate the map.

It is clear to me that either the people designing car UIs are staying away from those cars, or are just incompetent. (Or, I guess, both).

aenis

他还解释说:“我非常相信屏幕,因为我真的相信如果你想要连接,你必须让屏幕背后的魔力发挥作用。”

我非常反对让“产品人员”参与危险机器的用户界面设计。

驾驶员的眼睛和注意力应该集中在路面上。车内所有的视听噪音都是非常危险的。我不希望我的车因为非关键的发动机或胎压故障以外的任何事情吸引我的注意力。我不希望开车时有任何其他的提示音干扰我。

举个例子,我的沃尔沃在油量低时会闪烁类似的视觉警告(会弹出一个永久性的“是否导航到加油站”的窗口,挡住导航、速度表等界面)——这和遇到严重发动机故障时的提示是一样的。当它弹出时会占用我的一些注意力。某一天,因为这种愚蠢的设计,肯定会有人出事故,这是统计学上的必然。

雨刮喷水液不足也是同样情况,我需要点击按钮才能隐藏提示。

有时当它认为我刹车力度不够时,会发出非常大的哔哔声。谷歌安卓车载导航中,地图在我只是想平移时会自动旋转。当我想选择备用路线时,需要非常精确地点击屏幕上的一个很小区域,但更多情况下,不是选中备用路线,而是被地图旋转了。

我很清楚,要么是设计车载UI的人根本不在那些车里使用它们,要么就是他们根本不称职。(或者,我猜,两者都是。)


Windows quality update: Progress we’ve made since … #

https://news.ycombinator.com/item?id=47995618

I recently got locked out of my machine because logging in with the mandatory Microsoft account-backed primary user of my machine didn’t work anymore. It said I was offline and I had to use the “previous password” even though I didn’t have a previous password for that account.

Hacking around in the recovery console to add another administrator user worked, but then I couldn’t reset the original user’s password because it was tied to the Microsoft account and you can’t change the password locally.

I don’t need Copilot managing my inbox through AI, nor do I need a more exciting widget experience.

I just want an OS where if something like the above happens there’s a way to fix it without having to reinstall. It doesn’t seem like much to ask.

Edit: yes, I can use Linux but I have decades of Windows muscle memory and I do a bunch of DirectX programming. I shouldn’t have to switch :)

sagacity

我最近被锁在了我的机器外面,因为用我机器上强制绑定的微软账户进行登录不再有效了。它显示我处于离线状态,而且说我必须使用“之前的密码”,但我根本没有那个账户的之前密码。

在恢复控制台里搞了一番,添加了另一个管理员用户,虽然成功了,但我不能重置原来那个用户的密码,因为它绑定了微软账户,密码不能在本地更改。

我不需要 Copilot 用 AI 管理我的收件箱,也不需要更炫的部件体验。

我只想要一个操作系统,当上面那种情况发生时,有办法修复它,而不必重装系统。这难道不算合理的要求吗?

补充:是的,我可以用 Linux,但我有几十年的 Windows 操作习惯,而且我做很多 DirectX 编程。我不想换系统 :)


Dav2d #

https://news.ycombinator.com/item?id=47989035

Not on topic, but wow the internet has very quickly devolved into: click -> “making sure you’re not a bot”, click -> “making sure you’re a human”, click -> “COOKIES COOKIES COOKIES”, click -> “cloudflare something something”

tensor

题外话,但哇,互联网很快就退化成了这样:点击——“确认你不是机器人”,点击——“确认你是人类”,点击——“COOKIE,COOKIE,COOKIE”,点击——“Cloudflare什么什么”的流程。


Utah to hold websites liable for users who mask th… #

https://news.ycombinator.com/item?id=47997517

I am completely baffled by this wave of new laws and proposals… they feel dystopic and can seemingly only lead to brutal restrictions on the internet. What will we end up with? Only attested modems / endpoints in the home? With DPI? And a government issued smartcard to use it? It comes across as if this is what some legislators are actually after… they must have some technical advisors who can explain to them that the solutions they propose will not work and I am a bit worried they will morph the public discussion into enforcing at a lower level otherwise “the bad guys still circumvent”??

mvdwoord

我对这波新的法律和提案感到完全困惑……它们看起来像反乌托邦,只会导致互联网被严格限制。最终我们会变成什么样?家里只能用经过认证的调制解调器/终端?带有深度包检测(DPI)?还得有政府发放的智能卡才能使用?感觉这好像确实是一些立法者想要的……他们肯定有技术顾问告诉他们所提的解决方案行不通,但我有点担心他们会把公众讨论引导成在更底层强制执行,否则“坏人仍然可以绕过”?


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47991069

Principal engineer balks at bad UX when the PM should know better (it’s their job)

2023: Ah well I guess we can’t do it

2025: you’re fired. Hey kid we hired two weeks ago, implement bad idea please

mohamedkoubaa

首席工程师对糟糕的用户体验表示反感,而产品经理本应更清楚(这是他们的职责)。

2023年:唉,好吧,我想我们做不到了。

2025年:你被解雇了。嘿,那个我们两周前刚雇的孩子,请去实现这个糟糕的主意。


California to begin ticketing driverless cars that… #

https://news.ycombinator.com/item?id=47988988

I am, in general, hoping AV will reduce road deaths in the future.

The last hurdle is regulatory. We can’t let AV manufacturers use “there’s no driver” as a way to escape responsibility, externalizing the harms AC cause onto society.

The question is how to achieve fairness. If a human driver commits vehicular manslaughter, they get the book. What about AV? $10 million? Executives go to jail? What if $10 million fine per X AV miles driven is an OK cost of doing business?

callc

总体来说,我希望自动驾驶技术将来能减少道路交通死亡事故。

最后的障碍是监管问题。我们不能让自动驾驶制造商以“没有司机”为由逃避责任,把自动驾驶造成的危害转嫁给社会。

问题是如何实现公平。如果是人为驾驶者肇事导致过失杀人,他们会被严惩。那么自动驾驶呢?罚款一千万美元?高管入狱?如果每行驶一定里程就罚款一千万美元,成为一种正常的经营成本,又该如何?


Dav2d #

https://news.ycombinator.com/item?id=47988928

Project description:

dav2d is the fastest AV2 decoder on all platforms :) Targeted to be small, portable and very fast. If you’re out of the loop like me:

AV2 is the next-generation video coding specification from the Alliance for Open Media (AOMedia). Building on the foundation of AV1, AV2 is engineered to provide superior compression efficiency, enabling high-quality video delivery at significantly lower bitrates. It is optimized for the evolving demands of streaming, broadcasting, and real-time video conferencing.

jzebedee

项目描述:

dav2d 是所有平台上最快的 AV2 解码器 :) 目标是小巧、便携且非常快速。 如果你和我一样不了解:

AV2 是开放媒体联盟(AOMedia)推出的下一代视频编码规格。它基于 AV1 的基础,旨在提供更优越的压缩效率,使高质量视频可以在显著更低的比特率下传输。AV2 针对流媒体、广播和实时视频会议等不断发展的需求进行了优化。 ——摘自 https://av2.aomedia.org/


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47992281

I think the constructive criticism is best directed at whatever process you are following. That process allowed a very visible user facing change in a widely used piece of software. How did this change make it to production without some process catching the impact of this change? Was there really no internal discussion from a code review at least? This seems hard for me to believe. I expect more from Microsoft.

somebehemoth

我认为建设性的批评应该针对你们所遵循的流程。正是这个流程导致了在一个广泛使用的软件中出现了一个非常显眼的面向用户的变更。这样的变更如何能在没有任何流程发现其影响的情况下就进入了生产环境?难道内部在代码审查环节真的没有任何讨论吗?我很难相信这一点。我对微软有更高的期望。


Kimi K2.6 just beat Claude, GPT-5.5, and Gemini in… #

https://news.ycombinator.com/item?id=47993691

These posts are going to be a constant for the next year, because there’s no objective way to compare models (past low-level numbers like token generation speed, average reasoning token amount, # of parameters, active experts, etc). They’re all quite different in a lot of ways, they’re used for many different things by different people, and they’re not deterministic. So you’re constantly gonna see benchmarks and tests and proclamations of “THIS model beat THAT model!”, with people racing around trying to find the best one.

But there is no best one. There’s just the best one for you, based on whatever your criteria is. It’s likely we’ll end up in a “Windows vs MacOS vs Linux” style world, where people stick to their camps that do a particular thing a particular way.

0xbadcafebee

这些帖子在未来一年内会持续不断,因为没有客观的方法来比较模型(过去那种低级别的数据,如生成速度、平均推理令牌数量、参数数量、活跃专家数等)。它们在很多方面都非常不同,被不同的人用来做各种不同的事情,且结果也不是确定性的。因此你会不断看到各种基准测试和宣称“这个模型打败了那个模型”的说法,人们竞相寻找最好的模型。

但其实没有绝对最好的模型。只有最适合你的模型,这取决于你的具体标准。很可能我们最终会进入一个“Windows vs MacOS vs Linux”的世界,人们各自坚持用特定方式做特定事情。


Dav2d #

https://news.ycombinator.com/item?id=47989315

We had to set it up on the parts of VideoLAN infra so the service would remain usable.

Otherwise it was under a constant DDoS by the AI bots.

thresh

我们不得不在VideoLAN的基础设施部分进行设置,以确保服务能够继续使用。

否则它将持续受到AI机器人发起的DDoS攻击。


VS Code inserting ‘Co-Authored-by Copilot’ into co… #

https://news.ycombinator.com/item?id=47991220

To everyone who bought the “developer-friendly” Microsoft of VSCode fame from a few years ago: this is what they forever did, and forever will do.

This company has been pulling these tricks since the early 90s.

If you fell for this once again, there’s nobody else to blame but yourself.

artyom

对于那些几年前买了“对开发者友好”的以VSCode闻名的微软的人来说:这就是他们永远会做的事。

这家公司从90年代初就一直在玩这些把戏。

如果你再次上当,那只能怪你自己。


Six years perfecting maps on watchOS #

https://news.ycombinator.com/item?id=47990968

The fact that there is no 1st party Apple made hiking and topography map on the Apple Watch is such a failure, not even on the most expensive “made for explorers” Watch Ultra. And things like gpx import is just a mere dream

It’s a lifestyle device after all but still

thrownawaysz

苹果手表上没有第一方制作的徒步和地形地图真是一个失败,甚至在最贵的“为探险者打造”的Apple Watch Ultra上也没有。而且像GPX导入这样的功能简直就是奢望。

毕竟它是一个生活方式设备,不过还是很遗憾。