2025-09-27 Hacker News Top Stories #
- Google DeepMind 推出的 Gemini 2.5 Flash 与 Flash‑Lite 在指令遵循和多模态翻译上提升显著,但仍存在响应截断和强制 JSON 输出的工具调用限制。
- 文章阐述了 AT 协议通过将“开放”延伸至数据本身,实现用户对身份与内容的自主控制,预示去中心化社交的潜在方向。
- Pop!_OS 24.04 LTS Beta 引入全新 COSMIC 桌面和 Linux 6.16.3 内核,虽提升多屏体验,但在全屏应用时间显示等细节上仍有待完善。
- 伊凡斯顿市强制 Flock Safety 拆除重新安装的车牌识别摄像头,指控其违规向联邦机构提供数据并可能面临法律纠纷。
- 研究表明,合法国际象棋局面中单方最多合法走法约为 218 步,虽未完全证明,但已是极限的有力候选。
- Ollama 推出网页搜索功能,提供多供应商的标题、链接与摘要 API,帮助模型获取实时信息并降低幻觉。
- 英国计划在员工入职前强制使用手机存储的数字身份证,旨在防止非法劳工,但因隐私与中心化风险受到广泛质疑。
- AMD 通过兼容性强、功耗低的 Athlon 64 推出首个 x86 64 位扩展,成功击败 Intel 的 Itanium 并引领行业转向 64 位 x86。
- 该项目使用 Rust 重写 Firefox 的 QUIC UDP I/O,利用批量系统调用将吞吐提升至约 4 Gbit/s,显著降低 CPU 消耗。
Improved Gemini 2.5 Flash and Flash-Lite #
谷歌 DeepMind 今日发布更新版的 Gemini 2.5 Flash 与 Gemini 2.5 Flash-Lite 预览模型,现已在 Google AI Studio 和 Vertex AI 上线。此次更新旨在提升模型质量的同时进一步优化效率。
Gemini 2.5 Flash-Lite 在三个关键方面实现显著改进:
- 更强的指令遵循能力:更精准理解复杂指令与系统提示。
- 更简洁的输出:减少冗余内容,降低 token 消耗与延迟,适用于高吞吐量场景。
- 增强的多模态与翻译能力:提升音频转录准确率、图像理解能力及翻译质量。
开发者可立即通过模型名称 gemini-2.5-flash-lite-preview-09-2025
进行测试。
Gemini 2.5 Flash 在以下两方面取得突破:
- 更优的代理工具使用能力:在复杂、多步骤的代理任务中表现更佳,SWE-Bench Verified 基准测试得分从 48.9% 提升至 54%,提升 5%。
- 更高的效率:开启思考模式后,输出质量更高且 token 使用更少,显著降低延迟与成本。
早期测试反馈积极。Manus 公司联合创始人兼首席科学家 Yichao “Peak” Ji 表示:“新版本在速度与智能之间实现了卓越平衡,长周期代理任务性能提升 15%,成本效率的提升让我们能够实现前所未有的规模化。”
为便于使用,谷歌引入 -latest
别名机制:
gemini-flash-latest
和gemini-flash-lite-latest
将始终指向最新预览版本。- 每次更新前将提前两周通过邮件通知,确保用户有足够时间测试。
- 该别名不保证稳定,建议生产环境仍使用稳定版本
gemini-2.5-flash
和gemini-2.5-flash-lite
。
谷歌将持续通过预览版本快速迭代,推动 Gemini 模型边界前进,未来将带来更多更新。
HN 热度 526 points | 评论 268 comments | 作者:meetpateltech | 1 day ago #
https://news.ycombinator.com/item?id=45375845
- Gemini 模型在功能上表现优秀,但存在频繁的响应截断问题,导致输出不完整,影响使用可靠性。
- 该截断问题已被长期报告,属于 P2 级别缺陷,尽管模型能力强大,但可靠性不足使其在实际应用中显得“不完整”。
- 相比之下,用户更看重稳定输出,即使质量稍低,也优于偶尔出现半截回复的模型。
- Gemini 在使用工具调用时无法同时启用强制 JSON 输出格式,限制了其在结构化数据处理中的应用。
- 该限制导致用户需通过两次请求实现工具调用与 JSON 格式化,增加了复杂性与延迟。
- 其他模型如 OpenAI、Ollama 和 DeepSeek 已支持工具调用与 JSON 输出同时使用,Gemini 的限制显得尤为不便。
- 有建议通过构建代理(agent)或“最终结果”工具来绕过此限制,但本质上仍需多步操作。
- Google 的搜索工具调用要求返回特定格式,进一步增加了输出的不灵活性。
- 用户反馈 ChatGPT 也存在类似可靠性问题,尤其在语音模式下容易中断并重启。
- 语音模式的中断可能与语音活动检测(VAD)或使用了性能较低的模型有关。
- 模型响应质量波动可能与动态负载均衡、计算资源分配不均有关,存在时间差异性。
- Google 在技术实力上强大,但在 UI/UX 设计上存在明显短板,如 AI Studio 的滚动体验极差。
- Gemini 网页端存在语法高亮失效等基础功能问题,影响使用体验。
- 移动端应用在输入时会自动滚动到底部,干扰用户在对话中引用中间内容。
- OpenAI 的“项目”功能在 Firefox 浏览器中会导致标签页卡顿,影响组织聊天的体验。
- 在分支对话中,若某次生成失败,后续尝试将永久失败,无法恢复,影响交互流畅性。
Open Social #
https://overreacted.io/open-social/
本文探讨了“开放社交”(Open Social)这一新兴理念,类比三十年前“开源”运动的崛起,认为当前社交应用领域正处在类似的转折点。作者指出,尽管如今主流社交平台仍由封闭系统主导,但以 Bluesky 的 AT 协议(atproto)为代表的开放社交架构,可能是未来发展的关键方向。
文章首先回顾了互联网早期的去中心化模式:每个人拥有自己的网站(如 alice.com),自主控制内容与数据,即使更换托管服务,也不会丢失链接和流量,因为网页链接指向的是逻辑地址而非物理服务器。这种设计让服务提供商必须良性竞争,用户始终掌握主动权。
然而,随着社交平台兴起,内容发布从个人网站转向平台账号(如 @alice),数据被集中存储在平台的私有数据库中。虽然这种模式支持复杂的社交功能(如 feeds、通知、搜索、算法推荐),但也带来了严重的问题:用户的数据被平台牢牢控制,难以迁移,一旦平台改变政策或“作恶”,用户几乎没有选择权。
AT 协议的核心思想是:将“开放”从代码扩展到数据本身。它允许用户拥有自己的数据身份(如 @alice),并自由选择在哪个服务器上托管内容,同时保持跨平台的连通性。用户的数据(如帖子、关注、点赞)以标准化方式存储,可在不同客户端和服务器间流动,就像当年的网页链接一样,不绑定特定服务。
作者强调,AT 协议目前仍在发展中,但其愿景极具吸引力:用户真正“拥有”自己的社交数据,平台之间可互操作,开发者可以构建多样化的客户端,而无需依赖单一巨头。这与今天封闭生态形成鲜明对比。
最后,作者认为开放社交不会一夜成功,但正如开源最终成为行业默认标准一样,开放社交也可能在数十年后成为社会基础设施的必然选择。推动这一变革,需要一群坚持理想的社区成员持续努力。
HN 热度 398 points | 评论 209 comments | 作者:knowtheory | 8 hours ago #
https://news.ycombinator.com/item?id=45388021
- AT Protocol 的数据存储由用户自主选择,强调在读取端进行过滤而非写入端,更符合去中心化理念。
- 评论者最初误以为 AT Protocol 是 ActivityPub 的企业版,但通过文章理解后认为其设计更优,尤其在多程序共享同一身份方面。
- AT Protocol 中评论等操作记录存储在评论者自己的 PDS 中,而非原发帖人仓库,确保了数据所有权的清晰。
- AT Protocol 的默认部署方式自动处理 SSL 和 HTTPS/WSS 服务,但用户可自行配置,灵活性较高。
- AT Protocol 的 DID 通过 DNS TXT 记录绑定到可读域名,应用层自动解析为友好显示形式,提升用户体验。
- 与 ActivityPub 相比,AT Protocol 缺乏本地化数据处理机制,依赖中心化的 AppServer 决定内容流,导致隐私和性能问题。
- AT Protocol 的全局视图架构使得“私密点赞”等特性难以实现,所有操作需由中间服务手动追踪,增加复杂性。
- ActivityPub 本就支持多程序访问同一身份,早期实现因简化而放弃此功能,AT Protocol 反而保留了这一优势。
- 有观点指出,AT 与 ActivityPub 的优劣之争充满复杂性,需结合具体使用场景权衡。
- Bevy 社区讨论中对“如何定义成功”的反思,引发对开源项目目标的深层讨论,强调不应盲目追求 GitHub 指标。
- 开源项目成功的关键在于社区建设,而非单纯追求流行度或平台热度,需重视长期可持续发展。
Pop OS 24.04 LTS Beta #
https://system76.com/pop/pop-beta/
Pop!_OS 24.04 LTS Beta 已发布,搭载由 System76 自主开发的全新 COSMIC 桌面环境,带来多项新功能与改进。该版本为长期支持(LTS)版本的测试版,存在部分已知问题,建议用户在升级前备份数据。
主要更新包括:
- 新的 COSMIC 桌面环境(COSMIC DE)已基本功能完备,当前重点转向 Bug 修复以准备正式发布。
- 替换原有 GNOME 应用:GNOME Files 改为 COSMIC Files,GNOME Terminal 改为 COSMIC Terminal,GNOME Text Editor 改为 COSMIC Text Editor,GNOME Media Player 改为 COSMIC Media Player,Pop!_Shop 也已替换为 COSMIC Store。
- 内核版本为 Linux 6.16.3,Mesa 升至 25.1.5-1,NVIDIA 驱动为 580,Wayland 库更新至 1.23.1-3。
升级提示:
- 从 Pop!_OS 22.04 LTS 升级至本 Beta 版,需在终端执行
pop-upgrade release upgrade -f
命令。 - 升级后,原 Dock 中的“收藏”应用将丢失,需通过右键“固定到应用托盘”重新添加。
- 升级过程中 PPA 源将被禁用,建议升级后手动重新启用。
安装注意事项:
- 安装前需在 BIOS 中禁用安全启动(Secure Boot)。
- 提供两个镜像版本:标准版(2.75 GB)适用于 Intel/AMD 显卡或 10 系列及更早 NVIDIA 显卡;NVIDIA 版(3.21 GB)专为 16 系列及以上 NVIDIA 显卡设计。
已知问题与限制:
- 虚拟机中安装程序可能无法启动,可按 Super 键调出启动器搜索“Installer”。
- Wayland 应用无法拖拽文件至 X11 应用(如 COSMIC Files 到 Slack),建议使用上传功能作为替代。
- Firefox 在非 Pop!_OS 系统上需手动关闭
widget.gtk.libadwaita-colors.enabled
以匹配 COSMIC 主题。 - Chrome 浏览器版本低于 140 或其他基于 Chromium 的浏览器需设置
ozone-platform-hint
为 “auto”。 - 部分游戏可能启动时显示异常,可按 F11 或 Super+F11 进入全屏。
- 显示切换快捷键与屏幕显示提示尚未支持。
- 窗口边框“强调提示”样式与外观设置中的圆角风格不一致,预计在 Release Candidate 中修复。
- COSMIC 内置截图工具,推荐使用 Flameshot(Flathub 安装,版本 13.1+)进行标注。
- COSMIC Store 暂不显示 Flatpak 应用的推荐插件,计划在 RC 版本中修复。
- 屏幕阅读器对 COSMIC 应用的 UI 元素识别和导航尚不完善,正在优化中。
- 部分应用指示器不显示在通知托盘,且通过指示器切换应用功能暂不可用。
- COSMIC Text Editor 的打印功能将在 Release Candidate 中加入。
更多功能和 Bug 修复计划详见项目看板的 RC 列。该版本为 Beta 测试版,建议仅用于测试环境,不推荐生产使用。
HN 热度 380 points | 评论 199 comments | 作者:agluszak | 15 hours ago #
https://news.ycombinator.com/item?id=45384481
- Cosmic 桌面环境因其独立于各显示器的工作区和多屏顶部栏功能,受到用户期待,尤其适合多屏工作场景。
- GNOME Shell 虽然可通过扩展实现部分功能,但需要安装多个扩展,且更新后容易失效,维护成本高。
- 全屏应用(如游戏或视频)时无法查看时间,影响用户体验,尤其在单屏或双屏环境下。
- 有用户指出,即使在单屏情况下,全屏应用中查看时间或切换任务也存在困难,影响专注力。
- 部分用户建议使用物理时钟或设置定时器来减少对手机的依赖,以避免分心。
- KDE 桌面环境在多屏任务栏和全屏应用管理方面表现良好,可作为参考。
- Sway 等 tiled 窗口管理器虽灵活,但缺乏统一的设置应用,管理多个系统功能较繁琐。
- Regolith 桌面环境结合了 Sway 与 GNOME 设置,提供较好的体验,适合喜欢 tiled 但需要图形化设置的用户。
- 非 GTK 应用在 GNOME 中难以使用“始终置顶”功能,因缺少 SSD 支持,影响使用便利性。
- 通过 Alt+Space 快捷键可访问任意窗口的上下文菜单,包括非 GTK 应用,是解决部分问题的可行方法。
- 现代游戏已不再默认使用独占全屏,使得在全屏下调出任务栏变得可行,减少了系统切换的干扰。
- 有用户认为,手机的干扰是设计使然,但可通过主动管理(如设置定时器)来减少分心。
Evanston orders Flock to remove reinstalled cameras #
https://evanstonroundtable.com/2025/09/24/flock-safety-reinstalls-evanston-cameras/
Evanston 市在 2025 年 9 月 24 日向私人监控公司 Flock Safety 发出停止令,要求其立即拆除重新安装的车牌识别摄像头。此前,该市已于 8 月 26 日下令关闭 19 个自动车牌识别设备(含 18 个固定摄像头和 1 个可移动摄像头),并启动 30 天合同终止程序。
这一决定源于 Flock 被曝允许美国海关与边境保护局(CBP)访问伊利诺伊州的摄像头数据,违反了州法律。此前《Evanston RoundTable》报道指出,外地执法机构曾利用 Flock 的数据协助移民执法行动。
尽管 Flock 在 9 月 8 日前已拆除 15 个固定摄像头,但到 9 月 24 日,这些摄像头被重新安装在原位置。市府发言人 Cynthia Vargas 强调,市政府从未批准重新安装,且政策自 8 月 26 日以来未作任何变更。
重新安装的摄像头中,部分使用了新型号——较短的“Standard”型摄像头,配备额外附件,无太阳能板,部分通过电线连接至市政路灯供电,表明可能持续供电运行。另有 5 个摄像头安装在新立的地面支柱上,部分区域可见“FLOCK”标识和编号。
尽管市府称摄像头“不再收集或传输数据”,但 Flock 官网的公开透明门户页面仍显示每日有车辆被检测,暗示摄像头可能仍在运行。该数据自 8 月 26 日以来持续更新,与官方声明存在矛盾。
目前,Flock 正对终止合同提出异议,双方争议可能进入法律程序。市府计划于 9 月 26 日正式终止合同,若合同继续,仍需支付剩余三年费用约 14.55 万美元。
HN 热度 367 points | 评论 212 comments | 作者:ptk | 21 hours ago #
https://news.ycombinator.com/item?id=45382434
- 公司可以无视法律,随意行事,相关责任人应被逮捕,公司应被罚款至破产。
- 企业与联邦政府机构合作进行非法监控,可能利用司法管辖权混乱来规避责任。
- 这种行为类似于苏联时期的体制,权力集中导致法律被随意践踏。
- 资本主义在财富高度集中时会演变为专制,与极权体制有相似之处。
- 苏联体制下,高层命令直接执行,无需讨论,一切以中央意志为准。
- 俄罗斯的“奥普里奇纳”原则允许为统治者服务而无视法律,这种现象在当前美国执法中已初现端倪。
- 对反对者贴上“安提法”标签,即可合法化对其的暴力镇压,形成“反恐战争”逻辑。
- 当前社会正经历一场缓慢但不可逆的系统性崩溃,人们在麻木中旁观。
- 人们意识到系统已崩溃,但因缺乏有效行动方案而陷入抑郁与冷漠。
- “超正常化”现象描述了人们在明知制度失效的情况下仍维持日常生活的状态,伴随恐惧与疏离。
- 与制度僵化的集体相比,人格崇拜式的权力结构反而更容易被反抗。
- 人格崇拜的集体难以被摧毁,因为其核心是信仰而非个人。
- 体制的混乱与矛盾可以随时被利用,但个体无法掌控这种变化,因此更难对抗。
No reachable chess position with more than 218 moves #
本文探讨了一个长期困扰国际象棋理论界的问题:是否存在一个可达成超过 218 步的合法棋局?这一纪录由前国际象棋作曲大师尼纳德·佩特罗维奇(Nenad Petrović)于 1964 年创造,其作品中白方有 218 步可走。
作者 Tobs40 在 2024 年 5 月启动了一项基于计算机与数学建模的系统性研究,试图证明 218 步是理论上限。他指出,直接枚举所有约 4.8×10⁴⁴ 个可能的棋局是完全不可行的,即使是最强大的超级计算机也无法完成。
为此,作者采用数学优化方法,提出一系列精简策略:
- 无用棋子可移除:若黑方棋子不增加白方走法(如不被白兵吃掉、不保护黑王、不解除白方棋子受牵制),则可视为冗余。
- 强子可替换为弱子:在允许的前提下,可用更弱的棋子(如后换象或车)替代黑方强子,不会增加白方走法,反而简化问题。
- 禁止任何一方被将死:若黑王被将,局势非法(白方可直接吃王);若白王被将,其走法受限,最多约 120 步,远低于 218 步,故可排除。
作者尝试使用整数规划(Integer Programming)建模,引入“部分棋子”概念(如一个象可部分位于 e4 和 g2),以实现快速搜索。在理想化模型下,空棋盘的理论最大步数约为 305 步,这证明真实局面不可能超过此值。
尽管如此,完整求解仍需数年时间。作者在实验中发现,即使放宽规则(如忽略被牵制、允许任意吃子、简化王车易位条件),计算仍极为缓慢,预计需 29 天,最终选择中止。
结论:虽然尚未完全证明 218 步为上限,但数学与计算分析强烈支持这一观点。目前没有发现能突破该纪录的合法布局,218 步很可能已是理论极限。
HN 热度 340 points | 评论 172 comments | 作者:emporas | 20 hours ago #
https://news.ycombinator.com/item?id=45382755
- 评论者最初误解标题,以为是“达到任意棋局最多需要 218 步”,实际是指某个棋局中一方最多有 218 种合法走法。
- 有评论指出,标题中的“possible”应改为“legal”以更准确表达“合法着法”的含义。
- 有人提出,棋局的最长路径(从开局到达某位置所需的最少步数)可能上限为 218 步,目前已有 185 步的下限记录。
- 关于棋局最长可能持续的步数,现代规则下有 75 步无吃子或兵动则判和,据此可推算出理论最大步数约为 8848.5 步。
- 有评论质疑标题的歧义性,认为标题容易引发误解,甚至调侃说理解标题可能需要 218 条评论。
- 有人指出,虽然长棋局罕见,但现实中确实存在超过 50 步的对局,因此标题的表述需更严谨。
- 评论者讨论了“可达位置”的概念,认为从初始位置到达任意合法位置的步数存在上界,但该问题比“最大走法数”更复杂。
- 有观点提到,历史上曾有棋局出现 218 种合法走法,这与标题中的数字一致,支持了标题的正确理解。
Ollama Web Search #
https://ollama.com/blog/web-search
Ollama 推出全新网页搜索功能,现已开放 API 接口,支持通过 REST API 与 Python 和 JavaScript 库深度集成,帮助模型获取最新网络信息,减少幻觉,提升准确性。该功能提供免费个人使用额度,更高请求频率可通过 Ollama 云服务获得。
用户可通过 API 查询关键词,返回包含标题、链接和摘要的搜索结果。示例显示,查询“what is ollama?” 会返回多个相关网页,涵盖 Ollama 官网、技术解析文章和使用指南。
Ollama 还支持构建搜索代理(search agent),通过调用 web_search
和 web_fetch
工具实现自动研究任务。例如,使用 Qwen3:4B 模型可自动搜索并分析“Ollama 新引擎”相关信息,系统能识别问题并调用搜索工具,最终返回包含模型调度优化和多模态支持等关键更新的详细内容。
2025 年 Ollama 发布两大核心引擎升级:
- 增强型模型调度系统(9 月 23 日):实现精准内存管理,显著提升 GPU 利用率与运行速度,支持多 GPU 高效协同,适用于 gemma3、llama4、qwen3 等主流模型。
- 多模态引擎(5 月 15 日):原生支持视觉模型,如 llama4:scout、gemma3、qwen2.5vl 等,可完成图像识别、视频理解与文档扫描等任务。
此外,Ollama 提供 web_fetch
功能,可抓取指定网页内容,返回标题、正文和链接,适用于解析用户提供的网址信息。建议在使用搜索代理时,将模型上下文长度扩展至 32000 tokens 以获得最佳效果。
推荐使用具备强大工具调用能力的模型,如 qwen3、gpt-oss,以及云端大模型如 qwen3:480b-cloud、gpt-oss:120b-cloud 等。相关代码示例可在 GitHub 获取。
HN 热度 336 points | 评论 169 comments | 作者:jmorgan | 1 day ago #
https://news.ycombinator.com/item?id=45377641
- Ollama Web Search 的搜索结果由多个提供商提供,包括 Brave、Exa、Parallel Web Systems、DuckDuckGo 等,但具体组合不公开,以避免宣传或贬低特定服务商。
- Ollama 声称用户对搜索结果拥有完全所有权,可自由使用,但需遵守所在司法管辖区的法律法规。
- 用户担忧不同搜索服务提供商的使用条款限制数据存储和再发布,例如 Brave 和 Exa 明确禁止存储或分发搜索结果。
- 有观点指出,Ollama 若声称用户可自由使用结果,可能需承担违反第三方服务条款的法律风险,但用户本身可能不受影响。
- 有人质疑 Ollama 为何不公开技术细节,认为这与开源精神相悖,且对本地部署的 searxng 服务构成竞争。
- Ollama 回应称,其搜索功能提供慷慨的免费额度,且本地运行存在结果质量与网站反爬限制问题,因此选择使用托管 API 提升效率。
- 有用户指出,Ollama 的免费层级目前未在官网明确说明,存在信息不透明问题。
- 有人认为,搜索结果是否受版权保护是学术争议,实际应以 API 的服务条款为准,而非法律理论。
- 有评论讽刺 Google 和 Facebook 在处理版权与数据使用上的双重标准,尤其提到 Facebook 曾屏蔽 Pirate Bay 链接而 Google 拒绝类似请求。
- 有人指出 DuckDuckGo 实质上是基于 Bing 的搜索结果,只是对外包装成独立服务。
- 有观点认为,Ollama 未提供隐私政策,令人对其数据处理方式产生疑虑,可能与投资方存在隐性合作。
Britain to introduce compulsory digital ID for workers #
https://www.reuters.com/world/uk/britain-introduce-mandatory-digital-id-cards-2025-09-26/
Warning: Page exception Timeout 30000ms exceeded. 英国政府宣布将推出强制性数字身份制度,要求所有员工在工作前必须持有数字身份证明。此举由首相基尔·斯塔默在 2025 年全球进步行动峰会上宣布,旨在应对非法移民问题,遏制通过小船从法国偷渡至英国的现象,并回应选民对移民问题的关切。
该数字身份将存储在个人手机中,成为雇主招聘时必须核查的法定文件。未来还将用于申请儿童保育、福利和税务记录等公共服务。政府表示,将借鉴 Estonia、丹麦、澳大利亚和印度等国的数字身份系统设计,确保安全与效率。
尽管超过五成英国人支持身份卡制度,但该计划仍引发广泛争议。反对党改革英国党批评该措施无效,认为非法务工者不会因数字 ID 而改变行为,且现金交易仍可规避监管。爱尔兰民族主义政党也表示反对,认为该政策在北爱尔兰具有政治敏感性,可能加剧社会分裂。
英国历史上曾于二战后废除身份证制度,目前公民通常使用护照或驾照证明身份。此次计划是工党在 2000 年代失败尝试后的重启,面临公众对隐私泄露、数据滥用和安全风险的担忧。
HN 热度 335 points | 评论 616 comments | 作者:alex77456 | 22 hours ago #
https://news.ycombinator.com/item?id=45381810
- 英国政府缺乏信任,其已有的大规模数据留存、强制加密后门、内容监控扩张及与 Palantir 等公司秘密合作的记录,使得强制数字身份计划本质上是权力扩张的工具。
- 现行数字 ID 方案依赖中心化数据库,一旦被攻破或滥用,将带来严重隐私风险,且政府可随时撤销或修改身份权限,缺乏物理 ID 的抗撤销性。
- 与传统实体身份证不同,数字 ID 本质上是数据库中的一个指针,其有效性完全依赖于政府系统的状态,存在被随意操控的风险。
- 尽管数字 ID 可能用于防止伪造身份,但中心化数据库反而更容易成为黑客攻击目标,可能被篡改或用于批量生成虚假身份。
- 真正的安全应基于用户持有的加密凭证(如属性证明),而非依赖政府控制的中心化系统,现有方案未体现这一原则。
- 政府已通过多种手段实现对公民行为的广泛监控,数字 ID 将进一步整合这些数据,形成持续追踪的“数字足迹”。
- 一旦数字 ID 系统扩展至更多社会功能,政府将拥有前所未有的控制能力,个人可能因政治或社会原因被剥夺工作、居住等基本权利而不知原因。
- 电话普及并非数字 ID 的正当理由,澳大利亚等国的数字驾照虽被接受,但其设计与英国方案存在本质差异,不能作为支持依据。
- 现有身份验证机制(如驾照、护照)早已依赖中心数据库,数字 ID 只是将这一模式数字化,并未解决根本问题,反而加剧了集中化风险。
- 与欧盟等地区相比,英国在数字治理上已高度集中,数字 ID 将进一步强化这一趋势,违背去中心化与隐私保护原则。
Athlon 64: How AMD turned the tables on Intel #
https://dfarq.homeip.net/athlon-64-how-amd-turned-the-tables-on-intel/
2003 年 9 月 23 日,AMD 发布 Athlon 64 处理器,标志着 x86 架构正式迈入 64 位时代,彻底改变了 CPU 市场竞争格局。当时,英特尔(Intel)并不愿将 x86 扩展至 64 位,而是选择另起炉灶,推出基于全新架构的 Itanium 处理器。然而,Itanium 因缺乏对 Windows 系统的支持而市场反响平平,被媒体讥讽为“Itanic”。
相比之下,AMD 选择了一条更具风险但更具战略眼光的道路:在保持完全向后兼容的前提下,将 x86 架构扩展为 64 位,即 AMD64 架构。这一设计允许系统在 64 位模式下运行 64 位软件,同时无缝支持 32 位和 16 位应用程序,极大降低了用户升级的门槛。
Athlon 64 不仅在性能上超越同期 Intel 处理器,尤其在 32 位应用表现和功耗控制方面优势明显,还凭借出色的能效比赢得了数据中心的青睐。尽管初期 64 位操作系统和软件生态尚不成熟,但其卓越的 32 位性能和兼容性使其迅速获得市场认可。
尤其值得一提的是,原本只使用 Intel 芯片的戴尔(Dell)公司,最终因 Athlon 64 的出色表现而开始在服务器和桌面系统中采用 AMD 处理器,标志着 AMD 正式进入企业级市场。
这篇文章回顾了 Athlon 64 发布的历史意义:它不仅是技术上的突破,更是一次市场策略的成功。AMD 通过兼容性与性能的平衡,迫使英特尔不得不跟进,最终推动整个行业向 64 位 x86 架构统一。这一事件也奠定了 AMD 在 CPU 领域的重要地位。
HN 热度 321 points | 评论 242 comments | 作者:giuliomagnifico | 1 day ago #
https://news.ycombinator.com/item?id=45376605
- Intel 曾内部开发过 64 位 x86 扩展,但因担心影响 Itanium 的市场推广而被管理层强制禁用。
- AMD64 的成功不仅在于 64 位扩展,还因其改进了 x86 架构的诸多缺陷,如增加寄存器数量。
- Intel 的 64 位方案可能并未真正成熟,其设计可能只是最小限度地实现 64 位功能,未进行深度优化。
- Itanium 架构虽在理论上先进,但实际性能高昂且软件生态薄弱,导致市场接受度低。
- Itanium 的失败并非技术本身问题,而是商业决策和生态建设滞后所致。
- 若无 AMD64 的出现,Itanium 可能最终仍会成为主流,但需要更长时间和更大投入。
- VLIW 架构对编译器要求极高,自动并行化难题难以解决,影响了 Itanium 的普及。
- Pentium 4 的 NetBurst 架构在硬件上具备支持 64 位运算的潜力,但未被启用。
- 64 位 x86 的实现需要大量硅片面积和工程投入,Intel 可能因设计阶段已定而无法轻易调整。
Redis is fast – I’ll cache in Postgres #
https://dizzy.zone/2025/09/24/Redis-is-fast-Ill-cache-in-Postgres/
本文作者对比了使用 Redis 和 Postgres 作为缓存的性能表现,通过构建一个简单的 HTTP 服务进行基准测试,涵盖 GET、SET 和混合读写场景。
实验环境为 Kubernetes 集群,Redis 和 Postgres 均限制为 2 核 CPU 和 8GiB 内存。Redis 使用官方镜像 redis:8.2,Postgres 使用 postgres:17.6,并采用 unlogged 表优化写入性能。
测试数据包括 3000 万条记录,模拟真实缓存场景:GET 操作 80% 命中率,SET 操作 10% 更新现有键,混合负载中 20% 为 SET,80% 为 GET。
结果表明,Redis 在所有测试中均显著优于 Postgres:
- GET 性能:Redis 每秒处理请求远超 Postgres,且 CPU 使用率稳定在 1280m,内存约 3.8GiB;Postgres CPU 持续满载,内存达 5GiB。
- SET 性能:Redis 仍占优势,内存增长至 4.3GiB;Postgres 写入压力大,CPU 满载,内存达 5.5GiB。
- 混合负载:Redis 保持领先,Postgres CPU 持续满载,内存接近 6GiB。
尽管使用了 unlogged 表,Postgres 的写入性能仍远低于 Redis,但该优化对写入有明显提升,对读取影响较小。
结论:Redis 在缓存场景下性能远超 Postgres,具备更低延迟和更高吞吐。虽然 Postgres 可作为缓存替代方案,但其性能和资源消耗不具竞争力。Redis 仍是最适合缓存的工具,尤其在需要 TTL、高并发和低延迟的场景中。
HN 热度 311 points | 评论 273 comments | 作者:redbell | 1 day ago #
https://news.ycombinator.com/item?id=45380699
- 使用默认配置进行基准测试是不合理的,因为这相当于故意限制硬件性能,尤其是 PostgreSQL 的默认共享内存设置极低,导致大量内存被浪费。
- 如果默认配置已经满足性能需求,就没有必要进行额外调优,这既节省时间也避免不必要的成本。
- 即使不进行调优,PostgreSQL 在普通硬件上也能表现良好,因此在某些场景下无需引入 Redis 等额外缓存层。
- 缓存的目的不仅限于提升性能,还可能用于防止缓存击穿、减轻系统压力或应对分布式环境下的 DoS 攻击。
- 在某些情况下,缓存反而可能成为性能瓶颈,因为网络请求和缓存一致性管理会带来额外开销。
- 过度依赖缓存是一种“仪式性编程”行为,缺乏数据支持,可能导致系统复杂性增加而收益微乎其微。
- 亚马逊等公司曾因缓存带来的复杂性和一致性问题而选择移除部分缓存,强调系统行为一致性的重要性。
- 在生产环境中,硬件资源受限、网络延迟、CPU 资源争抢等因素使得“本地测试表现良好”不能代表真实场景。
- 使用 LLM 或网络搜索获取配置建议是合理且高效的,关键在于理解并验证其适用性,而非盲目复制。
- 配置调优不应被视为“硬核”或“必须手动完成”的任务,合理利用现代工具可以显著提升开发效率。
Fast UDP I/O for Firefox in Rust #
https://max-inden.de/post/fast-udp-io-in-firefox/
项目背景与动机
Firefox 约 20% 的 HTTP 流量使用 HTTP/3,其底层依赖 QUIC 协议,而 QUIC 运行在 UDP 之上。目前 Firefox 使用较老旧的 NSPR 库进行 UDP I/O 操作,仅提供如 PR_SendTo
和 PR_RecvFrom
这类基于 POSIX 的基础系统调用。这些接口已无法充分利用现代操作系统在多消息传输(如 sendmmsg
/recvmmsg
)和硬件卸载(如 GSO/GRO)方面的性能优势。
项目目标与技术选型
2024 年中启动项目,目标是用现代系统调用重写 Firefox 的 QUIC UDP I/O 层,提升性能并增强安全性。由于 QUIC 本身已在 Rust 中实现,项目选择 Rust 语言开发,以保障内存安全并实现与现有代码的无缝集成。项目基于 Quinn 项目的 quinn-udp
库,大幅加速开发进程。
核心优化技术
- 单个数据报:传统方式每次发送/接收一个 UDP 数据报,系统调用开销高,尤其在高吞吐场景下。
- 批量数据报:利用
sendmmsg
和recvmmsg
等系统调用,一次处理多个数据报,显著减少上下文切换和系统调用开销。 - 大段数据报分段:通过 GSO(发送端分段)和 GRO(接收端聚合),允许应用发送超 MTU 大小的 UDP 数据报,由内核或网卡自动分片/聚合,减少 CPU 负载。
跨平台实现与挑战
- Windows:支持
WSASendMsg
/WSARecvMsg
,并提供 USO(发送分段)和 URO(接收聚合)功能。初期测试中发现,启用 URO 时部分网站(如 fosstodon.org)无法加载,问题源于 Fastly CDN 使用 GSO 发送大段数据报,而 Windows 的 URO 实现存在兼容性缺陷,需进一步调试。 - macOS / Linux / Android:均支持相关系统调用,但需兼容老旧系统版本(如 Android 5),开发中需处理版本差异与 API 兼容性问题。
性能成果 在纯 CPU 限制的基准测试中,性能从低于 1 Gbit/s 提升至 4 Gbit/s。CPU 火焰图显示,耗时主要集中在 I/O 系统调用和加密操作,表明 I/O 优化已取得显著成效。
总结与展望 项目已逐步向多数 Firefox 用户推送,为高性能 UDP I/O 提供了可复用的实现范例。尽管部分平台存在边缘问题,但整体成果显著。作者鼓励其他项目借鉴其经验,尤其在跨平台、高吞吐 UDP 通信场景中应用现代系统调用与 Rust 安全编程。
HN 热度 302 points | 评论 59 comments | 作者:Bender | 9 hours ago #
https://news.ycombinator.com/item?id=45387462
- 该技术改进使 UDP 网络吞吐量提升 400%,从不足 1Gbit/s 增至 4Gbit/s,显著降低 CPU 占用,提升移动设备和笔记本的能效。
- 当前系统调用开销和网络协议设计限制了 UDP 性能,即使在理想情况下,仍存在大量性能浪费。
- 现有网络栈中内存拷贝和系统调用开销远低于实际瓶颈,真正的性能瓶颈在于协议设计与系统架构的不匹配。
- 加密处理对小数据包性能影响显著,状态初始化开销在小包场景下难以摊薄,导致整体效率下降。
- UDP 缓冲区大小仍沿用上世纪 90 年代标准,远不足以支持高速网络场景,缺乏动态扩展机制。
- 高性能 UDP 应用需要更先进的 API 支持,如零拷贝、提交队列、跨上下文消息传递等,现有 BSD socket 接口已无法满足需求。
- RDMA 等技术已实现 NIC 直接访问用户空间缓冲区,但需提前注册,限制了通用性。
- 现有系统架构中,安全机制与高性能需求冲突,硬件层面难以实现跨上下文 DMA,需重新设计安全模型。
- 真正实现极致性能需重构操作系统、协议栈、加密算法和硬件协同,但当前生态中缺乏统一推动者。
- 苹果是唯一具备全栈控制权的厂商,但仍未有效解决 UDP 性能问题,表明问题复杂性极高。
- 未来进步依赖于持续的工程实践积累和社区协作,需借鉴 MPTCP 等项目推动跨层优化的范例。
Hacker News 精彩评论及翻译 #
ChatGPT Pulse #
https://news.ycombinator.com/item?id=45375992
My pulse today is just a mediocre rehash of prior conversations I’ve had on the platform.
I tried to ask GPT-5 pro the other day to just pick an ambitious project it wanted to work on, and I’d carry out whatever physical world tasks it needed me to, and all it did was just come up with project plans which were rehashes of my prior projects framed as its own.
I’m rapidly losing interest in all of these tools. It feels like blockchain again in a lot of weird ways. Both will stick around, but fall well short of the tulip mania VCs and tech leaders have pushed.
I’ve long contended that tech has lost any soulful vision of the future, it’s just tactical money making all the way down.
SirensOfTitan
我今天的心情,感觉无非是我在平台上过往对话的平庸重复。
前几天我试着让GPT-5 pro直接挑一个它想做的雄心勃勃的项目,我负责执行它在现实世界需要的任何任务。结果它只是拿出了一些项目计划,不过是把我之前的项目换了个包装,当成了它自己的新想法。
我正迅速对所有这些工具失去兴趣。这在很多方面都让人感觉很像当年的区块链热潮。它们大概都会留存下来,但远远达不到风险投资家和科技领袖们所鼓吹的那种“郁金香狂热”的盛况。
我一直认为,科技已经失去了对未来任何深刻的愿景,说到底,都只是为了赚钱而已。
No reachable chess position with more than 218 mov… #
https://news.ycombinator.com/item?id=45383525
They dont really spell it out but they mean “from this position the player has 218 possible legal moves to choose from”
codeulike
他们并没有明确说明,但他们的意思是“从这个位置,玩家有218种合法的走法可供选择”
Evanston orders Flock to remove reinstalled camera… #
https://news.ycombinator.com/item?id=45382972
Even though it’s become commonplace in the last 20 years, I’m still shocked to see how companies can pretty much ignore the law, do whatever they want, and have everyone involved shielded from any kind of significant consequences.
In situations like this, I think the person at the top of the chain that told employees to perform the illegal installations should be arrested and charged. On top of that, the company should be fined into bankruptcy. If the directors knew about it any companies they’re involved with shouldn’t be allowed to conduct future business in the municipality (or state).
donmcronald
尽管在过去20年里这已变得司空见惯,但我仍然感到震惊,看到公司们可以几乎无视法律,为所欲为,并且让所有相关人员都免受任何严重后果的惩罚。
在这种情况下,我认为指示员工进行非法安装的最高层负责人应该被逮捕并起诉。此外,公司应该被处以足以使其破产的罚款。如果董事们知情,那么他们所参与的所有公司都不应被允许在该市(或州)开展未来的业务。
ChatControl: EU wants to scan all private messages… #
https://news.ycombinator.com/item?id=45378256
Dear citizens of the EU:
If this gets pushed through, you will gradually lose control of your government much like how the people of the UK already lost control of theirs.
What are you going to do when the government’s interests inevitably drift out of alignment with yours? Start a political movement? You will have the police knocking on your door for criticizing the establishment.
Start a revolution? You have no weapons. You can’t even organize a resistance because all channels of communication are monitored.
You have neither the pen nor the sword. There is no longer an incentive for the government to serve you, and so it eventually won’t.
No amount of protest will recover the freedom you once had. You’re heading towards a society where everyone feels oppressed but no one can do anything about it.
txrx0000
亲爱的欧盟公民:
如果这项法案获得通过,你们将逐渐失去对自己政府的控制,就像英国人民已经失去对他们政府的控制一样。
当政府的利益与你们不可避免地背道而驰时,你们要怎么办?发起一场政治运动?仅仅因为批评当权者,就会有警察上门找你麻烦。
发动一场革命?你们没有武器。你们甚至无法组织抵抗,因为所有的通信渠道都受到监控。
你们既没有笔,也没有剑。政府再也没有动力去服务你们了,所以它最终也做不到。
无论多少抗议都无法挽回你们曾经拥有的自由。你们正走向一个所有人都感到压迫,却又无能为力的社会。