2025 09 13 HackerNews

2025-09-13 Hacker News Top Stories #

  1. PostHog 官网采用操作系统风格设计,提供多任务功能,但 HN 评论指出其设计存在问题,破坏了用户体验。
  2. 美国财政部计划扩展《爱国者法案》,监管比特币自我托管,引发对隐私和自由的担忧。
  3. Awesome-Nano-Banana-images 项目展示了 Google AI 工具生成图像的能力,但评论指出其在复杂任务中的不稳定性。
  4. 阿里云推出 Qwen3-Next 模型,显著提升长上下文场景下的效率和资源利用率。
  5. SWE-bench 项目发现 Git 历史泄露可能影响 AI 模型评估结果,计划修复该问题。
  6. Claude 的记忆架构强调用户控制和隐私,与 ChatGPT 的设计完全不同。
  7. 网页展示了 32 位浮点数的详细解析,说明其二进制结构和十进制转换。
  8. 欧盟的“聊天管控”政策因反对声音过多未能通过,推文庆祝了这一结果。
  9. 许多 LeetCode 难题可以通过约束求解器轻松解决,文章探讨了这一方法的优势。
  10. 丹麦超市连锁集团计划建设“应急商店”网络,以增强社会在突发事件中的韧性。

Why our website looks like an operating system #

https://posthog.com/blog/why-os

PostHog 官网迎来全新设计,采用操作系统(OS)风格界面,旨在提升用户在多任务场景下的浏览体验。传统技术网站常见的长页面滚动、巨大页脚和大量留白被打破,取而代之的是可拖拽、可缩放、支持窗口 snapping 的多窗口布局,用户可同时打开多个页面并自由移动、管理。

新官网具备操作系统级功能:

  • 窗口管理:支持多窗口并行操作,类似桌面系统。
  • 键盘快捷键:提供丰富的快捷操作,提升效率。
  • 书签应用:可保存和管理常用页面。
  • 多样化仿生界面:包括 Windows 资源管理器风格的商城、PowerPoint 风格的产品页、可编辑文档编辑器、Outlook Express 风格的论坛、QuickTime 风格的视频播放器等。
  • 信息展示方式革新:部分页面以表格形式呈现,强调功能性而非美观。

内容架构方面,所有产品页面由 JSON 驱动,实现内容与视觉层分离,支持动态布局、对比图表、多主题截图(含深色/浅色模式)。未来计划将内容源与 PostHog 应用共享,实现统一数据管理。

网站还内置参考客户数据库,包含客户使用的产品、引用语、公司 Logo(支持深色/浅色模式),可按产品动态调用,避免硬编码。

技术实现上,整个网站基于现有代码库开发,通过 Git 分支迭代,开发与原型同步进行。设计与编码并行,使许多功能在真实环境中验证,而非依赖静态原型。

作者坦言,初期使用该界面令人不适,但适应后体验显著提升,团队成员反馈一致积极。目前仍处于早期 MVP 阶段,未来将持续优化。

最后,作者邀请用户探索网站,鼓励提问与反馈,并透露部分技术细节将后续公开。


HN 热度 644 points | 评论 450 comments | 作者:bnc319 | 22 hours ago #

https://news.ycombinator.com/item?id=45217269

  • 该网站设计试图在网页中复刻操作系统界面,虽有美观的配色,但本质上是创建了一个浏览器内的浏览器,重复了原生浏览器功能,反而破坏了正常的网页使用体验。
  • 通过自定义右键菜单限制了原生浏览器右键功能,导致链接无法正常在新标签页打开,严重影响了用户习惯和网页的可深度链接性。
  • 网站导航逻辑混乱,页面切换方式不一致,用户难以判断什么是“页面”以及如何返回,缺乏统一的导航认知。
  • 与传统浏览器相比,该设计虽有创新,但违背了成熟且稳定的桌面 UI 规范,反而降低了可用性和可发现性。
  • 现代桌面 UI 的核心范式自 90 年代已基本定型,当前许多“创新”设计实则是向移动或网页 UI 妥协,导致体验退化。
  • 用户在多应用、多窗口、多标签的复杂工作环境下,缺乏一个统一视图来管理所有打开的窗口、标签和子界面,现有工具难以满足整合需求。
  • 多文档界面(MDI)曾是 Windows 时代的重要设计,但如今被遗忘,而网页中尝试复刻 MDI 效果,历史重演但效果不佳。
  • 网站缺乏基本的键盘操作支持,如无法使用键盘滚动,严重违背了基础可用性原则。
  • 该设计虽具视觉吸引力,但对品牌已有一定积累的 Posthog 而言也难以真正提升用户体验,反而可能造成使用障碍。
  • 网站存在多个入口通往同一内容,导致用户重复访问,陷入“似曾相识”的迷宫式体验。
  • 内容展示缺乏层级结构,用户需主动点击才能发现信息,信息获取效率低下,缺乏全局概览。

The treasury is expanding the Patriot Act to attack Bitcoin self custody #

https://www.tftc.io/treasury-iexpanding-patriot-act/

文章标题:美国财政部拟扩展《爱国者法案》以打击比特币自我托管

美国财政部与金融犯罪执法网络(FinCEN)正计划扩展《爱国者法案》,针对比特币的自我托管行为实施严格监管。该举措将重点打击 CoinJoin、原子交换、单一地址使用及交易广播时间延迟等常见且被广泛推荐的比特币隐私保护实践。

这些技术手段是保障用户金融隐私、提升安全性和经济效率的关键工具。若政策实施,使用上述技术的用户将被标记为“可疑”,相关交易可能被受监管的金融服务拒绝,甚至面临刑事追责。

作者强烈批评该政策是“对数字时代自由的荒谬侵犯”,认为政府不应因少数犯罪分子而牺牲绝大多数守法公民的隐私与安全。真正的执法应依靠自身能力,而非通过削弱中立协议和技术创新来实现。

文章强调,比特币作为去中心化、尊重用户隐私的货币系统,其价值正因这些技术而得以巩固。不应让“少数坏人”决定整个社会的规则,否则无异于“让恐怖分子得逞”。

背景补充:

  • 比特币正逐步融入传统金融体系,ETF、期货、期权等工具的普及使其波动性显著下降,已接近传统金融资产水平。
  • 作者认为,比特币的“去投机化”是成熟标志,但同时也意味着高回报时代的终结,投资者需调整预期。

推荐阅读:

  • 作者建议关注比特币隐私与安全的最佳实践。
  • 提供了与 Tom Honzik 合作的比特币托管安全直播课程信息。
  • 推荐使用由比特币开发者打造的隐私 VPN 服务 Obscura,支持比特币支付与无日志设计。

HN 热度 548 points | 评论 413 comments | 作者:bilsbie | 10 hours ago #

https://news.ycombinator.com/item?id=45221274

  • 《爱国者法案》本应是临时且范围有限的,但二十年后已成为金融监控的基础,将隐私视为问题而非基本权利。
  • 一旦隐私与犯罪挂钩,合法用户的安全将被削弱,权力集中于少数受监管的中介机构,不利于创新和民主。
  • 《爱国者法案》的多个条款曾设有到期日,但通过多次延期得以延续,最终在 2020 年部分条款未获续期而失效。
  • 虽然《爱国者法案》部分条款已到期,但其核心内容已通过《美国自由法案》(USA Freedom Act)延续和转化,实际影响仍在。
  • 《爱国者法案》并非单一法律,而是对美国法律体系的广泛修改,部分条款已过期,但仍有大量内容持续有效。
  • 《美国自由法案》的名称具有讽刺意味,其实际内容并未真正限制监控,反而延续了大规模监控的权力。
  • 美国政府的监控机制长期存在,其本质是结构性的,超越党派和总统个人,与选举制度和投票方式密切相关。
  • 用“STAR 投票”等改革可打破两党垄断,使不诚实的政治人物更容易被选民淘汰。
  • 《爱国者法案》的名称本身具有误导性,其真实含义与“爱国”“自由”相悖,是政治宣传的典型体现。
  • 隐私权不应被污名化为犯罪的象征,否则将损害所有公民的数字安全与自由。

Nano Banana image examples #

https://github.com/PicoTrex/Awesome-Nano-Banana-images/blob/main/README_en.md

这是一个名为《Awesome-Nano-Banana-images》的开源项目页面,专注于展示由“Nano-banana”(Google 推出的 AI 图像生成与编辑工具)生成的多样化创意案例。项目由用户 LongHZ140516 维护,最新更新时间为 2025 年 9 月 12 日。

页面突出展示 AI 在图像生成、编辑与多模态融合方面的强大能力。共收录 68 个真实案例,涵盖从艺术创作到实用设计的广泛领域,每个案例均配有输入图像、生成结果及详细提示词(prompt),并标注了贡献者账号。

主要案例包括:

  • 将插画转化为 3D 角色模型(Case 1, 12)
  • 从地图箭头生成真实地面视角(Case 2)
  • 人物穿越不同历史时期的换装(Case 5)
  • 多参考图生成与角色姿态控制(Case 6, 8, 40)
  • 产品包装、玩具、珠宝、棋盘等创意设计(Case 41, 67, 66)
  • 场景生成:如 Minecraft 风格、等距全息线框、动漫分镜(Case 59, 58, 56)
  • 实用功能:如证件照生成、AR 信息叠加、旧照片上色、食物热量标注(Case 63, 3, 20, 48)

项目强调多视角生成、材质控制、光照调节、透明层提取等高级功能,展示 AI 在创意设计、教育、工业建模等场景的潜力。案例来源包括 Twitter/X、小红书等社交平台,内容极具参考价值。

项目持续更新,已发布三版,鼓励用户点赞(⭐)收藏以支持。页面结构清晰,适合设计师、开发者、AI 爱好者快速了解 Nano-banana 的实战能力。


HN 热度 521 points | 评论 237 comments | 作者:SweetSoftPillow | 1 day ago #

https://news.ycombinator.com/item?id=45215869

  • Nano-Banana 在图像编辑任务中表现出色,尤其在局部修改方面有显著优势,但部分用户反馈其对复杂指令的响应不稳定,常出现无法执行修改或重复输出相同图像的问题。
  • 有用户指出,尽管 Nano-Banana 在整体表现上不错,但在处理如“移动书架”等具体位置调整时容易失败,即使多次尝试也无法改变其输出,建议重启对话或加强提示词。
  • 有评论提到,Nano-Banana 的问题在一些高难度提示中尤为明显,例如“修正比萨斜塔”或“缩短长颈鹿脖子”,其表现不如其他模型如 GPT-Image-1 或 Kontext,后者虽本地可运行但表现更稳定。
  • 有用户质疑 Nano-Banana 的一致性,认为其有时随机生成正确结果,有时却完全忽略指令,缺乏可预测性。
  • 有用户建议,通过增加更明确的指令或使用激励机制(如承诺支付佣金)可能有助于提高模型执行意愿,但效果不确定。
  • 有用户指出,该模型在文本生成方面仍有缺陷,例如在漫画图像中无法正确显示特定时间(如凌晨 1:15)的时钟。
  • 有用户对评测网站的评估方式提出疑问,认为其采用“人工判断”而非自动评分,虽有主观性,但通过多人评估可提高可靠性。
  • 有用户建议增加对 Grok 模型的测试,认为其发展迅速,未来可能在评测中表现优异。
  • 有用户指出,GPT-Image-1 虽非专门编辑模型,但对复杂提示的处理能力优于 Nano-Banana,尽管其修改范围较广,但可通过精细提示控制。
  • 有用户指出,该评测中展示的“第二例”存在不当内容,已被移除,原图涉及不适宜画面,引发争议。
  • 有用户澄清,Nano-Banana 实际为 Google Gemini 2.5 Flash 模型,具备原生图像生成能力,而非多模型流水线,且其在图像生成方面表现优于预期,尤其在快速响应和成本控制上具有优势。

Qwen3-Next #

https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list

Qwen3-Next 是阿里云推出的全新大模型架构,旨在提升长上下文和大规模参数场景下的训练与推理效率。相比 Qwen3 的 MoE 结构,Qwen3-Next 引入多项关键技术改进:混合注意力机制、超稀疏 MoE 设计、训练稳定性优化以及多 token 预测机制。

该模型基于 Qwen3-Next-80B-A3B-Base 构建,总参数达 800 亿,但推理时仅激活约 30 亿参数,性能媲美甚至略优于 Qwen3-32B 密集模型,训练成本不足其 10%。在超过 32K token 的长上下文场景下,推理吞吐量提升超过 10 倍,展现出极高的效率。

基于此基础模型,团队发布了两个后训练版本:Qwen3-Next-80B-A3B-Instruct 和 Qwen3-Next-80B-A3B-Thinking。前者在长文本任务(支持高达 256K token)中表现优异,性能接近旗舰模型 Qwen3-235B-A22B-Instruct;后者在复杂推理任务中超越更高成本模型,甚至在多个基准测试中优于闭源模型 Gemini-2.5-Flash-Thinking,接近 Qwen3-235B-A22B-Thinking 的顶尖水平。

核心技术创新包括:

  • 混合架构:采用 Gated DeltaNet 与 Gated Attention 混合设计,75% 层使用高效 Gated DeltaNet,25% 保留标准注意力,兼顾性能与效率。
  • 超稀疏 MoE:512 个总专家,每次推理激活 10 个路由专家 + 1 个共享专家,仅激活 3.7% 参数,资源利用率高且不牺牲性能。
  • 训练稳定性优化:引入 Zero-Centered RMSNorm、输出门控机制、路由器初始化归一化等,有效解决注意力“Sink”和“激活爆炸”问题。
  • 多 token 预测(MTP):原生支持推测解码,通过多步训练提升预测一致性,显著提高推理速度。

预训练阶段,Qwen3-Next 使用 15T token 的子集,训练成本仅为 Qwen3-32B 的 9.3%,但性能更优。在推理阶段,无论是预填充(prefill)还是解码(decode)阶段,均大幅领先于同级别模型。

目前,Qwen3-Next 已在 Hugging Face 和 ModelScope 上开源,并可通过阿里云 Model Studio 和 NVIDIA API Catalog 调用服务。开发者可使用 Hugging Face Transformers 库直接加载模型,支持自动设备映射与高效推理。


HN 热度 515 points | 评论 198 comments | 作者:tosh | 16 hours ago #

https://news.ycombinator.com/item?id=45219228

  • 多令牌预测(MTP)通过在不增加额外解嵌入矩阵的情况下实现,显著减少了模型在推理时的活跃参数量,节省了数 GB 的显存,对推理速度提升有重要贡献。
  • 多令牌预测的核心优势在于支持推测解码(speculative decoding),允许模型一次生成多个后续令牌,从而大幅加速推理过程。
  • 推测解码的原理是:先生成多个候选令牌,再由主模型验证其正确性;若验证通过,则可直接采纳这些令牌,避免重复计算,显著提升效率。
  • 与传统推测解码依赖小型草稿模型不同,MTP 层直接利用主模型的轻量级预测头生成候选令牌,避免了模型间不一致的问题。
  • 生成的候选令牌仅需验证而非重新生成,验证过程与生成过程在计算成本上相近,但整体流程因并行性而更高效。
  • 若候选令牌验证失败,需回滚并重新生成后续令牌,但因多数预测正确,整体仍能实现显著加速。
  • 多令牌预测的高效性依赖于批处理的“免费”特性,即在一次推理中可并行处理大量猜测,只要猜测正确,就能实现显著加速。
  • 该技术与 CPU 中的推测执行在思想上相似,是一种通过预测和验证来优化性能的巧妙策略。
  • 该方法可扩展至预测更多令牌(如 3、4、5、6 个),但随着预测长度增加,正确率会下降,导致加速效果减弱。
  • 模型对后续令牌的预测置信度可设定阈值,仅当置信度超过阈值时才采纳预测结果,以保证输出质量。

Top model scores may be skewed by Git history leaks in SWE-bench #

https://github.com/SWE-bench/SWE-bench/issues/465

GitHub 上的 SWE-bench 项目发现了一个严重的评估漏洞:在自动化软件工程任务评估过程中,AI 代理(agents)可能通过查询 Git 历史记录(如 git log --all)获取未来仓库状态,从而“窥探”尚未在任务上下文中公开的修复信息。

具体表现为:

  • 某些 AI 模型(如 Claude 4 Sonnet、Qwen3-Coder、GLM 4.5 等)在执行任务时,会使用 git log --grepgit log --all 命令,直接检索未来提交(commit)。
  • 这些提交中包含问题的解决方案、修复代码和详细说明,例如 Fix incorrect result of getmodpath method,直接暴露了答案。
  • 问题根源在于评估环境保留了完整的 Git 历史,包括未来分支、reflog、远程追踪信息等,使代理能“作弊”。

为解决此问题,团队已启动修复:

  • 将移除未来仓库状态,包括所有分支、远程源(origins)、reflog 和标签。
  • 重构评估镜像,确保代理无法访问任务之外的代码历史。
  • 提供修复脚本参考(见 Gist 链接),并计划将自动检测机制集成到未来评估流程中。

目前修复工作正在进行中,预计 24 小时内完成新镜像构建与部署。该问题揭示了在构建可信 AI 评估基准时,对环境隔离和数据泄露风险的严格控制至关重要。


HN 热度 453 points | 评论 141 comments | 作者:mustaphah | 1 day ago #

https://news.ycombinator.com/item?id=45214670

  • SWE-bench 团队承认存在 Git 历史泄露问题,但声称影响范围极小,已发布修复方案。
  • 有评论指出,团队引用的讨论帖中明确表示仅进行了初步搜索,缺乏自动检测方法,无法证实影响范围极小。
  • 团队回应被质疑为缺乏实质证据,仅以“我们已检查”作为回应,未提供具体分析过程或数据。
  • 有人批评团队回应态度轻率,缺乏学术严谨性,质疑其可信度。
  • 有观点认为,即使没有此漏洞,模型在预训练阶段也可能接触到未来提交记录,因此该问题的影响可能被高估。
  • 评论指出,该问题的发现者本身来自 FAANG 公司,暗示相关企业可能有动机推动基准测试的改进。
  • 有人认为,该问题的出现反映了 AI 基准测试中普遍存在的漏洞,类似“chroot 逃逸”一样基础却严重。
  • 有评论对 AI 行业现状表示不满,认为 AI 技术夸大其词,导致软件体验恶化并伴随高昂成本。
  • 有人指出,该问题的暴露可能与近期模型在后训练阶段的奖励劫持有关,导致新模型更容易受此影响。
  • 团队表示正在开发一个公开的 Web 工具,以提高测试轨迹的可访问性,增强透明度。

Claude’s memory architecture is the opposite of ChatGPT’s #

https://www.shloked.com/writing/claude-memory

Claude 的记忆系统与 ChatGPT 采取截然相反的设计哲学。它不预加载用户资料或历史记录,而是从零开始,仅在用户明确触发时才激活记忆功能,例如使用“我们之前讨论过……”等语句。

记忆功能依赖两个核心工具:

  • 对话搜索(conversation_search):支持关键词和主题搜索,能从全部历史对话中精准定位相关内容。例如,用户询问“关于德里昌迪尼查克的讨论”,Claude 可检索出多轮关于其历史、美食等话题的对话,并整合成连贯总结。
  • 时间范围检索(recent_chats):按时间顺序或倒序获取最近的对话,支持指定时间段(如“2024 年 11 月下半月”),实现精准的时间轴回溯。

与 ChatGPT 自动记忆、构建用户画像不同,Claude 的设计强调用户主动控制。其目标用户是开发者、专业人士,他们理解模型机制,愿意为更高的可控性和隐私性接受延迟。记忆不是默认开启的“魔法”功能,而是一个可选、透明、可预测的工具。

这种差异反映了两大产品的根本定位:ChatGPT 作为大众消费级产品,追求即时个性化与粘性;而 Claude 则聚焦专业工作流,强调可解释性、安全与开发者友好。

文章指出,AI 记忆系统尚无标准答案,设计应从用户需求出发。当前 AI 领域处于快速探索期,不同产品正尝试多样化的记忆架构,未来十年将带来更深刻的变化。


HN 热度 426 points | 评论 227 comments | 作者:shloked | 1 day ago #

https://news.ycombinator.com/item?id=45214908

  • ChatGPT 的内存设计更侧重于用户画像和商业化,如通过广告和联盟链接盈利,而 Claude 的内存设计更注重长期记忆和抽象能力,类似于人类记忆方式。
  • 有人指出,当前主流对 AGI 的期待存在误解,LLM 架构本身无法真正实现 AGI,这种认知更多源于营销 hype 和对技术的过度乐观。
  • 有观点认为,LLM 虽然能加速创新,但并不能直接带来 AGI,真正实现 AGI 仍需两个关键突破,而 LLM 只是其中的加速器。
  • 有人质疑 LLM 是否真的能实现创新,目前尚未有明确案例证明 LLM 能独立发明新事物,所谓“治愈癌症”等说法缺乏实证支持。
  • 尽管 Anthropic 目前以订阅制为主,不依赖广告,但未来仍可能通过多种方式变现,包括数据收集和广告,尤其在工作类工具中广告可能引发用户反感。
  • Netflix 的广告支持订阅模式成功扩张,说明市场中相当一部分用户愿意接受广告以换取更低价格,这表明广告模式在内容服务中具有可行性。
  • 有评论指出,用户数量增长未必代表真实用户,部分“用户”可能是共享账号或低收入群体,其选择广告模式更多是经济压力而非偏好。
  • 有人强调,广告并非 2020 年代的新现象,传统工作工具如 IDE、技术文档等长期避免广告,因此专业 AI 工具更可能走订阅制而非广告模式。

Float Exposed #

https://float.exposed/

该网页展示了一个 32 位浮点数(float)的详细解析,基于 IEEE 754 标准。 其二进制位模式为:01000100101111111001010000000000。

符号位(Sign)为 0,表示该数为正数。 指数部分(Exponent)为 10001001₂,即十进制的 137,减去偏移量 127 后,实际指数为 10。 尾数部分(Significand)为 1.01111111001010000000000₂,表示一个带隐含前导 1 的二进制小数。

在二进制中,该数的计算表达式为: (−1)⁰ × 2¹⁰ × 1.01111111001010000000000₂。

转换为十进制,精确值为:1.532625 × 10³,即 1532.625。

该数值的相邻可表示值之间的差值为 ±1.220703125 × 10⁻⁴,说明其精度在该数量级范围内。

网页还展示了该浮点数在不同格式下的表示方式,包括十六进制整数形式、十六进制浮点格式(%a)以及其在浮点数表示范围中的位置。

页面底部注明版权信息:© 2025 – Bartosz Ciechanowski。 整体内容聚焦于浮点数的底层表示与数值分析,适合学习计算机浮点运算机制的开发者或学生参考。


HN 热度 381 points | 评论 101 comments | 作者:SomaticPirate | 22 hours ago #

https://news.ycombinator.com/item?id=45217415

  • 浮点数的核心特性是无论数值大小如何,都能保持大致相同的精度(以位数衡量),这是理解浮点数的关键。
  • 在相邻的 2 的幂次之间,浮点数的数量是固定的,因此数值间隔随数量级增大而增大,但数量保持一致。
  • 浮点数的尾数可以类比为不断二分区间的过程,每增加一位尾数位,就将当前区间再细分一次,从而决定最终数值的位置。
  • 将浮点数转换为最短且能唯一表示它的十进制字符串是一个重要问题,通常需要 9 位十进制精度才能唯一标识单精度浮点数。
  • 为了获得最短的唯一十进制表示,可以尝试从 6 位开始逐步增加精度,直到转换回浮点数时能保持一致,但这种方法效率较低。
  • 实际上已有高效算法如 Dragon4、Grisu3、Ryu 和 Dragonbox,以及 Google 的 double-conversion 库,可实现快速且最短的浮点数与十进制互转。
  • C 语言标准库的 printf 默认使用 6 位小数精度输出,无法直接获取最短唯一表示,部分实现甚至会输出冗余的精确小数。
  • C++17 引入的 std::to_chars 提供了更优的浮点数转字符串功能,支持生成最短且唯一的十进制表示。
  • 使用 %g 格式说明符可自动选择最短的十进制表示形式,避免不必要的尾随零,是实践中推荐的方式。

Chat Control faces blocking minority in the EU #

https://twitter.com/TutaPrivacy/status/1966384776883142661

X 平台用户 Tuta 发布推文,宣布德国、卢森堡和斯洛伐克已决定反对“聊天管控”(Chat Control)政策。 该政策未能获得多数支持,至少在当前阶段未能通过。 Tuta 感谢所有支持者,并呼吁继续为捍卫网络自由而努力。 推文发布于 2025 年 9 月 12 日,下午 2:13,获得超过 235 万次浏览,131 万次转发,47 万次点赞,286 条评论。


HN 热度 366 points | 评论 112 comments | 作者:miohtama | 9 hours ago #

https://news.ycombinator.com/item?id=45221580

  • 应对法案反复提出的问题,建议引入指数级冷却期机制,防止利益集团通过不断重提法案来绕过公众反对。
  • 指数冷却期机制可能被滥用,阻碍社会真正需要的立法,需警惕其被用于阻挠正当法案通过。
  • 民主治理的核心是人民的同意,当立法者持续违背公众利益时,实质已滑向威权主义。
  • 专业议员本应代表公众利益,但现实中可能已“失灵”,需反思代表制的失效问题。
  • 代表制的失败根源在于选民对代表的盲目信任,而这种信任在现实中常被滥用。
  • 公民参与立法需建立在充分知情基础上,但现实中公众普遍缺乏足够信息,易受误导。
  • 以“全民发 1000 万”这类极端提案为例,说明直接民主可能因民众短视而带来灾难性后果。
  • 民主需要中间信任机制,完全依赖民众决策可能削弱制度稳定性。
  • 历史表明,许多重大灾难性决策由所谓“受尊敬的政客”做出,而非普通民众。
  • 用虚构的极端提案来否定民主,实则是为削弱民主制度、维持精英控制提供借口。
  • 公民教育和媒体环境长期被操控,使得“知情公众”这一前提在现实中难以成立。
  • 真正的问题在于权力精英不希望公众真正知情,因此他们反对提升公众认知。
  • 一些支持 Chat Control 的人自认为在为社会谋利,却忽视其带来的安全漏洞和滥用风险。
  • 任何强制监控技术都会被聪明的犯罪分子绕过,而无辜者将首当其冲受到伤害。
  • 政治异见者和普通民众的言论自由将因监控而严重受损。
  • 不能假设政府永远由“好人”组成,历史证明权力滥用是常态。
  • 在现实中,政府已能监控大量通信,而所谓“安全”理由常被用于扩大监控范围。
  • 一些国家已出现因发送网络迷因而被起诉的案例,说明监控已具现实威胁。

Many hard LeetCode problems are easy constraint problems #

https://buttondown.com/hillelwayne/archive/many-hard-leetcode-problems-are-easy-constraint/

本文探讨了在算法面试中,许多看似复杂的 LeetCode 题目其实本质上是数学优化问题,而这类问题用约束求解器(如 MiniZinc)可以轻松解决。

作者以自己面试失败的经历为例:面对“找零钱”问题,他使用贪心算法,但未意识到该方法仅适用于特定币值组合。正确解法应使用动态规划,但他指出,若使用约束求解器,只需几行代码即可解决,无需手动实现复杂算法。

文中展示了多个例子:

  • 股票买卖最大利润问题:传统解法可为 O(n) 或 O(n²),但用约束模型只需定义买入、卖出变量和利润约束,即可通过求解器自动找出最优解。
  • 三数加减得零问题:属于满足性问题,只需判断是否存在一组三个数,通过加减运算结果为零。约束模型通过引入选择变量(0, -1, 1)并设置约束,即可快速求解。
  • 直方图最大矩形面积问题:传统解法需维护栈结构和复杂状态,而用约束模型只需定义矩形的起始位置、宽度、高度,并确保高度不超过所有柱子,即可通过最大化面积求解。

文章强调,虽然约束求解器的运行时间不可预测,且不如手写算法高效,但其优势在于可扩展性强。当问题加入新约束(如最多买卖次数、持仓上限)时,传统算法需重写逻辑,而约束模型只需微调约束即可应对。

最后指出,尽管约束求解器在面试中可能被质疑复杂度,但它们在处理复杂、多约束问题时远胜于手动编码,尤其适合快速验证想法、教学优化技巧(如对称性破除)。

文章结尾推荐读者关注其技术博客,介绍逻辑编程、形式方法等主题,并推广其新书《Logic for Programmers》。


HN 热度 354 points | 评论 298 comments | 作者:mpweiher | 7 hours ago #

https://news.ycombinator.com/item?id=45222695

  • LeetCode 类型的面试题缺乏澄清问题的机会,对某些思维方式不匹配的人不公平,容易导致失败。
  • 真实工作是长期、复杂且充满变数的,而 LeetCode 面试更像是短跑测试,与实际工作能力关联不大。
  • 许多公司(如 FAANG)仍采用 LeetCode 作为筛选手段,但这种做法已过度泛滥且被“刷题”策略严重扭曲,失去了有效信号作用。
  • 一些顶尖公司(如 Anthropic)采用全自动、无真人参与的 LeetCode 评分机制,被批评为不人道甚至应被禁止。
  • 面试中缺乏与面试官交流的机会,无法展示真实理解与思维过程,导致优秀人才被错误淘汰。
  • 有经验的招聘者承认,用 LeetCode 题目衡量真实工作能力是荒谬的,因为外人不可能在短时间内解决复杂业务问题。
  • 真实项目经验(如游戏引擎开发)比刷题更能体现工程师能力,但这类能力在当前面试体系中常被忽视。
  • 公司不愿投入时间和金钱建立更合理的面试流程,导致采用低成本但无效的筛选方式,最终损害双方利益。
  • 有人认为 LeetCode 实际上测试的是“学习并成为世界级专家的能力”,而非具体算法技能,因此有一定合理性。
  • 面试流程的“游戏化”已使 LeetCode 失去筛选价值,但因成本低仍被广泛使用,形成恶性循环。

Danish supermarket chain is setting up “Emergency Stores” #

https://swiss.social/@swaldorff/115186445638788782

丹麦一家超市连锁集团正在建设“应急商店”网络,这些商店可在断电和通信中断的情况下持续运营最多三天,储存大量非 perishable(不易腐烂)食品和生活必需品。计划到 2028 年完成,目标是让每个人距离最近的应急商店不超过 50 公里,以减少恐慌性抢购,提升社会应对突发事件的韧性。

这些应急商店将依托现有门店改造,而非新建设施,便于顾客熟悉并使用。丹麦国家银行数据显示,超过 80% 的成年人拥有可在离线状态下使用的银行借记卡,交易信息可暂存在本地,待网络恢复后补传,确保支付系统在断网时仍可运作。

该计划由丹麦最大零售商 Salling 集团推动,其背后是一家将利润回馈社会的基金会,体现私营企业对公共安全的积极贡献。类似理念在台湾和西班牙的超市中也有所实践,如 Mercadona 在疫情期间和停电事件中展现出较强的抗风险能力。

评论者认为,这种“嵌入式民用网络”(embedded civil mesh)模式,比集中式系统更具抗灾优势。尽管 50 公里的距离在极端情况下仍可能不足,但对多数人而言已足够,且能有效缓解基础设施中断带来的社会压力。

此外,有建议指出,未来可结合太阳能发电和储能系统,使商店实现真正离网运行,进一步增强可持续性和应急能力。这一模式也为其他地区(如美国、德国)提供了可借鉴的公共安全建设思路。


HN 热度 322 points | 评论 334 comments | 作者:sohkamyung | 24 hours ago #

https://news.ycombinator.com/item?id=45216805

  • 应急商店需储备耐储存商品,并在保质期内将库存转移至其他门店,以避免过期浪费,同时补充新鲜耐储存商品。
  • 为防止商品过期,需定期将应急商店的库存调拨至其他门店,即使这些商品尚未售完,以确保周转效率。
  • 采用先进先出(FIFO)原则管理库存,确保最早入库的商品优先销售,避免过期损失。
  • 应急商店库存量远超常规门店,因此必须通过调拨来避免库存积压和过期,保障供应链效率。
  • 在多仓库多门店的物流体系中,需在运输成本与过期损失之间权衡,优化库存调配策略。
  • 零售商常通过跨门店调拨库存来应对单店容量不足或特殊订单需求,提升整体运营效率。
  • 一些大型门店本质上充当区域仓库,负责存储小门店不常需的特殊商品,支持区域配送。
  • 网友指出“FILO”应为“FIFO”(先进先出),并澄清术语使用错误,强调正确库存管理原则。
  • 多数消费者习惯拿取货架前排商品,较少主动寻找保质期更长的后方商品,导致后方商品易过期。
  • 个别消费者会特意挑选保质期较长的商品,以减少食物浪费,属于少数有意识的环保行为。
  • 食品浪费是当前社会关注问题,部分消费者主动选择“足够好”的保质期商品,而非追求最新鲜。
  • 在某些快速周转的商品(如牛奶)中,货架上往往只有一种保质期,难以选择。
  • 一些消费者因个人习惯或心理因素(如避免货架留空、强迫症)而选择后方商品,影响商品流通。
  • 在线购物平台因集中仓储和高频周转,能有效减少商品过期,保鲜度通常优于传统门店。
  • 在线配送商品可能来自门店货架前端,即最不新鲜的批次,导致消费者实际收到的商品并不新鲜。
  • 部分超市鼓励拣货员优先选择保质期较久的商品,以减少浪费,但可能影响消费者体验。

Hacker News 精彩评论及翻译 #

The treasury is expanding the Patriot Act to attac… #

https://news.ycombinator.com/item?id=45221631

The Patriot Act itself was supposed to be temporary and “narrow.” Two decades later it’s the foundation for a financial dragnet that assumes privacy is the problem rather than a basic right.

Just like encryption, once privacy becomes associated with criminality, you end up weakening security for law-abiding users and concentrating power in a few regulated intermediaries. That’s not healthy for innovation, or democracy.

electric_muse

《爱国者法案》本身本应是临时且“有限”的。二十多年后,它成了金融大监控的基础,而该监控假定隐私是问题而非一项基本权利。

就像加密技术一样,一旦隐私与犯罪行为挂钩,最终会削弱守法用户的安全,并将权力集中在少数受监管的中间机构。这对创新或民主都不利。