2026-02-07 Hacker News Top Stories #

Anthropic 发布 Claude Opus 4.6，带来百万 token 级超大上下文窗口并显著提升代码与长上下文推理能力，API 支持上下文压缩与自适应思考，定价不变且安全评估良好。

OpenAI 推出 GPT-5.3-Codex，作为高效的代理式编程模型兼具强推理与约 25% 的速度提升，擅长实时交互与复杂多步骤任务。

作者认为自苹果与 Taboola 合作后 Apple News 广告质量急剧下降，充斥可疑和可能由 AI 生成的点击诱饵，损害用户信任。

Mitchell Hashimoto 描述将 AI 从辅助工具逐步演进为全天候代理的六步实践，通过任务拆解、阶段执行与验证机制将 AI 深度融入个人工作流。

Anthropic 用 16 个 Opus 4.6 代理并行协作自动构建了一个基于 Rust 的 C 编译器，展示长期自主协作与测试驱动开发的潜力，但在效率、自举完整性及汇编/链接器方面仍有不足。

Waymo 基于 DeepMind Genie 3 发布 World Model，用于生成高保真 3D 多传感器虚拟环境以训练和测试自动驾驶在极端与罕见场景下的鲁棒性。

Flock CEO 将反对其监控系统的组织 Deflock 称为“恐怖组织”，引发围绕未经授权安装摄像头、数据共享及压制监督的强烈争议。

欧盟初步裁定 TikTok 的无限滚动、自动播放与个性化推荐构成“成瘾性设计”，要求整改否则面临巨额罚款，TikTok 表示将抗辩。

开源项目揭露 LinkedIn 在页面加载时静默检测 2,953 个浏览器扩展以进行指纹识别或行为分析，提示平台监控与隐私风险需引起重视。

文章主张在 2026 年多数场景应以现代 PostgreSQL 及其生态扩展作为统一数据平台以简化架构并降低运维成本，但被批评为过于一刀切。

Anthropic 推出新一代旗舰模型 Claude Opus 4.6 (Claude Opus 4.6) #

https://www.anthropic.com/news/claude-opus-4-6

Anthropic 推出新一代旗舰模型 Claude Opus 4.6，标志着其在智能模型领域的重大升级。该模型在多个关键能力上实现突破，尤其在代码编写、复杂任务规划和长上下文处理方面表现卓越。

Opus 4.6 首次在 Opus 系列中引入 100 万 token 的上下文窗口（处于测试阶段），使其能够处理更大规模的信息，适用于复杂研究、法律分析、金融建模等专业场景。在 agentic coding 任务中，模型展现出更强的规划能力，能将复杂任务拆解为子任务，支持并行执行和工具调用，显著提升系统级任务的完成效率。

在权威评测中，Opus 4.6 表现领先：在 Terminal-Bench 2.0（代理编码）中取得最高分，在 Humanity’s Last Exam（多学科推理测试）中超越所有前沿模型。在 GDPval-AA 评估中，其性能比行业第二的 GPT-5.2 高出约 144 Elo 分，比前代 Opus 4.5 高出 190 分。此外，在 BrowseComp 测评中，其网络信息检索能力也优于所有其他模型。

Opus 4.6 还支持更智能的协作模式。通过 Claude Code，用户可组建“代理团队”协同工作；API 支持上下文压缩与自适应思考机制，使模型能根据任务复杂度动态调整推理深度。开发者可通过 /effort 参数灵活控制模型的思考强度，平衡性能、速度与成本。

产品层面，Claude 已全面升级至 Excel 和 PowerPoint，提供研究预览版，显著增强日常办公能力。在真实场景中，Opus 4.6 已在 Notion、GitHub、Replit、Asana、Cognition、Windsurf、Thomson Reuters、NBIM、Cursor、Harvey、Rakuten、Lovable、Box 等多家企业中完成验证，广泛应用于代码审查、安全调查、法律推理、组织管理、设计原型生成等任务，普遍反馈其自主性、准确性和创造力大幅提升。

安全性方面，Opus 4.6 在多项安全评估中表现优异，误导向行为率极低，整体安全性能达到或超过行业领先水平。

目前，Claude Opus 4.6 已上线 claude.ai、API 及主流云平台，定价保持不变：每百万 token 5 美元（输入）和 25 美元（输出）。

HN 热度 2264 points | 评论 977 comments | 作者：HellsMaddy | 1 day ago #

https://news.ycombinator.com/item?id=46902223

Claude Opus 4.6 在处理哈利·波特前四本书（约 73.3 万 token）时，成功识别出 50 个已知魔法中的 49 个，仅遗漏“Slugulus Eructo”，表现令人印象深刻。
有人质疑该测试是否真正检验模型能力，因为训练数据可能已包含互联网上关于魔法列表的公开信息，模型更可能是基于已有知识进行预测而非从文本中提取。
有观点指出，主流大模型训练数据中很可能已包含大量受版权保护的书籍内容，包括《哈利·波特》系列，这使得测试结果难以证明模型具备真正的文本理解能力。
多个来源表明，像 Library Genesis 和 Anna’s Archive 这样的“影子图书馆”被多家科技公司用于训练数据，包括 NVIDIA、Google 和 Meta，这进一步支持了训练数据广泛覆盖公开文本的观点。
尽管存在版权争议和法律诉讼，法院目前倾向于支持“合理使用”原则，认为大模型训练属于合法范畴，但未经授权复制和分发仍可能带来法律责任。
有评论指出，对于普通用户而言，其接触的文本信息几乎都可能已被大模型训练覆盖，因此很难找到模型未曾见过的“新鲜”知识。
有人提出，真正有效的测试应修改原文中的魔法名称或添加虚构魔法，以检验模型是否能从原始文本中真正发现信息，而非简单复述训练数据中的共识。
也有观点认为，即使模型依赖训练数据，其在处理复杂文本分析任务（如语义模式识别）上的能力仍值得肯定，尤其在学术研究领域具有潜在应用价值。
有建议提出，应使用合成文本进行测试，例如随机生成包含特定特征的句子并嵌入“魔法”元素，以评估模型在未见过语境下的发现能力。
最终，最严格的测试可能是使用未发表的手稿或小众非主流作品，以排除模型依赖已有公开数据的可能性。

GPT-5.3-Codex：目前最强大的代理式编程模型 (GPT-5.3-Codex) #

https://openai.com/index/introducing-gpt-5-3-codex/

OpenAI 推出了新一代模型 GPT-5.3-Codex，这是目前最强大的代理式编程模型。该模型融合了 GPT-5.2-Codex 的前沿编码能力与 GPT-5.2 的推理及专业领域知识，性能更优且速度提升 25%。GPT-5.3-Codex 能够独立完成复杂、长时间的任务，如研究、工具调用和多步骤执行，并支持用户在任务进行中实时交互，保持上下文连贯。

该模型在多个权威基准测试中表现卓越，包括 SWE-Bench Pro 和 Terminal-Bench 2.0，均达到行业领先水平，且用更少的 token 实现更高准确率。它不仅在编程方面表现出色，还能完成网页开发、文档撰写、数据分析等专业工作。

在实际应用中，GPT-5.3-Codex 成功自主构建了两款完整游戏：一款赛车游戏和一款潜水探索游戏，具备多地图、角色、道具系统和动态机制，可直接运行。此外，它还能根据简单指令生成功能丰富、设计精良的网页，如自动优化价格展示、生成动态轮播图，显著提升页面的生产就绪度。

GPT-5.3-Codex 还能胜任跨领域的专业任务，如制作金融建议幻灯片、零售培训文档、净现值分析表和时尚展示报告，其表现与 GPT-5.2 相当，充分体现了其在真实职场场景中的强大能力。

值得一提的是，GPT-5.3-Codex 是首个在自身开发过程中发挥关键作用的模型，其训练、部署和测试均借助早期版本实现，大幅加速了研发进程。该模型现已开放预约使用，标志着 AI 代理在专业工作自动化方面迈入新阶段。

HN 热度 1477 points | 评论 582 comments | 作者：meetpateltech | 1 day ago #

https://news.ycombinator.com/item?id=46902638

Codex 5.3 被视为交互式合作者，强调人类在开发过程中持续介入与引导，可随时调整方向。
Opus 4.6 倾向于更自主、代理式的系统，具备深度规划能力，运行时间长，对人类干预需求低。
两种模型代表了编程与 AI 协作的两种哲学：一种是紧密的人机协同，另一种是高度自动化交付。
实际使用中，部分用户发现 Codex 会长时间思考后才返回结果，与“交互性”描述相反，可能体验上更像独立执行。
Claude Code 有更强的协作感，倾向于与开发者共同构建，而 Codex 更倾向独自完成任务再输出。
尽管初始定位不同，但两者正逐渐向中间靠拢，趋于融合。
有用户指出，当前模型存在“过冲”问题，即过度思考导致上下文浪费或误解，影响效率。
长时间思考可能导致上下文溢出，甚至耗尽会话资源，尤其在简单问题上表现不佳。
使用明确的任务定义和强约束（如 guardrails）可有效控制 AI 行为，避免意外。
利用工具如 Claude Hooks、hookify 插件或 OpenSpec 可帮助建立结构化任务流程，提升聚焦度。
在本地部署如 Qwen-code-next 模型时，通过增加上下文长度可提升表现，但会降低速度。
对于子代理（subagents），目前缺乏灵活的中途干预机制，通常需中断所有任务才能调整。
子代理的成果若未显式保存，将无法回溯，影响长期开发效率。
有人认为，模型响应速度差异可能源于推理服务的性能瓶颈，而非设计哲学本身。
支持人类持续介入的观点认为，这能有效防止代码质量下降，确保抽象合理性和长期可维护性。
反对观点认为，只要框架得当，自主式代理也能通过自我反思实现收敛，无需频繁人工干预。
自主模式虽高效，但缺乏对核心逻辑的全局理解，难以主动发现统一解决方案，仅适合原型或临时脚本。

我如今认为苹果新闻中的所有广告都是骗局 (I now assume that all ads on Apple news are scams) #

https://kirkville.com/i-now-assume-that-all-ads-on-apple-news-are-scams/

作者在 2026 年 2 月 6 日发表文章，批评苹果新闻（Apple News）中的广告质量急剧下降，认为绝大多数广告均为骗局。文章指出，自 2024 年苹果与 Taboola 合作后，其新闻应用内的广告风格与 Taboola 常见的低质、重复性广告无异，且内容越来越像 AI 生成的虚假宣传。

作者列举了多个近期注册的域名广告案例，如 MUSTYLEVO.COM、SOLVERACO.COM 和 SHIYAATELIER.COM，这些域名均在 2025 年底至 2026 年初注册，注册信息显示其来源地多为境外（如中国），缺乏可信背景。这些广告常以“退休”“关闭”等名义吸引用户点击，实则为典型的“虚假清仓”骗局，已被美国 Better Business Bureau 等机构警示。

其中一则名为 Tidenox 的广告声称“26 年历史”“退休创始人”，但其域名 TIDENOX.COM 实际于 2025 年 5 月注册，且注册商为阿里云旗下服务商，与广告内容严重不符。更令人怀疑的是，广告图中隐约可见 Google Gemini 的水印，暗示其为 AI 生成。

作者质疑苹果是否关心此类广告的存在，认为苹果作为高端平台，却放任这类低质、欺诈性广告充斥其新闻服务，本质上是在为诈骗提供“诱饵平台”。作者最终断言，苹果已失去公众信任，不再值得信赖其广告系统。

HN 热度 917 points | 评论 401 comments | 作者：cdrnsf | 12 hours ago #

https://news.ycombinator.com/item?id=46911901

Apple News 和 News+ 服务整体表现平庸，界面混乱，将低质量的点击诱饵与严肃新闻混杂，技术实现粗糙，许多杂志内容仅为低分辨率 PDF，未能发挥苹果在硬件上的优势。
苹果自 2014 年转向服务战略后，其服务产品缺乏创新与质量，仅以增加营收为目标，背离了乔布斯时代注重用户体验的初心。
Apple Fitness+ 虽然被部分用户认为是服务战略中少有的高质量产品，具备良好整合性与趣味性，值得每月订阅，但也有用户指出其功能存在明显短板，如不支持多人同时观看时的同步显示，被批评为“弃用式维护”。
有用户反驳称 Fitness+ 持续更新新课程，功能完善，多人共同锻炼的场景属于小众需求，无需过度关注。
苹果曾试图通过技术手段限制网络广告，但如今却在自家服务中推广个性化广告，形成鲜明对比，被批评为双重标准。
Apple TV+ 的原创剧集如《黑镜》《Slow Horses》《Severance》广受好评，但其内容传播受限，观众基数远低于 Netflix 或 Amazon Prime，导致优质内容难以触达大众。
有用户指出 Apple TV+ 存在广告问题，例如在观看内容前会强制播放 Peacock 等其他平台的广告，影响体验。
部分评论认为，苹果服务整体质量参差不齐，但许多批评来自非苹果用户或故意夸大问题的“刷屏者”，真实用户反馈中存在大量主观偏好差异。
苹果在内容制作上虽有投入，但其“Apple TV”品牌既指服务也指内容，名称混淆，建议应使用更清晰的命名区分。
有用户认为，苹果内容生产模式与 Netflix、Amazon 类似，多依赖外部制作公司，而非完全自建内容体系。

我的 AI 采纳之旅 (My AI Adoption Journey) #

https://mitchellh.com/writing/my-ai-adoption-journey

作者 Mitchell Hashimoto 分享了自己在 AI 工具使用上的六步成长历程，强调通过实践逐步建立对 AI 的真正理解与高效应用。

第一步：放弃依赖聊天机器人。作者指出，直接用 ChatGPT 等聊天界面写代码效率低下，容易陷入反复纠错的循环。真正的价值在于使用“代理”（Agent）——能够读取文件、执行程序和发起 HTTP 请求的 AI 系统。

第二步：亲自复现工作成果。作者尝试 Claude Code 时起初效果不佳，于是强迫自己将手动完成的任务，用 AI 代理重新实现，且不能参考原结果。这一过程虽痛苦，但帮助他建立起对 AI 能力边界和最佳实践的深刻认知：任务需拆解、分阶段执行、加入验证机制，从而提升准确率。

第三步：利用每日结束时间运行代理。作者每天留出 30 分钟，启动多个代理进行深度调研、探索未尝试的创意或自动处理问题与 PR 的初步筛选。这些任务在精力不足的晚间完成，为第二天工作提供“热启动”优势，带来轻微但可感知的效率提升。

第四步：外包高成功率任务。当作者确认某些任务 AI 能稳定完成时，开始主动将这些“高光任务”交给 AI 代理处理，自己则专注其他核心工作。关键在于关闭通知，避免干扰，保持专注。

第五步：构建自动化工作流。作者开始设计系统化的 AI 协作流程，让代理在后台持续运行，自动完成重复性、可验证的任务，形成稳定的辅助工作模式。

第六步：始终保持一个代理运行。作者最终让一个 AI 代理全天候运行，持续监控、处理低优先级任务，实现真正的“被动生产力”，使 AI 从工具变为工作流的一部分。

全文核心观点：AI 的价值不在于即时生成完美结果，而在于通过系统性实践，理解其能力边界，构建适合个人工作节奏的 AI 协作机制。真正的效率提升来自对 AI 的深度驾驭，而非盲目依赖。

HN 热度 883 points | 评论 373 comments | 作者：anurag | 1 day ago #

https://news.ycombinator.com/item?id=46903558

AI 编程工具的兴起让许多原本持怀疑态度的开发者开始接受，尽管早期的过度宣传导致了行业内的不信任和分裂。
工具迭代速度过快，导致开发者难以适应，产生困惑和对立情绪，但本质上仍是编程工作。
将 AI 辅助编程称为“ vibe coding”并不恰当，如同不会称使用 CAD 的建筑师为“vibe architects”。
编译器生成的机器码是确定性的，而 AI 输出具有非确定性和不可预测性，两者本质不同。
虽然编译器也可能存在 bug，但其错误是可复现且可修复的，而 AI 的错误难以预测和定位。
编译器的错误通常不影响程序功能或仅影响性能，而 AI 的错误可能直接导致逻辑或功能问题。
有人指出，编译器 bug 在实际开发中极为罕见，大多数开发者从未遇到过。
将 AI 与编译器类比是一种误导，忽视了 AI 在可靠性与确定性上的根本差异。
AI 的“智能”更多是模仿人类，而非真正理解世界，其目标与构建真正通用智能相去甚远。
AI 生成的内容缺乏可验证性和可信度，不能像编译器输出那样直接信任。

使用代理团队的 Opus 4.6 构建 C 编译器 (We tasked Opus 4.6 using agent teams to build a C Compiler) #

https://www.anthropic.com/engineering/building-c-compiler

本文介绍了使用多个并行运行的 Claude 模型（称为“agent teams”）构建一个完整的 C 编译器的实验。研究者通过构建一个自动化循环系统，让 16 个 Claude 实例在无须人工干预的情况下，持续协作开发一个基于 Rust 的 C 编译器，目标是能够编译 Linux 6.9 内核。

为了实现长期自主运行，作者设计了一个无限循环的执行框架，使每个 Claude 实例在完成任务后自动进入下一个任务。该框架通过 Git 仓库共享代码，并利用文件锁机制避免多个代理同时处理同一任务，从而实现基本的并发控制。

在并行运行方面，系统通过 Docker 容器为每个代理提供独立环境，各代理可专注于不同子任务，如语法分析、代码生成或文档维护。尽管存在频繁的合并冲突，但 Claude 能自行解决大部分问题。

文章强调了构建高质量测试体系的重要性：必须确保测试足够精确，防止代理偏离目标。为此，研究者引入了持续集成流水线和严格的回归测试机制，以防止新功能破坏已有功能。

此外，作者指出需充分考虑语言模型的局限性，例如上下文窗口污染和时间感知缺失。因此，系统设计注重输出简洁、日志结构清晰，并引入快速采样模式（如 1% 随机样本），帮助代理高效推进。

最后，当测试通过率接近 99% 时，系统仍能有效分配剩余的小型缺陷修复任务，体现出该方法在大规模复杂项目中的潜力与可行性。整个项目耗时近 2000 次 API 调用，花费约 2 万美元，最终产出一个 10 万行代码的编译器，支持 x86、ARM 和 RISC-V 架构。

HN 热度 695 points | 评论 678 comments | 作者：modeless | 1 day ago #

https://news.ycombinator.com/item?id=46903616

该项目展示了 AI 在构建复杂、有明确规范的系统（如编译器）方面的潜力，尤其得益于完备的测试套件支持。
虽然编译器能成功构建可引导的 Linux 内核，但其生成代码效率较低，甚至不如关闭优化的 GCC，表明性能仍有待提升。
编译器在生成 16 位 x86 代码时因大小超过 32KB 限制而无法独立完成引导，需借助 GCC 绕过，因此并非完全自足。
有人质疑该项目是否真正“自举”成功，认为其依赖外部工具链，削弱了“从零构建”的叙事完整性。
尽管成本高达 2 万美元，但结果仍存在不确定性，因为无法在过程中提前验证最终成果是否有效。
项目中未实现独立的汇编器和链接器，这被部分人视为关键短板，尽管汇编器本身并不简单，尤其对 x86 这种多编码指令集而言。
汇编器实现困难在于变量长度指令导致地址未知，形成“鸡生蛋蛋生鸡”的循环问题，需要多轮遍历和符号解析。
该项目的成功也反映了训练数据中大量开源编译器代码的影响，使 AI 具备理解复杂编译逻辑的能力。
有人指出，若没有全面的测试用例（如 GCC 的 torture 测试套件），即使任务看似简单，也难以保证正确性。
项目虽不完美，但整体仍是一项令人惊叹的技术突破，证明了当前 AI 在系统级软件开发中的可行性。

Waymo 世界模型 (The Waymo World Model) #

https://waymo.com/blog/2026/02/the-waymo-world-model-a-new-frontier-for-autonomous-driving-simulation

Waymo 今日发布其全新自动驾驶仿真技术——Waymo World Model，标志着自动驾驶模拟进入一个新阶段。该模型基于 Google DeepMind 的 Genie 3 通用世界模型，专为自动驾驶场景优化，能够生成高度逼真的 3D 虚拟环境，支持多传感器输出（包括相机与激光雷达数据）。

Waymo Driver 已累计行驶近 2 亿英里完全自动驾驶里程，而其背后在虚拟世界中的模拟里程更是以数十亿计。Waymo World Model 使团队能够在安全可控的环境中训练和测试车辆应对极端、罕见或高风险场景，如龙卷风、洪水、雪覆盖的热带街道、逆行车辆、动物闯入（如大象、长角牛、狮子）、巨型 tumbleweed、甚至穿着恐龙服装的行人等。

该模型具备强大的可控性，支持三种核心控制方式：驾驶行为控制、场景布局控制和语言指令控制。工程师可通过简单语言提示调整时间、天气、交通信号状态或道路结构，快速生成定制化测试场景。例如，可模拟“如果当时更自信地行驶，是否能避免碰撞”这类反事实情境，提升算法鲁棒性。

相比传统重建式模拟方法（如 3D Gaussian Splats），Waymo World Model 因具备生成能力，即使在与原始驾驶路线差异较大的新路径上，仍能保持视觉真实性和一致性。

该技术是 Waymo 安全 AI 战略的三大支柱之一，显著增强其在复杂城市环境和新区域扩展服务的能力。通过高保真、多模态、可控的仿真，Waymo 正加速实现更安全、更可靠的自动驾驶系统。

HN 热度 664 points | 评论 425 comments | 作者：xnx | 8 hours ago #

https://news.ycombinator.com/item?id=46914785

Google 在 AI 领域的垂直整合能力极强，涵盖从硬件、能源到应用生态的全方位布局，远超 ChatGPT 或 Grok 等产品。
Google 长期专注于 AI 研发与内部应用，而非快速推出商业化产品，这种策略差异导致其在 AI 产品化方面起步较慢。
早期 Google 在 AI 研究方面处于领先地位，许多顶尖 AI 人才曾聚集于此，但产品转化效率低下。
Sergey Brin 的回归被部分人认为对 AI 战略有影响，但内部反馈显示其频繁介入不同项目反而造成方向混乱。
Google 曾因忽视产品价值而放弃 Google Reader，反映出其在产品维护与长期价值判断上的短视。
Google Reader 的关闭并非因技术或用户体验问题，而是因为其广告变现模式不如页面浏览量高效。
Google 在 AI 早期已有类似 LaMDA 的先进模型，但因担心其可能引发负面舆论而迟迟未推出，错失先机。
Google Brain 团队贡献了 Transformer 等核心 AI 技术，但未能将这些技术转化为市场主导产品。
ChatGPT 的爆发让 Google 等巨头意识到必须快速行动，否则将面临巨大战略风险。
生成式 AI 的迅速普及迫使大公司改变决策，即使存在法律与伦理风险，也必须跟进。
与技术突破相比，如何将 AI 技术转化为可持续、安全且盈利的产品，是当前更关键的挑战。
当前 AI 产品的核心问题不在于能力不足，而在于如何实现商业化、可控性和社会接受度的平衡。

Flock CEO 称 Deflock 为“恐怖组织”（2025）[视频] (Flock CEO calls Deflock a “terrorist organization” (2025) [video]) #

https://www.youtube.com/watch?v=l-kZGrDz7PU

视频标题为“Flock CEO 称 Deflock 为‘恐怖组织’”，由 Hex Studios 发布，于 2025 年 11 月 16 日上传，目前已有 8,553 次观看。

在该视频中，Flock 公司首席执行官在接受《福布斯》采访时，将 Deflock 称为“所谓的恐怖组织”。这一言论引发了广泛关注和讨论，凸显了科技行业内部在 AI 监管、数据安全与组织定位等问题上的激烈分歧。

视频内容聚焦于 Flock CEO 对 Deflock 的严厉指控，强调其对网络安全与人工智能伦理的担忧。尽管未提供具体证据或详细解释，但该言论表明 Flock 可能正试图通过舆论施压，以确立自身在 AI 领域的道德与安全领导地位。

视频下方有 64 条评论，用户对这一指控反应不一，部分质疑其合理性，也有支持者认为 Deflock 的行为确实构成威胁。视频还附带了相关推荐内容，包括 SNL 节目、Jiu-Jitsu 挑战、AI 招聘内幕等热门话题。

HN 热度 655 points | 评论 503 comments | 作者：cdrnsf | 1 day ago #

https://news.ycombinator.com/item?id=46903556

Flock 公司在未获许可的情况下持续安装和激活监控摄像头，且在多个城市被发现未经同意共享数据，引发公众对隐私侵犯的担忧。
Mountain View 市发现 Flock 的“全州查询”功能被 250 多个未签署数据协议的机构使用，一年内进行了约 60 万次搜索，严重违反隐私保护原则。
Evanston 市曾正式要求 Flock 拆除摄像头并终止合同，但 Flock 在未获授权的情况下重新安装，迫使市政府用黑袋子覆盖摄像头以应对非法行为。
Flock CEO 将反对其监控系统的组织 Deflock 称为“恐怖组织”，并指责其制造混乱，但这种说法被批评为颠倒黑白，实则是对合法监督行为的打压。
一些城市如 Cambridge、San Marcos、Staunton 和 Eugene 等地已因 Flock 违反法律或合同而取消其服务，部分城市甚至需采取物理遮蔽措施应对非法设备。
Flock 公司与联邦机构存在“有限试点”合作，涉及打击人口贩卖和芬太尼分销，但未充分告知公众，引发对政府与私营监控公司勾结的担忧。
有观点指出，Flock 的 CEO 在公开声明中承认部分信息不实，显示出其在透明度和诚信方面的严重问题。
反对 Flock 的行动，如记录摄像头位置并建立 Discord 频道讨论应对策略，被贴上“恐怖主义”标签，反映出对公民监督权的压制。
一些人呼吁建立数据库，记录已通过禁止监控系统（包括无人机常态化飞行）的市政单位，以支持选择性旅游和对隐私友好的地区进行经济支持。
Flock 公司对城市政府的合法指令置若罔闻，持续非法部署设备，暴露出其对法律和民主程序的漠视。
将公众监督行为定性为“恐怖主义”是一种危险的修辞，实质上是在为系统性监控和侵犯隐私提供正当化借口。
有评论讽刺指出，真正制造“混乱”的是那些在未经同意下持续监控公众的公司，而反对者反而被污名化为“恐怖分子”。

TikTok“成瘾性设计”被欧洲裁定违法 (TikTok’s ‘addictive design’ found to be illegal in Europe) #

https://www.nytimes.com/2026/02/06/business/tiktok-addictive-design-europe.html

欧洲联盟监管机构近日发布初步裁定，指控 TikTok 的“无限滚动”、自动播放功能及个性化推荐算法构成“成瘾性设计”，违反了欧盟在线安全法规。该机构指出，这些功能可能导致用户，尤其是未成年人和脆弱成年人，出现“强迫性使用”行为，对身心健康造成潜在危害。

这是全球首次将“社交媒体成瘾”纳入法律审查范畴。欧盟委员会强调，TikTok 必须对其核心产品设计进行重大调整，否则将面临巨额罚款。

TikTok 对此回应称，欧盟的初步结论“完全错误且毫无依据”，并表示将通过一切合法手段进行抗辩。目前，该事件仍在调查阶段，最终裁决尚未公布。

HN 热度 585 points | 评论 424 comments | 作者：thm | 12 hours ago #

https://news.ycombinator.com/item?id=46911869

TikTok 的推荐算法因其极低的延迟更新（小于 1 秒）而表现出色，依赖于实时流处理技术如 Apache Flink 和 Kafka，而非所谓的“在线训练”。
TikTok 的搜索功能极为精准，即使通过模糊描述也能找到目标视频，远超其他平台。
部分用户反映 TikTok 搜索功能差，难以找到特定视频，与他人体验存在差异。
YouTube Shorts 也具备类似行为反馈机制，观看时长会影响后续推荐内容，但可能带来不良用户体验。
快速滚动浏览导致系统不断推送相似内容，形成“反应测试”，用户若未能持续互动就会被推送低质量内容。
用户可通过调整自身行为来引导推荐内容，例如关注高质量频道，从而获得更符合兴趣的内容。
算法虽看似让用户“有控制感”，实则要求用户时刻保持警惕以避免被诱导，不利于真正放松。
从成瘾角度出发，应提供非成瘾性推荐选项，如仅推荐订阅频道内容，以尊重用户自主选择权。
社交媒体算法应被监管，因为企业追求用户停留时间最大化，而非内容质量或用户体验。
提供更少成瘾性的算法选项是可行且有益的，许多用户希望减少使用时间，提升生活质量。
算法并非唯一成因，社会整体娱乐与技能学习资源匮乏也是影响因素，不能将问题全归于算法。
比喻指出不应因厌恶算法而否定其背后的技术价值，如同不应因洗澡水脏就丢弃婴儿。
类比航空业：强制改变服务模式可能损害可及性，即便现有体系不理想，但也需考虑对弱势群体的影响。
TikTok 的成功源于优秀工程实现，而非恶意设计，其核心是动态推荐新内容的能力。

LinkedIn 检测 2953 个浏览器扩展程序 (LinkedIn checks for 2953 browser extensions) #

https://github.com/mdp/linkedin-extension-fingerprinting

该网页是一个开源项目页面，专注于揭示 LinkedIn 在用户浏览页面时进行的 Chrome 扩展指纹识别行为。LinkedIn 会在每次页面加载时默默检测 2,953 个不同的 Chrome 扩展程序，用于用户行为分析或安全检测。

项目提供了完整的扩展列表，包含扩展 ID、名称及 Chrome Web Store 或 Extpose 的链接，数据存储在 chrome_extensions_with_names_all.csv 文件中。其中约 78% 的扩展可在 Chrome Web Store 找到，剩余 22% 通过 Extpose 平台作为备用来源获取。

项目包含多个工具脚本：

fetch_extension_names.js：用于从 Chrome Web Store 抓取扩展名称，支持分批请求以应对 API 限流。
test_fetch.js：用于测试前三个扩展的抓取过程，输出详细信息。

扩展 ID 列表源自 LinkedIn 的 fingerprint.js 脚本，该脚本已被反编译并分析。项目还提供了一个原始 ID 列表文件 chrome_extension_ids.txt。

该项目旨在提高透明度，揭示平台对用户浏览器环境的监控行为，具有一定的隐私与安全研究价值。

HN 热度 509 points | 评论 232 comments | 作者：mdp | 1 day ago #

https://news.ycombinator.com/item?id=46904361

Firefox 通过为每个浏览器实例随机生成扩展唯一标识符（UUID），有效防止网站通过扩展列表进行用户指纹识别，从而提升隐私保护。
虽然使用市场份额较小的浏览器可能错过某些新功能，但这种选择反而有助于避免被大型平台追踪和数据滥用。
浏览器之间的工作流不互通是跨浏览器使用的最大障碍，尤其是书签同步在不同浏览器间缺乏统一解决方案。
有用户尝试将书签导出为 HTML 文件，并开发网页版书签工具，支持搜索和图标下载，作为更优的替代方案。
部分用户发现使用 Firefox 访问 LinkedIn 时会出现严重的性能问题，如高内存占用、风扇狂转甚至崩溃，怀疑其存在资源滥用或恶意行为。
有人推测可能是由于网站试图扫描所有可能的扩展标识符来实现指纹识别，但这种做法在实际中因空间过大而难以实现。
尽管存在生成完整唯一标识符数据库的想法，但由于其规模庞大（16 字节），实际操作上几乎不可行，且缺乏商业壁垒。
有真实项目“everyuuid.com”已尝试记录所有可能的唯一标识符，展示了该概念的可行性与趣味性。
用户对网站过度收集信息的行为表示担忧，尤其关注数据被出售或用于非相关场景，而非单纯的识别本身。
一些人认为，即使网站能检测到用户使用的是 Firefox，也无法准确识别具体个人，因为每次重启都会生成新的唯一标识符。

2026 年，只需使用 PostgreSQL (It’s 2026, Just Use Postgres) #

https://www.tigerdata.com/blog/its-2026-just-use-postgres

本文探讨了在现代技术环境下，为何 PostgreSQL 应成为大多数应用的首选数据库，而非盲目追求“专用数据库”。文章指出，尽管“用对工具做对事”的理念看似合理，但现实中企业往往因此陷入多数据库管理的复杂困境。

当前 AI 时代，尤其是智能代理（AI agents）的兴起，使得数据库环境的复杂性成为重大障碍。使用多个专用数据库（如 Elasticsearch、Pinecone、Redis、Kafka、InfluxDB 等）意味着需要管理七套不同的查询语言、备份策略、安全模型和监控系统，调试或测试时更需协调多个服务，效率极低。

作者强调，PostgreSQL 通过扩展已能胜任几乎所有场景，且性能不输甚至优于专用数据库。例如：

pgvector 与 pgvectorscale 可替代 Pinecone，采用 HNSW/DiskANN 算法，延迟低 28 倍，成本降低 75%
TimescaleDB 在时间序列处理上媲美 InfluxDB，同时支持完整 SQL
pg_textsearch 提供与 Elasticsearch 相同的 BM25 算法
JSONB 支持文档存储，性能媲美 MongoDB
PostGIS 已支撑 OpenStreetMap、Uber 等大型应用超过 20 年

这些扩展均基于成熟算法，由开源社区维护，且多数由原算法研究者开发，具备高度可靠性。

文章还指出，多数据库带来的隐性成本极高：安全补丁、监控、故障演练、数据一致性维护等任务成倍增加。三套 99.9% 可用系统叠加，整体可用性仅约 99.7%，年宕机时间达 26 小时，远高于单一数据库的 8.7 小时。

在 AI 时代，快速构建、测试、回滚环境成为刚需。使用 PostgreSQL 只需一条命令即可复制整个环境，而多数据库系统几乎无法实现。

作者推荐采用“现代 PostgreSQL 生态”作为统一数据平台，包括：

TimescaleDB（时间序列）
pgvector / pgvectorscale（向量搜索）
pg_textsearch（全文检索）
pgai（自动同步 AI 嵌入数据）

最终结论：99% 的企业无需专用数据库。PostgreSQL 加扩展，已足够应对所有需求，简化架构，降低运维成本，提升开发效率。在 AI 驱动的时代，统一、简洁的数据库才是真正的“对的工具”。

HN 热度 506 points | 评论 315 comments | 作者：turtles3 | 1 day ago #

https://news.ycombinator.com/item?id=46905555

使用 Postgres 作为默认选择是合理的，但不应盲目奉行“只用 Postgres”这种一刀切的建议。
许多团队误以为自己有特殊需求而选择非 Postgres 技术，实际上大多数情况并不需要，过度复杂化反而增加成本和维护负担。
从早期阶段就应考虑合理规模的设计，避免后期因架构问题导致性能瓶颈或高昂的改造成本。
随着数据量和工作负载的增长，专门用途的技术（如 ClickHouse）在初创公司中已变得越来越常见，甚至在种子轮阶段就已出现。
对于特定场景，如大规模分析型查询，使用专为该场景优化的系统能带来显著性能提升，且集成成本可控。
在缺乏明确指标的情况下讨论“合理规模”是模糊且误导性的，应通过实际基准测试来验证是否需要替代方案。
过度依赖流行趋势或他人经验做技术选型，可能导致不必要地引入复杂技术栈，忽视简单方案的有效性。
技术决策应基于真实数据和具体业务需求，而非主观感受或对“特殊性”的错觉。

Hacker News 精彩评论及翻译 #

I now assume that all ads on Apple news are scams #

https://news.ycombinator.com/item?id=46912336

Apple News and News+ represent everything wrong with modern Apple: a ham-fisted approach to simplicity that ignores the end user. It is their most mediocre service, jarringly jamming cheap clickbait next to serious journalism in a layout that makes no sense.

The technical execution is just as lazy. While some magazines are tailored, many are just flat, low-res PDFs that look terrible on the high-end Retina screens Apple sells. Worst of all, Apple had the leverage to revolutionize a struggling industry; instead, they settled for a half-baked aggregator.

It’s a toxic mix of Apple tropes that simply weren’t thought through. The ads are the cherry on the cake.

speak_plainly

Apple News 和 News+ 体现了现代苹果公司所有的问题：一种笨拙的“简洁”方式，完全无视了终端用户。这是他们最平庸的服务，在一个毫无逻辑的布局中，将廉价的点击诱饵与严肃的新闻内容生硬地堆砌在一起。

技术执行也同样懒散。虽然部分杂志经过了专门优化，但许多只是扁平化的低分辨率PDF文件，在苹果销售的高端 Retina 屏幕上看起来效果糟糕。最糟糕的是，苹果本有机会去革新一个苦苦挣扎的行业，但他们却选择了一个半生不熟的聚合服务。

这是一种未经深思熟虑的有毒混合体，充满了苹果公司的陈词滥调。而广告更是为这一切锦上添花。

An Update on Heroku #

https://news.ycombinator.com/item?id=46914321

“We know changes like this can raise questions, and we want to be clear about what this means for customers.”

Proceeds to not be clear about what this means for customers.

simonw

我们知道这样的变动会引起疑问，我们也想就此对客户的影响作出明确说明。然后并没有就此对客户的影响作出明确说明。

Claude Opus 4.6 #

https://news.ycombinator.com/item?id=46905735

Just tested the new Opus 4.6 (1M context) on a fun needle-in-a-haystack challenge: finding every spell in all Harry Potter books.

All 7 books come to ~1.75M tokens, so they don’t quite fit yet. (At this rate of progress, mid-April should do it ) For now you can fit the first 4 books (~733K tokens).

Results: Opus 4.6 found 49 out of 50 officially documented spells across those 4 books. The only miss was “Slugulus Eructo” (a vomiting spell).

Freaking impressive!

ck_one

我刚对新发布的 Opus 4.6（支持 100 万上下文）进行了一项有趣的“大海捞针”挑战：在所有《哈利·波特》系列书籍中找出所有的咒语。

整套 7 本书大约有 175 万个词元（token），所以目前还无法完全容纳（以目前的进展速度，四月中旬应该就能做到了）。目前你可以放入前 4 本书（约 73.3 万个词元）。

结果：Opus 4.6 在这 4 本书中成功找出了 50 个官方记录咒语中的 49 个。唯一漏掉的是“鼻涕精”（一种催吐咒语）。

这效果简直太惊人了！

We tasked Opus 4.6 using agent teams to build a C … #

https://news.ycombinator.com/item?id=46905771

I spent a good part of my career (nearly a decade) at Google working on getting Clang to build the linux kernel. https://clangbuiltlinux.github.io/

This LLM did it in (checks notes):

Over nearly 2,000 Claude Code sessions and $20,000 in API costs

It may build, but does it boot (was also a significant and distinct next milestone)? (Also, will it blend?). Looks like yes!

The 100,000-line compiler can build a bootable Linux 6.9 on x86, ARM, and RISC-V.

The next milestone is:

Is the generated code correct? The jury is still out on that one for production compilers. And then you have performance of generated code.

The generated code is not very efficient. Even with all optimizations enabled, it outputs less efficient code than GCC with all optimizations disabled.

Still a really cool project!

ndesaulniers

我职业生涯中相当长的一段时间（近十年）都在谷歌工作，致力于让 Clang 能够编译 Linux 内核。https://clangbuiltlinux.github.io/

而这个大型语言模型做到了（看看记录）：

在近 2000 次 Claude Code 会话和 20,000 美元的 API 成本之后

它或许能编译，但它能启动吗（这也是一个重要且截然不同的下一步里程碑）？（另外，它“能搅碎一切”吗？）。看起来可以！

这个 10 万行代码的编译器能够在 x86、ARM 和 RISC-V 架构上构建一个可启动的 Linux 6.9。

下一个里程碑是：

生成的代码是否正确？对于生产级编译器来说，这个问题尚无定论。然后你还要考虑生成代码的性能。

生成的代码效率不高。即便开启了所有优化选项，其输出的代码效率也比 GCC 在所有优化选项都关闭的情况下要低。

这仍然是一个非常酷的项目！

TikTok’s ‘addictive design’ found to be illegal in… #

https://news.ycombinator.com/item?id=46912562

I gave a talk at PyData Berlin on how to build your own TikTok recommendation algorithm. The TikTok personalized recommendation engine is the world’s most valuable AI. It’s TikTok’s differentiation. It updates recommendations within 1 second of you clicking - at human perceivable latency. If your AI recommender has poor feature freshness, it will be perceived as slow, not intelligent - no matter how good the recommendations are.

TikTok’s recommender is partly built on European Technology (Apache Flink for real-time feature computation), along with Kafka, and distributed model training infrastructure. The Monolith paper is misleading that the ‘online training’ is key. It is not. It is that your clicks are made available as features for predicitons in less than 1 second. You need a per-event stream processing architecture for this (like Flink - Feldera would be my modern choice as an incremental streaming engine).

https://www.youtube.com/watch?v=skZ1HcF7AsM
Monolith paper - https://arxiv.org/pdf/2209.07663

jamesblonde

我在 PyData Berlin 会议上做了一个关于如何构建你自己的 TikTok 推荐算法的演讲。TikTok 的个性化推荐引擎是世界上最昂贵的 AI。这是 TikTok 的核心差异化优势。在你点击后的 1 秒内，它就会更新推荐——其延迟是人类可以感知到的。如果你的 AI 推荐系统特征更新不及时，它就会被感知为迟钝，而不是不够智能——无论推荐结果本身有多好。

TikTok 的推荐系统部分建立在欧洲技术之上（使用 Apache Flink 进行实时特征计算），并结合了 Kafka 和分布式模型训练基础设施。那篇“单体”论文具有误导性，认为“在线训练”是关键，事实并非如此。真正关键的是，你的点击行为能在不到 1 秒的时间内作为特征用于预测。为此，你需要一个事件流的流处理架构（例如 Flink——如果让我选一个现代的增量流处理引擎，我会选择 Feldera）。

Claude Opus 4.6 #

https://news.ycombinator.com/item?id=46904493

We don’t vary our model quality with time of day or load (beyond negligible non-determinism). It’s the same weights all day long with no quantization or other gimmicks. They can get slower under heavy load, though.

(I’m from OpenAI.)

tedsanders

我们的模型质量不会因时段或负载而变化（除了微不足道的非决定性因素）。我们全天使用相同的模型权重，不存在量化或其他花哨操作。不过，在负载过高时，它们的响应速度可能会变慢。（我来自OpenAI。）

The Waymo World Model #

https://news.ycombinator.com/item?id=46916092

Suddenly all this focus on world models by Deep mind starts to make sense. I’ve never really thought of Waymo as a robot in the same way as e.g. a Boston Dynamics humanoid, but of course it is a robot of sorts.

Google/Alphabet are so vertically integrated for AI when you think about it. Compare what they’re doing - their own power generation , their own silicon, their own data centers, search Gmail YouTube Gemini workspace wallet, billions and billions of Android and Chromebook users, their ads everywhere, their browser everywhere, waymo, probably buy back Boston dynamics soon enough (they’re recently partnered together), fusion research, drugs discovery…. and then look at ChatGPT’s chatbot or grok’s porn. Pales in comparison.

mattlondon

突然之间，DeepMind对世界模型的这种关注就说得通了。我以前从未真的把Waymo看作机器人，比如和波士顿动力的类人机器人一样，但当然，它也算是一种机器人。

仔细想想，谷歌/Alphabet在AI领域已经实现了如此深度的垂直整合。对比一下他们做的事情——自己的发电、自己的芯片、自己的数据中心、搜索、Gmail、YouTube、Gemini、Workspace、钱包，数十亿的安卓和Chromebook用户，无处不在的广告、浏览器，Waymo，可能很快就会回购波士顿动力（他们最近刚合作），聚变研究、药物发现……然后再看看ChatGPT的聊天机器人或者Grok的色情内容，简直不值一提。

CIA suddenly stops publishing, removes archives of… #

https://news.ycombinator.com/item?id=46903021

Facts are the enemy.

I remember reading books like 1984 and Fahrenheit 451 as a teen thinking, “Cool story, but the US will never look like that.” Oof.

clintfred

事实是敌人。

我记得十几岁读《一九八四》和《华氏451》的时候，心想：“故事很酷，但美国绝不会变成那样。”唉。

We tasked Opus 4.6 using agent teams to build a C … #

https://news.ycombinator.com/item?id=46904041

This was a clean-room implementation

This is really pushing it, considering it’s trained on… internet, with all available c compilers. The work is already impressive enough, no need for such misleading statements.

geraneum

所谓“清洁室实现”真是言过其实了，毕竟它是在互联网和所有可用的C编译器上训练出来的。这项工作本身已经足够令人印象深刻，完全不需要这种误导性的说法。

GPT-5.3-Codex #

https://news.ycombinator.com/item?id=46902712

I think Anthropic rushed out the release before 10am this morning to avoid having to put in comparisons to GPT-5.3-codex!

The new Opus 4.6 scores 65.4 on Terminal-Bench 2.0, up from 64.7 from GPT-5.2-codex.

GPT-5.3-codex scores 77.3.

granzymes

我认为Anthropic今天早上10点前匆忙发布，就是为了避免不得不与GPT-5.3-codex进行比较！

新的Opus 4.6在Terminal-Bench 2.0上的得分是65.4，而GPT-5.2-codex的得分是64.7。

GPT-5.3-codex的得分是77.3。

GPT-5.3-Codex #

https://news.ycombinator.com/item?id=46904367

Whats interesting to me is that these gpt-5.3 and opus-4.6 are diverging philosophically and really in the same way that actual engineers and orgs have diverged philosophically

With Codex (5.3), the framing is an interactive collaborator: you steer it mid-execution, stay in the loop, course-correct as it works.

With Opus 4.6, the emphasis is the opposite: a more autonomous, agentic, thoughtful system that plans deeply, runs longer, and asks less of the human.

that feels like a reflection of a real split in how people think llm-based coding should work…

some want tight human-in-the-loop control and others want to delegate whole chunks of work and review the result

Interested to see if we eventually see models optimize for those two philosophies and 3rd, 4th, 5th philosophies that will emerge in the coming years.

Maybe it will be less about benchmarks and more about different ideas of what working-with-ai means

Rperry2174

有趣的是，GPT-5.3 和 Opus-4.6 在理念上正在分道扬镳，其方式与真实的工程师和组织在理念上的分化如出一辙。

对于 Codex (5.3)，其定位是一个交互式协作者：你可以引导其执行过程，保持全程参与，并在其工作时进行纠正。

而对于 Opus 4.6，侧重点则截然相反：它是一个更具自主性、代理性和深思熟虑的系统，会进行深度规划、运行更长时间，并且对人类的依赖更少。

这反映了人们对基于大语言模型的编程应该如何运作存在真实的分歧……

一些人希望保持紧密的人机循环控制，而另一些人则希望将整块工作委托出去，然后审查结果。

我很想知道我们最终是否会看到模型针对这两种理念进行优化，以及未来几年将会出现的第三、第四、第五种理念。

或许，未来的重点将不再是基准测试，而是更多地取决于人们对于“与AI协作”意味着什么的不同理念。

I now assume that all ads on Apple news are scams #

https://news.ycombinator.com/item?id=46912393

We should assume that all ads in general are scams. The noise to signal ratio is too large to care. Word of mouth and maybe trusted communities like HN is the only way to reliably discover new things.

elashri

我们应该默认所有广告基本上都是骗局。其信噪比过高，已经不值得关注。只有口碑传播，以及像HN（Hacker News）这样值得信赖的社区，才是发现新东西的可靠途径。

LinkedIn checks for 2953 browser extensions #

https://news.ycombinator.com/item?id=46905566

And they said that using a browser with sub-5% market share would cause us to miss out on the latest and greatest in web technology!

rchaud

他们还说，使用市场份额低于5%的浏览器，就会让我们错失最新的网络技术！

Flock CEO calls Deflock a “terrorist organization”… #

https://news.ycombinator.com/item?id=46905139

Mountain View recently turned off their Flock installs after they discovered Flock had enabled data sharing without notice and other agencies were searching through MV data.

https://www.malwarebytes.com/blog/privacy/2026/02/flock-cameras-shared-license-plate-data-without-permission > A separate “statewide lookup” feature had also been active on 29 of the city’s 30 cameras since the initial installation, running for 17 straight months until Mountain View found and disabled it on January 5. Through that tool, more than 250 agencies that had never signed any data agreement with Mountain View ran an estimated 600,000 searches over a single year, according to local paper the Mountain View Voice, which first uncovered the issue after filing a public records request.

A different town (Staunton, VA) also turned of their Flock installs after their CEO sent out an email claming:

https://www.aclu.org/news/privacy-technology/flock-ceo-goes-ballistic > The attacks aren’t new. You’ve been dealing with this for forever, and we’ve been dealing with this since our founding, from the same activist groups who want to defund the police, weaken public safety, and normalize lawlessness. Now, they’re producing YouTube videos with misleading headlines.

ian_d

山景城在发现Flock未经通知就启用了数据共享，并且其他机构正在搜索山景城的数据后，最近关闭了其Flock系统。

https://www.malwarebytes.com/blog/privacy/2026/02/flock-cameras-shared-license-plate-data-without-permission > 据当地报纸《山景之声》报道，该报纸在提交了公共记录请求后最先揭露了此问题，一个名为“全州查询”的独立功能自最初安装以来，已在全市30台摄像头中的29台上运行了连续17个月，直到山景城在1月5日发现并关闭了它。通过该工具，从未与山景城签署任何数据协议的超过250个机构，在一年内进行了估计60万次搜索。

另一个小镇（弗吉尼亚州斯坦顿市）也在其CEO发送了一封电子邮件后关闭了其Flock系统，邮件中称：

https://www.aclu.org/news/privacy-technology/flock-ceo-goes-ballistic > 这些攻击并非新鲜事。你们一直在处理这个问题，而我们自成立以来也一直在面对，来自那些想要削减警察预算、削弱公共安全、并将犯罪常态化的同一活动团体。现在，他们正在制作带有误导性标题的YouTube视频。

Claude Opus 4.6 #

https://news.ycombinator.com/item?id=46906441

There’s lots of websites that list the spells. It’s well documented. Could Claude simply be regurgitating knowledge from the web? Example:

https://harrypotter.fandom.com/wiki/List_of_spells

golfer

有很多网站都列出了这些咒语，它们都有详细的记载。难道克劳德（Claude）只是在重复网络上的知识吗？例如：https://harrypotter.fandom.com/wiki/List_of_spells

Flock CEO calls Deflock a “terrorist organization”… #

https://news.ycombinator.com/item?id=46903996

Wow…

“…and then unfortunately there is terroristic organizations like DeFlock, whose primary motivation is chaos. They are closer to Antifa than they are anything else.”

“We’re not forcing Flock on anyone…”

It is a short 1:32 video, I encourage people to watch it for themselves.

I thought DeFlock was just publishing locations of cameras and lawfully convincing local governments to not use Flock, primarily through FOIA requests.

rationalist

哇……

“……然后不幸的是，像 DeFlock 这样的恐怖组织，他们的主要动机就是制造混乱。他们与 Antifa 的关系比与其他任何组织都更密切。”

“我们并没有强迫任何人使用 Flock……”

这是一段时长 1 分 32 秒的短视频，我鼓励大家自己去看。

我原以为 DeFlock 只是公布摄像头位置，并通过信息自由法（FOIA）等合法途径说服地方政府不使用 Flock。

Why more companies are recognizing the benefits of… #

https://news.ycombinator.com/item?id=46896158

Many years ago, I worked at a company with a product that ran on Mac and Windows. The Mac version was pretty solid, but the Windows version had some problems.

They had a talented team of developers who were mostly Mac experts and just starting to get a grip on Windows.

I was known at the time as a “Windows expert”, so they hired me to help the team get the Windows version into shape.

My typical day started with “house calls”. People would ping me with their Windows questions and I’d go door to door to help solve them - and to make sure they understood how to do things on Windows.

In the afternoon, I would work on my own code, but I told everyone they could always call on me for help with a Windows problem, any time of day.

One colleague asked me: “Mike, how can you afford to be so generous with your time?”

Then in a performance review, I got this feedback:

“Mike, we’re worried. Your productivity has been OK lately, but not great. And it’s surprising, because the productivity of the rest of the team has improved a lot during this time.”

I bit my tongue, but in retrospect I should have said:

“Isn’t that what you hired me for?”

Stratoscope

许多年前，我在一家公司工作，我们的产品同时支持 Mac 和 Windows 系统。Mac 版本非常稳定，但 Windows 版本存在一些问题。

团队里有一群才华横溢的开发人员，他们大多是 Mac 专家，当时才刚刚开始熟悉 Windows 系统。

当时，我被称为“Windows 专家”，所以他们雇佣我来帮助团队完善 Windows 版本。

我典型的一天从“上门服务”开始。同事们会就 Windows 相关的问题向我求助，我会一个接一个地帮助他们解决，并确保他们理解如何在 Windows 上操作。

下午，我会专注于我自己的代码，但我告诉所有人，任何时候遇到 Windows 问题都可以随时向我求助。

有位同事问我：“迈克，你怎么能如此慷慨地贡献你的时间？”

后来在一次绩效评估中，我收到了这样的反馈：

“迈克，我们有点担心。你最近的 productivity 还行，但不算出色。而且这很令人意外，因为在此期间，团队其他成员的 productivity 提高了很多。”

我咬紧牙关没有说话，但事后回想，我本该说：

“难道这不是雇佣我的目的吗？”