2026 02 05 HackerNews

2026-02-05 Hacker News Top Stories #

  1. 作者回忆作为深度思考者的沉浸式体验,担忧 AI 与代理工具以“足够好”的快速解法取代长期思考,导致创造性与成长感流失,并在效率与深度之间挣扎。
  2. 文章论证大型数据中心搬到太空在散热、发射和维护成本、通信带宽与轨道碎片风险等方面不可行,更像商业噱头而非技术可行方案。
  3. Mistral 发布开源 Voxtral Transcribe 2(含 Mini 与 Realtime),提供多语种、说话人分离、词级时间戳与低延迟/低成本的实时与批量转写,且可边缘部署。
  4. 因记者启用苹果锁定模式,FBI 无法解密其 iPhone,突显现代强加密与执法取证之间的紧张与冲突。
  5. Deno 推出云端轻量 microVM 沙箱,支持 JavaScript/Python、占位符式密钥注入和网络出口限制,便于安全执行不可信代码但仍存在密钥注入语义风险。
  6. Xcode 26.3 引入“代理编程”和模型上下文协议,允许在 IDE 内调用编码代理自动分解与修复任务以提升效率,但也引发对原生开发能力与长期维护的担忧。
  7. Anthropic 宣称将把 Claude 打造成无广告、以用户为中心的“思考空间”,通过企业合约和订阅获利,但其长期信念和合作透明性仍受质疑。
  8. 阿里开源 AliSQL 在 MySQL 上集成 DuckDB 列式引擎与原生向量索引,面向 HTAP 与相似搜索场景,并通过 binlog/GTID 保证分析节点与主库一致性。
  9. ghidra-mcp 提供生产级 MCP 服务与约百个工具端点,将 Ghidra 与现代 AI 自动化流程结合,便于批量化、跨版本的逆向工程与注释迁移。

我怀念深度思考 (I miss thinking hard) #

https://www.jernesto.com/articles/thinking_hard

作者在一篇博客文章中表达了对现代编程环境中“深度思考”逐渐消失的深切忧虑。他将自己人格分为两个部分:Builder(建造者)Thinker(思考者)。Builder 追求快速实现、交付成果,享受从想法到现实的转化;而 Thinker 则渴望长时间沉浸于复杂问题中,通过持续深入的思考找到创造性解决方案。

文章回顾了作者在大学物理学习时期的经历:面对难题时,他属于少数能坚持独立思考数日甚至数周的“思考者”,这种过程带来极大的满足感。他认为,正是这种深度思考,让他在软件工程中不断成长。

然而,随着 AI 工具的普及,这种成长感正在消失。尽管作者仍在编写更复杂、更多代码,但真正需要长时间思考的问题越来越少。AI 能快速生成“足够好”的解决方案,使他陷入“ vibe coding”——快速实现、高效交付,却失去了创造性突破的体验。

作者承认,从实用角度看,使用 AI 是理性的选择。但问题在于,他的“思考者”一面正在被严重压抑,而“建造者”一面又无法容忍低效的回归。他尝试通过重读物理教材等方式找回思考的乐趣,但难以说服自己投入无直接产出的智力劳动。

最终,作者坦承:他不知道如何调和这两者。或许,未来已不再可能同时满足 Builder 与 Thinker 的需求。这篇文章是一次真诚的自我反思,也反映了当代技术从业者在效率与深度之间日益加剧的内在冲突。


HN 热度 1199 points | 评论 662 comments | 作者:jernestomg | 21 hours ago #

https://news.ycombinator.com/item?id=46881264

  • 编程如同雕塑 clay,过程本身带来对作品本质的理解,而不仅仅是实现最初设想的方案。
  • 使用代理工具编程时,需要主动推动创新想法,否则容易被模型引导至平庸的常规解法,这种努力与手动编码的投入相当。
  • 与代理工具互动迫使开发者清晰表达创意边界,否则模型会自动“修正”并破坏独特性。
  • 外包开发与使用代理编程在本质上相似,若缺乏有效沟通与控制,都可能产出低质量结果。
  • 与外包团队相比,使用 LLM 的最大优势在于反馈循环极快,可随时重置和迭代,极大提升灵活性。
  • 外包人力虽具备创造性,但受制于绩效压力,往往更关注交付速度而非质量,导致创新受限。
  • 与人类团队合作存在大量无效会议和延迟,而与 LLM 交互则避免了这些瓶颈,效率更高。
  • 虽然外包工作可能令人沮丧,但通过优化流程、减少无意义会议,仍可改善体验。
  • 有效的会议应有明确目标、议程、预读材料、会议记录及后续行动项,但现实中执行困难。
  • 当前许多会议低效并非因为方法缺失,而是执行者缺乏责任感或意愿。
  • 与外部团队沟通时要求“享受垃圾输出”是荒谬的,真正的价值在于高质量协作与创造。

数据中心上天毫无意义 (Data centers in space makes no sense) #

https://civai.org/blog/space-data-centers

文章标题为《数据中心上天毫无意义》,发表于 2026 年 2 月 3 日,作者为 Andrew Yoon。文章批判了将大型数据中心部署至太空的设想,指出尽管 SpaceX 收购 xAI 后组建了估值 1.25 万亿美元的巨型企业,并推动太空数据中心计划,谷歌、Lonestar、Axiom、Starcloud 等公司也纷纷跟进,但这一构想在现实中存在根本性问题。

文章指出,尽管有无限太阳能、免费空间和巨型火箭等看似优势,但实际可行性极低。首先,训练前沿人工智能需要数十万甚至上百万块 GPU,若全部部署在太空中,需发射数十万甚至数百万颗卫星,远超目前地球轨道上约 1.5 万颗卫星的总数,将极大加剧“凯斯勒综合征”风险——即轨道碎片引发连锁碰撞,导致太空环境不可用。

其次,卫星无法像地面数据中心那样进行硬件升级。新一代 AI 芯片推出后,地面数据中心可快速部署,而太空中的卫星必须重新发射整支舰队,成本与效率完全不可比。

再者,太空数据中心的经济性难以成立。即便到 2035 年,火箭发射成本降至 200 美元/公斤,且技术成熟,其运行成本仍需持续低于地面数据中心。然而,地面太阳能等可再生能源成本持续下降,而太空能源系统无法实现同等效率,使得太空数据中心的相对优势不断缩小。

文章最后分析,尽管该想法明显不切实际,但企业与投资者仍蜂拥而入,原因在于商业动机:SpaceX 计划年内 IPO,需要制造市场热度;xAI 持续烧钱,急需融资;投资者只需预期能将项目转卖给下一位“接盘者”即可获利。由于太空数据中心实现时间极长,足够让资本泡沫持续膨胀,最终可能在泡沫破裂前“落地”前就已退潮。


HN 热度 1036 points | 评论 1223 comments | 作者:ajyoon | 1 day ago #

https://news.ycombinator.com/item?id=46876105

  • 空间环境为真空,无法通过传导或对流散热,只能依赖辐射散热,这极大限制了计算能力的提升,且散热系统会显著增加卫星重量。
  • 与地球上的数据中心相比,空间数据中心在成本、性能、维护、能效和垃圾处理等方面均无优势,建设成本远高于实际收益。
  • 星链卫星虽已实现 50 兆瓦级的总功率,但其功耗分布于数以万计的小型卫星中,单个卫星散热压力小,而大规模集中式空间数据中心则面临难以解决的热管理问题。
  • 将大量服务器部署在太空中并依靠无线通信连接,会导致节点间带宽降低、噪声增加、通信能耗上升,严重制约分布式计算效率。
  • 使用激光通信虽可提供高带宽(100-1000 Gbps)且功耗较低,但在大规模集群中仍存在信号干扰、同步复杂性和可靠性挑战。
  • 沙漠地区建数据中心虽有灰尘污染问题,但可通过倾斜面板设计和风力自清洁缓解,无需频繁人工清理,而空间散热问题却无类似简单解决方案。
  • 太空数据中⼼的构想可能并非出于实际技术需求,而是为了吸引投资、规避监管或转移竞争注意力,本质上是商业策略而非可行的技术路径。
  • 即使未来发射成本下降,空间数据中心仍无法在算力密度、能源利用效率和运维便利性上超越地面设施,尤其在人工智能等需要密集计算的应用场景中并无明显优势。
  • 若真有空间计算需求,如低重力制药或太空制造,应聚焦特定任务而非构建通用型数据中心,现有技术条件尚不足以支撑此类大规模基础设施。

Mistral AI 发布了新一代语音转写模型 (Voxtral Transcribe 2) #

https://mistral.ai/news/voxtral-transcribe-2

Mistral AI 发布了新一代语音转写模型 Voxtral Transcribe 2,包含两款产品:Voxtral Mini Transcribe V2 和 Voxtral Realtime。

Voxtral Mini Transcribe V2 专为批量转写设计,支持 13 种语言,具备高精度的说话人分离、词级时间戳和上下文偏置功能。其在 FLEURS 基准测试中达到约 4% 的词错误率,每分钟仅需 0.003 美元,性能优于 GPT-4o mini、Gemini 2.5 Flash 等主流模型,且处理速度更快、成本更低。适用于会议记录、访谈分析、合规审计等企业级场景。

Voxtral Realtime 面向实时应用,采用创新流式架构,可实现低于 200 毫秒的延迟,支持近似离线准确率的实时语音转写。同样支持 13 种语言,参数量仅 40 亿,可在边缘设备部署,保障隐私安全。该模型以 Apache 2.0 开源协议发布,可在 Hugging Face 上获取。

两款模型均支持长音频(最长 3 小时)、噪声环境鲁棒性及多语言处理,广泛应用于语音助手、客服自动化、媒体字幕、智能会议等场景。

Mistral Studio 推出全新音频体验区,用户可直接上传音频文件(支持 mp3、wav 等格式,单个不超过 1GB),实时测试转写效果,开启说话人分离、设置上下文关键词,并选择时间戳粒度。


HN 热度 696 points | 评论 169 comments | 作者:meetpateltech | 10 hours ago #

https://news.ycombinator.com/item?id=46886735

  • 该实时语音转录演示非常惊艳,即使快速说话并夹杂专业术语也能准确识别,包括 WebAssembly 等技术词汇。
  • 作为长期使用语音模型的开发者,认为此模型在实时和非实时场景下的表现远超此前所有产品,且为开源模型,令人感激。
  • 尝试双语混杂说话时,模型能正确识别,展现了出色的实时多语言处理能力。
  • 模型基于 Le Chat,说明其在实际应用中已具备强大性能。
  • 虽然整体表现令人印象深刻,但在混合语言(如法语与英语)时仍可能出现错误,例如将“pistolet”误识别为“redote”。
  • 部分用户反馈无法使用,可能与浏览器安全策略(如 CSP)或广告拦截插件有关,需关闭相关设置才能正常运行。
  • 有用户尝试使用孟加拉语,但模型却转录为印地语,说明其对孟加拉语支持有限,可能仅能识别相似语言。
  • 模型在背景音乐中仍能准确转录 Bad Bunny 的歌词,显示其在复杂音频环境下的强大能力。
  • 模型并非完全在浏览器中运行,而是服务器端处理,因模型大小约 7.5GB,难以在浏览器中运行。
  • 模型支持 13 种语言,包括英语、中文、西班牙语、俄语、德语等,但对波兰语等欧洲语言支持不佳,存在误识别为俄语或乌克兰语的情况。
  • 有用户指出,尽管公司强调欧洲背景,但对主要欧洲语言(如波兰语)支持不足,令人失望。
  • 模型在处理相似语言(如斯拉夫语系、罗曼语系)时,可能因语言相近而产生混淆,训练数据和参数设计需权衡区分能力。
  • 有用户在使用意大利语时被误识别为法语,但中途纠正后仍能识别,说明模型具备一定纠错能力。
  • 模型在清晰发音下表现优秀,即使有背景噪音也能准确识别,让人联想到早期的 Dragon NaturallySpeaking。
  • 该模型有望成为本地化语音转录的未来方向,尤其适用于隐私敏感场景。

FBI 因启用“紧急模式”无法解锁《华盛顿邮报》记者 iPhone (FBI couldn’t get into WaPo reporter’s iPhone because Lockdown Mode enabled) #

https://www.404media.co/fbi-couldnt-get-into-wapo-reporters-iphone-because-it-had-lockdown-mode-enabled/

FBI 在调查《华盛顿邮报》记者哈娜·纳塔森的泄密案时,突击搜查了她的住所,但未能解锁其被扣押的 iPhone,原因是设备启用了“紧急模式”(Lockdown Mode)。这一功能是苹果设备的一项安全特性,旨在增强对高风险用户的防护,显著提升设备抵御黑客攻击的能力。根据最新提交的法庭文件,FBI 仅能访问部分数据,而无法获取受保护的加密内容,这表明 Lockdown Mode 在当前情况下确实有效。然而,文件也暗示 FBI 可能仍会尝试其他技术手段突破防护。该事件为公众提供了罕见的窗口,了解现代执法机构在面对强加密设备时的实际挑战。文章由 404 Media 科技记者约瑟夫·考克斯撰写,强调了个人设备安全功能在对抗政府监控中的重要性。


HN 热度 538 points | 评论 469 comments | 作者:robin_reala | 10 hours ago #

https://news.ycombinator.com/item?id=46886237

  • FBI 无法破解华盛顿邮报记者的 iPhone,因为启用了锁定模式,但能通过 Touch ID 访问其工作电脑上的 Signal 消息。
  • 政府机构无法强迫用户提供密码,但可以强制使用生物识别解锁设备。
  • 建议使用 Bookmarklet 等工具自动将 X.com 等平台重定向至替代网站,以规避潜在的审查或数据追踪。
  • 马斯克作为“万亿富豪”被频繁提及,其财富和影响力引发广泛讨论。
  • 对马斯克在 DOGE 导致全球援助中断的后果表示担忧,有人估算可能造成数十万无辜死亡。
  • 有人认为马斯克的科技贡献(如火箭、电动车)无法抵消其对社会造成的负面影响。
  • 有人指出美国对外援助存在腐败问题,但不能因此否定所有援助的积极意义。
  • 有人认为美国没有道德义务向全球提供援助,若真关心可自行捐赠。
  • 有人强调对外援助是美国维持全球影响力和稳定的战略手段。
  • 有人批评将援助资金用于科技项目而非国内医疗等基本需求,认为这种优先级不合理。
  • 有人指出美国历史上在海外的干预行为,使得对外援助具有一定的道德责任。
  • 有人认为马斯克对极右翼政党的支持可能引发种族清洗等严重后果。
  • 有人认为马斯克与有儿童性剥削前科者交往的行为令人极度反感,不应因其成就而被原谅。
  • 有人认为即使个人有严重道德瑕疵,也不能否定其技术贡献,如爱迪生也曾是争议人物。
  • 有人质疑在面对系统性不公时,个人发声是否真的有效,表达对改变现状的无力感。
  • 有人强调儿童性侵是严重犯罪,不能以“净收益”来衡量,必须追究责任。

Deno Sandbox:安全运行不可信代码的轻量级沙箱环境 (Deno Sandbox) #

https://deno.com/blog/introducing-deno-sandbox

Deno Sandbox 是 Deno 推出的一项全新功能,专为安全运行由 LLM 生成或用户提交的不可信代码而设计。它提供轻量级的 Linux 微虚拟机(microVM),在 Deno Deploy 云端运行,实现计算与网络的深度隔离。

该功能核心解决了两个关键问题:防止敏感信息泄露和控制网络出口。Secrets(如 API 密钥)不会直接暴露给代码,而是以占位符形式呈现。只有当代码尝试访问被授权的主机(如 api.openai.com)时,真实密钥才会动态注入,阻止恶意代码通过伪造请求窃取密钥。

网络访问受到严格控制,可通过配置 allowNet 限制 sandbox 只能连接指定域名。所有未授权的网络请求均在 VM 边界被拦截,实现“出口即管控”的安全策略。

Deno Sandbox 支持通过 JavaScript 或 Python SDK 快速创建,启动时间低于 1 秒。用户可通过 SSH、HTTP 或直接在浏览器中打开 VS Code 进入沙箱环境,实现高效开发与调试。

沙箱可直接部署为生产环境,调用 sandbox.deploy() 即可将开发环境一键发布到 Deno Deploy,无需重建或重新认证,实现从开发到生产的无缝衔接。

支持持久化存储,提供体积(Volumes)和快照(Snapshots)机制。可将常用工具链(如 apt-get 安装的软件)打包成快照,每次启动自动加载,极大提升环境初始化效率。

技术规格:支持 2 vCPU,内存 768MB 至 4GB,最大生命周期 30 分钟,支持按需延长。部署区域包括阿姆斯特丹和芝加哥。

定价采用按使用量计费模式,包含在 Deno Deploy Pro 计划中,提供免费额度(如 40 小时 CPU、1000 GB·h 内存、5 GiB 体积存储)。企业用户可联系 deploy@deno.commailto:deploy@deno.com 获取定制方案。

Deno Sandbox 适用于 AI 代理执行代码、编程协作环境、安全插件系统、临时 CI/CD 运行器以及客户自定义代码执行等场景。现已进入 Beta 阶段,可访问 deno.com/sandbox 获取文档与 SDK。


HN 热度 515 points | 评论 162 comments | 作者:johnspurlock | 1 day ago #

https://news.ycombinator.com/item?id=46874097

  • Deno Sandbox 提供了 Python 客户端 SDK,允许用户在不使用 Deno 与 JavaScript 的情况下调用其功能,通过 WebSockets 协议进行通信。
  • 该沙箱运行在 Deno Deploy 云端,而非本地机器,因此安全性和隔离性依赖于云端基础设施。
  • 沙箱通过“占位符”机制保护敏感信息,真实密钥仅在向受信任主机发起请求时才注入,防止恶意代码窃取。
  • 这种设计类似于 Fly.io 项目的 Tokenizer,即通过代理层处理密钥注入,避免应用本身接触真实凭证。
  • 该方案的安全性依赖于对目标主机和请求内容的严格控制,若缺乏上下文理解,可能被利用于反射攻击或数据泄露。
  • 对于复杂认证体系如 AWS,可通过 IAM 条件策略限制密钥使用范围(如仅限特定 VPC 或网络),从而增强安全性。
  • 机器绑定的 Macaroons 技术可进一步解决 IMDS 等漏洞问题,确保密钥只能在特定设备上使用,提升防篡改能力。
  • 该技术理念与多年前用于 PCI-DSS 合规的 SaaS 数据令牌化服务相似,均通过中间代理实现敏感数据隔离。
  • 有开发者正在构建基于 Envoy 透明代理与外部授权服务器的本地沙箱系统,支持自定义授权逻辑与多因素身份验证。
  • 若代理仅替换占位符而不了解请求语义,则存在风险:恶意程序可能将占位符放入非敏感字段中,诱导系统将其替换为真实密钥并泄露。
  • 为防范此类风险,需对 API 的哪些字段可包含密钥进行预定义或配置,否则难以保证所有场景下的安全性。

Xcode 26.3 – 开发者可直接在 Xcode 中使用编码代理 (Xcode 26.3 – Developers can leverage coding agents directly in Xcode) #

https://www.apple.com/newsroom/2026/02/xcode-26-point-3-unlocks-the-power-of-agentic-coding/

苹果公司于 2026 年 2 月 3 日发布 Xcode 26.3 更新,正式引入“代理编程”(agentic coding)功能,显著提升开发者在构建应用时的效率与创造力。

该功能允许开发者在 Xcode 中直接调用先进的编码代理,包括 Anthropic 的 Claude Agent 和 OpenAI 的 Codex,实现从任务分解到决策执行的全流程自主协作。这些代理可访问项目架构,自动搜索文档、探索文件结构、修改项目设置,并通过 Xcode 预览功能验证代码效果,实现快速迭代与修复。

Xcode 26.3 在前代版本引入的 Swift 智能编码助手基础上进一步升级,使代理能够深度集成于开发全生命周期中。开发者无需切换工具,即可借助强大模型的推理能力,加速应用开发进程。

此外,苹果推出了“模型上下文协议”(Model Context Protocol),这是一个开放标准,允许开发者接入任何兼容的代理或工具,提升平台灵活性与生态兼容性。

该版本现已作为候选版本向苹果开发者计划成员开放,预计不久将上线 App Store。苹果全球开发者关系副总裁苏珊·普雷斯科特表示,此举旨在将前沿技术直接赋能开发者,让他们更专注于创新。


HN 热度 359 points | 评论 314 comments | 作者:davidbarker | 1 day ago #

https://news.ycombinator.com/item?id=46874619

  • 有资深 iOS 开发者表示,虽然 Xcode 体验不佳,但使用 React Native 结合命令行工具(如 Fastlane)可完全避免使用 Xcode,实现高效开发,且应用审核通过率高。
  • 有人担忧这种开发模式会导致未来招聘困难,因为缺乏原生 iOS 开发经验的候选人可能难以接手项目,尤其在团队缺乏技术传承的情况下。
  • 有开发者指出,React Native 虽能快速实现功能,但若项目依赖大量“原生功能点缀”,长期维护成本高,且在处理复杂原生功能(如认证)时仍需深厚原生开发经验。
  • 有人认为,React Native 项目在 App Store 审核中可能面临更严格的审查,尤其当应用功能与网页高度相似时,容易被判定为“非原生体验”。
  • 有开发者对比了早期移动开发(如 J2ME、Symbian)与现代开发工具,认为当前开发环境已极大改善,Xcode 虽有缺陷,但相比过去已是巨大进步。
  • 有人强调,若企业重视应用质量与生态扩展(如 Widget、手表端支持等),原生开发仍是必要选择,React Native 在资源受限场景下性能不足。
  • 有观点认为,React Native 的流行部分源于“服务器驱动用户界面”(SDUX)失败后的替代方案,但这类架构常导致客户端逻辑混乱、职责不清。
  • 部分开发者表示,Android Studio 虽有改进,但整体体验仍不如 Xcode 稳定,尤其在复杂项目中工具链问题频发。
  • 有人建议使用轻量级 AI 辅助开发工具(如 KiloCode)替代 Cursor,认为其性价比更高,且支持更多模型选项。
  • 有开发者指出,Xcode 存在诸多痛点,如诊断错误不准确、预览功能体验差、Swift 6 并发代码调试困难、无法同时编辑依赖的 Swift 包等。

Claude:一个专注思考的无广告空间 (Claude is a space to think) #

https://www.anthropic.com/news/claude-is-a-space-to-think

Claude 作为一款人工智能助手,明确承诺保持无广告状态。公司认为,将广告引入与用户的对话中会破坏其作为深度思考和工作辅助工具的核心定位。与搜索引擎或社交媒体不同,用户在与 Claude 对话时往往分享敏感或私密信息,这种开放性使对话更易受到商业利益的影响,从而削弱信任。

广告可能带来不当的激励机制。例如,当用户提及睡眠问题时,一个无广告的助手会专注于提供真正有帮助的建议,而广告支持的系统则可能倾向于推荐可获利的产品,导致用户难以分辨建议的真实意图。即使广告不直接影响回答内容,仅出现在界面中也会分散注意力,促使产品优化“使用时长”等指标,而这与“真正有用”的目标未必一致。

尽管存在其他广告模式(如用户主动选择),但历史经验表明,一旦引入广告,其影响往往会逐步扩大,模糊原本清晰的边界。因此,Anthropic 决定不引入此类机制。

公司的商业模式基于企业合同和订阅服务,收入用于持续改进 Claude。同时,为推动公共利益,已向全球 60 多个国家的教育机构提供工具与培训,并对非营利组织给予大幅折扣。免费版本也持续保持前沿智能水平,未来可能根据需求推出更多价格层级。

未来,Claude 将支持用户自主发起的商业活动,如代理购物、预订等,所有第三方交互均以用户主动请求为前提,确保 AI 始终服务于用户自身目标,而非广告商。

最终,Claude 的设计目标是成为一个专注、可信的思维伙伴,如同一张干净的纸或一块黑板,不被广告干扰。


HN 热度 340 points | 评论 182 comments | 作者:meetpateltech | 13 hours ago #

https://news.ycombinator.com/item?id=46884883

  • Anthropic 发布的“Claude 是思考的空间”这类声明类似于过去“不作恶”的口号,可能在面临压力时被抛弃,目前的积极表态或许只是因为公司现状良好。
  • 当前互联网充斥着广告、自动播放视频和数据收集,用户体验极差,而使用 Claude 等 AI 工具查询信息比传统搜索引擎更尊重用户尊严。
  • 以 Claude 为代表的大型语言模型提供了一种类似早期互联网的纯净感,充满探索性和可能性,但这种理想状态能否持续尚不确定。
  • 现有大模型生成的内容存在严重不一致问题,例如多次询问同一问题会得到差异较大的答案,影响可信度。
  • 尽管有人质疑大模型结果不稳定,但实测表明在相同模式下回答具有高度一致性,说明问题可能出在具体使用方式或模型版本上。
  • 使用 Perplexity 等工具作为信息聚合器,通过点击溯源可获得更可靠的结果,但需要用户具备一定的判断力和主动意识。
  • Anthropic 在多个方面表现出“正向价值观”:拒绝广告、反对 AI 监管立法、拒绝参与致命武器项目,这些行为值得肯定。
  • 与 Palantir 的合作令人担忧,其实际合作内容不透明,可能带来伦理风险。
  • 随着竞争加剧,Anthropic 曾转向寻求威权投资者,表明其立场可能随商业利益而改变,引发对初心真实性的怀疑。
  • 公司宣称的价值观更多是营销策略而非内在信念,其“道德形象”本质上是为吸引用户和资本服务的工具。
  • 企业本身不具备道德主体性,只受经济激励驱动,所谓“价值观”不过是包装宣传,不能真正信任。
  • 无法轻易区分营销话术与真实价值观,但当前 Anthropic 的行为尚未明显背离其公开承诺,仍有一定可信度。

AliSQL:集成向量与 DuckDB 引擎的阿里巴巴开源 MySQL (AliSQL: Alibaba’s open-source MySQL with vector and DuckDB engines) #

https://github.com/alibaba/AliSQL

AliSQL 是阿里巴巴集团推出的 MySQL 分支版本,专为生产环境设计,支持高并发、高可用的数据库需求。该版本在保持 100% MySQL 兼容性的基础上,集成了多项企业级增强功能,特别适用于混合负载场景。

核心亮点包括:

  • DuckDB 列式存储引擎:实现高达 200 倍的分析查询性能提升,适用于 OLAP 场景。
  • 原生向量索引(VIDX):内置 HNSW 算法,支持高达 16,383 维的向量相似性搜索,适用于 AI/ML 应用。
  • DDL 优化:实现快速 DDL 操作,支持并行 B+ 树构建与无锁操作,提升元数据变更效率。
  • RTO 优化:加速崩溃恢复,显著缩短实例重启时间。
  • 复制增强:支持 binlog 并行刷盘、binlog 写入 redo 日志、大事务优化等,提升主从同步性能。

支持多种部署方式:

  • 可通过源码构建,使用 build.sh 脚本完成编译与安装。
  • 提供专用的 DuckDB 分析节点配置指南,便于构建混合分析架构。

项目开源,遵循开源许可协议,欢迎开发者参与贡献。文档与开发指南可在 Wiki 和 README 中查阅,支持中文与英文双语。


HN 热度 282 points | 评论 45 comments | 作者:baotiao | 1 day ago #

https://news.ycombinator.com/item?id=46875228

  • AliSQL 通过 MySQL 的 binlog 机制实现只读列式存储(DuckDB)节点,利用 GTID 确保数据一致性,支持在 binlog 开启和关闭两种场景下的事务一致性处理。
  • 将 DuckDB 作为存储引擎集成到 MySQL 中,可在不改变现有连接、工具和复制拓扑的前提下,将分析查询路由到列式引擎,降低运维复杂性。
  • 数据一致性是混合 OLTP/OLAP 系统的关键挑战,AliSQL 通过在崩溃恢复时进行幂等写入、记录有效 binlog 位置等机制保障 DuckDB 与主库数据一致。
  • 相比 PostgreSQL 的 pg_duckdb,AliSQL 的设计更依赖 MySQL 的 binlog 和插件化存储架构,而 PostgreSQL 可通过 FDW 或 pg_lake 等机制实现类似功能。
  • 有人认为 PostgreSQL 的扩展能力更强,如 FDW、WAL 扩展、逻辑复制等,可更灵活地构建类似方案,不应简单类比 MySQL 的架构。
  • OrioleDB 作为 SQL Server 的存储引擎,理论上更适合与 DuckDB 结合实现数据一致性,但其尚未正式发布,生产使用仍有限。
  • 该方案本质上是 HTAP(混合事务/分析处理)的实现,通过持续从事务负载中摄取数据,减少对 Kafka、Debezium 等中间件的依赖。
  • 该技术方案在 MySQL 内部实现高效、事务一致的分析数据同步,是当前 HTAP 趋势中的重要进展。

Show HN: Ghidra MCP Server – 110 个工具助力 AI 辅助逆向工程 (Show HN: Ghidra MCP Server – 110 tools for AI-assisted reverse engineering) #

https://github.com/bethington/ghidra-mcp

这是一个基于 Ghidra 的生产级 Model Context Protocol (MCP) 服务器项目,名为 ghidra-mcp。该项目由 Ben Ethington 维护,是 LaurieWired/GhidraMCP 仓库的 fork 版本,旨在将 Ghidra 强大的逆向工程能力与现代 AI 工具及自动化框架无缝集成。

项目核心功能包括:132 个 MCP 端点、跨二进制文件的文档传递、批量分析、无头模式运行以及 Docker 部署支持,适用于 AI 驱动的逆向工程工作流。

主要特性涵盖:

  • 全面的 MCP 协议兼容性,提供 110 个可用工具;
  • 实时分析能力,可与 Ghidra 内部分析引擎联动;
  • 支持函数分析(反编译、调用图、交叉引用)、数据结构自动识别、字符串提取、符号表导出和内存布局文档化;
  • 跨版本二进制函数哈希匹配,实现多版本代码一致性分析;
  • 自动化开发流程,支持脚本创建、执行与管理,可同时处理多个程序并进行批量重命名、注释和类型标注。

技术栈方面,项目使用 Java 21 LTS、Apache Maven 3.9+、Ghidra 12.0.2 及 Python 3.8+,并通过 .env 配置管理环境变量,支持通过 PowerShell 和批处理脚本完成部署与库复制。

项目已更新至兼容 Ghidra 12.0.2,修复了大量版本引用问题,并引入了更完善的测试套件、非破坏性集成测试、配置验证工具和文档重构。此外,提供了完整的 CI/CD 流水线、Docker 化部署方案及详细的快速入门指南。

开源协议为 Apache-2.0,鼓励用户通过星标(⭐)支持项目,帮助更多开发者发现该工具。


HN 热度 269 points | 评论 63 comments | 作者:xerzes | 18 hours ago #

https://news.ycombinator.com/item?id=46882389

  • 该工具通过函数逻辑结构哈希实现跨版本反向工程的自动化标注迁移,解决了因重编译导致地址偏移使原有注释失效的问题。
  • 与 Ghidra 内置的 FunctionID 或 Bindiff 相比,其哈希系统更注重逻辑结构而非字节或绝对地址,能有效应对代码布局变化带来的影响。
  • 相较于 Ghidra 自带的 Version Tracker,该方案采用更全面的哈希策略,并结合多种启发式方法进行函数关联,提升匹配准确性。
  • 与 ReVa、Binary Ninja 的 WARP 等工具相比,该系统提供更丰富的 110 个 MCP 工具集,支持批量处理和持续集成环境下的自动化分析。
  • 该工具在实际测试中成功实现了从多个《暗黑破坏神 2》补丁版本间自动迁移超过 1300 个函数的注释信息,验证了其有效性。
  • 工具支持无 GUI 的头文件模式运行于 Docker 容器中,便于在自动化流程中集成,且配置方式灵活(.env 文件)。
  • 用户反馈安装后无法在 Ghidra 中看到插件,怀疑文档不完整或安装方式存在问题,建议使用 GH Discussions 作为主要沟通渠道。
  • 有用户指出该项目已远超原分支(LaurieWired/GhidraMCP),提交历史显示已领先 110 个提交,代码差异显著。
  • 在与 Claude、Gemini、Qwen 等大模型结合使用时,发现 Claude 在生成准确代码方面表现优于 Gemini,后者常出现遗漏关键逻辑的情况。
  • 利用大模型进行反向工程可显著提升效率,尤其在处理老旧游戏或加密逻辑时,能快速提取密钥或重构功能代码。
  • 有案例表明,通过将反汇编代码与外部符号定义以 RAG 方式输入给大模型,可生成接近人工水平的伪代码,再经迭代优化形成可用代码。
  • 该工具为开发者提供了强大的自动化反向工程能力,尤其适合需要长期维护多版本二进制分析的场景。

Hacker News 精彩评论及翻译 #

Data centers in space makes no sense #

https://news.ycombinator.com/item?id=46878977

I would not assume cooling has been worked out.

Space is a vacuum. i.e. The lack-of-a-thing that makes a thermos great at keeping your drink hot. A satellite is, if nothing else, a fantastic thermos. A data center in space would necessarily rely completely on cooling by radiation, unlike a terrestrial data center that can make use of convection and conduction. You can’t just pipe heat out into the atmosphere or build a heat exchanger. You can’t exchange heat with vacuum. You can only radiate heat into it.

Heat is going to limit the compute that can be done in a satellite data centre and radiative cooling solutions are going to massively increase weight. It makes far more sense to build data centers in the arctic.

Musk is up to something here. This could be another hyperloop (i.e. A distracting promise meant to sabotage competition). It could be a legal dodge. It could be a power grab. What it will not be is a useful source of computing power. Anyone who takes this venture seriously is probably going to be burned.

beloch

我不会想当然地认为散热问题已经解决。

太空是真空。也就是说,正是因为什么都没有,保温瓶才能让你的饮料保持温暖。一颗卫星,即便不说别的,也极像一个极好的保温瓶。与地球上的数据中心可以利用对流和导热来散热不同,太空中的数据中心必然会完全依赖辐射散热。你不能简单地将热量通过管道排放到大气中,或建造一个热交换器。你无法与真空交换热量,只能将热量辐射到其中。

热量将限制卫星数据中心的计算能力,而辐射散热方案又会大大增加其重量。在北极建造数据中心要明智得多。

马斯克这次是在搞什么名堂。这可能是另一个“超回路列车”项目(即一个旨在分散注意力、破坏竞争的承诺)。也可能是一种法律上的规避手段,也可能是一次权力争夺。但它绝不会是一个有用的计算能力来源。任何认真对待这个项目的人,很可能会因此吃大亏。


I miss thinking hard #

https://news.ycombinator.com/item?id=46881543

This March 2025 post from Aral Balkan stuck with me:

https://mastodon.ar.al/@aral/114160190826192080

“Coding is like taking a lump of clay and slowly working it into the thing you want it to become. It is this process, and your intimacy with the medium and the materials you’re shaping, that teaches you about what you’re making – its qualities, tolerances, and limits – even as you make it. You know the least about what you’re making the moment before you actually start making it. That’s when you think you know what you want to make. The process, which is an iterative one, is what leads you towards understanding what you actually want to make, whether you were aware of it or not at the beginning. Design is not merely about solving problems; it’s about discovering what the right problem to solve is and then solving it. Too often we fail not because we didn’t solve a problem well but because we solved the wrong problem.

When you skip the process of creation you trade the thing you could have learned to make for the simulacrum of the thing you thought you wanted to make. Being handed a baked and glazed artefact that approximates what you thought you wanted to make removes the very human element of discovery and learning that’s at the heart of any authentic practice of creation. Where you know everything about the thing you shaped into being from when it was just a lump of clay, you know nothing about the image of the thing you received for your penny from the vending machine.”

gyomu

Aral Balkan 在 2025 年 3 月的这篇帖子让我印象深刻:

https://mastodon.ar.al/@aral/114160190826192080

“编程就像拿一块黏土,慢慢将它塑造成你想要的样子。正是这个过程,以及你对所塑造的媒介和材料的熟悉,让你逐渐了解你所创造的东西——它的特性、公差和极限——即使你正在创造它。在你真正开始动手创造的那一刻,你对它的了解最少。那时你以为自己清楚想要创造什么。而这个迭代的过程,会引导你理解自己真正想要创造什么,无论你最初是否意识到这一点。设计不仅仅是解决问题;更是要发现值得解决的问题,然后去解决它。我们之所以常常失败,往往不是因为没能很好地解决问题,而是因为我们解决了错误的问题。

当你跳过创造的过程,你本可以学会创造的东西,就变成了你以为想要创造的那个拙劣模仿品。得到一件烤制并上釉、近似于你最初想法的成品,却抹去了任何真实创作实践核心中的人类探索与学习元素。当你知道一件从黏土块到成型的作品的一切时,你对于从自动售货机花一分钱买来的那个东西的影像,却一无所知。”


New York’s budget bill would require “blocking tec… #

https://news.ycombinator.com/item?id=46879497

My main concern is, how long is it before you can’t print a replacement part for something you bought because it looks too similar to an OEM part and the manufacturer doesn’t think you should be able to do that so they throw a little money to the right politician.

robflynn

我最担心的是,到底要过多久,当你想为自己购买的东西打印一个替换零件时,会仅仅因为它看起来和原厂零件太相似,制造商就认为你不应该这么做,然后他们再花点钱打点一下合适的政客,最后导致你无法打印了。


I miss thinking hard #

https://news.ycombinator.com/item?id=46881716

I don’t get it.

I think just as hard, I type less. I specify precisely and I review.

If anything, all we’ve changed is working at a higher level. The product is the same.

But these people just keep mixing things up like “wow I got a ferrari now, watch it fly off the road!”

Yeah so you got a tools upgrade; it’s faster, it’s more powerful. Keep it on the road or give up driving!

We went from auto completing keywords, to auto completing symbols, to auto completing statements, to auto completing paragraphs, to auto completing entire features.

Because it happened so fast, people feel the need to rename programming every week. We either vibe coders now, or agentic coders or … or just programmers hey. You know why? I write in C, I get machine code, I didn’t write the machine code! It was all an abstraction!

Oh but it’s not the same you say, it changes every time you ask. Yes, for now, it’s still wonky and janky in places. It’s just a stepping stone.

Just chill, it’s programming. The tools just got even better.

You can still jump on a camel and cross the desert in 3 days. Have at it, you risk dying, but enjoy. Or you can just rent a helicopter and fly over the damn thing in a few hours. Your choice. Don’t let people tell you it isn’t travelling.

We’re all Linus Torvalds now. We review, we merge, we send back. And if you had no idea what you were doing before, you’ll still have no idea what you’re doing today. You just fat-finger less typos today than ever before.

keyle

我不明白。

我思考得同样努力,但打的字更少了。我会精确地提出要求,然后对结果进行复核。

退一步说,我们改变的只是工作层面更高了,但实际产出物还是一样的。

但这些人就是喜欢把事情搞混,就好像在说:“哇,我现在有法拉利了,看它飞出赛道!”

是啊,你只是升级了工具,它更快,也更强了。要么就老老实实开在路上,要么就别开了!

我们经历了从自动补全关键词、符号、语句、段落,到如今能自动补全整个功能的过程。

因为这一切发生得太快了,以至于人们每周都觉得有必要给编程重新命名。我们现在要么是“vibe程序员”,要么是“代理型程序员”,或者……嘿,说到底不就还是程序员嘛。你知道为什么吗?

我用C语言编程,得到的是机器码,但我没写机器码!这一切都是抽象!

哦,但你说这不一样,每次提问都会得到不同的答案。是的,至少目前,它在某些方面仍然很粗糙、很卡顿。但这只是一个垫脚石。

冷静点,这还是编程,只是工具变得更好了。

你仍然可以骑上骆驼,花三天时间穿越沙漠。尽管去尝试吧,冒着死掉的风险,但享受过程。或者你也可以租架直升机,在几小时内就飞过该死的地方。随你便。别让别人告诉你这不是在旅行。

我们现在都成了林纳斯·托瓦兹。我们审查代码,合并请求,然后退回。而且,如果你以前不知道自己在干嘛,那今天你依然不知道。只是你打错字的概率比以前低多了。


New York’s budget bill would require “blocking tec… #

https://news.ycombinator.com/item?id=46873220

This is insanely stupid stuff. Even the UK with our weird panic over Incredibly Specific Knives hasn’t tried to do this kind of technical restriction to prevent people printing guns. Why not? Because nobody is printing guns! It’s an infeasible solution to a non-problem!

Someone should dig into who this is coming from and why. The answers are usually either (a) they got paid to do it by a company selling the tech, which appears not to be the case here, or (b) they went insane on social media.

(can’t confirm this personally, but it seems from other comments that it’s perfectly feasible to just drive out of New York State and buy a gun somewhere else in the gun-owning US? And this is quite likely where all the guns used in existing NY crime come from?)

I would also note that the Shinzo Abe doohickey wasn’t 3D-printed.

pjc50

这真是愚蠢至极。就连英国对我们那些关于“极其特定刀具”的恐慌都还没尝试过用这种技术手段来阻止人们打印枪支。为什么不呢?因为根本没人打印枪支!这是一个针对并不存在的问题提出的、完全行不通的解决方案!

有人应该深挖一下这件事的来源和动机。答案通常要么是 (a) 他们收了相关技术公司的钱,但在这里似乎并非如此;要么就是 (b) 他们在社交媒体上脑子进水了。

(我无法亲自证实这一点,但从其他评论来看,似乎只要开车离开纽约州,就能在美国其他允许拥枪的地方买到枪?而这很可能就是纽约现有犯罪案件中所有枪支的来源?)

我也想指出一点,安倍晋三遇刺所用的那个玩意儿并不是3D打印的。


X offices raided in France as UK opens fresh inves… #

https://news.ycombinator.com/item?id=46881916

To people claiming a physical raid is pointless from the point of gathering data :

  • you are thinking about a company doing good things the right way. You are thinking about a company abiding by the law, storing data on its own server, having good practices, etc.

The moment a company starts to do dubious stuff then good practices start to go out the window. People write email with cryptic analogies, people start deleting emails, … then as the circumvention become more numerous and complex, there needs to still be a trail in order to remain understandable. That trail will be in written form somehow and that must be hidden. It might be paper, it might be shadow IT but the point is that if you are not just forgetting to keep track of coffee pods at the social corner, you will leave traces.

So yes, raids do make sense BECAUSE it’s about recurring complex activities that are just too hard to keep in the mind of one single individual over long periods of time.

utopiah

对于那些声称实地搜查对于收集数据来说毫无意义的人:

  • 你们是在想一家用正确方式做好事的公司。你们想的是一家遵守法律、将数据存储在自己的服务器上、拥有良好实践的公司。

一旦一家公司开始做可疑的事情,良好的实践就开始被抛之脑后。人们会用隐晦的比喻写邮件,人们开始删除邮件……随着规避手段变得越来越多、越来越复杂,为了保持可追溯性,仍然需要留下一条线索。这条线索会以某种书面形式存在,并且必须被隐藏。可能是纸质文件,也可能是影子IT,但关键是,如果你不只是忘了记录社交角落的咖啡豆,你总会留下痕迹。

所以,是的,搜查是有意义的,因为这是关于重复的复杂活动,这些活动对于任何单个人来说,都太难在长时间内仅靠记忆来掌握了。


Data centers in space makes no sense #

https://news.ycombinator.com/item?id=46880580

I was talking to someone about this the other day. I was part of a team at NASA that developed a cooling system for the ISS and this whole premise makes no sense to me.

  1. Getting things to space is incredibly expensive

  2. Ingress/egress are almost always a major bottleneck - how is bandwidth cheaper in space?

  3. Chips must be “Rad-hard” - that is do more error correcting from ionizing radiation - there were entire teams at NASA dedicated to special hardware for this.

  4. Gravity and atmospheric pressure actually do wonders for easy cooling. Heat is not dissipated in space like we are all used to and you must burn additional energy trying to move the heat generated away from source.

  5. Energy production will be cheaper from earth due to mass manufacturing of necessary components in energy systems - space energy systems need novel technology where economies of scale are lost.

Would love for someone to make the case for why it actually makes total sense, because it’s really hard to see for me!

elamje

前几天我和人聊过这个话题。我当时是NASA一个团队的一员,负责为国际空间站开发冷却系统,而这个整个前提对我来说完全不合逻辑。

  1. 将物品送入太空的成本极其高昂。
  2. 进出(航天器)几乎总是一个主要的瓶颈——太空中的带宽怎么会更便宜?
  3. 芯片必须是“抗辐射的”——也就是说,它们需要具备更强的电离辐射纠错能力——当时在NASA,有专门的团队致力于为此研发特殊硬件。
  4. 重力和大气压力实际上对散热大有裨益。热量在太空中的散逸方式和我们习惯的完全不同,你必须消耗额外的能量来将产生的热量从源头带走。
  5. 能源生产在地球上会更便宜,因为能源系统所需组件可以进行大规模生产——而太空能源系统需要新技术,这会失去规模经济的优势。

真的希望有人能站出来,告诉我这一切到底在什么意义上是完全合理的,因为我真的很难看出其中的道理!


France dumps Zoom and Teams as Europe seeks digita… #

https://news.ycombinator.com/item?id=46876302

I work at Grist, the “tableur collaboratif” (collaborative spreadsheet) listed on the La Suite homepage. We’re in the interesting situation of being both a NYC-based company, and open source software the French gov has adopted and is helping to develop. Grist is mostly a node backend. So it is a complicated story. The key is having code the gov can review and trust and run it on sovereign infrastructure.

Grist https://www.getgrist.com/

A write-up of how the French gov uses it https://interoperable-europe.ec.europa.eu/collection/open-source-observatory-osor/news/grist-joins-suite-numerique-public-administration

paulfitz

我在 Grist 工作,Grist 是“La Suite”首页上列出的“tableur collaboratif”(协作电子表格)。我们处于一个很有意思的境地:我们是一家总部位于纽约的公司,同时,我们的开源软件也被法国政府采纳并正在协助其开发。Grist 的后端主要是基于 Node.js 的,所以这是一个复杂的故事。关键在于要有政府能够审查、信任的代码,并在其主权基础设施上运行。

Grist https://www.getgrist.com/

一篇关于法国政府如何使用 Grist 的文章 https://interoperable-europe.ec.europa.eu/collection/open-source-observatory-osor/news/grist-joins-suite-numerique-public-administration


Agent Skills #

https://news.ycombinator.com/item?id=46871907

This stuff smells like maybe the bitter lesson isn’t fully appreciated.

You might as well just write instructions in English in any old format, as long as it’s comprehensible. Exactly as you’d do for human readers! Nothing has really changed about what constitutes good documentation. (Edit to add: my parochialism is showing there, it doesn’t have to be English)

Is any of this standardization really needed? Who does it benefit, except the people who enjoy writing specs and establishing standards like this? If it really is a productivity win, it ought to be possible to run a comparison study and prove it. Even then, it might not be worthwhile in the longer run.

iainmerrick

这些东西的气味表明,人们或许并未真正理解“苦涩的教训”的内涵。

你完全可以用任何旧格式直接写英文指令,只要内容清晰易懂。这和为人类读者写文档的做法如出一辙!对于什么样的才算好文档,其实本质并没有变。(编辑补充:我这里显得有些狭隘了,指令不一定要用英文写)

这些标准化真的有必要吗?除了那些喜欢编写规范和制定此类标准的人之外,到底谁会从中受益?如果这真能提升生产力,那理应可以通过对比研究来证明。即便如此,从长远来看,可能也并不划算。


I miss thinking hard #

https://news.ycombinator.com/item?id=46881725

And when programming with agentic tools, you need to actively push for the idea to not regress to the most obvious/average version. The amount of effort you need to expend on pushing the idea that deviates from the ’norm’ (because it’s novel), is actually comparable to the effort it takes to type something out by hand. Just two completely different types of effort.

There’s an upside to this sort of effort too, though. You actually need to make it crystal clear what your idea is and what it is not, because of the continuous pushback from the agentic programming tool. The moment you stop pushing back, is the moment the LLM rolls over your project and more than likely destroys what was unique about your thing in the first place.

helloplanets

在使用智能体工具编程时,你必须主动推动想法,防止其退化为最平庸或最普通的版本。为了推动一个偏离“常规”的创新想法,你所付出的努力,实际上与亲手敲出代码所花的精力相当。只是这是两种完全不同类型的努力。

不过,这种努力也有其好处。由于智能体编程工具会持续提出反驳,你反而需要把你的想法是什么、不是什么,阐述得一清二楚。一旦你停止推动,大语言模型就会接管你的项目,并且极有可能摧毁其中最独特的东西。


France dumps Zoom and Teams as Europe seeks digita… #

https://news.ycombinator.com/item?id=46874040

Refreshing. No more Teams? Sounds like a dream… Of all the crapware I am forced to work with, Teams really pushes the envelope in every single negative way conceivable. I think I have more love for SharePoint than Teams, and that is a massive concession.

pelagicAustral

真令人耳目一新。不用Teams了?听起来简直是做梦……在我被迫使用的所有垃圾软件里,Teams在每一个你能想到的负面方面都做到了极致。我觉得我可能都比喜欢Teams更喜欢SharePoint,这可真是个巨大的让步。


I miss thinking hard #

https://news.ycombinator.com/item?id=46881955

You just described the burden of outsourcing programming.

fallous

你刚才描述的正是外包编程的负担所在。


Data centers in space makes no sense #

https://news.ycombinator.com/item?id=46880296

Simply put no, 50MW is not the typical hyperscaler cloud size. It’s not even the typical single datacenter size.

A single AI rack consumes 60kW, and there is apparently a single DC that alone consumes 650MW.

When Microsoft puts in a DC, the machines are done in units of a “stamp”, ie a couple racks together. These aren’t scaled by dollar or sqft, but by the MW.

And on top of that… That’s a bunch of satellites not even trying to crunch data at top speed. No where near the right order of magnitude.

hirsin

简单来说,50兆瓦并不是典型的超大规模云计算大小,甚至连单个数据中心的标准大小都算不上。

单个AI机架消耗60千瓦,而据称有一个数据中心仅自身消耗就高达650兆瓦。

当微软建设一个数据中心时,其设备是以“邮票”(stamp)为单位来配置的,也就是将几个机架组合在一起。其规模并非按美元或平方英尺来衡量,而是按兆瓦来计算的。

而且……那还只是一堆卫星,它们甚至没有满负荷高速处理数据。规模数量级完全不对。


What’s up with all those equals signs anyway? #

https://news.ycombinator.com/item?id=46869870

The real punchline is that this is a perfect example of “just enough knowledge to be dangerous.” Whoever processed these emails knew enough to know emails aren’t plain text, but not enough to know that quoted-printable decoding isn’t something you hand-roll with find-and-replace. It’s the same class of bug as manually parsing HTML with regex, it works right up until it doesn’t, and then you get congressional evidence full of mystery equals signs.

ruhith

真正的笑点在于,这是一个“懂一点皮毛,反而坏事”的完美例证。处理这些邮件的人只知道邮件不是纯文本,却不足以明白quoted-printable解码不能自己动手用查找替换来实现。这类bug和用正则表达式手动解析HTML是同一性质——在它失效之前一直能正常工作,然后你就得到了一堆满是神秘等号的国会证据。


Data centers in space makes no sense #

https://news.ycombinator.com/item?id=46879507

It’s exiting the 5th best social network and the 10th (or worse) best AI company and selling them to a decent company.

It probably increases Elon’s share of the combined entity.

It delivers on a promise to investors that he will make money for them, even as the underlying businesses are lousy.

lancewiggs

它正在将排名第五的社交网络和排名第十(或更差)的AI公司出售给一家体面的公司。

这或许会增加埃隆在合并实体中的股份。

这兑现了他向投资者做出的承诺——他会为他们赚钱,尽管这些基础业务本身很糟糕。


Lessons learned shipping 500 units of my first har… #

https://news.ycombinator.com/item?id=46878821

As someone who generally stays out of politics, I didn’t know much about the incoming administration’s stance towards tariffs, though I don’t think anyone could have predicted such drastic hikes.

I have an appreciation for very bright lamps, and the project is neat, but that stuck out to me.

I’m always fascinated by people who both feel comfortable ignoring maybe the single most impactful society-determining apparatus but will also say “no one could have seen that coming”, where that is whatever they were unaware of because they chose to check out. I find the stance so fascinating because for myself, it would be impossible to not try and understand why the world is the way it is.

Everything is downstream of politics whether people want to recognize that or not, and choosing to ignore it is, in fact, a political choice.

cwal37

作为一个通常不参与政治的人,我并不太了解新政府在关税方面的立场,不过我想没人能预测到会如此大幅度的增长。

我非常喜欢非常明亮的灯,这个项目也很巧妙,但正是那一点引起了我的注意。

我总是对那些人感到着迷,他们一方面能心安理得地选择无视那个或许对整个社会走向影响最深远的机制,另一方面却又说“没人能预料到”,而他们所说的“预料不到”,恰恰是他们因为选择置身事外而未曾了解的事情。我觉得这种立场非常有趣,因为对我来说,不去努力理解世界为何会是这个样子,那是不可能的。

无论人们是否愿意承认,一切问题的根源都在于政治,而选择忽视它,本身就是一种政治选择。


Lessons learned shipping 500 units of my first har… #

https://news.ycombinator.com/item?id=46879928

This is the second article about hardware supply from China I’ve read and it reads very much the same, albiet in a different niche (the other one was about SBC construction) -Anything you don’t specify will be done least cost, and there is no amount of “least” which cannot be chased in manufacture.

The other one noted if you don’t specify the density of plastic for bags, or paper for bags and packing, you get clingfilm thinner than you thought existed, and paper which is almost tissue in its weakness. You don’t even get boxes to put the boxes in, if you don’t specify boxes to be delivered in boxes. So now wrapping a pallet becomes a nightmare if they don’t stack. And if you don’t specify how many to stack, and how to pad the stack, they won’t do unit height stacking if it costs labour time. Your risk.

Some of this like the casting mistake, or the knob thing, could happen anywhere and you have to be close to final manufacture spec to find out e.g. the metal coating impinges on the knob at the free space you specified, because your test rig didn’t have powder coating. Or, that a design feature you need like the light entry holes, is used by the casting engineer as pour points because it looked like you’d specified mould pour points not functional holes.

But other things like “yea, you didn’t spec how long to make the tails so we cut the tails as close as we could” is just the cheapening above: if you don’t SAY its a 10cm tail for the connector, it will be 2cm, if saving 8cm of cable saves money for them.

I’ve read some stuff which says the cost of 5 SBC boards with pre-applied SMD is now so low, you might as well order 5 so you get at least 1 which works. That means they will wind up working out your tolerance for failure, and produce goods to meet that: if 1 in 5 is viable, thats what they’ll target.

ggm

这是我看过的第二篇关于中国硬件供应链的文章,内容惊人地相似,尽管讨论的是不同的领域(另一篇是关于单板电脑的制造)。——任何你没有明确指明的,都会按最低成本来生产,而且制造业中,没有“最低”这个限度是无法被挑战的。

另一篇文章提到,如果你没有指定塑料袋或包装用纸的密度,你收到的保鲜膜会比你能想象的还薄,而纸张的脆弱程度几乎跟餐巾纸一样。如果你没有规定要用箱子来运输箱子,那你就连装箱子的箱子都得不到。这样一来,如果他们不妥善堆叠,给托盘打包就成了噩梦。而且,如果你没有规定堆叠的数量和填充方式,只要会增加人工成本,他们就不会进行单位高度的堆叠。这都是要你自己承担的风险。

其中一些问题,比如铸造错误或旋钮问题,可能在任何地方都发生,你必须非常接近最终制造规格才能发现,例如,你指定的自由空间里的金属涂层,会覆盖到旋钮上,因为你的测试设备没有进行粉末喷涂。或者,你设计中需要的功能部件,比如光线进入的孔洞,会被铸造工程师当作浇铸点,因为他们以为你指定的是模具的浇铸点,而不是功能孔。

但像“是的,你没有规定尾巴要多长,所以我们就尽可能地切短了”这种事,就纯粹是为了省钱:如果你没有说明连接器的线缆需要10厘米长,那它就会只有2厘米,只要能省下8厘米的线材,他们就能省下钱。

我看过一些资料说,现在附有预贴装SMD元件的5块单板电脑成本已经低到,你不如直接订5块,这样至少能有一块是能用的。这意味着他们会摸清你对产品不良率的容忍度,并按此标准来生产:如果5块中能有1块是合格的,那他们就会把目标定成这个水平。


Bunny Database #

https://news.ycombinator.com/item?id=46873586

fwiw, Bunny are the people that announced S3 compatibility for their object storage in Q2 2022 [1]

We can’t wait to have this available as a preview later in Q2 and truly make global storage a breeze, so keep an eye out!

then apologised for missing that in September 2023 [2]

We initially announced that we were working on S3 support for Bunny Storage all the way back in 2022. Today, as 2023 is slowly coming to an end, many of our customers continue to follow our blog, hoping for good news about the release.

changing the roadmap to early 2024 [2]

But we are working aggressively toward shipping S3 compatibility in early 2024.

That same post also has the beautiful “At bunny.net, we value transparency.” quote. It’s early 2026, and they’re literally ignoring my support requests asking about what the roadmap is looking like for this now.

So, do not trust their product or leadership at all.

[1] https://bunny.net/blog/introducing-edge-storage-sftp-support-s3-next/ [2] https://bunny.net/blog/whats-happening-with-s3-compatibility/

cschmatzler

顺便一提,Bunny 是在2022年第二季度宣布为其对象存储提供 S3 兼容性的公司 [1]。

我们迫不及待地希望在第二季度晚些时候能以预览版的形式推出这项功能,让全球存储变得轻而易举,所以请密切关注!

随后在2023年9月,他们就食言了,承认未能实现该承诺 [2]。

我们早在2022年就宣布正在为 Bunny Storage 开发 S3 支持。如今,2023年即将结束,我们许多客户仍在关注我们的博客,希望能得到发布的好消息。

并将路线图修改为2024年初 [2]。

但我们正努力在2024年初推出 S3 兼容性。

同篇文章中还有一句漂亮的引言:“在 bunny.net,我们重视透明度。” 现在已经是2026年初,他们对我询问此项功能最新路线图的客服请求完全不予理睬。

所以,千万不要相信他们的产品或领导层。

[1] https://bunny.net/blog/introducing-edge-storage-sftp-support-s3-next/ [2] https://bunny.net/blog/whats-happening-with-s3-compatibility/


AI is killing B2B SaaS #

https://news.ycombinator.com/item?id=46892313

It’s a tale as old as time that developers, particularly junior developers, are convinced they could “slap together something in one weekend” that would replace expensive SAAS software and “just do the parts of it we actually use”. Unfortunately, the same arguments against those devs regular-coding a bespoke replacement apply to them vibe-coding a bespoke replacement: management simply doesn’t want to be responsible for it. I didn’t understand it before I was in management either, but now that I’m in management I 100% get it.

bandrami

这是一个老生常谈的故事:开发者,尤其是初级开发者,总相信自己能在“一个周末内”拼凑出能取代昂贵SAAS软件的东西,并且“只用上我们实际需要的功能”。然而,反对这些开发者开发定制化产品的理由,也同样适用于他们凭感觉搞出来的定制化产品:管理者根本不想为此负责。我以前没当管理者的时候也不明白,但如今身在其位,我百分百理解了。