2025 06 17 HackerNews

2025-06-17 Hacker News Top Stories #

  1. 一名因毒品犯罪入狱的男子通过监狱项目学习编程,并通过Project Limbo获得Turso公司的软件工程师职位,展现了罪犯康复和就业的可能性。
  2. Bow Shock Systems Consulting提出成立互联网韧性俱乐部,利用LoRa无线电和Meshtastic软件在断网情况下实现社区间通信,应对互联网中断问题。
  3. Android公共API中隐藏了许多幽默的方法和常量,如isUserAMonkey()isUserAGoat(), 展现了开发者在严肃工作中的幽默感。
  4. Nanonets-OCR-s是一个先进的OCR模型,可将文档转换为结构化Markdown,支持表格、公式和图像识别,但可能存在“幻觉”问题。
  5. 研究表明,使用大型语言模型辅助写作可能导致认知负债,削弱表达能力和深入理解,影响教育和学习效果。
  6. 大卫·艾登堡在99岁时回顾了他对海洋的热爱,并对海洋的未来恢复持乐观态度,强调人类在解决海洋问题中的潜力。
  7. 一种新理论提出重力可能是熵增的表现,认为粒子的随机振动和混合导致了重力现象,并与黑洞热力学相联系。
  8. WhatsApp宣布在应用中引入广告,利用用户数据定向投放,但消息内容和通话记录仍保持端到端加密,引发隐私争议。
  9. Zeekstd是一个用Rust实现的Zstandard可寻址格式,支持压缩数据的随机读取和高效解压,适用于远程托管的压缩文件。
  10. 英国计划在未来十年关闭大部分传统电话交换机,转而通过“超级数字交换机”提供光纤宽带服务,标志着电信系统的数字化转型。

Working on databases from prison #

https://turso.tech/blog/working-on-databases-from-prison

这篇文章是 Preston Thorpe 在 Turso 公司担任软件工程师的经历分享。文章分为几个部分,详细讲述了他是如何从监狱中获得这份工作的。

如何来到这里 #

文章开头,Preston Thorpe 宣布他加入了 Turso 公司,成为一名软件工程师。他强调,尽管许多人梦想着从事数据库工作和解决独特挑战,但对他来说,这份工作更加特别,因为他目前被监禁在州立监狱中。他简要回顾了自己因二十年代的毒品相关决策和生活方式选择而入狱的经历,并提到三年前他参加了一个监狱大学项目,该项目提供了有限的互联网访问权限的电脑。这重新点燃了他对编程的热爱,并让他意识到编程可能是他摆脱困境的方式。他很快就超越了课程内容,每天花费 15 小时以上在项目和开源贡献上。

找到 Turso:参与 Project Limbo #

Preston Thorpe 讲述了他是如何在去年 12 月发现 Turso 的 Project Limbo 的。Project Limbo 是 Turso 公司重写 SQLite 的努力。尽管他之前没有从事过关系数据库的工作,但他对存储引擎产生了兴趣。他发现这个项目还处于早期阶段,有很多简单的任务可以让他开始。在监狱中,编程几乎占据了他所有的时间,他每周大约工作 90 小时,唯一的娱乐是每天一小时的技术/编程 YouTube 视频。

通过 Turso 的 Discord,他了解到了 Turso 公司,并对他们的分布式、多租户 SQLite 概念产生了兴趣。他提到,他多年来一直仰慕 Glauber 和 Pekka,并没有想到自己有一天能够为他们的雄心勃勃的项目做出有意义的贡献。他开始为 Project Limbo 做出贡献,这很快成为了他的新痴迷。他将时间分配在工作和深入研究 SQLite 源代码、数据库内部的学术论文以及 Andy Pavlo 的 CMU 讲座之间。

接下来是什么 #

Preston Thorpe 表示,他非常自豪能够成为别人努力、决心和纪律能够达到多远的例子,并对缅因州矫正部门和 Unlocked Labs 给予他工作机会表示感谢。他宣布,他现在全职为 Turso 工作,这是他几年前做梦也想不到的。他对于能够参与构建 SQLite 的现代演变感到非常兴奋。

尽管最近法院的坏消息意味着他不会像家人和他希望的那样早回家,但他选择将这视为一种祝福,并在接下来的 10 个月里,继续专注于推进自己的职业生涯。他感谢所有在过去几年中联系他的人,感谢 Unlocked Labs 的团队,特别是他的父母。他感谢 Turso 给予的机会,以及所有有公平机会招聘政策的公司,他们相信人们应该得到第二次机会。他感叹自己的旅程是超现实的,每天都对自己的生活从几年前的生活有多远感到敬畏。


HN 热度 655 points | 评论 424 comments | 作者:dvektor | 11 hours ago #

https://news.ycombinator.com/item?id=44288937

  • 远程工作项目有助于减少累犯,给予囚犯实际工作机会,使他们在出狱后能继续工作
  • 北欧国家注重康复而非惩罚,因此累犯率较低
  • 囚犯通过对话解决争端有助于培养愤怒管理能力,更好地适应社会
  • 单一民族人口可能有助于降低累犯率
  • 即使在单一民族人口中,犯罪行为也可能发生,因此单一民族人口的影响可能不大
  • 非暴力毒品犯罪的刑期过长,尤其是与大型制药公司相比
  • 贩卖芬太尼等毒品的人对社会有害,不应被视为小罪
  • 邪恶是一个宗教概念,卖毒品并不等同于邪恶
  • 医生开处方药与非法卖药的人在道德上有所不同
  • 贩卖芬太尼等毒品的人对社会造成巨大伤害,许多人因此死亡
  • 执法资源有限,应优先打击大型犯罪集团而非小规模毒品交易
  • 社会应该允许一些小罪的存在,而不是对所有犯罪都进行严厉追诉
  • 选择性执法可能掩盖了歧视,法律执行应更加严格和统一
  • 新加坡的执法方式被提及作为例子
  • 即使在毒品合法化的国家,也不应容忍所有毒品交易行为
  • 贩卖毒品是一个有受害者的犯罪,不应被视为无受害者犯罪

Start your own Internet Resiliency Club #

https://bowshock.nl/irc/

Bow Shock Systems Consulting 提出了成立互联网韧性俱乐部的概念,以应对战争、地缘政治和气候变化等因素导致的欧洲互联网中断问题。这些俱乐部由互联网专家组成,能够在没有集中基础设施的情况下,使用低成本、低功耗、无需许可的 LoRa 无线电和开源 Meshtastic 文本消息软件,在几公里范围内相互通信。这些志愿者团体可以利用他们的无线电、技术技能和与其他专家的个人联系来恢复互联网连接。

网页提供了一个快速启动指南,帮助人们组建自己的互联网韧性俱乐部,并提供了一个邮件列表供人们就互联网韧性俱乐部的一般问题和讨论进行交流。作者 Valerie Aurora 是一位拥有 25 年开源软件、操作系统、网络、文件系统和志愿者组织经验的系统软件工程师。她搬到阿姆斯特丹后,开始寻找回馈新家园的方式,并在系统咨询工作之余,担任欧盟网络韧性法案的特别报告员、RIPE 会议计划委员会成员,并在欧洲技术会议上发表演讲。

互联网韧性俱乐部的成立源于作者对失去电力、互联网、手机服务的噩梦,以及对俄罗斯对乌克兰的通信和电力攻击、德国风车被恶意软件攻击、波罗的海海底电缆被切断等问题的关注。乌克兰 IXP 1-IX 制作的视频教会了其他国家乌克兰互联网运营商在 2022 年俄罗斯入侵前后如何加强和修复互联网基础设施。荷兰政府并未效仿乌克兰的做法,其基于云的“紧急通信”系统在任何影响电力或互联网连接的紧急情况下都不会奏效。

作者提出了危机工程的概念,即组织在面临生存危机时要么迅速转型,要么失败并变得更加功能失调。个人可以组织一群志愿者网络专家,在没有任何集中基础设施的情况下进行通信,从而有效地启动通信恢复。

LoRa 无线电和 Meshtastic 是低成本、低功耗的通信方式,不需要集中基础设施和许可,价格低廉,功耗低,运行开源 Meshtastic 固件,可以发送文本消息,并通过蓝牙或 WiFi 连接到手机/电脑。与业余无线电相比,LoRa/Meshtastic 可以在几公里范围内发送文本消息,而业余无线电需要更多的培训、许可、更大的天线和更多的电力。在紧急情况下,理想情况下两者都应该是可用的。

具体来说,LoRa 是一种专有技术,用于以非常低的功率(<1W)发送低比特率无线电消息(~1-25kbps),源自于 chirp spread spectrum 技术。Meshtastic 是 LoRa 无线电的开源固件,使用洪水转发网状协议将消息发送至最多三个转发节点。


HN 热度 518 points | 评论 289 comments | 作者:todsacerdoti | 16 hours ago #

https://news.ycombinator.com/item?id=44287395

  • Meshtastic 项目完全基于网络,没有互联网环境难以设置,文档和固件下载都依赖网络
  • 有用户通过 CLI 或拖放方法进行固件烧录,认为应更多支持长期无网络使用场景
  • 编译后的固件和烧录脚本可在 GitHub 上找到,Meshtastic CLI 可用,文档以.mdx 格式存在于 git 仓库
  • 有人认为 Meshtastic 在实际使用中性能不佳,不可靠,不适合紧急情况下依赖
  • 有人提出公共 WiFi 网络可能更有价值,旧路由器免费且易得,功耗低,覆盖范围有限但实用
  • 有人认为 Meshtastic 的实际效果不佳,传统业余无线电和 Hamnet 等方法更有效
  • 有人推荐尝试 Reticulum 网络作为替代方案
  • Meshtastic 网络需要一些规划,某些地区通过合理布置节点可以实现较远距离的可靠通信
  • Meshtastic 的路由算法效率低下,有很大的改进空间
  • WiFi 路由器覆盖面积有限,功耗相对较高,不适合覆盖整个城市
  • 有人质疑 WiFi 网络是否能够支持城市规模的文本网络,但认为其带宽更高
  • 有人指出 WiFi 路由器的实际覆盖范围有限,通常只有几十米的视线范围内有效

Jokes and Humour in the Public Android API #

https://voxelmanip.se/2025/06/14/jokes-and-humour-in-the-public-android-api/

这篇文章讨论了 Android 操作系统中一些有趣的、幽默的公共 API,这些 API 对开发者来说可能比对普通用户更有趣味性。文章列举了几个具体的例子:

  1. ActivityManager.isUserAMonkey():这个函数最初看起来像是一个玩笑,它返回一个布尔值,表示用户界面是否“正在被一只猴子搞乱”。实际上,这个函数与 UI Exerciser Monkey 有关,这是一个开发者工具,用于模拟随机的用户输入序列来压力测试应用程序。该方法用于检测 Monkey 是否正在运行,最早出现在 Android 2.2 Froyo 版本中。
  2. UserManager.isUserAGoat():这个函数更像是一个笑话,开发者文档称它用于“确定发起此调用的用户是否受到传送影响”。这个函数最初在 Android 4.2 版本中引入,最初总是返回 false。但在 Android 5.0 Lollipop 版本中,它被改变为检测设备上是否安装了 Goat Simulator 游戏。到了 Android 11 版本,这个函数被修改为对目标 API 30 及以上的应用总是返回 false,以“保护山羊隐私”。
  3. UserManager.DISALLOW_FUN:这个常量是在 Android 6 Marshmallow 版本中添加的,它是一个设备策略,限制用户“享受乐趣”。开发者文档中的描述带有讽刺意味,类似于 GLaDOS 可能会说的话。这是一个真实的设备策略,设备所有者可以更改它以限制设备用户的行为。第三方可以利用这个策略来禁用他们应用程序中被认为“太有趣”的功能。
  4. Chronometer.isTheFinalCountdown():在 Android 8 Oreo 版本中,Chronometer 类新增了一个名为 isTheFinalCountdown 的方法。调用这个方法会发送一个 Intent 来打开 YouTube 上的 The Final Countdown 视频。
  5. PackageManager.FEATURE_TOUCHSCREEN_MULTITOUCH_JAZZHAND:这个常量在 Android 2.3 Gingerbread 版本中添加,用于描述支持同时跟踪 5 个触摸输入的设备,名称是对“爵士手”的引用。
  6. Log.wtf():根据开发者文档,WTF 代表“What a Terrible Failure”,用于记录不应该发生的事情,以断言级别记录消息。
  7. AdapterViewFlipper.fyiWillBeAdvancedByHostKThx():这是一个方法,名字带有幽默的非正式感,可能是由于某个开发者在命名时想不出更好的名字,最终出现在公共 Android API 中。这个方法在 Android 3.0 Honeycomb 版本中被添加。
  8. IBinder.TWEET_TRANSACTION 和 IBinder.LIKE_TRANSACTION:这两个事务类型分别在 Android 3.2 Honeycomb 和 Android 4.0.3 ICS 版本中添加,它们的名字分别与发送推文和表示喜欢有关,但实际上它们并不执行任何操作。
  9. SensorManager.SENSOR_TRICORDER 和 SensorManager.GRAVITY_*:SensorManager 类中有一些常量,包括 SENSOR_TRICORDER,这是一个来自《星际迷航》的虚构设备,以及 GRAVITY_*常量,它们存储了我们太阳系中各种天体的重力速度。这些常量在 API 级别 15 中被弃用,转而使用 Sensor 类,后者不包括任何与 Tricorder 等效的引用。

HN 热度 275 points | 评论 150 comments | 作者:todsacerdoti | 23 hours ago #

https://news.ycombinator.com/item?id=44285781

  • 在 Facebook,给危险或即将废弃的标记加上 _DO_NOT_USE_OR_YOU_WILL_BE_FIRED 后缀是一种标准做法,但这种做法在远程工作文化中引起了恐惧和不确定性。
  • React 的 __SECRET_INTERNALS_DO_NOT_USE_OR_YOU_WILL_BE_FIRED 也因去除幽默化而发生了变化。
  • 有建议在 __SECRET_INTERNALS_DO_NOT_USE_OR_YOU_WILL_BE_FIRED 中加入《未来世界》的引用。
  • 有趣的命名可以,但不应引入歧义。
  • 谷歌曾有一个难以理解的代码块,被重命名为"[Foo]Sorcery"后,人们不再尝试添加内容,而是定期移除部分代码。
  • Android 源代码中有一个有趣的函数 android.os.Handler.runWithScissors(),但不是公共 API 的一部分。
  • X11 中有一个全局变量 party_like_its_1989 用于切换许多遗留功能。
  • BeOS(现在 Haiku)中有 is_computer_on()is_computer_on_fire() 两个函数,都有详细的描述。
  • Delphi 有一个异常 EProgrammerNotFound,文档页面非常严肃。
  • 现代计算机中,从深度睡眠状态唤醒或主板温度达到 200 摄氏度的状态是正常的,操作系统应该能够处理。
  • 许多部件的规格不会超过 140 摄氏度,有些甚至不超过 80 摄氏度。
  • HT83C51 芯片的规格可以达到 225 摄氏度。
  • 大多数市场上的芯片最高只能承受 150 摄氏度。
  • Haiku 文档中 is_computer_on() 函数被用作示例。
  • 这种幽默感在大型公司代码库中得以保留,让人感到温暖。
  • 人们需要更多这样的幽默感,以对抗许多软件的冷漠感。
  • Chrome 任务管理器中有一个隐藏列显示浏览器进程传送了多少山羊,但现在不再有效。
  • 有人发布了一个可以测试 isUserAGoatisUserAMonkey 的小应用。
  • Android 15 及以上版本的设备无法安装该应用,因为谷歌强制执行了最低编译 SDK 版本。
  • isUserAGoat() 在 Android 11 及以上版本中将返回 false,isUserAMonkey() 只有在使用猴子测试套件时才会返回 true。
  • 怀念科技产品中彩蛋的时代,随着一切的公司化而消失。

Nanonets-OCR-s – OCR model that transforms documents into structured markdown #

https://huggingface.co/nanonets/Nanonets-OCR-s

Nanonets-OCR-s 是一个强大的、最先进的图像到 Markdown 的光学字符识别(OCR)模型,它超越了传统的文本提取功能。这个模型能够将文档转换成结构化的 Markdown,通过智能内容识别和语义标记,非常适合后续由大型语言模型(LLMs)处理。

Nanonets-OCR-s 拥有多项功能,能够轻松处理复杂文档:

  1. LaTeX 公式识别:自动将数学公式和方程转换成正确格式的 LaTeX 语法,并区分行内($…$)和展示式( $$ … $$

    )方程。

  2. 智能图像描述:使用结构化的 <img> 标签描述文档中的图像,使其可供 LLM 处理。能够描述包括徽标、图表、图形等在内的各种图像类型,详细说明它们的内容、风格和上下文。

  3. 签名检测与隔离:识别并隔离签名,将其输出在 <signature> 标签中,这对于处理法律和商业文档至关重要。

  4. 水印提取:检测并提取文档中的水印文本,将其放置在 <watermark> 标签中。

  5. 智能复选框处理:将表单中的复选框和单选按钮转换成标准化的 Unicode 符号(☐, ☑, ☒),以实现一致可靠的处理。

  6. 复杂表格提取:从文档中准确提取复杂表格,并将其转换成 Markdown 和 HTML 表格格式。

使用 transformers 库,可以通过以下步骤使用 Nanonets-OCR-s 模型:

  • 导入必要的库和模型。
  • 定义一个函数 ocr_page_with_nanonets_s,该函数接收图像路径、模型、处理器和最大新令牌数作为参数。
  • 使用 PIL 打开图像,并构建消息列表,包括系统角色和用户角色,其中用户角色包含图像和提示文本。
  • 将文本和图像传递给处理器,并生成模型输入。
  • 使用模型生成输出,并解码生成的 ID,得到输出文本。

使用 vLLM 时,需要启动 vLLM 服务器,并使用 OpenAI 客户端预测模型。定义 encode_image 函数对图像进行编码,并使用 ocr_page_with_nanonets_s 函数进行 OCR 处理。

使用 docext 时,可以通过安装 docext 库并运行相关命令来使用 Nanonets-OCR-s 模型。

模型的详细信息包括:

  • 模型大小:3.75B 参数
  • 张量类型:BF16
  • 基础模型:Qwen/Qwen2.5-VL-3B-Instruct
  • 微调模型数量:226
  • 使用该模型的量化版本数量:11
  • 使用该模型的空间数量:4

最后,提供了模型的 BibTex 引用格式,以及模型的下载和使用统计信息。


HN 热度 266 points | 评论 61 comments | 作者:PixelPanda | 17 hours ago #

https://news.ycombinator.com/item?id=44287043

  • Nanonets-OCR-s 可以将文档转换为结构化的 Markdown,包括表格、方程式、图像等。
  • 模型可能会产生幻觉,例如将页码识别错误。
  • 模型基于 Qwen2.5-VL-3B,存在“模型可能产生幻觉”的局限性。
  • 模型可以提取图像描述,但不是图像本身。
  • 有工具可以提取 PDF 中的图像,不需要使用大型语言模型。
  • 模型可以用于将餐厅菜单照片/PDF 解析成 JSON 文件。
  • 有人尝试使用模型将 Shipibo 语字典翻译成英语,面临格式问题。
  • 模型可以帮助将旧的 Word 和 PowerPoint 文档转换为标准化格式。
  • 有人建议使用 unoconv 或 pandoc 转换文档,然后用 LLM 清理文本。
  • 有人批评模型只针对 Markdown,而不是结构更严格的格式如 XML。
  • 模型同时训练了转换为 Markdown 和语义标记。
  • 有人提到 XML 和 TEI 在文档标记上的成熟和健壮性。
  • 有人提到 MyST Markdown 在学术出版中的应用。
  • 有人询问为什么 MyST 而不是 RST 获得了关注。
  • 有人提出 ePub(基于 XHTML)作为另一种可能的输出格式。
  • 模型会将脚注作为普通文本提取在新行中。
  • 有人对脚注的处理方式表示担忧,希望有更好的标记方法。
  • 有人对“结构化 Markdown”的实现表示失望,认为只是对某些元素进行了标记。

Accumulation of cognitive debt when using an AI assistant for essay writing task #

https://arxiv.org/abs/2506.08872

这篇文章的标题是“Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task”,由 Nataliya Kosmyna 等 8 位作者共同撰写。文章探讨了使用大型语言模型(LLM)辅助写作时对神经和行为的影响。研究将参与者分为三组:LLM 组、搜索引擎组和仅用大脑(不使用工具)组。每组在相同条件下完成三个会话。在第四个会话中,LLM 用户被重新分配到仅用大脑组(LLM-to-Brain),而仅用大脑组用户被重新分配到 LLM 条件(Brain-to-LLM)。共有 54 名参与者参加了第 1-3 会话,其中 18 人完成了第 4 会话。

研究使用脑电图(EEG)评估写作过程中的认知负荷,并利用自然语言处理(NLP)分析文章,同时借助人类教师和 AI 裁判对文章进行评分。结果显示,各组在 NERs(命名实体识别)、n-gram 模式和主题本体方面表现出组内同质性。EEG 揭示了大脑连接性方面的显著差异:仅用大脑组的参与者展现出最强、最广泛的网络连接;搜索引擎用户显示出适度的参与度;而 LLM 用户的连接性最弱。认知活动随着外部工具的使用而减少。在第四个会话中,LLM-to-Brain 组的参与者显示出降低的 α 和 β 连接性,表明参与度降低。Brain-to-LLM 组的用户显示出更高的记忆回忆和顶枕区及前额叶区域的激活,与搜索引擎用户相似。自我报告的文章所有权在 LLM 组中最低,在仅用大脑组中最高。LLM 用户在准确引用自己的作品方面也存在困难。

尽管 LLM 提供了即时的便利,但研究发现它们可能带来潜在的认知成本。在四个月的时间里,LLM 用户在神经、语言和行为层面上的表现始终较差。这些结果对 LLM 依赖的长期教育影响提出了担忧,并强调了对 AI 在学习中角色进行更深入探究的必要性。文章共有 206 页,包含 92 个图表、4 个表格和附录。


HN 热度 260 points | 评论 155 comments | 作者:stephen_g | 21 hours ago #

https://news.ycombinator.com/item?id=44286277

  • 使用 AI 助手进行写作任务可能导致认知能力下降或技能丧失
  • 经常使用谷歌地图导航的人空间记忆受损,类似地,过度依赖 AI 写作可能影响认知技能
  • 理解科学领域知识需要深入思考和探索,不能仅仅通过浏览教材获得
  • 写作有助于大脑结构化思考,与自身进行结构化对话,探索不同路径
  • 写作比单纯思考能更深入地探索思想
  • 写作对心理健康有益,建议每天写博客以自我观察
  • 手工写作或抄写可以避免 GPT 带来的麻木感
  • 白板讨论有助于快速发现问题,避免讨论陷入立场框架
  • 简洁是智慧的灵魂,LLMs 生成的内容往往过于冗长
  • AI 辅助编程可能导致无法形成程序的心理模型
  • 教学过程中对材料的理解深度会显著提高
  • 使用 LLMs 作为表达工具会削弱表达能力和对主题的深入理解
  • 写作是一种魔法,能带来反思和洞察,但速度慢
  • 在探索新的数学问题时,可以在不写下来的情况下先在心中探索可能的解决方案路径
  • 写作草稿有助于结构化思考
  • 提示(prompting)是写作的一部分,涉及描述目的、确定受众、制定结构等重要步骤
  • 提示与写作不同,它更短、组织性差,且不构成真正的写作,而是考虑机器如何解释和回应

David Attenborough at 99: ‘I will not see how the story ends’ #

https://www.thetimes.com/life-style/celebrity/article/david-attenborough-book-extract-age-99-lj3rd2fg7

这篇文章是大卫·艾登堡爵士(David Attenborough)在《星期日泰晤士报》上发表的,纪念他即将到来的 99 岁生日,并分享了他对海洋的热爱和对未来海洋的乐观看法。

文章开头,艾登堡爵士回忆了他童年时对海洋的最早记忆,那是他在莱斯特附近的一个古老的石灰石采石场,想象自己在一个热带泻湖中探险。他描述了自己如何被古代海洋生物的化石所吸引,这些化石激发了他对海洋深处生物的好奇心。

艾登堡爵士提到,在他近 100 年的生命中,人类对海洋的了解比历史上任何时期都要多。他强调了海洋科学揭示的自然奇观,以及新技术如何使我们能够记录下他早期职业生涯中无法想象的野生动物行为。同时,他也指出人类对海洋的影响是深远的,未来 100 年可能会见证海洋生物的大规模灭绝或壮观的恢复。

文章中,艾登堡爵士表达了对未来海洋可能面临的挑战的担忧,但他也强调了海洋恢复的可能性。他提到了红树林和海带森林的再生、鲸鱼的回归以及沿海社区的繁荣。他认为,我们已经知道如何解决许多面临的问题,并且有数百年的进步可以作为灵感来源。

艾登堡爵士还提到了过去 100 年人类在减少婴儿死亡率、抑制疾病、提高教育和医疗保健的可及性、获得改变我们对世界理解的科学知识以及在前所未有的全球问题上合作方面取得的成就。他强调,今天在海滩上玩耍的孩子们将经历人类历史上最重要的时期之一,他们将看到我们选择的结果。

最后,艾登堡爵士分享了他最喜欢的一些海洋经历,希望激励人们超越海岸线,深入海底。他描述了在加利福尼亚湾拍摄蓝鲸的经历,这是一次艰难的挑战,因为蓝鲸难以捕捉,而且当时没有现代技术如无人机和卫星标签来帮助定位。他提到,尽管蓝鲸的数量在商业捕鲸禁令后有所恢复,但仍然只有大约 5000 头,仅为自然水平的 2%。

文章以艾登堡爵士的乐观态度结束,他认为只要人们享受并理解自然世界,我们就有更大的希望拯救它和我们自己。他希望他的经历能够激励人们关注海洋,并为海洋的未来采取行动。


HN 热度 259 points | 评论 168 comments | 作者:herbertl | 1 day ago #

https://news.ycombinator.com/item?id=44285054

  • 大卫·阿滕伯勒的纪录片《海洋》揭示了海底拖网捕鱼的破坏性,人们对此感到震惊。
  • 有人提出通过投放巨石来阻止海底拖网捕鱼,认为这是一种有效的解决方案。
  • 有人提到 Greenpeace 曾通过投放巨石来阻止海底拖网捕鱼。
  • 有人赞扬 Paolo Fanciulli 通过投放巨石阻止拖网捕鱼的行为是英雄行为。
  • 有人质疑巨石是否会在声纳上显示,以及是否需要在每次拖网前调查拖网路径。
  • 有人提出亿万富翁购买旧船投放巨石以保护最受欢迎/脆弱的渔场的想法。
  • 有人指出新贵取代了旧贵族,新贵没有旧贵族对平民断头台的历史恐惧。
  • 有人提到 Ray Dalio 参与海洋研究和教育。
  • 有人认为善良的富人因为公众舆论而变得疯狂和邪恶。
  • 有人声称只有邪恶的人才能保持超级富有,因为他们使用财富的方式会消耗他们的财富。
  • 有人争论说亿万富翁通过创造价值变得富有,尽管有些人也通过其他方式。
  • 有人不同意亿万富翁通过创造价值变得富有,认为他们通过保留价值给自己而变得富有。
  • 有人提出亿万富翁的财富是通过承担风险和员工的工作创造的。
  • 有人提出自由职业者既可能是被剥削的,也可能是为自己保留所有价值的。
  • 有人提醒福布斯富豪榜只是一个营销工具,不应该被视为世界上最富有的人的真实名单。
  • 有人提出自己创造的价值没有那么多财富,可能是因为其他人通过不道德的手段从社会中提取价值。

Is gravity just entropy rising? Long-shot idea gets another look #

https://www.quantamagazine.org/is-gravity-just-entropy-rising-long-shot-idea-gets-another-look-20250613/

这篇文章探讨了一个长期存在但非主流的观点:重力可能只是熵增的表现。文章由 George Musser 撰写,发表于 2025 年 6 月 13 日。

文章首先提到,艾萨克·牛顿对他的万有引力定律并不满意,他和其他科学家提出了几种机械模型,其中重力不是吸引力,而是一种推动力。例如,空间可能充满了看不见的粒子,这些粒子从四面八方撞击物体。这些理论从未完全成功,阿尔伯特·爱因斯坦后来提供了一个更深层次的解释,即重力是时空的扭曲。但爱因斯坦的广义相对论也带来了自己的谜题,他自己也认识到这不可能是一个最终的答案。因此,重力作为一种集体效应的观点——不是基本力,而是更精细尺度上群体行为的结果——仍然吸引着物理学家。

文章接着介绍了今年早些时候,一组理论物理学家提出了一种可能是这些 17 世纪机械模型的现代版本。这个项目是物理学家试图将重力理解为从更深层次、更微观的物理现象中涌现出来的众多方式之一。这个观点被称为熵增重力,它将更深层次的物理现象视为本质上就是热物理。它认为重力是由粒子的随机振动和混合——以及随之而来的熵增,即混乱度的增加——所导致的。

文章提到,将重力建模为熵增的结果的尝试在过去几十年中不时出现。熵增重力是一个非常小众的观点,但它不会消失,甚至批评者也不愿完全否定它。新的模型有一个优点,即它是可以进行实验测试的——这在关于普遍吸引力的神秘基础的理论中是罕见的。

文章进一步解释了爱因斯坦的重力理论之所以了不起,不仅因为它有效(并且具有卓越的数学之美),还因为它暴露了自己的不完整性。广义相对论预测恒星可以坍缩形成黑洞,而在这些物体的中心,重力变得无限强。在那里,时空连续体像一个超载的购物袋一样撕裂开来,而理论无法说出接下来会发生什么。此外,广义相对论与热物理有着惊人的相似之处,尽管在其发展中没有使用任何热概念。它预测黑洞只增长,不缩小,只吞噬,不吐出。这种不可逆性是热流的特征。当热量流动时,能量采取更加随机或混乱的形式;一旦这样做,它不太可能自发地重新排序。熵量化了这种混乱度的增长。

文章最后讨论了物理学家如何从黑洞中寻找线索,探索时空如何从更微观的组成部分中涌现。主要的方法是基于所谓的全息原理。它说时空的涌现有点像普通的全息图。就像全息图从一个刻在平面上的波纹图案中唤起深度感一样,宇宙微观组成部分中的模式可能会产生另一个空间维度。这个新维度是弯曲的,因此重力自然产生。

熵增重力,由马里兰大学的的理论物理学家 Ted Jacobson 在 1995 年的一篇著名论文中引入,采取了相关但不同的方法。之前,物理学家从爱因斯坦的理论出发,推导出其类似热的结果。但雅各布森反其道而行之。他从假设时空具有热性质出发,并用这些性质推导出广义相对论的方程。他的工作证实了重力和热之间的相似之处确实有其重要性。


HN 热度 246 points | 评论 209 comments | 作者:pseudolus | 23 hours ago #

https://news.ycombinator.com/item?id=44285874

  • 熵增重力理论类似于“巴西果效应”,即大质量物体在随机粒子撞击下会相互吸引,形成“影子”。
  • 费曼讲座中提到了一种类似的重力机制,但存在问题,如地球在轨道上的运动会受到阻力而减速。
  • 熵增重力理论可能有一定的价值,可以将其视为被无质量的“作用潜能”从四面八方轰炸,质量吸收这些潜能以在时空中移动。
  • 通过振动速度可以解释颗粒物理中的反直觉现象,低速度时类似于牛顿重力,高速度时类似于不需要暗物质的 MOND 重力。
  • 熵增可以理解为系统倾向于宏观上可能的状态群体。

WhatsApp introduces ads in its app #

https://www.nytimes.com/2025/06/16/technology/whatsapp-ads.html

2025 年 6 月 16 日,WhatsApp 宣布将首次在其应用中投放广告。这一举措标志着 WhatsApp 在广告方面的重大转变,尤其是在其用户长期以来习惯于无广告、端到端加密的聊天环境中。广告将仅在名为 “Updates” 的部分展示,每天约有 15 亿用户使用该功能。WhatsApp 表示,它将收集一些用户数据(如位置和设备的默认语言)来进行广告定向,但不会接触用户的消息内容或通话记录,确保用户的个人消息、通话和状态保持端到端加密。

WhatsApp 的创始人 Jan Koum 和 Brian Acton 曾致力于打造一个简单、快速、安全的通讯工具,而这一广告策略的实施与他们的初衷相悖。自两位创始人离开后,Meta CEO 马克・扎克伯格专注于 WhatsApp 的用户增长和隐私保护,同时将其整合到 Meta 的其他产品中。投放广告为 Meta 提供了一个潜在的盈利机会,尤其是在公司在人工智能等领域投入巨资的情况下。

WhatsApp 的负责人 Will Cathcart 向用户保证,尽管引入广告,应用的安全性和隐私保护将不会受到影响。此次宣布是在戛纳国际创意节上进行的,WhatsApp 还计划推出类似于其他平台(如 X、YouTube 和 Twitch)的内容创作者月订阅服务,并允许用户和企业为他们的 “频道” 投放广告。

Meta 近年来一直在寻找未开发的收入来源,已经在 Instagram 和 Facebook 上推出了创作者的付费订阅服务,并开始在 Threads 应用上显示广告。分析师 Brian Wieser 表示,Meta 的广告业务处于强势地位,去年该公司 1640 亿美元的收入几乎全部来自广告。

尽管如此,由于 WhatsApp 在用户隐私方面的品牌形象,与 Facebook 和 Instagram 相比,其广告收入可能面临挑战。WhatsApp 长期以来将自己定位为一个安全的聊天工具,用户尤其在政治不稳定或专制国家中更倾向于使用此应用。引入广告可能会引发用户对 WhatsApp 隐私保护的关注,尤其是在 2021 年因条款变更而引发的全球反对之后。

WhatsApp 表示,用户可以选择将 WhatsApp 与 Instagram 和 Facebook 账户链接,以便基于这些平台收集的数据进行广告定向。此外,WhatsApp 还与苹果公司一起,针对英国监管机构试图打破加密的举措展开法律斗争,强调保护用户隐私和数据安全的重要性。


HN 热度 176 points | 评论 260 comments | 作者:greenburger | 10 hours ago #

https://news.ycombinator.com/item?id=44289412

  • 许多人不愿意为软件付费,宁愿使用盗版也不愿意支付小额费用,尤其是当他们认为数字产品不应该是付费的。
  • 人们更愿意为即时交易付费,例如游戏内购买和季票,因为它们被视为一次性购买,不需要进一步计算。
  • 订阅服务如果价格足够便宜,购买欲望会降低,而且复杂的取消流程也会影响人们的购买意愿。
  • 有人对 WhatsApp 引入广告感到不满,因为他们曾支付费用以换取无广告体验。
  • 有人认为 Facebook 的创始人 Brian Acton 在出售 WhatsApp 时面临巨大的机会成本,19 亿美元的收购价很难拒绝。
  • 有人认为苹果错失了通过 iMessage 建立跨平台聊天服务的机会,而 Facebook 和 Meta 正在侵蚀 iPhone 用户在聊天服务上的最后一块阵地。
  • 有人认为在美国,人们转向使用 WhatsApp 的数据并不明显,因为许多美国青少年仍在使用 iMessage。
  • 有人认为 Google 也错过了通过 Hangouts 建立跨平台聊天服务的机会,因为运营商的反对导致 Google 放弃了这一计划。
  • 有人认为为服务支付小额费用的问题不在于费用本身,而在于支付过程中的摩擦和支付后带来的麻烦。

Show HN: Zeekstd – Rust Implementation of the ZSTD Seekable Format #

https://github.com/rorosen/zeekstd

这个网页是一个关于“Zeekstd”项目的 GitHub 页面,提供了一个 Rust 语言实现的 Zstandard Seekable Format(Zstandard 可寻址格式)。以下是网页的详细中文摘要:

项目介绍: Zeekstd 是一个 Rust 实现的 Zstandard Seekable Format,它将压缩数据分割成一系列独立的“帧”,每个帧单独压缩。这样,解压档案中间的部分只需要解压至多一个帧的额外数据,而不是整个档案。Zeekstd 对可寻址格式进行了更新版本的实现,但与最初的可寻址格式完全兼容。

压缩功能: Zeekstd 的可寻址编码器会自动在 2MiB 的未压缩数据后开始新的帧。可以通过 EncodeOptions 更改此设置和其他压缩参数。示例代码展示了如何使用 Zeekstd 的 Encoder 来压缩数据。

use std::{fs::File, io};
use zeekstd::Encoder;

fn main() -> zeekstd::Result<()> {
    let mut input = File::open("data")?;
    let output = File::create("seekable.zst")?;
    let mut encoder = Encoder::new(output)?;
    io::copy(&mut input, &mut encoder)?;
    // 结束压缩并写入寻址表到可寻址文件的末尾
    encoder.finish()?;
    Ok(())
}

解压缩功能: 默认情况下,可寻址解码器会解压所有内容,从第一个帧到最后一个帧,但也可以选择配置来只解压特定的帧。示例代码展示了如何使用 Zeekstd 的 Decoder 来解压数据。

use std::{fs::File, io};
use zeekstd::Decoder;

fn main() -> zeekstd::Result<()> {
    let input = File::open("seekable.zst")?;
    let mut output = File::create("decompressed")?;
    let mut decoder = Decoder::new(input)?;
    // 解压所有内容
    io::copy(&mut decoder, &mut output)?;
    let mut partial = File::create("partial")?;
    // 只解压特定的帧
    decoder.set_lower_frame(2);
    decoder.set_upper_frame(5);
    io::copy(&mut decoder, &mut partial)?;
    Ok(())
}

命令行工具(CLI): 该仓库还包含了一个使用该库的命令行工具。

许可证: zstd C 库采用双 BSD/GPLv2 许可证,而 Zeekstd 采用 BSD 2-Clause 许可证。

项目活动: 页面显示该项目有 127 个星标,1 个观看者,1 个分支,并且有 8 个版本发布,最新的版本是 v0.3.0-cli,发布于 2025 年 5 月 27 日。

项目语言: 主要使用的语言是 Rust,占比 94.5%,还有 5.5% 的 Nix 语言。

以上就是这个 GitHub 项目页面的主要内容摘要。


HN 热度 165 points | 评论 34 comments | 作者:rorosen | 1 day ago #

https://news.ycombinator.com/item?id=44284871

  • Seekable formats 允许随机读取,可以用于远程托管的压缩文件上,例如通过 HTTPS 启动 qemu 虚拟机。
  • zstd 的 seekable 版本尚未标准化。
  • Zeekstd 名称是由 “zstd” 和 “seek” 结合而来,与另一个同名的安全项目 “zeek” 无关。
  • 在某些情况下,使用自定义字典可以提高压缩效率,尤其是在较小的块大小下。
  • 标准的 zstd 允许多个帧组成一个流,但这不足以实现高效查找,需要一个 “seek table” 来记录每个压缩帧的大小信息。
  • Seekable Zstd 是一个多帧 Zstd 流,文件末尾包含一个可跳过的 seek table,记录了每个帧的压缩和解压大小。
  • bgzip/gzip 世界中,索引是通过外部的索引文件(.gzi)来处理的,而 zstd 的方法更受欢迎,因为它将索引作为文件的一部分。

Telephone Exchanges in the UK #

https://telephone-exchanges.org.uk/

电话交换机是英国电信系统的核心,已经存在了超过一个世纪。全国有超过 5,500 个电话交换机,这些建筑物大多外观普通,默默地连接着超过 254 万公里的电缆和线路,使人们能够相互联系以及与世界其他地方保持联系。

自 1879 年伦敦建立第一个电话交换机以来,这些看似无名的建筑遍布英国,从偏远的舍特兰群岛的 Papa Stour(仅有 14 户人家)到位于曼彻斯特的老汉姆的最大交换机(服务超过 45,000 用户)都有。然而,随着基于数字光纤服务的迅猛发展,大多数传统的电话交换机即将结束它们的使命。

现代技术的进步,如微处理器和比人类头发宽度还要细的光纤,使得旧的基于铜线的电话网络(公共交换电话网络,PSTN)所需的空间大幅减少。因此,我们现在可以通过仅 1,000 个 “超级数字交换机” 或 Openreach 交接点(OHP)为全国提供光纤宽带服务。

这意味着,仍在使用的 4,600 个传统铜线电话和宽带语音服务的交换机即将消亡,而依赖这些服务的用户也在迅速减少,大家都在向更快、更高效的光纤服务迁移。Openreach 公司正与其通信服务提供商客户(如 Sky、Vodafone、TalkTalk 和 BT)进行咨询,计划在未来十年内关闭这些 “遗留” 交换机。

这一过程将是一个重大工程,需要迁移数百万个服务,同时确保脆弱用户和英国的关键国家基础设施供应商在这一过程中受到保护。因此,Openreach 将分阶段进行规划,首批 103 个交换机计划在 2030 年 12 月前关闭,这些交换机的运营成本较高,因此优先关闭它们是有明显优势的。其余的 4,500 个交换机预计将在 2030 年代初期陆续关闭。

以上信息来源于 Openreach 的首席战略官理查德・奥尔伍德于 2023 年 6 月 26 日发布的新闻稿。


HN 热度 163 points | 评论 68 comments | 作者:petecooper | 1 day ago #

https://news.ycombinator.com/item?id=44284466

  • 有人分享了他们的父亲作为电话工程师/经理在美国 GTE 的经历,描述了 70 年代的电话交换大楼的安保措施和内部情况。
  • 有人推荐了西雅图的 Connections Museum,那里有多个时期的机电交换设备和老式电话、电传机和付费电话的收藏。
  • 有人提到了自己作为志愿者在博物馆工作的经历,并提到了博物馆即将在丹佛开设第二个地点。
  • 有人推荐了阿拉斯加科迪亚克岛上的 Kodiak Military History Museum,那里有老式工作电话和电传系统。
  • 有人分享了一个 YouTube 视频,展示了年轻人探索一个仍在活跃的电话交换中心,里面充满了古老和现代的技术。
  • 有人提到了一个网站,展示了用旧电话和电子设备制作的一些很酷的东西。
  • 有人分享了自己父亲在 BT 工作的经历,以及他们一起参观不同电话交换中心的经历。
  • 有人推荐了“这个博物馆不是过时的”(This Museum is (not) Obsolete),这是一个可以体验旧式分支交换机的地方。
  • 有人提到了 Look Mum No Computer 的 Sam 运营的一个有趣的 YouTube 频道,内容包括老式音乐设备和电话实验。
  • 有人推荐了西苏塞克斯的 Amberley Museum,那里有关于通信历史的展览。
  • 有人提到了英国伯明翰附近的 Avoncroft 博物馆,那里有一系列老式电话亭,都连接到现场的一个交换中心。
  • 有人提到了 Kidderminster 的地毯博物馆和 Dudley 的 Black Country Museum,以及 Ironbridge 的一系列工业博物馆。
  • 有人对电话交换目录的编目工作表示赞叹,并认为电信系统作为现代技术的基础,没有得到足够的公众关注。
  • 有人提到了 80 年代物理学老师关于电话交换位置是英国国家机密的说法,以及苏联间谍可能如何获取这些信息。
  • 有人回应了关于苏联间谍和英国地图的信息,并指出苏联的地图大多是基于英国测绘局的地图制作的。
  • 有人提出了关于电力变电站位置是否为“秘密”的问题,以希思罗机场的三个变电站为例。