2024 03 13 HackerNews

2024-03-13 Hacker News Top Stories #

一句话摘要 #

  1. 波音告密者约翰·巴尼特在美国去世,他在去世前正准备对波音公司提出告密诉讼的证词。
  2. 詹姆斯·韦伯太空望远镜和哈勃太空望远镜的合作测量结果确认了宇宙膨胀速率的准确性,解决了长期存在的哈勃张力问题。
  3. Trangram 是一个免费的动态图形创作平台,类似于Adobe Illustrator但专注于动画制作。
  4. 苹果公司宣布在欧盟地区允许用户直接从网站下载应用程序,为开发者提供更多分发选项。
  5. 文章介绍了通过NVMe over TCP技术克隆笔记本电脑的详细过程,包括磁盘复制和系统调整。
  6. 这篇教程从优化的角度介绍了如何从头开始构建、训练和采样一个简单的扩散模型,提供了理论和代码实现。
  7. Meta公司详细介绍了其人工智能基础设施的建设,包括硬件、网络、存储和软件等方面的创新。
  8. Cognition实验室介绍了世界上第一个完全自主的AI软件工程师Devin,能够执行复杂的工程任务。
  9. 辛普森悖论是统计学中的现象,说明了在分组数据中出现的趋势在合并后可能消失或反转。
  10. OpenAI发布了Transformer Debugger工具,用于调查和解释小型语言模型的行为,提供了对模型组件的深入分析。

Boeing whistleblower found dead in US #

https://www.bbc.com/news/business-68534703

这篇文章报道了波音公司的告密者约翰·巴尼特被发现在美国去世的消息。约翰·巴尼特曾在波音公司工作超过 30 年,于 2017 年退休。在去世前的几天,他正在对公司进行告密诉讼的证词。

报道指出,62 岁的约翰·巴尼特于 3 月 9 日因“自残”身亡,警方正在调查此案。他曾在南卡罗来纳州的北查尔斯顿工厂担任质量经理,制造 787 梦幻客机。2019 年,他告诉 BBC,受到压力的工人故意在生产线上安装次标准零部件。他还发现氧气系统存在严重问题,可能导致四分之一的呼吸面罩在紧急情况下无法使用。

约翰·巴尼特表示,他已向管理层提出关切,但未采取任何行动。尽管波音公司否认了他的说法,但美国联邦航空管理局(FAA)在 2017 年的审查中确认了他的一些担忧。约翰·巴尼特退休后,对公司提起了长期的法律诉讼。在去世时,他正在查尔斯顿接受与此案相关的法律采访。他在酒店停车场的卡车内被发现死亡。这起事件发生在波音公司和其主要供应商 Spirit Aerosystems 的生产标准正受到严格审查的时候。

文章还提到了一起早前发生的事件,即一架全新的波音 737 Max 飞机在从波特兰国际机场起飞后不久,一个未使用的紧急出口门脱落的情况。美国国家运输安全委员会的初步报告指出,设计用于牢固固定门的四个关键螺栓未安装。最近,FAA 表示对波音公司进行了为期六周的审计,发现“公司多次未能遵守制造质量控制要求”。


HN 评论 506 comments | 作者:neapolisbeach | 1 day ago #

https://news.ycombinator.com/item?id=39673589

对于这位波音公司的举报者的死因,有人认为即使是自杀也可能不是自愿的,可能是在受到威胁和压力下被迫做出的选择;

也有人认为他可能出于让公众意识到波音问题的唯一解决方案而自杀;

还有人质疑他的死是否真的是自杀,认为可能有更多背后的故事。

同时,有人指出波音公司的恶劣工作环境可能导致了他的死亡,而对于此案的调查和结论仍在进行中。


Webb and Hubble confirm Universe’s expansion rate #

https://www.esa.int/Science_Exploration/Space_Science/Webb/Webb_Hubble_confirm_Universe_s_expansion_rate

根据欧洲空间局(ESA)发布的信息,詹姆斯·韦伯(James Webb)太空望远镜的测量结果为一个持续了十年之久的谜团带来了新的启示。宇宙膨胀速率,即哈勃常数,是理解宇宙演化和最终命运的基本参数之一。然而,存在一个持续的差异,被称为哈勃张力,即在独立距离指示器测量的常数值与从宇宙大爆炸余辉预测的值之间存在差异。NASA/ESA/CSA 詹姆斯·韦伯太空望远镜证实了哈勃太空望远镜一直是正确的,消除了对哈勃测量的任何疑虑。

在哈勃太空望远镜发射之前,地面望远镜的观测结果存在巨大的不确定性。哈勃的观测结果将宇宙的膨胀速率的测量精度缩小到不到百分之一,将宇宙年龄的值确定为 138 亿年。然而,哈勃的值与其他测量结果不一致,这些结果暗示宇宙在大爆炸后膨胀得更快。詹姆斯·韦伯太空望远镜的红外视图与哈勃的光学数据相符,证实了哈勃望远镜的观测结果。

哈勃张力仍然是宇宙学家头疼的难题,可能有一些我们尚未理解的空间特性。解决这一矛盾是否需要新的物理学?还是由于两种不同方法用于确定空间膨胀速率之间的测量误差?

哈勃和韦伯现在已经合作进行了确定性的测量,进一步证实了某种影响膨胀速率的因素,而不是测量误差。这些发现发表在 2024 年 2 月 6 日的《天体物理学通讯》杂志上。


HN 评论 306 comments | 作者:thunderbong | 1 day ago #

https://news.ycombinator.com/item?id=39673087

评论中的观点归纳如下:

  • 对宇宙膨胀速率的认知历史和方法的赞赏;
  • 对古代天文学家如亚里士多德的贡献和估算距离的讨论;
  • 对古代天文学家估算距离的不确定性和准确性的讨论;
  • 对古代天文学家在不同时期的贡献和认知的探讨;
  • 对天文学中的误差分析和不确定性的讨论;
  • 对宇宙膨胀速率的不同测量方法和结果的讨论;
  • 对宇宙膨胀速率的矛盾和可能解释的探讨;
  • 对宇宙微波背景辐射的不同理论和解释的讨论。

Show HN: I made a free animator. Think Adobe Illustrator but for animation #

https://www.trangram.com

Trangram 是一个创作动态图形的平台,用户可以在该平台上创建、制作动画并分享。该平台提供了多种功能,包括探索和获取灵感。用户可以通过该平台打开编辑器,展开创作。

希望这个简要概要能够帮助您对该网站有一个初步了解。如果您需要更多详细信息或有其他问题,请随时告诉我!


HN 评论 172 comments | 作者:trangram | 19 hours ago #

https://news.ycombinator.com/item?id=39675807

评论中的观点归纳如下:

  • Flash 因不符合网络约定而消亡,CSS 已经取代了 Flash 的功能。
  • Flash 消亡是因为苹果和微软的抵制,特别是苹果拒绝在 iPhone 上支持 Flash。
  • Flash 的核心价值在于其出色的 IDE,使用户可以轻松创建动画和应用。
  • Flash 的死亡导致了许多新工具的出现,但缺乏 Flash 的所有功能,如文本选择等。
  • Flash 的消失影响了业余动画师和内容创作者的数量,尽管互联网采用率大幅提高。
  • Adobe Animate 被认为是 Flash 的继任者,但并不完全取代了 Flash 的功能。
  • Rive 等新工具正在兴起,提供类似 Flash 的动画功能。
  • 评论者期待使用类似 Flash 的现代工具,如 Rive 和 LottieLab。
  • Trangram 被认为是现代 Macromedia Flash,提供 JS 运行时而非插件。
  • Adobe Animate 被用于导出视频,但仍支持大部分 Flash 的功能。
  • Flash 的消失导致了一些功能的缺失,如库和组件支持,以及在元素上添加点击处理等。
  • Flash 的作者工具被认为是优秀的矢量动画工具,但 Adobe 未能将其输出为 HTML5。
  • Ruffle 被用于复兴 Flash 动画,以保留早期千禧年 Flash 动画的文化遗产。

Apple announces ability to download apps directly from websites in EU #

https://www.macrumors.com/2024/03/12/apple-announces-app-downloads-from-websites/

根据您提供的链接,文章介绍了苹果公司在欧盟地区为开发者带来的三项新变化。其中一项重要变化是允许开发者直接从网页上分发应用程序。这意味着用户可以通过访问特定网站来下载 iPhone 应用程序,而无需通过 App Store。

此外,开发者还可以选择如何向用户提供应用程序的更新,包括通过网页或其他方式。这一举措旨在增加开发者的灵活性,并为用户提供更多选择。

文章还提到,这些变化将在未来几个月内逐步推出,以确保顺利过渡和最佳用户体验。


HN 评论 884 comments | 作者:Hamuko | 10 hours ago #

https://news.ycombinator.com/item?id=39678532

  • 应用生态系统(android 和 apple)被精心构建,以最大程度地提取市场所有者价值,用户价值是次要考虑因素。
  • 应用程序像网页一样有可能设计更好的网络,但实际上是一个相对笨拙的封闭过程,必须首先明确安装应用程序,然后才能使用。
  • Apple 试图保护用户免受欺诈者的伤害,但随着费用的移除,这种合理的授权和认证业务将继续存在。
  • 独立开发者完全被锁定在网络分发之外,仅适用于已经支付 Apple 税款的开发者。
  • Apple 的目标很明确,是为了阻止竞争,而不是像他们一直谎称的那样关于安全,这一切都是为了维持他们的应用商店垄断地位。
  • 通过网页分发的应用程序必须满足认证要求,以保护平台完整性,就像所有 iOS 应用程序一样,只能从开发者在 App Store Connect 中注册的网站域名安装。

Cloning a Laptop over NVMe TCP #

https://copyninja.in/blog/clone_laptop_nvmet.html

这篇博文讲述了如何通过 NVME TCP 克隆笔记本电脑的过程。作者最初打算设置新笔记本电脑,但不想重复之前的步骤。在同事的建议下,作者决定将整个磁盘复制到新笔记本电脑上。

具体步骤包括:导出旧笔记本电脑的磁盘,进行磁盘复制到新笔记本电脑,调整分区以使用完整的 1TB,调整 LUKS,最后调整 BTRFS 根磁盘。作者通过使用 nvmet-tcp 模块将设备导出为 NVME over TCP,并在新笔记本电脑上连接设备。

然后使用 dd 命令将根磁盘复制到新笔记本电脑,调整分区和 LUKS 容器大小,最终调整 BTRFS 文件系统大小。整个过程使作者获得了新笔记本电脑,同时学习了如何使用 NVME over TCP 导出磁盘。


HN 评论 150 comments | 作者:pabs3 | 16 hours ago #

https://news.ycombinator.com/item?id=39676767

这篇帖子中的评论观点可以归纳为:

    1. 使用 netcat 替代复杂命令进行网络镜像操作;
    1. 建议使用 pv 替代 dd,提供进度图表;
    1. 讨论 Linux 管道缓冲区大小和性能优化;
    1. 讲述了恢复数据的经历;
    1. 讨论 dd 参数设置以避免数据损坏;
    1. 探讨 SSD 顺序写和随机写速度;
    1. 讨论 NVMe/TCP 和 Clonezilla 的使用建议;
    1. 推荐使用 gzip 或 lz4 进行镜像压缩;
    1. 讨论 O_DIRECT 对性能的影响;
    1. 建议使用 dump 和 restore 工具进行数据复制。

Diffusion models from scratch, from a new theoretical perspective #

https://www.chenyang.co/diffusion.html

这个网页内容主要介绍了从头开始构建扩散模型的过程。扩散模型最近在生成建模方面取得了令人印象深刻的成果,特别是在从多模态分布中采样方面。

本教程旨在从优化的角度介绍扩散模型,通过一个运行示例来说明如何从头开始构建、训练和采样一个简单的扩散模型。教程涵盖了理论和代码,使用理论来解释如何实现扩散模型。通过教程的学习,您将学会为玩具数据集实现训练和采样代码,这也适用于更大的数据集和模型。

教程中还介绍了扩散模型的训练、噪声调度、噪声生成、理想去噪器等内容。同时,还提到了采样过程、相对误差模型、扩散采样作为距离最小化等内容。整体而言,这篇文章详细介绍了扩散模型的原理、训练和采样方法,适合想要深入了解扩散模型的读者阅读。


HN 评论 40 comments | 作者:jxmorris12 | 1 day ago #

https://news.ycombinator.com/item?id=39672450

  • 有评论认为这篇博文简洁明了,对扩散模型的训练和采样进行了基本介绍,易于初学者理解;
  • 另一些评论提到希望在未来的帖子中深入探讨与变分自动编码器(VAEs)的联系,优化主题等,但也强调要保持对初学者友好的风格;
  • 还有评论指出缺乏关于得分建模、理解潜在表示困难等主题的讨论,建议作者倾听读者的反馈,持续改进;
  • 有人提到希望看到扩散变换器的延伸,建议使用变换编码器替换 U-net,并讨论不同的编码策略;
  • 还有评论提到扩散模型建模得分函数和扩散采样类似于 Langevin 动力学,解释了为什么训练这些模型比 GANs 更容易。

Building Meta’s GenAI infrastructure #

https://engineering.fb.com/2024/03/12/data-center-engineering/building-metas-genai-infrastructure/

这篇文章介绍了 Meta 公司在人工智能领域的重大投资,宣布推出两个拥有 24,000 GPU 集群的项目。文章详细介绍了硬件、网络、存储、设计、性能和软件等方面的细节,这些方面帮助他们为各种人工智能工作负载提取高吞吐量和可靠性。Meta 公司致力于开放计算和开源,他们在 Grand Teton、OpenRack 和 PyTorch 等平台上构建这些集群,并继续推动行业的开放创新。

Meta 公司的长期愿景是构建开放且负责任的人工通用智能(AGI),以便广泛为所有人提供利益。他们不仅在构建 AI 基础设施方面取得了长足进展,还在扩展集群规模以支持这一愿景。文章还介绍了 Meta 公司的 AI 集群的网络、计算、存储和性能等方面的细节,展示了他们在人工智能领域的领先地位和创新能力。

此外,文章还强调了 Meta 公司对开放 AI 创新的承诺,包括在硬件和软件方面的开源创新,以及与学术研究人员合作深化对 AI 技术发展的理解。Meta 公司的未来 AI 基础设施规划包括继续扩展基础设施建设,到 2024 年底,他们计划将拥有 35 万个 NVIDIA H100 GPU,相当于将近 60 万个 H100 GPU 的计算能力。他们不断评估和改进基础设施的各个方面,以支持快速发展的新模型和研究。


HN 评论 159 comments | 作者:mootpt | 6 hours ago #

https://news.ycombinator.com/item?id=39680997

这篇评论讨论了在构建 Meta 的 GenAI 基础设施过程中涉及的各种技术细节和问题。

评论中提到了使用 float8 和 2:4 稀疏性支持等技术,以及对 CPU 推理性能的影响。

讨论了 FLOPs 增加对内存带宽的影响以及小浮点数对数据传输带宽的减少。

评论还涉及到了构建大规模集群时的工程力量与计算能力之间的关系,以及对计算资源的高额支出。

评论中及了 Meta 的 GenAI 项目的成本和未来发展前景,以及对 AI 技术在社交媒体中的应用和商业潜力的看法。

最后还讨论了 Meta 的数据优势和可能的发展方向,以及 Meta 与其他大型科技公司之间的竞争关系。


Devin: AI Software Engineer #

https://www.cognition-labs.com/blog

这个网站是关于一个名为 Devin 的全自动 AI 软件工程师的介绍。

Devin 是世界上第一个完全自主的 AI 软件工程师,能够执行复杂的工程任务,包括学习和修复错误,构建和部署应用程序,训练和微调自己的 AI 模型等。

Devin 在 SWE-bench 编码基准测试中表现出色,解决了一些真实世界的 GitHub 问题,远远超过了以往的技术水平。

该网站还介绍了 Cognition 实验室,他们专注于推理技术,并提供了关于如何雇佣 Devin 以及加入他们团队的信息。

如果您对解决世界上的重大问题并构建具有推理能力的 AI 感兴趣,可以在该网站上了解更多信息并申请加入。


HN 评论 339 comments | 作者:neural_thing | 8 hours ago #

https://news.ycombinator.com/item?id=39679787

  • 有开发者表示尝试使用 AI 编码,但遇到了上下文长度、模型输出质量、缺乏架构等问题,认为当前技术还不够成熟;
  • 认为 VC 对 LLM 技术存在过度炒作,应该更多投入研究实验室,而不是追求快速产品上线;
  • 有人认为 LLM 可能无法实现人工智能通用智能(AGI),需要更多研究和实验;
  • 有人指出 LLM 在文本任务上表现良好,但 VC 更关注虚幻问题而非实际应用;
  • 认为 LLM 无法达到专业写手水平,写作风格缺乏专业性;
  • 有人表示 LLM 对日常工作有所帮助,但不能完全取代人类写作;
  • 有人认为 LLM 技术仍有发展空间,未来版本可能会有更大突破。

Simpson’s paradox #

https://en.wikipedia.org/wiki/Simpson%27s_paradox

辛普森悖论是概率和统计学中的一种现象,指的是在几组数据中出现的趋势,在这些组合并后消失或反转的情况。这种现象经常在社会科学和医学科学统计中遇到,尤其是当频率数据被不当地赋予因果解释时,会带来问题。

辛普森悖论可以通过适当处理混杂变量和因果关系来解决,例如通过聚类分析等统计建模方法。这一现象最早由 Edward H. Simpson 在 1951 年的一篇技术论文中描述,但此前统计学家 Karl Pearson 和 Udny Yule 也提到了类似的效应。

辛普森悖论的名称是由 Colin R. Blyth 在 1972 年引入的,也被称为辛普森逆转、尤尔-辛普森效应、合并悖论或逆转悖论。这一现象的教训在于强调我们需要同时考虑数据的部分和整体,而不是选择其中一种观点。


HN 评论 93 comments | 作者:tosh | 1 day ago #

https://news.ycombinator.com/item?id=39673754 #

  • 数据分析中遇到的 Simpson’s paradox 案例:营销团队降低了每个产品类别的营销成本,但总体成本却翻了一番,因为产品类别的销售比例发生了巨大变化。
  • 网络工程师优化了负载大小,结果导致平均延迟反而增加,因为服务改善后,用户使用量增加,拉高了整体延迟。
  • 讨论中提到的 YouTube 优化案例,改善页面重量导致性能下降,因为低网速国家的用户增加。
  • 讨论中涉及的不同解释和观点:Simpson’s paradox、Jevons Paradox、数据分析误解等。
  • 总结:数据分析中需综合考虑整体和部分数据,选择合适的指标,避免陷入 Paradox。

OpenAI – transformer debugger release #

https://github.com/openai/transformer-debugger

GitHub 上的 openai/transformer-debugger 是由 OpenAI 的 Superalignment 团队开发的 Transformer Debugger(TDB)工具,旨在支持对小型语言模型特定行为的调查。该工具结合了自动可解释性技术和稀疏自动编码器。

TDB 能够在无需编写代码之前快速探索,具有干预前向传递并查看其对特定行为的影响的能力。它可用于回答诸如“为什么模型在这个提示下输出标记 A 而不是标记 B?”或“为什么注意力头 H 在这个提示下关注标记 T?”等问题。它通过识别特定组件(神经元、注意力头、自动编码器潜在特征)来解释行为,展示自动生成的解释,以及追踪组件之间的连接以帮助发现电路。

该工具提供了关于 TDB 的概述视频,并展示了如何使用它来调查 GPT-2 small 中的间接对象识别。

主要内容包括:

Neuron viewer:一个托管 TDB 的 React 应用程序,以及有关各个模型组件(MLP 神经元、注意力头和自动编码器潜在特征)信息的页面。 Activation server:一个后端服务器,对主题模型执行推理以为 TDB 提供数据。它还从公共 Azure 存储桶中读取和提供数据。 Models:用于 GPT-2 模型及其自动编码器的简单推理库,具有抓取激活的钩子。 汇总的激活数据集:MLP 神经元、注意力头和自动编码器潜在特征的最高激活数据集示例。

安装步骤包括设置环境、克隆仓库、安装组件等。还提供了如何进行更改验证的步骤。

此外,还提供了术语表、如何引用以及其他相关资源的链接。


HN 评论 100 comments | 作者:nmca | 21 hours ago #

https://news.ycombinator.com/item?id=39675054

  • 有评论认为 Elon Musk 的诉讼引发了 OpenAI 发布更多内容,但其核心论点被认为是站不住脚的;
  • 另一方认为 Elon Musk 提出了关于 OpenAI 非营利地位和相关活动不足的合理质疑;
  • 讨论围绕 OpenAI 的非营利地位,税收豁免机构 501(c)的要求,以及 Elon Musk 的诉讼展开;
  • 有人认为 Elon Musk 的诉讼是因为 OpenAI 开始收费,而内部通信显示他也有同样的想法;
  • 讨论围绕 AGI 的研究问题,以及对于替代人类工作的讨论。