2024 04 10 HackerNews

2024-04-10 Hacker News Top Stories #

一句话摘要 #

  1. Llm.c – LLM training in simple, pure C/CUDA 一个使用 C/CUDA 语言训练大型语言模型(LLMs)的简单、纯净的项目,旨在减少对 PyTorch 或 cPython 的依赖。
  2. Peter Higgs, physicist who discovered Higgs boson, has died 诺贝尔奖得主、希格斯玻色子的发现者彼得·希格斯去世,享年94岁,他的理论对理解宇宙有着深远的影响。
  3. Beeper acquired by Automattic Beeper,一个跨平台聊天应用,被Automattic收购,将继续开发并致力于创造新的聊天体验。
  4. After AI beat them, professional Go players got better and more creative 职业围棋选手在人工智能AlphaGo的挑战后,不仅水平提升,而且变得更具创造力。
  5. Hello OLMo: A truly open LLM AI2发布了全新的开放式大型语言模型(LLM)框架OLMo,旨在推动语言模型科学的发展。
  6. Show HN: I made a discrete logic network card 作者介绍了他使用离散逻辑芯片构建10BASE-T以太网收发器的过程和技术细节。
  7. 1.18k drawings of plant root systems 瓦赫宁根大学的研究收藏页面,展示了1800多张植物根系的详细绘图。
  8. How I tripped over the Debian weak keys vulnerability 作者分享了他如何意外发现Debian弱密钥漏洞的经历,以及这一发现对开源软件安全的重要性。
  9. Intel Gaudi 3 AI Accelerator 英特尔发布了Intel Gaudi 3 AI加速器,旨在提供高性能的AI计算能力,特别是在生成式AI模型上。
  10. Fairbuds: In-ear with replaceable batteries Fairphone推出了Fairbuds耳机,这是一款具有可更换电池和三年保修期的高端、易维修的耳机。

Llm.c – LLM training in simple, pure C/CUDA #

https://github.com/karpathy/llm.c

这个 GitHub 仓库( https://github.com/karpathy/llm.c)包含了一个名为 LLM 的训练项目,使用简单、纯净的 C/CUDA 语言。该项目旨在训练大型语言模型(LLMs),无需使用大量的 PyTorch(245MB)或 cPython(107MB)。举例来说,训练 GPT-2(CPU,fp32)只需约 1000 行干净的代码在一个文件中。项目可以立即编译和运行,并且完全匹配 PyTorch 的参考实现。作者选择 GPT-2 作为第一个工作示例,因为它是 LLMs 的鼻祖,是现代堆栈首次组合的产物。

目前,作者正在进行以下工作:

  • 直接的 CUDA 实现,预计速度将显著提高,并可能接近 PyTorch 的性能。
  • 使用 SIMD 指令(如 x86 上的 AVX2 或 ARM 上的 NEON,例如 Apple Silicon)加速 CPU 版本。
  • 更现代的架构,例如 Llama2、Gemma 等。

作者希望在仓库中保持干净、简单的参考实现,同时也提供更多优化版本,这些版本可以接近 PyTorch 的性能,但代码量和依赖要少得多。 该项目还包括单元测试、教程以及正在进行的 CUDA 移植工作。项目采用 MIT 许可证。


HN 评论 158 comments | 作者:tosh | 1 day ago #

https://news.ycombinator.com/item?id=39973467

  • 赞赏 Andrej 的视频,认为视频内容丰富,能够从中获益。
  • 希望摆脱 Python 及其环境依赖,转向更轻量级的 C/CUDA。
  • 对 Python 的功能性表示赞赏,认为其他语言需要更多工作来实现同样的功能。
  • Mojo 目前不支持 GPU 数据并行,对于 AI 应用可能存在限制。
  • Candle 是一个面向性能和易用性的 Rust 最小化 ML 框架,受到好评。
  • 对于 GPU 内存扩展提出建议,但指出 GPU 制造商可能不会支持。
  • 认为大型算法可能不适合 1000 行以内的代码实现。
  • Andrej 的贡献和教学受到赞扬,被视为专家的标志。
  • 有关在时序数据中训练 GPT-2 的讨论,提供了相关研究和项目链接。
  • 对 Andrej 的项目和学习资源表示感谢,希望有更多实践性的学习体验。

Peter Higgs, physicist who discovered Higgs boson, has died #

https://www.theguardian.com/science/2024/apr/09/peter-higgs-physicist-who-discovered-higgs-boson-dies-aged-94

彼得·希格斯(Peter Higgs)是一位诺贝尔奖获得者,他提出了一种被称为希格斯玻色子的新粒子,并于 94 岁时去世。

希格斯在 1964 年的工作中展示了这种玻色子如何通过赋予粒子质量来将宇宙粒子结合在一起,因此在 2013 年获得了物理学诺贝尔奖。他在爱丁堡的家中去世,他的理论在 2008 年开始的一系列实验后得到证实,2012 年瑞士 CERN 大型强子对撞机的物理学家证实了他的理论。

诺贝尔奖与比利时理论物理学家弗朗索瓦·英格勒特(François Englert)共同获得,后者的 1964 年的工作也直接促成了这一发现。希格斯是皇家学会的成员和荣誉同伴,他的职业生涯大部分时间都在爱丁堡大学度过,该大学在 2012 年为他设立了希格斯理论物理中心以示敬意。

希格斯的工作激励了成千上万的科学家,他的遗产将继续激励更多的人。希格斯被描述为一个非常特别的人,一个极其谦逊的人,一个伟大的教师,以简单而深刻的方式解释物理。他的预测和发现为我们理解宇宙运作方式的方式提供了深刻的见解。

希格斯的离世对粒子物理学界来说是一个巨大的损失,他的成就为科学做出了巨大贡献。


HN 评论 82 comments | 作者:angrygoat | 8 hours ago #

https://news.ycombinator.com/item?id=39981034

这篇帖子中的评论观点主要包括对 Peter Higgs 的怀念与赞扬,以及对科学传播的讨论,包括科学家在社交媒体上的角色,科学传播者的价值,以及科学家与科学传播者之间的差异。评论还涉及了关于天才是天生还是后天培养的讨论,以及对科学理论的实际应用性的思考。


Beeper acquired by Automattic #

https://blog.beeper.com/2024/04/09/beeper-is-joining-automattic/

Beeper 宣布被 Automattic 收购!团队已加入 Automattic,并将继续打造 Beeper。Beeper 是一个通用聊天应用,可在 14 个不同的聊天网络上发送和接收消息。他们还推出了 Beeper Mini,一个短暂提供的 iMessage-on-Android 应用。

Beeper 目前有超过 115,000 用户,直到今天仍处于测试阶段。他们认为在当今的消息传递领域,有巨大的机会突破界限,创造新的聊天体验。Automattic 以支持 WordPress 和 WooCommerce 而闻名,现在他们将共同开发第三个基本的互联网支柱:聊天。

Beeper CEO 和 Automattic 的 CEO 一直保持着良好的合作关系,他们对目标(打造地球上最好的聊天应用)、方法(尽可能采用开源)和独立性(Beeper 将作为 Automattic 的其他投注部门的一部分独立运营)非常一致。Automattic 去年收购了 Texts.com,现在他们将与 Beeper 团队和产品合并,Beeper CEO 将担任消息部门的负责人。

Beeper 用户可以期待更好的 Beeper 应用,而 Texts.com 用户则不会有变化。未来,两个团队和产品将逐步整合。


HN 评论 215 comments | 作者:Belphemur | 9 hours ago #

https://news.ycombinator.com/item?id=39980268

这篇帖子中的评论观点归纳如下:

  • Beeper 被 Automattic 收购,有人认为 Automattic 将成为 Beeper 的好归属,希望 Beeper 继续使用 Matrix 作为基础;
  • 有人担心 Beeper 被收购后可能会失去独立性,但 Beeper 表示一半产品已开源;
  • 有人猜测 Beeper 和 Texts.com 可能会合并,但也有人认为 Texts 更稳定易用;
  • 有人对 Automattic 的收购充满期待,认为 Automattic 是很好的管理者;
  • 有人关注 Beeper 的安全升级,称其不会查看 Signal、WhatsApp 等未加密消息;
  • 有人质疑 Automattic 收购 Beeper 的战略意义,认为可能是为了加强聊天服务。

After AI beat them, professional Go players got better and more creative #

https://www.henrikkarlsson.xyz/p/go

这篇文章讨论了围棋领域的发展。长期以来,职业围棋选手似乎已经达到了围棋水平的极限,他们的决策质量在 1950 年代到 2010 年代中期基本上停滞不前。然而,2016 年 5 月,DeepMind 展示了 AlphaGo,一款能够击败最优秀人类围棋选手的人工智能。

这引发了人类的反应:几年后,最弱的职业选手比 AI 出现之前最强的选手更好。最强的选手超越了人们认为可能的水平。文章指出,围棋选手的棋艺提升并非仅仅是模仿 AI,而是变得更有创造力。历史上新颖的着法和序列有所增加。研究表明,大约 40% 的提升来自可以通过学习 AI 而记忆的着法,而 60% 的提升来自于与 AI 不同的着法。

作者推测 AlphaGo 的成功迫使人类重新评估某些着法并放弃弱的启发式方法,从而看到之前被忽视的可能性。文章还讨论了 AI 系统对人类技能分布尾部的影响,指出 AI 系统可以证明某些事情是可能的,并激发人们的创造力和技能。文章还提到了 Leela Zero 的发布,一个开源的围棋引擎,促使人们通过 AI 的推理来提高人类创造力。

最后,文章探讨了人类在高度竞争的领域中的潜力,指出 AI 可能会帮助我们突破目前认为不可能的极限。


HN 评论 213 comments | 作者:iNic | 1 day ago #

https://news.ycombinator.com/item?id=39972990

评论中的观点归纳如下:

  • 顶尖棋手因能与计算机训练,比以往更强,但比赛变得枯燥,难以提出独特策略,导致防守型比赛和平局增多;
  • 棋手防守性增加与比赛奖金制度有关,顶级比赛奖金差距巨大,导致风险大;
  • 提出通过先前资格赛和邀请制改变比赛形式;
  • 建议国际象棋类似网球,根据比赛胜利数给分;
  • 建议国际象棋设立升降级系统;
  • 建议国际象棋比赛胜利得分高于平局;
  • 讨论国际象棋比赛规则变革以减少平局;
  • 讨论国际象棋比赛规则变革以增加胜负结果;
  • 讨论国际象棋规则变革以消除平局;
  • 讨论国际象棋规则变革以促进胜负结果。

Hello OLMo: A truly open LLM #

https://blog.allenai.org/hello-olmo-a-truly-open-llm-43f7e7359222?gi=760105621962

这篇文章介绍了 AI2 发布的全新开放式大型语言模型(LLM)框架 OLMo。随着世界竞相部署既有效又安全的 AI 模型,对开放式大型语言模型(LLMs)的需求激增。发布 OLMo 框架将为行业提供了解 AI 模型内部运作的机会。AI2 发布了 OLMo 7B,这是一个真正开放、最先进的大型语言模型,同时提供了预训练数据和训练代码,使研究人员和开发人员能够共同使用最佳的开放模型来推动语言模型科学的发展。

该框架旨在帮助研究人员训练和实验大型语言模型。它们可以直接在 Hugging Face 和 GitHub 上下载。此工作部分得益于与哈佛大学 Kempner 研究自然和人工智能学院以及合作伙伴(包括 AMD、CSC(Lumi 超级计算机)、华盛顿大学保罗·艾伦计算机科学与工程学院和 Databricks)的合作。

OLMo 框架提供一套完全开放的 AI 开发工具,包括完整的预训练数据、训练代码和模型权重,以及评估套件。通过将 OLMo 和其训练数据完全提供给公众,AI2 迈出了共同构建世界上最佳开放语言模型的重要一步。未来,AI2 将继续对 OLMo 进行迭代,并将不同的模型大小、模态、数据集和功能引入 OLMo 系列。

通过 OLMo,AI 研究人员和开发人员将获得更高的精度、更少的碳排放以及持久的结果。这一开放框架将为全球 AI 研究社区提供可信赖的资源和平台,以促进语言模型的创新和发展。


HN 评论 65 comments | 作者:tosh | 1 day ago #

https://news.ycombinator.com/item?id=39974374

  • 有关模型许可的讨论,包括需告知作者使用情况的要求;
  • 对于自定义许可的疑问,以及是否有更简单的许可证选择;
  • Apache 许可证下权重和代码的许可,以及训练数据的许可问题;
  • 有关数据集风险分类的疑问,以及风险分类的含义;
  • 对于模型性能和训练过程中的问题的讨论;
  • 关于开源模型的重要性和许可证问题的看法;
  • 对于封闭模型和开源模型的比较,以及对于开源发展和创新的期望。

Show HN: I made a discrete logic network card #

https://qdiv.dev/posts/eth2/

这篇文章是关于使用离散逻辑芯片构建 10BASE-T 以太网收发器(接收器和发射器)的内容。作者在文章中描述了他使用离散逻辑组件构建完整计算机系统的旅程。他已经成功制作了一个能够运行网络应用程序如 HTTP 服务器或局域网游戏的计算机。文章提到作者去年构建了一个物理层适配器,将 10BASE-T 以太网信号转换为 SPI 信号,然后再转换回来。现在,作者正在实现一个 MAC 层模块,以将其连接到自制计算机上。这两个适配器都是全双工的,具有独立的发射器和接收器部分。

文章详细介绍了接收器和发送器的操作原理。接收器部分涵盖了 SPI 串行数据转换为逐字节并行数据,检查目标 MAC 地址,将数据写入静态 RAM 缓冲区等操作。发送器部分类似于接收器,不实现 FCS 生成,而是在软件中完成。发送器仅支持固定长度的帧,简化了传输逻辑。

此外,文章还介绍了 MAC 地址过滤、计数器、数据流、CPU 接口、编程等方面的内容。作者还提到了他的网络性能虽然很低,但考虑到这里没有商用 CPU 或特殊芯片参与,他对此仍然感到非常满意。文章最后提到了项目存储库,包括模型、原理图文件和 PCB 图纸等。

总的来说,这篇文章详细介绍了作者使用离散逻辑芯片构建 10BASE-T 以太网收发器的过程和相关技术细节。


HN 评论 65 comments | 作者:ynoxinul | 18 hours ago #

https://news.ycombinator.com/item?id=39976640

这篇帖子中的评论观点包括:

对硬件 MAC 地址过滤的需求,对实际网络应用的讨论,以及对构建以太网卡的最小实现方式的探讨;

USB 与 10base2 以太网的复杂性比较;

使用 FPGA 实现 USB LS/FS 和 NIC 的普遍性;

对 ISA 总线连接网络卡的想法;

对 C 编译器的赞赏;

对硬件和软件项目的热情;

对网络卡设计和实现的赞美;

对网络卡构建过程的提问;

对编译器设计、基本电子学和计算机体系结构的学习需求的探讨。


1.18k drawings of plant root systems #

https://images.wur.nl/digital/collection/coll13/search

这个网址是 Wageningen University & Research 的图像收藏页面。该页面展示了各种不同的图像收藏,包括 Alterra 地图收藏、Fiep Westendorp 的绘画、海洋和淡水照片、教授和校长的绘画等。

其中有一些子收藏,如 wurzelatlas mitteleuropaeischer gruenlandpflanzen、wurzelatlas mitteleuropaeischer ackerunkraeuter、bewurzelung von pflanzen 等,涵盖了植物根系的绘画。你可以浏览各种植物的根系图像,这些图像是在欧洲进行的 40 年根系挖掘的成果之一,主要在奥地利进行。

总体来说,这个网站提供了丰富的植物根系图像资源,适合对植物学感兴趣的人士浏览和学习。


HN 评论 70 comments | 作者:bookofjoe | 1 day ago #

https://news.ycombinator.com/item?id=39974646

这篇帖子中评论的观点归并如下:

    1. 植物根系的深度和结构对园艺和植物兼容性有重要影响;
    1. 深根植物有助于从土壤深处吸收养分,为花园提供免费的土壤养分;
    1. 蒲公英等植物根系深度惊人,具有吸养分功能;
    1. 植物根系的形态受土壤条件影响,如砂土或黏土;
    1. 植物根系的绘制可能通过逐层挖掘土壤完成;
    1. 对植物根系的绘制需要耐心和努力。

How I tripped over the Debian weak keys vulnerability #

https://www.hezmatt.org/~mpalmer/blog/2024/04/09/how-i-tripped-over-the-debian-weak-keys-vuln.html

这篇博文讲述了作者在工作中意外发现了 Debian 弱密钥漏洞的经历。

故事发生在 2008 年,当时作者在一家名为 Engine Yard 的公司工作,该公司为 GitHub 提供免费基础设施。GitHub 因用户增长导致 SSH 登录时间变慢,为解决这一问题,作者与 GitHub 团队决定通过在 MySQL 数据库中索引密钥指纹的方式修改 OpenSSH,以加快 SSH 登录速度。然而,不久后,GitHub 团队发现用户能够访问其他用户的存储库,经过调查发现一些用户的密钥指纹相同,这在理论上是不可能的。

最终,通过调查发现 Debian 维护人员在清理 OpenSSL 随机生成代码时出现错误,导致密钥生成数量减少,从而导致密钥冲突。这一发现揭示了 Debian 弱密钥漏洞,作者认为深入调查和发现关键问题的能力至关重要。

文章强调了花时间深入研究问题的重要性,以及行业需要更多人有能力和时间进行深入调查的观点。


HN 评论 95 comments | 作者:ecliptik | 19 hours ago #

https://news.ycombinator.com/item?id=39976225

评论中的观点归纳如下:

  • 开源软件的优势在于“多眼睛”效应和“阳光是最好的消毒剂”,有利于发现和修复漏洞。
  • 闭源软件中也存在漏洞,但发现和报告漏洞的过程更为复杂,可能会被忽视或不被重视。
  • 开源软件能够更快速地发现、报告和修复漏洞,提供更好的安全模型。
  • 有关软件漏洞的发现和修复需要一系列步骤,包括观察、理解、报告和解决。
  • 对于加密货币钱包等安全关键软件,漏洞可能会导致严重后果,需要高度警惕。
  • 通过开源软件和闭源软件的对比,强调了开源软件的优势和安全性。
  • 讨论了加密货币钱包中的种子生成漏洞可能带来的风险和后果。
  • 对于加密货币钱包中的密钥生成问题,提出了技术和安全性方面的考虑。
  • 讨论了加密货币钱包中的密钥生成问题可能带来的潜在风险和挑战。

Intel Gaudi 3 AI Accelerator #

https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-gaudi-3-ai-accelerator.html

在 2024 年 4 月 9 日的 Intel Vision 活动上,Intel 推出了 Intel Gaudi 3 AI 加速器。这款加速器提供了 4 倍的 BF16 AI 计算能力,以及与其前身相比 1.5 倍的内存带宽增加。

Intel Gaudi 3 旨在为全球企业提供生成式 AI 的选择,构建在其 Gaudi 2 前身的性能和可扩展性基础上。它通过开放的基于社区的软件和行业标准以太网网络,为客户提供选择,帮助企业灵活扩展其系统。该加速器采用了定制架构,采用了 5 纳米工艺制造,旨在为大规模 AI 计算提供性能和效率。关键功能包括 AI 专用计算引擎、LLM 容量需求的内存增强、企业 GenAI 的高效系统扩展以及开放行业软件以提高开发人员的生产力。

Intel Gaudi 3 加速器将于 2024 年第二季度以通用基板和开放加速器模块(OAM)的行业标准配置提供给原始设备制造商(OEM),预计 2024 年第三季度将普遍提供。Intel Gaudi 3 PCIe 插件卡预计将于 2024 年第四季度提供。 Intel Gaudi 3 加速器还将为训练和推断任务提供显著的性能改进,特别是在领先的 GenAI 模型上。 Intel Gaudi 3 加速器将为云端 LLM 基础设施提供成本效益,为训练和推断提供价格性能优势和选择。

Intel Gaudi 3 加速器的动力将为 Intel 的下一代图形处理单元(GPU)Falcon Shores 奠定基础,该 GPU 将集成 Intel Gaudi 和 Intel Xe 知识产权(IP),并建立在 Intel oneAPI 规范上。


HN 评论 158 comments | 作者:goldemerald | 8 hours ago #

https://news.ycombinator.com/item?id=39981032

这篇帖子中的评论观点包括:

对 AMD 的合作策略表示赞赏;

认为 AMD 因为反向工程 Intel 芯片而发展壮大;

认为 Intel 可能会终止产品线;

讨论 Intel Gaudi 3 加速器对未来 GPU 的影响;

对 Intel 使用 HBM2e 内存表示惊讶;

讨论 Gaudi 3 PCIe 的价格可能性;

对 Intel 的技术策略表示质疑;

讨论 AMD 的 GPU 在 ML 工作负载中的表现;

讨论 AMD 的 ROCm 软件存在的问题。


Fairbuds: In-ear with replaceable batteries #

https://shop.fairphone.com/fairbuds

这个链接是关于 Fairphone 推出的 Fairbuds 产品页面。Fairbuds 是世界上最易维修的高端耳机之一,内置可更换电池,包括耳机和充电盒。这款耳机售价为 €149.00,还需支付 €3.95 的运费。

Fairbuds 设计耐用,提供三年保修期和 14 天试用期,全额退款。耳机和充电盒内部的电池可更换,具备防水防汗功能。Fairbuds 采用图钛驱动单元,提供优质音质,支持主动降噪和环境噪音消除功能。此外,Fairbuds 还配备专用移动应用程序,可自定义 EQ 设置、固件更新等。

耳机单次充电可使用 6 小时,充电盒额外提供 20 小时续航。Fairbuds 还具备多点连接、自动播放暂停等功能,配备三种不同尺寸的耳塞。产品规格包括蓝牙 5.3、45mAh 电池容量、11mm 驱动单元等。

Fairbuds 兼容 Fairphone 3、3+、4 和 5,以及任何带有蓝牙的设备。购买 Fairbuds 可享受三年保修期和 14 天试用期。


HN 评论 185 comments | 作者:pfooti | 7 hours ago #

https://news.ycombinator.com/item?id=39981550

评论观点可以总结为:

一些人认为有可更换电池的耳机设计是可持续的选择,但希望恢复耳机插孔;

另一些人认为蓝牙耳机音质不如有线耳机,但高质量的蓝牙耳机也存在;

还有人提到使用有线耳机时的便利性和可靠性,以及对于可更换电池的可持续性的讨论。