2024 03 09 HackerNews

2024-03-09 Hacker News Top Stories #

一句话摘要 #

  1. 漫画家鸟山明,创作了《龙珠》系列,于2024年3月1日去世,享年68岁,其作品对全球文化产生了深远影响。
  2. “Don’tFuckWithPaste” 是一个浏览器扩展,旨在防止网页应用阻止用户复制和粘贴内容。
  3. 文章介绍了如何在家用两个24GB GPU训练一个70亿参数的大型语言模型,使用FSDP和QLoRA技术。
  4. 博文分享了指数平滑这一动画技巧,它通过平滑过渡来改善动画效果,适用于多种动画场景。
  5. 文章提供了家用实验室硬件指南,讨论了家庭实验室的设置、网络和服务器机架等。
  6. “The Man in Seat 61” 网站是一个全面的火车旅行指南,提供全球火车旅行的信息和实用建议。
  7. “Hatchet” 是一个开源的分布式任务队列,旨在提供低延迟、高吞吐量的调度服务。
  8. 文章讨论了氯氰菊酯这种杀虫剂与儿童大脑损伤的关联,并提到了相关的法律和政策问题。
  9. 博文介绍了如何成为“海盗”存档者,即通过数字化手段保存和传播知识和文化遗产。
  10. 研究指出,深海鲨鱼和鳐鱼因国际鱼肝油和肉类贸易而面临灭绝威胁,呼吁采取保护措施。

Akira Toriyama has died #

https://noisypixel.net/dragon-ball-creator-akira-toriyama-has-passed-away/

Dragon Ball(《龙珠》)创作者鸟山明(Akira Toriyama)于 2024 年 3 月 1 日因硬膜下血肿去世,享年 68 岁。消息概述了他的成就,同时指出已举行了葬礼,只有家人和极少数亲戚参加。Dragon Ball 官方账号要求粉丝不要向鸟山明的家人要求采访,拜访他们或寄送花束或慰问礼物。官方账号还表示遗憾的是鸟山明在多部作品的创作过程中离世,尤其是考虑到他的热情。

我们对他的离世深感悲痛,将永远记住他为漫画和动画界做出的传奇贡献。希望鸟山明独特的创作世界能够长久受到大家的喜爱。葬礼已与家人和极少数亲戚举行,根据他的意愿,我们不接受花束、慰问礼物、拜访、祭品等。同时,我们要求您不要与他的家人进行采访。未来的纪念活动计划尚未确定,我们会在确认后通知大家。我们深深感谢您一直以来的理解和支持。


HN 评论 195 comments | 作者:gaoryrt | 19 hours ago #

https://news.ycombinator.com/item?id=39637471

  • Akira Toriyama 对全球文化的影响巨大,被誉为传奇,尤其在中南美洲影响深远。
  • Son Goku 被认为是千面英雄中的代表,具有神话般的意义,尤其在拉丁美洲。
  • Son Goku 在东南亚被视为孙悟空,与佛教/道教宇宙息息相关。
  • Dragon Ball 设定在道教/佛教宇宙中,训练可获得超能力,与佛教/道教神话密切相关。
  • Son Goku 与孙悟空在行为上有所不同,但两者在某些方面有相似之处。
  • Son Goku 和孙悟空都经历了成长和智慧之路,成为了有高尚心灵的战士。
  • 孙悟空的形象受到孙悟空的启发,而且与英雄的定义相符。
  • Goku 是对 Sun Wukong“孙悟空”日文发音的转写。
  • Dragon Ball 超越文化、语言和世代,捕捉了人类经验中的勇气、友谊、坚韧和追求梦想的真谛。
  • Dragon Ball 在 90 年代是日本软实力的支柱之一,对培养动漫文化影响深远。
  • Dragon Ball 是许多人的童年英雄,对艺术家产生了深远影响,推动了动漫在全球的普及。
  • Dragon Ball 在西方推广了日本动画,成为许多人进入动漫文化的入口。
  • Dragon Ball Z 和 Chrono Trigger 对一些人的成长产生了深远影响,塑造了他们的职业生涯和兴趣。
  • Dragon Ball 是许多人接触动漫的第一步,对动漫在西方的普及起到了重要作用。
  • Dragon Ball 是许多人对动漫文化的启蒙,成为他们探索新文化、学习新事物的契机。
  • 日本动画在欧洲 70 年代末 80 年代初开始流行,而 Dragon Ball 则在之后才开始受欢迎。
  • Dragon Ball 使人们疯狂迷恋漫画,对漫画产生了巨大影响。

Don’t fuck with paste #

https://github.com/aaronraimist/DontFuckWithPaste

这个 GitHub 地址是关于一个名为"Don’tFuckWithPaste"的 Google Chrome 和 Firefox 浏览器扩展程序。该扩展程序旨在防止网页应用程序阻止用户将内容粘贴到输入字段中。作者表示,当网页应用程序阻止用户粘贴内容或复制内容时,会让他感到非常恼火。他认为,如果他粘贴了一个错误的电子邮件地址,那是他自己的错。作者使用诸如 1Password 之类的工具来帮助记住各种信息,对他来说,从 1Password 复制并粘贴到文本框中比逐个字符输入更容易出错。

解决方案是一个非常简单的 Google Chrome 扩展程序,用于移除复制和粘贴的阻止功能。用户可以通过点击扩展程序图标将网站添加到黑名单,然后编辑自动生成的模式,最后点击“保存”来实现这一功能。扩展程序图标变为蓝色表示扩展程序在当前标签页中处于活动状态。

版本 2 是该扩展程序的重大更新,使得确保扩展程序仅在存在复制和粘贴事件的不良网站上运行变得更加容易,并提供了对每个标签页的扩展程序活动/非活动状态的可见性。为了提供尽可能流畅的体验,扩展程序需要知道何时更改活动标签页。为了让扩展程序了解到这一事件,它需要 tabs 权限,Chrome 描述为“可以读取和更改您访问的网站上的所有数据”。作者强调,这个描述非常可怕,而且绝对不是这个扩展程序的工作方式。作为一个开源项目,用户可以随时阅读所有代码,了解这个扩展程序的工作原理以及它对您的数据的处理方式。

总的来说,这是一个旨在防止将内容粘贴到输入字段中的 Google Chrome 和 Firefox 浏览器扩展程序。


HN 评论 346 comments | 作者:zettabomb | 22 hours ago #

https://news.ycombinator.com/item?id=39636470

  • 禁止粘贴会导致用户体验下降,用户可能会使用更简单的密码;
  • 一些系统要求使用特定字符,限制密码长度和特殊字符种类;
  • Apple 为此开放了 GitHub 存储库,以解决密码管理器生成的密码与网站不兼容的问题;
  • 一些网站限制密码长度,但不告知,导致用户困惑;
  • 一些网站在创建账户时会截断密码,但在登录时不截断,导致密码无法登录;
  • 一些用户希望密码规则能够被密码管理器识别,生成完美密码;
  • 一些网站对密码复杂性要求过高,限制密码长度,不建议干扰密码复杂性;
  • 一些用户担心密码中的空格,有些网站对密码长度和字符有奇怪的限制。

Fine tune a 70B language model at home #

https://www.answer.ai/posts/2024-03-06-fsdp-qlora.html

这篇文章介绍了一个基于 FSDP 和 QLoRA 的开源系统,可以在两个 24GB GPU 上训练一个 70b 模型。

文章首先介绍了这个系统的背景和动机,指出传统的数据中心级别硬件和桌面电脑上的游戏 GPU 之间的性能差距,以及游戏 GPU 内存限制导致训练大型语言模型的困难。接着详细介绍了 QLoRA 和 FSDP 这两个项目,它们分别解决了在单个 GPU 上训练更大模型和在多个 GPU 上有效训练模型的问题。

作者还描述了如何将 FSDP 和 QLoRA 结合起来,通过将模型量化和分片,成功在两个 24GB 的消费级 GPU 上训练了一个 70b 模型。

最后,文章提到了 HQQ 方法的发现,结合了快速和准确的优点,使得 FSDP 和 HQQ 能够很好地配合使用。文章还提供了使用 FSDP/QLoRA 的方法和示例,以及未来改进的展望。


HN 评论 165 comments | 作者:jph00 | 24 hours ago #

https://news.ycombinator.com/item?id=39635483

  • 评论中提到了对 70B 语言模型进行微调的时间取决于数据集大小、序列长度、训练步数等因素,微调几百步可能需要几分钟到 1 小时;
  • 有关 1.58 位和 4 位编码的讨论,1.58 位编码的效率更高,因为避免了 GPU 中的乘法运算,只需进行加法运算;
  • 有人提到对推理速度的讨论,Mac Studio 的推理速度接近实时,但对于期望实时体验的用户可能会感到失望;
  • 讨论了苹果 M 系列芯片在机器学习方面的应用,库的功能不如 Nvidia 全面,但 M2 和 M3 机器的内存带宽巨大;
  • 讨论了苹果是否会专注于推理而非训练,可能会将训练工作外包给专业公司;
  • 评论中还提到了对开源 LLM 的积极态度,希望学术界能以此为标准。

My favourite animation trick: exponential smoothing (2023) #

https://lisyarus.github.io/blog/programming/2023/02/21/exponential-smoothing.html

这篇博文介绍了作者最喜欢的动画技巧之一:指数平滑。

作者分享了在图形相关工作中常用的简单动画技巧,例如旋转和移动摄像机、回合制游戏中的角色移动、UI 元素移动以及音频库中音量变化的平滑处理等。文章详细解释了指数平滑的原理,并通过示例展示了如何在动画中应用指数平滑技术。

指数平滑通过不断调整当前位置朝向目标位置,使得动画移动更加平滑,避免了突变和跳跃的情况。作者还比较了指数平滑与其他动画技术的优劣,并提供了代码示例和数学解释。文章还涉及了在 UI 设计、摄像机移动等方面的应用,以及指数平滑在数值处理和数字音频中的应用。

整体而言,这篇博文详细介绍了指数平滑技术的应用和优势,对于动画和交互设计领域的从业者具有一定的参考价值。


HN 评论 351 comments | 作者:atan2 | 19 hours ago #

https://news.ycombinator.com/item?id=39637487

根据您提供的链接,这篇帖子中的评论观点可以总结如下:

    1. 指数平滑处理不会完全到达目标,停止动画时会有一些问题;
    1. 对于连续/不可预测的移动,指数插值技巧非常有用;
    1. 作者认为立方函数比平方根函数更适合切换开关;
    1. CSS 动画比 JavaScript 更轻,更平滑;
    1. 一些人认为瞬间切换更好,而另一些人则认为动画能够突出变化。

Home Lab Beginners guide #

https://linuxblog.io/home-lab-beginners-guide-hardware/

这篇文章是关于家用实验室初学者指南中硬件部分的内容。作者 Hayden James 分享了他的经历,从过去十多年的流浪生活到现在更加稳定的生活,他的家庭办公室基本上只有几台笔记本电脑和显示屏。

文章介绍了家用实验室的概念,将其视为一个可以在家中私下进行失败尝试的地方,为技术人员提供一个安全的实验场所。他详细讨论了家用实验室的位置选择、网络和服务器机架、推荐硬件设备、UPS(不间断电源)、机架架子、散热风扇、路由器和交换机、配线面板和网络电缆、服务器等内容。

此外,文章还提供了一些硬件设备的推荐和购买建议,包括 ISP 电缆调制解调器、家用实验室机架架、UPS、机架架子、散热风扇、路由器和交换机、配线面板和网络电缆等。文章还包括了一些更新和作者的个人选择,以及一些实用的技术建议和购买链接。


HN 评论 300 comments | 作者:ashitlerferad | 9 hours ago #

https://news.ycombinator.com/item?id=39640992

  • 有人认为家庭实验室不需要过于复杂的架构,可以简单地使用自己喜欢的设备进行学习和扩展。
  • 一些人提到在家庭实验室中使用企业级硬件会带来噪音和能耗问题,建议使用高端消费级硬件,如 TP-Link 的智能交换机,以实现低噪音和高性能。
  • 也有评论指出老式企业服务器的能耗较高,推荐使用小型电脑或微型电脑,如 Raspberry Pi,以降低功耗和噪音。
  • 一些人分享了他们使用的小型 x64 机器型号,如 ThinkCentre M 系列“Tiny”和 Dell OptiPlex“Micro”,这些设备性能强劲,功耗低,适合家庭实验室使用。
  • 还有人提到在家庭实验室中使用垂直架可以节省空间,避免他人碰撞设备,同时分享了自己的家庭实验室配置和体验。

The Man in Seat 61 #

https://www.seat61.com

网站 https://www.seat61.com 是一个火车旅行指南,由“座位 61 号的男士”(The Man in Seat Sixty-One)创建。

该网站提供了关于如何在欧洲和全球范围内乘坐火车的信息,包括时刻表、票价以及购票方式。它还涵盖了从英国到欧洲各地、亚洲、非洲、美洲和澳大利亚的火车旅行信息,以及一些著名的火车旅行路线,如横跨欧亚大陆的“丝绸之路”、伦敦到中国和日本的“横贯欧亚铁路”等。

此外,网站还提供关于火车旅行的实用信息,如购买火车票、使用 Interrail 通行证、携带行李、睡车服务等。整体而言,该网站致力于向人们展示乘坐火车旅行的乐趣、浪漮和冒险,是一个有关火车旅行的全面指南。


HN 评论 89 comments | 作者:BerislavLopac | 14 hours ago #

https://news.ycombinator.com/item?id=39639125

这篇帖子中评论的观点归纳如下:

    1. Seat 61 网站提供了非常实用的火车旅行信息,对于欧洲火车旅行尤其有帮助;
    1. 欧洲火车旅行相对便利但也有复杂之处,Seat 61 网站帮助解决了许多问题;
    1. 美国长途火车旅行存在延误问题,主要原因是货运火车干扰;
    1. 美国货运火车运营成功,但乘客火车需要大量补贴;
    1. 美国乘客火车服务不佳,常常晚点,需改进;
    1. 评论者们对 Seat 61 网站的设计和信息密度表示赞赏和感激。

Show HN: Hatchet – Open-source distributed task queue #

https://github.com/hatchet-dev/hatchet

这个 GitHub 地址是关于一个名为"Hatchet"的分布式、容错的任务队列。Hatchet 旨在取代难以管理的传统队列或发布/订阅系统,使您能够设计可从失败中恢复并解决并发性、公平性和速率限制等问题的耐用工作负载。Hatchet 具有以下特点:

超低延迟和高吞吐量调度:Hatchet 建立在低延迟队列上(平均启动时间为 25 毫秒),完美平衡实时交互能力和对关键任务所需的可靠性。

并发性、公平性和速率限制:使用 Hatchet 内置的策略,实现 FIFO、LIFO、轮询和优先级队列,旨在通过最少的配置规避常见的扩展陷阱。

设计上的弹性:通过可定制的重试策略和集成的错误处理,Hatchet 确保您的操作能够迅速从瞬态故障中恢复。您可以将大型作业拆分为小任务,以便在不重新运行工作的情况下完成运行。

此外,Hatchet 还提供增强的可见性和控制,包括可搜索的运行记录、可重放事件、定时调度功能、一次性调度、峰值保护、增量流式处理等功能。它适用于多种用例,如生成式 AI 的公平性、文档索引的批处理、多模式系统的工作流编排以及事件驱动处理的正确性。

Hatchet 支持 Python、Typescript 和 Go 等技术栈,并提供开源 SDK。您可以在 Hatchet 文档中找到更多信息,或查看其快速入门示例。此外,Hatchet 还提供托管云版本和自托管版本,以及与其他替代方案(如 Celery、BullMQ)的比较。您可以通过 GitHub 提交问题或加入 Discord 社区进行讨论和贡献。


HN 评论 76 comments | 作者:abelanger | 5 hours ago #

https://news.ycombinator.com/item?id=39643136

  • 评论中有人认为 Hatchet 的低延迟队列(25ms 平均启动)似乎有点长,希望能得到更多解释。
  • 有人对 Hatchet 的愿景表示喜爱,期待其执行,但担心 RabbitMQ 依赖会增加额外依赖。
  • 有人提到可以使用 Postgres 和锁来实现大规模任务分发,不需要额外的组件。
  • 有人分享了自己在 29 年前使用 Oracle 构建类似系统的经历。
  • 有人质疑为什么 RabbitMQ 依赖重要,认为引入新软件会带来新的故障。
  • 有人询问 Hatchet 的云服务定价和是否会推出 Kubernetes 操作员。
  • 有人关注 Hatchet 的商业模式,是否会采用“开源核心”模式。
  • 有人提到需要任务队列,客户端(Web 浏览器)可以监听任务的进度直至完成。
  • 有人对 Celery 的可观察性表示不满,表示 Hatchet 的 JSON 请求/响应体操作方式可能需要改进。
  • 有人比较 Hatchet 与 Temporal/Cadence/Conductor,询问 Hatchet 是否支持持久执行。

Chlorpyrifos: Pesticide tied to brain damage in children #

https://usrtk.org/pesticides/chlorpyrifos/

这篇关于氯氰菊酯(Chlorpyrifos)的文章指出,这种广泛使用的杀虫剂与儿童大脑损伤密切相关。文章提到,拜登政府在 2021 年 8 月承认了氯氰菊酯对儿童的危险,并宣布将禁止其在农业上的使用。美国环境保护局(EPA)撤销了对这种化学物质的所有容许量,从而有效地停止了其在所有食品和动物饲料上的使用。这一决定是在第九巡回上诉法院指示 EPA 在未能证明该化学品的安全性的情况下禁止农业使用几个月后做出的。然而,2023 年 11 月,第八巡回上诉法院推翻了 EPA 的禁令,并指示该机构评估氯氰菊酯在某些食品上是否可以安全使用。尽管在美国试图禁止氯氰菊酯的使用,但美国 EPA 干扰了全球减少暴露于这种神经毒性杀虫剂的努力。

科学家和医生对氯氰菊酯有什么看法?美国儿科学会代表了超过 66,000 名儿科医生和小儿外科医生,警告称继续使用氯氰菊酯会对发育中的胎儿、婴儿、儿童和孕妇造成巨大风险。科学家发现,产前暴露于氯氰菊酯与低出生体重、智商降低、工作记忆丧失、注意力障碍和运动发育延迟有关。氯氰菊酯还与急性农药中毒有关,可能导致抽搐、呼吸麻痹,有时甚至导致死亡。

氯氰菊酯被广泛用于包括苹果、橙子、草莓、玉米、大豆、小麦、柑橘和其他家庭和孩子们每天食用的食品在内的各种作物上。美国食品药品监督管理局表示,食品和饮用水中的暴露是不安全的。欧洲食品安全局禁止了氯氰菊酯的销售,认为没有安全的暴露水平。一些美国州也禁止了氯氰菊酯在农业上的使用,包括加利福尼亚州和夏威夷州。

文章还提到了氯氰菊酯对儿童的智商和认知发展的影响,包括出生时的暴露与认知功能下降有关。此外,还有关于氯氰菊酯与自闭症等神经发育障碍的研究结果。其他研究还发现,氯氰菊酯的产前暴露与大脑结构异常、胎儿生长等方面有关。

此外,文章还提到了氯氰菊酯的历史、相关法律诉讼、行业研究存在的问题等内容。总的来说,这篇文章详细介绍了氯氰菊酯对儿童大脑的危害,以及相关的科学研究和法律行动。


HN 评论 126 comments | 作者:stareatgoats | 15 hours ago #

https://news.ycombinator.com/item?id=39638836

根据您提供的链接中评论的观点,可以总结为以下几点:

    1. 欧盟禁止使用 Chlorpyrifos,但摩洛哥使用并向欧盟出口受污染的橄榄;
    1. 欧盟对食品规定适用于本土产品,但对进口产品的检查不够严格;
    1. 购买欧洲产品可相对确保质量,其他产品风险自负;
    1. 欧洲食品标签不一定准确反映来源;
    1. 有人选择从当地农场购买水果;
    1. 有关食品来源的欺诈行为普遍存在;
    1. 有人提倡有机农业和可持续农业。

How to become a pirate archivist (2022) #

https://annas-blog.org/blog-how-to-become-a-pirate-archivist.html

这篇博文介绍了如何成为一名“海盗”存档者,即通过数字化保存知识和文化遗产的行为。文章首先提到了数字保存和海盗存档的重要性,指出人类正在创造比以往任何时候都更多的知识和文化,但也有更多的内容正在丢失。大部分这些遗产被托付给像学术出版商、流媒体服务和社交媒体公司等企业,但它们并不总是很好地保存这些遗产。

作为海盗存档者,你可以保存那些受版权执行或其他限制影响而无法被传统机构档案馆保存的收藏品。你还可以在全球范围内多次镜像这些收藏品,从而增加适当保存的机会。

文章还提到了成为海盗存档者的挑战,包括社区建设、项目选择、元数据抓取、数据选择、数据抓取和分发等方面。在社区方面,建议寻找志同道合的人,可以与亲密朋友分享,也可以在线寻找其他海盗存档者。在项目方面,需要选择领域、目标收藏品、抓取元数据、选择数据、抓取数据和分发数据等步骤。

最后,文章鼓励新的海盗存档者加入这个领域,共同保存世界的知识和文化,并将其广泛传播。


HN 评论 69 comments | 作者:surprisetalk | 23 hours ago #

https://news.ycombinator.com/item?id=39635743

  • 有人认为进行非法活动并与“社区”分享,或者与“朋友”分享,是愚蠢的行为,应该避免透露姓名,除非在一个安全的国家。
  • 有人提到自己有关如何备份所拥有的商业媒体的个人备份标准操作程序,认为音乐行业目前的做法是使产品尽可能在各处都可获得,以便盗版需要更大的努力,而不是消费。电影行业仍然像音乐行业在 90 年代那样行事。
  • 有人指出,音乐行业通过数字内容赚取更多钱,音乐会门票价格飙升,而电影行业成本更高,但他们却像失去玩具的孩子一样行事。
  • 有人讨论了许可服务器消失后会发生什么,指出现代视频游戏以这种方式著名,而数字产品中的内容被彻底剥离,例如游戏音轨在不透明许可协议到期后被移除,尽管您在数字库中“拥有”它们。
  • 有人质疑音乐人在流媒体上几乎没有收入,认为音乐公司和艺术家通过其他收入渠道弥补了录音音乐收入的下降。
  • 有人认为盗版是不可避免的,因为在资本主义活动领域中,社会面临着越来越大的压力,认为在一个公平的世界中,盗版将不再是必要的。

Fishing for oil and meat drives extinction of deepwater sharks and rays #

https://www.science.org/doi/10.1126/science.ade9121

这篇文章讨论了深海鲨鱼和鳐鱼面临的严重问题,指出国际鱼肝油和肉类贸易正在迅速耗尽深海鲨鱼,这些鲨鱼具有极其缓慢的生活史。研究发现,深海鲨鱼和鳐鱼是最容易受到过度捕捞影响的海洋脊椎动物之一。

其中,有三分之一的受威胁深海鲨鱼受到针对性捕捞,而一半被用于国际鱼肝油贸易的物种有一半受到濒临灭绝威胁。由于深海鲨鱼和鳐鱼生长缓慢、繁殖能力低,它们的潜在恢复能力有限,管理几乎不存在。文章呼吁立即对深海鲨鱼和鳐鱼实施贸易和捕捞管理,以防止不可逆的物种灭绝,并促进这一受威胁的大型动物群体的恢复。


HN 评论 82 comments | 作者:etiam | 8 hours ago #

https://news.ycombinator.com/item?id=39641113

根据 https://news.ycombinator.com/item?id=39641113 中评论的观点,可以总结为:对于捕捞深海鲨鱼和鳐鱼导致灭绝的情况,评论包括对于使用鲨鱼肝制造生物柴油的震惊,对于将鲨鱼副产品用于生产有价值产品的疑惑,以及对于捕捞技术导致意外捕获鲨鱼的批评和担忧。同时也有关于应该惩罚副捕获而不是鼓励的观点,以及对于全球渔业监管和环境保护政策的呼吁。