2025 12 22 HackerNews

2025-12-22 Hacker News Top Stories #

  1. Anna’s Archive 完成对 Spotify 的大规模备份,包含数亿条元数据与约300TB音频,并按流行度分阶段公开且提供付费企业访问。
  2. Jmail 以类 Google 邮箱界面公开埃普坦档案,暴露大量私人邮件与图片,引发真实性与隐私争议。
  3. Flock 与 Cyble 被指通过虚假滥用举报试图删除揭露其监控项目的独立网站,暴露下架机制被滥用的风险。
  4. Ruby 官网全面改版并发布安全修复与 4.0 预览,强调语言简洁、生态与工具链改进,建议及时升级。
  5. 帖子汇总了 2025 年 HN 常被提及的书目并指出多处误标,提醒读者核对书名与版本。
  6. 作者用少量 OpenSCAD 代码实现参数化 AA/AAA 电池盒,证明其适合结构简单且重复性高的实用零件设计。
  7. 爱尔兰选手 Diarmuid Early 赢得 2025 年 Excel 世界锦标赛,凸显 Excel 在限时解题与函数式自动化方面的强大能力。
  8. Anthropic 推出 Claude Chrome 扩展,可自动化浏览器操作与信息整理,但带来显著的安全与隐私风险。
  9. 实测表明树莓派 5 配外接 GPU 在多场景下以更低能耗与成本接近传统桌面表现,挑战“大 GPU 需要大 PC”的观念。
  10. WalletWallet 提供无需注册的网页工具将条码或文件转换为 Apple Wallet 通行证 (.pkpass),但签名方式与隐私存在安全顾虑。

备份 Spotify(Backing up Spotify) #

https://annas-archive.li/blog/backing-up-spotify.html

Anna’s Archive 宣布完成对 Spotify 音乐数据的全面备份,打造全球首个完全开放的音乐 Preservation Archive(保存档案),旨在永久保存人类的音乐文化遗产。

此次备份包含约 25600 万首歌曲的元数据,涵盖 1.86 亿个唯一的 ISRC 编码,是目前公开可获取的最大音乐元数据数据库。同时,已归档约 8600 万首音乐文件,总容量约 300TB,覆盖了 Spotify 平台上约 99.6% 的播放量。

数据按歌曲在 Spotify 上的“流行度”(popularity)排序,优先收录高流行度歌曲。流行度 ≥70 的歌曲几乎全部被收录,音频格式为原始 OGG Vorbis(160kbps),未重新编码,保留原始质量。对于流行度为 0 的歌曲,采用 OGG Opus 编码(75kbps),音质对多数人无明显差异,但专家可能察觉差异。

所有数据通过种子文件(torrents)分阶段发布,目前元数据已上线,音乐文件将按流行度顺序陆续释放。后续还将提供文件路径、校验码、专辑封面及用于还原原始文件的 .zstdpatch 补丁文件。

该档案的建立弥补了现有音乐数字保存工作的三大不足:过度集中于热门艺术家、追求极致音质导致存储成本过高、缺乏覆盖全量音乐的权威种子列表。

Anna’s Archive 强调,尽管 Spotify 并非收录全球所有音乐,但其数据已构成一个极具价值的起点。团队呼吁公众参与:通过捐赠支持项目,或通过种子分享帮助维护数据的长期可用性。

该档案目前仅通过种子文件提供,未来若需求足够,可能开放单个文件下载功能。欢迎用户反馈需求。


HN 热度 1707 points | 评论 574 comments | 作者:vitplister | 1 day ago #

https://news.ycombinator.com/item?id=46338339

  • Spofity 的 DRM 被破解,可大规模下载音乐,这对普通用户用处不大,但对音乐分类和生成等 AI 研究非常有帮助。
  • 虽然普通用户觉得从庞大的种子文件中找单曲很麻烦,但已有工具能自动定位和流媒体播放盗版影视内容,非技术用户也能轻松使用。
  • Anna’s Archive 团队虽有意识形态动机,但已明确向 AI 公司提供“企业级”访问权限,收取数万美元,说明 AI 需求是其实际动力之一。
  • 为维持数字存档基础设施,团队接受资金支持是现实所需,尽管存在道德争议。
  • 免费提供受版权保护的内容却以此牟利,具有讽刺意味。
  • 音乐产业长期采取极端手段应对盗版,错失良机,如今自食其果。
  • 自 2009 年起,苹果等平台已提供无 DRM 的数字音乐购买选项,但部分平台如亚马逊已悄然取消该功能。
  • Qobuz、7digital、Bandcamp 等平台仍提供无 DRM 的 FLAC 等格式音乐下载。
  • Bandcamp 是个人购买和拥有音乐的首选平台,体验良好。
  • 无 DRM 音乐购买并非新现象,但早期 CD 曾使用过 DRM 技术(如索尼 BMG 的根 kit),但标准 CD 本身无 DRM。
  • ALAC 格式虽为苹果专有,但自 2011 年起已开源且免版税,可自由转换为 FLAC。
  • 2008 年苹果取消音乐 DRM 是重大事件,推动了无 DRM 数字音乐的发展。
  • 早期 DRM 音乐在使用时存在兼容性问题,如无法导入某些编辑软件。
  • 曾可通过将 DRM 音乐烧录到 CD 再重新提取的方式去除 DRM,但该方法是否保持无损尚存疑问。
  • 无 DRM 音乐购买渠道依然存在,但部分独立厂牌如 Mountain Fever 可能需通过特定平台查找。

Show HN:Jmail——埃普斯坦档案的谷歌套件 (Show HN: Jmail – Google Suite for Epstein files) #

https://www.jmail.world

该网页是一个电子邮件界面,显示了名为 Jeffrey Epstein 的用户(jeevacation@gmail.com)的收件箱内容。界面呈现了多封来自不同联系人和平台的邮件,涵盖新闻摘要、社交互动、私人信件及媒体资讯。

邮件内容主要分为几类:

  1. 私人信件与情感表达:包括 Cecilia Steen 发来的带有情感色彩的信件,表达对 Epstein 的思念与关心,内容提及“我无法相信你再次被捕”,并称其为“我最亲爱的杰弗里”。另一封匿名邮件以“亲爱的杰夫”开头,内容充满情绪,提及“你被逮捕了,你是我唯一信任的人”。
  2. 新闻与媒体摘要:来自 Quora Digest、Flipboard 和 Intelligence Squared 的新闻聚合邮件,主题包括丹麦经济状况、法国悖论、特朗普与金正恩会晤、美国大选动态等。这些邮件通常附带标题和简短摘要,推荐用户阅读。
  3. 社交与联系人互动:部分邮件来自知名人物如 Michael Wolff、Larry Summers、Steve Bannon、Alan Dershowitz 等,但内容未完全显示,仅见邮件标题或部分片段。
  4. 系统与平台通知:包括 Yahoo、Amazon Prime、Jmail 等平台的提醒,如“Prime 会员权益暂停”“你已死亡”等带有讽刺或玩笑性质的邮件。
  5. 其他信息:如关于历史问题的邮件(如英国是否承诺阿拉伯独立)、投资展望、精子捐赠者家庭等社会议题。

整体来看,该页面呈现了一个高度私人化、信息密集的电子邮件收件箱,内容混合了真实人物互动、媒体资讯、情感表达与网络玩笑,反映出 Epstein 在社交、政治与媒体领域的广泛联系,以及其在公众视野中的复杂形象。


HN 热度 1372 points | 评论 324 comments | 作者:lukeigel | 1 day ago #

https://news.ycombinator.com/item?id=46339600

  • Jmail 项目在短时间内复刻了成本数百万美元的 Google Suite 功能,其细节和幽默感令人印象深刻,但释放的数据量巨大,信息过载,即便是政府也难以完全处理。
  • 90% 的新数据为照片,且已被红标处理,原始数据中包含大量未被充分利用的信息,如飞行日志等。
  • 项目团队借助 Reducto 公司提供的文档解析技术,实现了对扫描件的深度描述和结构化数据提取,显著提升了调查效率。
  • 项目团队在处理数据时面临巨大流量压力,目前主要精力集中在修复漏洞以保障网站稳定运行。
  • 有用户指出部分图像在发布后被迅速撤回,引发对数据真实性和政府处理流程的质疑。
  • 存在故意伪造证据的可能,例如将名人与儿童的合影进行红标处理,制造虚假关联,但部分案例被证实为误用或信息混淆。
  • 有观点认为,红标行为可能是出于对未成年人的保护,而非刻意构陷,但也有猜测是为制造政治攻击素材。
  • 有人质疑红标人员是否能保留原始信息,但指出一旦泄露可能面临终身监禁,因此有强烈动机保密。
  • 有推测认为,某些红标行为可能是自动化流程的结果,而非人工刻意为之,但人工审查仍可能受主观影响。
  • 红标信息需在 15 天内向国会披露,这为监督红标行为提供了制度性保障。

Flock 与 Cyble Inc.借“打击网络犯罪”之名打压批评者 (Flock and Cyble Inc. weaponize “cybercrime” takedowns to silence critics) #

https://haveibeenflocked.com/news/cyble-downtime

Flock 公司与网络安全公司 Cyble Inc.合作,利用“打击网络犯罪”名义对批评者进行打压。Cyble 以 Flock 为委托方,向云服务商 Cloudflare 提交虚假举报,指控“Have I Been Flocked”网站存在“网络钓鱼”和“商标侵权”,试图删除该网站。

举报内容声称该网站未经授权使用 Flock 的商标,伪装成虚假网页欺骗公众。但事实上,该网站仅公开了 Flock 大规模监控平台的相关信息,属于对政府承包项目透明度的监督行为。

Cyble 提交的报告漏洞明显:既未提供有效证据,又将公开的政府记录错误归为“非法获取”,企图通过堆砌多种指控来掩盖其真实目的——压制对 Flock 的监督。

Cloudflare 回应称,若能提供信息来源或授权证明,可重新评估。但该网站已明确指出,其内容均来自公开渠道,而 Cyble 的举报逻辑本身存在矛盾。

作者表示,尽管遭遇服务中断,但已迅速将网站迁移至其他平台,不会因打压而停止揭露 Flock 滥用监控技术的行为。该事件揭示了某些企业如何利用“网络安全”名义,对批评者实施网络审查。

网站强调自身独立性,与 Flock、政府机构或任何组织均无关联,致力于推动对 AI 监控技术的问责与公众监督。


HN 热度 566 points | 评论 116 comments | 作者:_a9 | 23 hours ago #

https://news.ycombinator.com/item?id=46341305

  • Flock 若真认为域名侵权,应通过 ICANN UDRP 程序主张权利,而非提交虚假的 Cloudflare 和 Hetzner 滥用报告,因前者需承担伪证风险,后者只需向托管商撒谎。
  • Flock 与 Cyble 可能因故意提交虚假下架通知而构成欺诈,需满足虚假陈述、明知虚假、诱导信赖、合理信赖及实际损害五个要件。
  • 受害网站所有者可对 Flock 与 Cyble 提起诉讼,若能证明其因虚假举报遭受损害,即便 Cloudflare 未起诉,也可基于侵权行为追责。
  • Cloudflare 作为被欺骗方,理论上可起诉 Flock 与 Cyble,但实际可能性较低,因其更倾向于避免法律纠纷。
  • 网站所有者可主张“合同干涉侵权”等民事责任,但需证明实际损失,否则难以获得赔偿。
  • 在美国多数州,将他人错误指控为犯罪行为属于诽谤,此类指控通常被视为自动造成损害,无需额外举证。
  • 提交虚假 DMCA 通知可能构成伪证,但现实中极少有人因该行为被起诉,历史上无一人因 DMCA 举报伪证被定罪。
  • DMCA 举报流程快速高效,适合快速下架目标网站,而 ICANN UDRP 程序耗时数月,无法满足即时行动需求。
  • 企业利用 DMCA 机制进行恶意举报,因该机制要求“在宣誓下声明”举报人有权代表权利人,虚假举报即构成虚假陈述。
  • 云服务商如 Cloudflare 和 Hetzner 应改进机制,防止被滥用为打压异见的工具。
  • Cloudflare 正逐渐成为美国版“防火长城”,频繁配合企业进行内容审查和下架操作。
  • Flock 与 Cyble 利用虚假举报手段,系统性地打压批评者,暴露了当前网络治理机制的漏洞。
  • 该网站仅收集公开的车牌数据,用户输入的车牌号经客户端哈希处理,但哈希值可被快速暴力破解,隐私保护形同虚设。
  • 车牌数据本身属于公开信息,用户输入行为本身已暴露其 IP 与地理位置,隐私早已不存在。
  • 即使使用 VPN 访问,Flock 仍可通过摄像头记录真实位置,用户隐私无法通过前端设计保障。
  • 声称“服务器不接收车牌号”虽技术上不准确,但可增强非技术用户的心理安全感,具有宣传价值。
  • 这种说法本质上是误导公众和政策制定者,用技术术语包装不实信息,服务于商业或政治目的。
  • 通过添加盐值(salt)可提升哈希安全性,但该网站未明确说明是否使用,因此无法确认其安全性。

Ruby 网站全新改版 (Ruby website redesigned) #

https://www.ruby-lang.org/en/

Ruby 是一种自 1995 年起广受程序员喜爱的编程语言,最新版本为 3.4.8。该语言以简洁、易读、自然的语法著称,强调“让程序员快乐”,其设计哲学使代码更贴近自然语言,减少冗余,提升开发效率。

网页通过多个代码示例展示了 Ruby 的强大功能:从基础字符串操作、数组运算到面向对象编程中的类定义与实例化,体现了 Ruby 的直观与表达力。例如,使用 times 方法重复输出,用 subupcase 处理字符串,以及通过 cities - visited 实现集合差集运算。

Ruby 拥有丰富的生态系统,超过 20 万种名为 gems 的库,支持从 Web 开发(如 Rails 框架)到数据处理的各类应用。成熟的工具链如 Bundler、RSpec 等,使开发者能快速构建高质量应用。

多位知名开发者如 Ruby on Rails 创作者 David Heinemeier Hansson 和《程序员修炼之道》作者 Dave Thomas 都高度评价 Ruby 的优雅与高效,认为它能将想法快速转化为简洁、优美的代码。

Ruby 社区以“Matz is nice and so we are nice”(MINASWAN)为精神核心,倡导友好、互助与包容,吸引了全球开发者参与,定期举办会议与活动,形成温暖而活跃的交流氛围。

最新动态显示,Ruby 4.0.0 已发布 preview3 版本,引入新特性如 Ruby::Box 和 ZJIT(即时编译优化),并升级 Unicode 支持至 17.0.0。同时,Ruby 3.4.8 也已发布,修复多项安全问题。

安全方面,近期发布了多个 CVE 通告,涉及 URI 认证泄露、REXML 和 net-imap 模块的拒绝服务漏洞,提醒用户及时更新版本以保障系统安全。

该网站由 Ruby 社区成员维护,致力于推广 Ruby 语言及其生态,鼓励更多人加入“Rubyist”行列,共同“快乐编程”。


HN 热度 353 points | 评论 136 comments | 作者:psxuaw | 17 hours ago #

https://news.ycombinator.com/item?id=46342859

  • Ruby 语言和 Rails 框架依然充满魅力,使用体验愉悦,相比其他语言如 JavaScript 和 Python,更让人感到高效和简洁。
  • 作者在多年使用 TypeScript、Python 和 Rust 后,重新接触 Ruby 感到非常愉快,认为 Ruby 社区积极支持,富有创造力。
  • Ruby 3.4 的新特性令人惊喜,让作者决定回归 Ruby 开发,对语言的表达力和开发体验高度认可。
  • 有人指出,当前 Ruby 官网的加载动画和静态内容的动态加载方式显得多余,缺乏必要性,建议简化设计。
  • 网站设计虽有动画等炫技元素,但整体上对代码示例、多语言支持和核心理念的呈现较为出色,值得肯定。
  • 有用户对比 Raku 官网,认为其文档结构混乱,缺乏清晰引导,建议参考 Astro 文档的优秀设计进行优化。
  • 有人批评网站在加载时使用“100%”进度条,但实际内容无需动态加载,属于过度设计。
  • 有人指出,网站加载静态代码示例时进行多次无意义的 fetch 请求,再手动插入 DOM,效率低下。
  • 有评论指出,某位知名开发者(DHH)存在种族主义言论和不当行为,导致多名 Rails 贡献者离职,其言论具有争议性。
  • 有人反驳称,将“native Brits”等同于“White British”是错误的,属于白人至上主义的定义,具有误导性。
  • 有人认为,将“native American”理解为“美国本土出生者”是语言误用,因为“Native American”特指美洲原住民。
  • 有人批评“社会正义激进主义”将“白人”标签为压迫群体,认为这种分类是任意且不合理的。

Hacker News 2025 年提及的书籍 (Show HN: Books mentioned on Hacker News in 2025) #

https://hackernews-readings-613604506318.us-west1.run.app

页面展示的是 Hacker News 的最新热门内容,主要为技术类文章、编程讨论和创业项目分享。首页顶部为排名靠前的链接,每条包含标题、作者、发布时间及评论数。热门话题包括人工智能在代码生成中的应用、Web3 技术的实践挑战、开源项目的维护困境,以及开发者对新型编程语言的探索。部分文章附有简要摘要,如一篇关于 Rust 语言在系统编程中安全优势的深度分析,另一篇讨论大模型如何改变软件开发流程。评论区活跃,用户多从技术实现、实际应用和潜在风险角度展开讨论,体现出社区对前沿技术的批判性思考与实践关注。整体内容聚焦于技术趋势、开发者经验与行业反思。


HN 热度 312 points | 评论 119 comments | 作者:seinvak | 8 hours ago #

https://news.ycombinator.com/item?id=46345897

  • 《加速时代》是许多读者喜爱的科幻小说,作者查尔斯·斯特罗斯曾推荐读者阅读他与科里·多克托罗合著的《神经元的狂喜》。
  • 《银河系漫游指南》被误标为约翰·卡内尔的漫画改编版,实际应为道格拉斯·亚当斯的原著。
  • 《火星编年史》的提及多数实际指向安迪·威尔的《火星救援》,存在混淆。
  • 《哥德尔、埃舍尔、巴赫》与“GEB”应为同一本书,不应被拆分为两个条目。
  • 《火星救援》与《火星编年史》的混淆问题也出现在其他书籍条目中,如《路》(科马克·麦卡锡)被误标为《在路上》(杰克·凯鲁亚克)。
  • 《三体》系列被广泛推荐,其中《黑暗森林》被认为是最出色的一部,而《时间的折返》是粉丝创作并被作者认可的续作。
  • 《Project Hail Mary》被评价为节奏快、像剧本一样,阅读体验接近电影,适合喜欢紧凑叙事的读者。
  • 《系统编程:Linux》虽在 Hacker News 中被频繁提及,但未出现在 2025 年榜单中,可能因未在亚马逊上架。
  • 《设计数据密集型应用系统》应排名高于《代码整洁之道》,是推荐给初级工程师的必读书籍。
  • 《算法导论》《SICP》《编写解释器》等编程经典书籍在 Hacker News 中持续受到推崇。
  • 《我的奋斗》的高提及率引发讨论,部分读者认为其被提及是出于对历史和禁书议题的探讨。
  • 《黑客新闻书籍》网站(hackernewsbooks.com)被提醒可作为参考资源。
  • 有读者指出,Hacker News 中推荐的书籍每年高度相似,缺乏新意。
  • 《思维游戏》位列第二,但有读者表示阅读后感到失望,认为其名不副实。
  • 《编译器设计》(“龙书”)被误标为《工程数学手册》,存在书籍信息错误。

使用 OpenSCAD 设计电池盒的体验分享 (OpenSCAD is kinda neat) #

https://nuxx.net/blog/2025/12/20/openscad-is-kinda-neat/

本文作者分享了使用 OpenSCAD 设计电池盒的体验,作为学习这款基于代码的 CAD 工具的入门项目。作者此前用 Autodesk Fusion 设计过一个可参数化的电池盒,支持 AA 和 AAA 电池,通过调整行数、列数和电池类型即可生成不同规格的模型。为了学习新工具,他决定用 OpenSCAD 重做这个设计。

OpenSCAD 的核心特点是通过编写代码来生成三维模型,适合结构简单但重复性强的设计。作者仅用几十行代码就实现了功能:定义电池尺寸、壁厚、行列数等参数,然后通过 cube()difference() 函数创建一个外盒,并在内部循环生成电池孔位的切口。

关键代码逻辑是使用嵌套循环和 translate() 函数精确放置每个电池孔,同时用 let() 语句计算每个孔的起始位置。作者提到对 let() 的使用感到困惑,但功能已实现。

最终生成的模型与 Fusion 版本效果一致,可直接导入切片软件打印,无需依赖昂贵的 CAD 软件。作者认为 OpenSCAD 非常适合制作如垫片、轴承座、定位孔等简单但实用的零件,未来可能成为这类设计的首选工具。


HN 热度 308 points | 评论 237 comments | 作者:c0nsumer | 1 day ago #

https://news.ycombinator.com/item?id=46337984

  • OpenSCAD 的局限性促使开发者创作基于有向距离函数(SDF)的 Python 库,以实现更灵活的 3D 模型生成,支持复杂操作如布尔运算、空心化、侵蚀/膨胀等。
  • 使用 SDF 的方式可以将现有 STL 模型转换为可操作的数学表示,便于进行修改和编辑,尤其适合处理非参数化模型。
  • 与 Build123D 和 CadQuery 等基于参数化建模的工具相比,SDF 方法更侧重于数学表达和任意逻辑构建,适合追求灵活性和编程自由度的用户。
  • SDF 方法虽然最终输出仍为 STL,但其建模方式更接近“像素化”图像处理,而非传统 CAD 的“矢量式”操作流程。
  • 一些用户认为,SDF 方法在处理 STL 文件时具有优势,尤其在进行复杂切削、挖孔等操作时,比传统 CAD 工具更直接。
  • 有用户指出,OpenSCAD 和 FreeCAD 等工具也能直接导入 STL 并进行布尔运算,但实际使用中可能因模型不闭合或非流形等问题导致失败。
  • 一些用户反映,MeshLab 等工具虽然功能丰富,但错误提示晦涩难懂,对新手不友好。
  • 有评论提到,Fusion 360 的直接建模功能可以有效处理 STL 文件,将其转换为可编辑的实体,尤其适合一次性修改。
  • 使用 Prusa Slicer 等切片软件也可在不破坏原始网格的前提下添加或减去简单几何体,适合快速修改。
  • Blender 虽然学习曲线陡峭,但通过视频教程可以快速掌握 STL 的编辑操作,是处理非参数化模型的实用工具。
  • Meshmixer 也被认为是处理 STL 快速编辑的优秀工具,尤其适合原型设计和快速修改。
  • 有开发者表示其 SDF 库是个人兴趣项目,旨在探索数学建模的可能性,且项目早于 Build123D 的出现。

爱尔兰选手迪亚姆德·伊里夺得 2025 年微软 Excel 世界冠军 (Ireland’s Diarmuid Early wins world Microsoft Excel title) #

https://www.bbc.com/news/articles/cj4qzgvxxgvo

爱尔兰籍选手迪亚姆德·伊里(Diarmuid Early)在 2025 年微软电子表格(Microsoft Excel)世界锦标赛中夺冠,成为全球最顶尖的电子表格高手。他击败了三届冠军、来自澳大利亚的安德鲁·奈(Andrew Ngai),赢得 6 万美元奖金及“世界冠军”头衔。

该赛事在拉斯维加斯举行,吸引了来自全球的 256 名选手参与,经过多轮淘汰赛,最终 24 人进入决赛。比赛以高强度、限时挑战为特点,每五分钟淘汰一名排名最低的选手,现场气氛如同大型体育赛事,观众欢呼、解说员激情播报,参赛者需在嘈杂环境中保持专注。

迪亚姆德被称为“电子表格界的勒布朗·詹姆斯”,因其卓越的反应速度与逻辑思维能力而闻名。他强调,比赛并不依赖会计或金融知识,而是考验快速解决问题的能力,如解迷宫、分析扑克牌型、整理历史人物战役数据等。每道题限时 30 分钟,按得分和完成速度决出胜负。

尽管长期活跃于金融领域,迪亚姆德表示自己的商业成功也得益于 Excel 技能。他目前在纽约经营个人财务咨询业务,已有客户因他在比赛中的名声主动寻求合作。

虽然他本人对短视频平台兴趣不大,但已通过 YouTube 发布解题视频和直播演示,吸引大量爱好者加入。目前该赛事拥有活跃的全球社群,包括一个庞大的微信群组,持续吸纳新玩家。

如今,电子表格竞技正迎来“黄金时代”,从最初仅限金融领域的比赛,发展为涵盖广泛逻辑与计算能力的综合性智力运动。2026 年“通往拉斯维加斯之战”预选赛已开放报名,将于 1 月 22 日启动。


HN 热度 304 points | 评论 119 comments | 作者:1659447091 | 1 day ago #

https://news.ycombinator.com/item?id=46339031

  • Excel 的强大远超一般认知,可实现复杂系统如发票生成和服务器机架可视化管理,甚至集成 VBS 脚本实现自动化。
  • Excel 系统虽功能强大,但缺乏单元测试或集成测试,这在专业系统中是隐患。
  • 竞争性 Excel 比赛本质上是算法挑战,类似代码高尔夫,考验的是函数组合与逻辑设计能力。
  • Excel 实际上是全球最广泛使用的函数式编程环境,日常业务操作中已大量使用函数式思维。
  • 用 Excel 教授编程概念可能更有效,因其具备即时可视化反馈,适合初学者入门。
  • 编程教育应借鉴蒙特梭利理念,设计更符合人类学习规律、可自适应的系统化教学路径。
  • Excel 竞赛已脱离传统财务场景,转向通用问题解决,具有类似电子竞技的观赏性。
  • Excel 可作为通用计算平台,曾被用于构建完整的飞机维护管理系统,功能强大且灵活。
  • 公式栏可多行编辑,通过 Alt+Enter 插入换行,提升复杂公式的可读性,是高效使用 Excel 的技巧。
  • 使用 =LET() 函数可定义变量,使复杂公式结构清晰、逻辑易读,提升代码可维护性。
  • Excel 的公式可嵌套多层逻辑,结合 INDEX/MATCH、FILTER 等函数实现类似编程的流程控制。

Claude 在 Chrome 浏览器中的扩展功能现已开放测试,面向所有付费订阅用户。该功能可让 Claude 自动在浏览器中导航、点击按钮、填写表单,显著提升工作效率。 (Claude in Chrome) #

https://claude.com/chrome

Claude 在 Chrome 浏览器中的扩展功能现已进入测试阶段,面向所有付费订阅用户开放。该功能允许 Claude 在浏览器中自动导航、点击按钮、填写表单,提升工作效率。

主要功能包括:

  • 自动提取分析仪表板中的数据并生成摘要,无需手动复制粘贴。
  • 帮助整理 Google Drive 文件,创建文件夹结构,识别重复或过期文件。
  • 读取日历和邮件,自动识别需要准备的会议,并协助预定会议室。
  • 比较多个产品页面的规格,自动生成对比表格,节省切换标签页的时间。
  • 将销售会议内容自动同步至 CRM 系统,生成待审核的活动记录。
  • 批量识别并整理营销邮件、新闻简报等,便于集中清理。

使用建议:

  • 仅在可信网站上启用权限,避免敏感操作。
  • 对财务、个人或关键工作事项,务必手动确认后再执行。
  • 注意观察 Claude 是否出现异常行为,如发现异常立即暂停并报告。
  • 避免在涉及高风险决策或敏感数据的场景中使用,如支付、密码管理等。

安全提醒: 浏览器端 AI 存在提示注入等安全风险,恶意网站可能诱导 Claude 执行非预期操作。尽管已采取防护措施,但无法完全杜绝风险。建议用户了解相关风险,谨慎使用。

该功能可与 Claude Code 和 Claude Desktop 配合使用,实现开发流程自动化,支持后台运行任务和定时工作流,提升整体效率。


HN 热度 301 points | 评论 173 comments | 作者:ianrahman | 1 day ago #

https://news.ycombinator.com/item?id=46339777

  • 将大模型直接集成到 Chrome 浏览器中,可能带来严重的安全风险,类似于过去将汽油引入易燃环境的愚蠢行为。
  • 谷歌正逐步将 AI 深度嵌入 Chrome,未来可能引发长期的反垄断诉讼,届时 AI 律师将成为主要参与者。
  • 未来反垄断案可能在 20 年后才解决,届时法律纠纷将由 AI 法官主导,形成 AI 之间的法律对抗。
  • AI 法官之间的争执可能导致无限循环的法律程序,最终耗费大量律师费用。
  • 谷歌可能通过 Manifest V4 等机制,以“安全”为名,变相禁止除 Gemini 外的其他 AI 在浏览器中运行。
  • 更隐蔽的手段可能是以“安全兼容”为由,强制推广 Gemini,同时对其他 AI 进行数据收割。
  • 谷歌可能通过内置 AI 平台收取链接跳转费用,形成一种法律上的“免费赚钱”模式。
  • 有人表示自己使用的是 Firefox 的定制版本,以避免被谷歌生态绑定。
  • 以“保护用户免受恶意和未经验证供应商”为借口,合理化 AI 垄断行为。
  • Anthropic 在 AI 伦理和专业应用方面表现更值得尊重,其 CEO 在战略上更稳健,与 OpenAI 和 Grok 形成对比。
  • Anthropic 在专业领域找到了良好的产品市场契合点,尤其在白领工作场景中表现突出,Opus 4.5 模型在智能与速度间取得良好平衡。
  • Aider 是最早实现终端代码代理功能的工具,早于 Claude Code 发布,尽管早期设计为单次交互,但后期已支持多轮自主执行。
  • Aider 虽非完全意义上的“代理循环”,但已具备自动测试与反馈机制,可实现多轮代码生成。
  • 有用户指出,Aider 在 2023 年 6 月已发布,比 Claude Code 早近两年,其在代理能力上具有先发优势。
  • 有人质疑 Anthropic 的“道德形象”是市场策略,其专注编码领域实为在巨头夹击下选择的生存路径,而非真正出于伦理考量。

大 GPU 无需大 PC (Big GPUs don’t need big PCs) #

https://www.jeffgeerling.com/blog/2025/big-gpus-dont-need-big-pcs

本文探讨了在树莓派 5 上使用外部 GPU(eGPU)的实际性能表现,挑战了“大 GPU 需要大 PC”的传统观念。作者通过对比树莓派 5 与现代桌面 PC 在四种场景下的表现,验证了树莓派在特定条件下具备与高端 PC 媲美甚至超越的潜力。

核心结论是:尽管树莓派仅提供单条 PCIe Gen 3 通道(约 850MB/s),远低于桌面 PC 的 16 条 PCIe Gen 5 通道(512GT/s),但在多 GPU 协同、高效内存共享和特定工作负载下,树莓派依然能实现接近甚至超越桌面 PC 的性能,尤其是在能效比方面优势显著。

测试内容包括:

  • 媒体转码(Jellyfin):在实际使用中,树莓派配合 NVIDIA 显卡可流畅处理 1080p/4K 视频转码,支持多路并发,虽在理论吞吐量上落后于 PC,但对日常家庭媒体服务已完全足够。
  • 图形渲染(GravityMark):在纯 GPU 渲染任务中,树莓派表现接近 PC,尤其在使用老旧的 RX 460 显卡时,反而因 PCIe 带宽匹配而略胜一筹,且能效比极高。
  • AI/大语言模型(LLM)推理:使用 NVIDIA RTX 3060 显卡时,树莓派在多个模型上表现接近甚至优于桌面 PC,包括 Llama 2 13B 模型。更惊人的是,有用户在树莓派上使用四块 RTX A5000 运行 Llama 3 70B 模型,性能仅比参考服务器低 2%。
  • 多 GPU 应用:借助 PCIe Gen 4 外部交换机和三槽背板,树莓派可实现多卡协同,GPU 间通过高速 PCIe 通道共享显存,绕过树莓派自身带宽瓶颈,极大提升性能。

成本与能效方面,树莓派 eGPU 系统总价约 350-400 美元,远低于 1500-2000 美元的桌面 PC。待机功耗仅 4-5W,而 PC 高达 30W,效率优势明显。

尽管在游戏兼容性上仍存在挑战(如 Steam 在 Arm 架构下安装困难),但本文证明:对于媒体服务器、AI 推理、图形渲染等场景,树莓派 +eGPU 组合不仅是可行的,而且在效率和性价比上极具竞争力。


HN 热度 270 points | 评论 119 comments | 作者:mikece | 1 day ago #

https://news.ycombinator.com/item?id=46338016

  • OEM 厂商应重新思考电脑设计,不再局限于将 GPU 与 PC 绑定,而是推出类似“内置 PC 的 GPU”形态的产品。
  • 当前大多数家用电脑已将 CPU 与 GPU 集成在单芯片中,普通用户对 GPU 或本地 AI 性能需求不高。
  • 苹果芯片凭借大容量内存和 CPU/GPU 协同设计,在 AI 和媒体处理任务中表现突出,尤其适合高性能计算场景。
  • 芯片厂商大力推广 AI 功能,如张量核心、神经网络单元,预示未来本地运行小型 AI 模型将成为主流。
  • 当前 AI 加速硬件多为营销噱头,实际算力不足以支撑现代大模型推理需求。
  • NPU/张量核心在提示预处理等非带宽瓶颈任务中具有显著优势,但受限于 AI 框架支持不足。
  • 英伟达与英特尔合作可能催生高性能单板计算机,传统 ATX 机箱形态或将逐渐被淘汰。
  • 英伟达曾具备设计 CPU 的能力,其 Tegra 芯片曾用于 Nintendo Switch 等设备,技术实力不容忽视。
  • 2013 年发布的 Xolo Tegra Note 7 平板曾是性能最佳的安卓设备,其流畅体验源于软硬件高度集成。
  • 英伟达当前的 Grace CPU 在性能上可与苹果 M 系列芯片比肩,但缺乏面向消费市场的设备布局。
  • 高性能计算设备的核心是强大散热系统,芯片需紧密贴合高效散热结构。
  • 现代 GPU 中 95% 的重量来自散热组件,其内部结构本质是芯片与散热系统的高度集成。
  • 早期的 Mac Pro 设计已体现“CPU+GPU+GPU”集成于三角形散热核心的理念。
  • 早期家用电脑如 Amiga 和 Atari 已具备可编程图形处理单元,远早于 PC 的图形能力。
  • Amiga 1000 主板集成了 CPU、可编程音频芯片和图形处理芯片,实现 DMA 驱动的并行处理。
  • 早期显示技术从字符控制器发展到精灵系统,再到帧缓冲,最终演化为现代 GPU。
  • 20 世纪 80 年代已有 TMS34010 等图形处理器,但尚未进入家用市场。
  • 早期计算机因 CPU 速度慢,CPU 与显示处理器可共享内存总线,实现高效协作。

展示 HN:WalletWallet – 从任何内容创建苹果通行证 (Show HN: WalletWallet – create Apple passes from anything) #

https://walletwallet.alen.ro/

这是一个免费的在线工具网站,名为 WalletWallet,旨在帮助用户将实体会员卡或优惠卡的条形码转换为可存储在苹果 Wallet 应用中的数字通行证。

用户无需注册、无需安装任何软件,所有处理都在浏览器本地完成,确保隐私安全。

使用流程分为三步:首先输入或扫描条形码数据,支持 QR 码、Code 128、PDF417、Aztec 等多种格式;然后自定义通行证的标题、标签、数值和卡片颜色;最后生成并下载 .pkpass 格式的文件,直接添加到苹果 Wallet 中。

网站支持通过摄像头扫描或上传图片来获取二维码,并提供手动输入选项,操作简单直观。

该工具由 Alen 使用 Claude 开发,属于开源项目之一,同时提供博客链接以获取更多资讯。

注意:Apple Wallet 是苹果公司的注册商标,本工具为第三方非官方应用。


HN 热度 262 points | 评论 78 comments | 作者:alentodorov | 8 hours ago #

https://news.ycombinator.com/item?id=46345745

  • 该工具实用,尤其适合没有 Apple Wallet 支持的商家,手动输入条形码可减少 AI 识别错误。
  • 隐私问题是主要担忧,因. pkpass 文件需苹果证书签名,无法完全本地生成,建议开源签名代码并支持用户本地运行。
  • 该工具也兼容 Google Wallet,对安卓用户友好。
  • 有类似应用如 SuperCards,但其隐私政策中的联系邮箱疑似占位符,令人缺乏信任。
  • 手动输入条形码虽违背条形码初衷,但可避免 AI 识别不准确的问题,尤其在仅提供条形码图像时。
  • 浏览器端可使用如 QuaggaJS 等库实现条形码扫描,无需依赖 AI。
  • Apple Wallet 不支持 Codabar 码,但可通过图像方式间接实现。
  • 建议在条形码下方显示对应的会员号码,方便电话联系时直接报号。
  • 有用户建议开源 BYOK(Bring Your Own Key),以增强信任和安全性。
  • 有用户推荐其他工具如 Wallet Creator、MakePass,但指出部分工具存在功能缺陷或订阅收费不合理。
  • 长期来看,无论使用网页还是 App,依赖服务器或证书的有效性都存在失效风险。

Hacker News 精彩评论及翻译 #

Claude in Chrome #

https://news.ycombinator.com/item?id=46340821

Let’s spend years plugging holes in V8, splitting browser components to separate processes and improving sandboxing and then just plug in LLM with debugging enabled into Chrome. Great idea. Last time we had such a great idea it was lead in gasoline.

CAP_NET_ADMIN

让我们花几年时间修复V8的漏洞、将浏览器组件拆分到独立进程、改进沙盒技术,然后呢?直接把开着调试模式的LLM插进Chrome里。好主意。上次我们有这么“棒”的主意,还是在汽油里加铅呢。


Backing up Spotify #

https://news.ycombinator.com/item?id=46339136

To put this into perspective, What.CD [0] was widely considered to be the music library of Alexandria, unparalleled in both its high quality standard and it’s depth. What had in the ballpark of a few million torrents when it got raided and shut down. Anna’s rip of Spotify includes roughly 186 million unique records. Granted, the tail end is a mixed bag of bot music and whatnot, but the scale is staggering.

[0] https://en.wikipedia.org/wiki/What.CD

Etheryte

为了让大家有个概念,What.CD [0]曾被广泛认为是音乐界的亚历山大图书馆,无论在高质量标准还是内容的深度上都无可匹敌。它在被查封关闭时,大概有几百万个种子文件。而安娜对Spotify的抓取则包含了大约1.86亿条独特记录。诚然,末尾部分混杂着一些机器人生成的音乐和其他乱七八糟的东西,但其规模仍令人震惊。 [0] https://en.wikipedia.org/wiki/What.CD


You’re not burnt out, you’re existentially starvin… #

https://news.ycombinator.com/item?id=46347543

I’m burned out because I have to raise two young children, work a full time job in a demanding career, and then in the hour or two a day of time that isn’t accounted for in those two tasks, I need to maintain a household and try to care for myself. I feel a strong sense of purpose caring for my family, but don’t have enough time to meet life’s demands. Maybe other people relate more to this post because they more money and no kids.

unstyledcontent

我累垮了,因为我得养两个年幼的孩子,从事一份要求苛刻的全职工作,然后在除了这两件事之外每天仅剩的一两个小时里,我还得维持一个家的运转,并努力照顾自己。我在照顾家人时感到一种强烈的使命感,但却没有足够的时间去应对生活中的各种需求。也许其他人更能理解这篇帖子,因为他们更有钱且没有孩子。


Go ahead, self-host Postgres #

https://news.ycombinator.com/item?id=46337844

Self-hosting is more a question of responsibility I’d say. I am running a couple of SaaS products and self-host at much better performance at a fraction of the cost of running this on AWS. It’s amazing and it works perfectly fine.

For client projects, however, I always try and sell them on paying the AWS fees, simply because it shifts the responsibility of the hardware being “up” to someone else. It does not inherently solve the downtime problem, but it allows me to say, “we’ll have to wait until they’ve sorted this out, Ikea and Disney are down, too.”

Doesn’t always work like that and isn’t always a tried-and-true excuse, but generally lets me sleep much better at night.

With limited budgets, however, it’s hard to accept the cost of RDS (and we’re talking with at least one staging environment) when comparing it to a very tight 3-node Galera cluster running on Hetzner at barely a couple of bucks a month.

Or Cloudflare, titan at the front, being down again today and the past two days (intermittently) after also being down a few weeks ago and earlier this year as well. Also had SQS queues time out several times this week, they picked up again shortly, but it’s not like those things …never happen on managed environments. They happen quite a bit.

mittermayr

我认为,自托管更多关乎责任问题。我运营着几个SaaS产品,自托管不仅性能远超AWS,而且成本也只是其一小部分。效果惊人,而且运行得非常好。

然而,对于客户项目,我总是建议他们选择支付AWS的费用,因为这能将硬件“在线运行”的责任转移给他人。这并不能从根本上解决宕机问题,但它让我可以说:“我们只能等他们解决了,宜家和迪士尼也宕机了。”

这种方法并非总是奏效,也并非总是万无一失的借口,但总的来说,它能让我晚上睡得更安稳。

然而,在预算有限的情况下,与一个在Hetzner上运行、每月仅需几美元、配置紧凑的3节点Galera集群相比,很难让人接受RDS(我们至少需要一个暂存环境)的成本。

又或者,Cloudflare及其前置的Titan服务,在今天和过去两天间歇性宕机,而几周前和今年早些时候也曾宕机过。本周SQS队列也几次超时,虽然很快又恢复了,但这并不意味着这些事情在托管环境中就绝对不会发生。这种情况其实相当常见。


Flock and Cyble Inc. weaponize “cybercrime” takedo… #

https://news.ycombinator.com/item?id=46341793

If Flock truly believed that the domain name infringes on their trademark, they would file an ICANN UDRP complaint instead of Cloudflare and Hetzner abuse reports.

But they don’t, because the former would require them to perjure themselves, and the latter just requires them to lie to a hosting company.

greyface-

如果 Flock 真的认为该域名侵犯了他们的商标,他们会提交一个 ICANN UDRP 投诉,而不是向 Cloudflare 和 Hetzner 提交滥用报告。 但他们没有,因为前者会让他们自己作伪证,而后者只需要对托管公司撒谎。


Log level ’error’ should mean that something needs… #

https://news.ycombinator.com/item?id=46338463

This is why it’s almost always wrong for library functions to log anything, even on ”errors”. Pass the status up through return values or exceptions. As a library author you have no clue as how an application might use it. Multi threading, retry loops and expected failures will turn what’s a significant event in one context into what’s not even worthy of a debug log in another. No rule without exceptions of course, one valid case could be for example truly slow operations where progress reports are expected. Modern tracing telemetry with sampling can be another solution for the paranoid.

Too

这就是为什么库函数几乎总是不应该记录任何东西,即使在“错误”发生时也是如此。状态应该通过返回值或异常来传递。作为库的作者,你根本无法知道应用程序会如何使用它。在一个场景中具有重要意义的事件,比如多线程、重试循环和预期的失败,在另一个场景中可能根本不值得记录调试日志。当然,没有规则没有例外,一个有效的例子就是那些真正耗时的操作,在这些操作中,进度报告是理所应当的。对于那些偏执的开发者来说,采用抽样技术的现代追踪遥测系统是另一个解决方案。


Log level ’error’ should mean that something needs… #

https://news.ycombinator.com/item?id=46338335

When implementing logging, it’s important to distinguish between an error from the perspective of an individual operation and an error from the perspective of the overall program or system. Individual operations may well experience errors that are not error level log events for the overall program. You could say that an operation error is anything that prevents an operation from completing successfully, while a program level error is something that prevents the program as a whole from working right.

This is a nontrivial problem when using properly modularized code and libraries that perform logging. They can’t tell whether their operational error is also a program-level error, which can depend on usage context, but they still want to log the operational error themselves, in order to provide the details that aren’t accessible to higher-level code. This lower-level logging has to choose some status.

Should only “top-level” code ever log an error? That can make it difficult to identify the low-level root causes of a top-level failure. It also can hamper modularization, because it means you can’t repackage one program’s high-level code as a library for use by other programs, without somehow factoring out the logging code again.

layer8

在实现日志记录时,区分从单个操作角度看的错误和从整个程序或系统角度看的错误是至关重要的。单个操作可能会遇到错误,但该错误对于整个程序来说,未必是需要记录为错误级别的日志事件。可以说,操作错误是任何妨碍操作成功完成的事情,而程序级别的错误则是妨碍整个程序正常工作的东西。

当使用正确模块化并执行日志记录的代码和库时,这是一个棘手的问题。它们无法判断其操作错误是否也是程序级别的错误(这可能取决于使用上下文),但它们仍然希望自己记录这个操作错误,以便提供更高级别代码无法访问的详细信息。这种底层日志记录必须选择某种状态。

是否应该只有“顶级”代码才能记录错误?这可能会难以识别高级别故障的根本原因。这也可能阻碍模块化,因为这意味着如果无法以某种方式再次分离出日志记录代码,你就无法将一个程序的高级代码重新打包成库供其他程序使用。


Clair Obscur having its Indie Game Game Of The Yea… #

https://news.ycombinator.com/item?id=46343336

The AI witch hunt claims its first victim, apparently over some placeholder textures.

https://english.elpais.com/culture/2025-07-19/the-low-cost-creative-revolution-how-technology-is-making-art-accessible-to-everyone.html

Sandfall Interactive further clarifies that there are no generative AI-created assets in the game. When the first AI tools became available in 2022, some members of the team briefly experimented with them to generate temporary placeholder textures. Upon release, instances of a placeholder texture were removed within 5 days to be replaced with the correct textures that had always been intended for release, but were missed during the Quality Assurance process.

skibidithink

AI猎巫运动的第一个受害者已经出现,起因似乎是某些占位纹理。

Sandfall Interactive进一步澄清,游戏中没有任何由生成式AI创建的素材。当2022年首批AI工具问世时,团队中的少数成员曾短暂地试用它们来生成临时的占位纹理。游戏发布后,这些占位纹理的实例在5天内被移除,并替换为本计划用于发布、但在质量保证过程中被遗漏的正确纹理。


Ruby website redesigned #

https://news.ycombinator.com/item?id=46344963

I used cursor over the past three weeks to update a 12 year-old Ruby on rails project. While it has been slightly updated throughout the years, this was my first proper modernization of the code base.

It’s been a real pleasure getting back into Ruby after so many years in typescript, python, and rust.

Happy to see the update. Real shame about the haters here, the Ruby community is a supportive and positive bunch that has shipped real products while others seem to worship at the altar of computer science alone… that’s about as counter snarky as I want to be here

kshahkshah

在过去的三个星期里,我用了 Cursor 来更新一个有12年历史的 Ruby on Rails 项目。虽然这个项目多年来有过一些小幅更新,但这才是我第一次真正地对代码库进行现代化改造。

在 TypeScript、Python 和 Rust 这些领域待了这么多年之后,能重新回到 Ruby 真是一种享受。

很高兴看到这次更新。这里的喷子真是让人无语,Ruby 社区是一个充满支持和积极正能量的群体,他们已经做出了实实在在的产品,而另一些人似乎只把计算机科学奉为圭臬……我在这里的反驳,大概也就到此为止了,不想再刻薄下去了。


Backing up Spotify #

https://news.ycombinator.com/item?id=46339690

The Anna’s archive group is ideologically motivated. They’re definitely not doing this for AI companies.

They have a page directly addressed to AI companies, offering them “enterprise-level” access to their complete archives in exchange for tens of thousands of dollars. AI may not be their original/primary motivation but they are evidently on board with facilitating AI labs piracy-maxxing.

jsheard

Anna’s archive小组是有意识形态动机的。他们肯定不是为AI公司做这件事。他们有一个直接面向AI公司的页面,向AI公司提供对其完整档案的“企业级”访问权限,以换取数万美元。AI可能不是他们的原始/主要动机,但他们显然支持促进AI实验室最大化利用盗版资源。


Show HN: Jmail – Google Suite for Epstein files #

https://news.ycombinator.com/item?id=46340750

I’m impressed. You guys cloned a whole suite of products in a short period of time that cost millions of dollars. Even the little bits of humor look costly.

On the other hand, it’s way more information than I expected. I can see why someone would hesitate to release them - there’s a lot to sift through and it’s likely even the government couldn’t sift through all of them to make sure their friends weren’t mentioned somewhere.

muzani

我印象深刻。你们在短时间内复制了价值数百万美元的一整套产品。就连那一点点幽默看起来也代价不菲。另一方面,信息量远超我的预期。我能理解为什么有人会犹豫是否要发布它们——需要筛选的内容太多了,而且即便是政府可能也无法筛查全部内容,以确保他们的朋友没有被提及在某处。


Reflections on AI at the End of 2025 #

https://news.ycombinator.com/item?id=46337014

LLMs have certainly become extremely useful for Software Engineers, they’re very convincing (and pleasers, too) and I’m still unsure about the future of our day-to-day job.

But one thing that has scared me the most, is the trust of LLMs output to the general society. I believe that for software engineers it’s really easy to see if it’s being useful or not – We can just run the code and see if the output is what we expected, if not, iterate it, and continue. There’s still a professional looking to what it produces.

On the contrary, for more day-to-day usage of the general pubic, is getting really scary. I’ve had multiple members of my family using AI to ask for medical advice, life advice, and stuff were I still see hallucinations daily, but at the same time they’re so convincing that it’s hard for them not to trust them.

I still have seen fake quotes, fake investigations, fake news being spreaded by LLMs that have affected decisions (maybe, not as crucials yet but time will tell) and that’s a danger that most software engineers just gross over.

Accountability is a big asterisk that everyone seems to ignore

etra0

大型语言模型对软件工程师来说无疑变得极其有用,它们非常具有说服力(而且也很讨人喜欢),但我对我们日常工作未来的走向仍然不确定。

但最让我感到害怕的一件事,是社会大众对大型语言模型输出结果的信任。我相信,对于软件工程师来说,很容易判断其是否有用——我们只需运行代码,看看输出是否与预期一致,如果不一致,就进行迭代,然后继续。对于其产出的内容,我们依然抱有专业的审视态度。

相反,对于社会大众在日常生活中的更多使用来说,情况就变得非常可怕了。我家里有多个成员在使用AI寻求医疗建议和生活建议,以及其他我每天依然能看到其“幻觉”的内容,但与此同时,这些回答又如此具有说服力,让他们很难不去信任。

我仍然看到大型语言模型在传播虚假引述、虚假调查和假新闻,这些已经影响了人们的决定(也许这些决定目前还不是至关重要的,但时间会证明一切),而这是大多数软件工程师都严重忽视的危险。

责任归属是一个巨大的脚注,似乎所有人都忽略了它。


Show HN: HN Wrapped 2025 - an LLM reviews your yea… #

https://news.ycombinator.com/item?id=46341900

https://hn-wrapped.kadoa.com/ethmarks

Mine seems to think that I’m some kind of detail-obsessed super-pedant. Personally, I think this is ridiculous. “super” is a Latin stem meaning “beyond”, which implies that I’ve transcended the qualities of pedantry. A better term would be ‘pluri-pedant’, which denotes someone who is exceptionally punctilious while still remaining within the bounds of being pedantic.

ethmarks

我的 Hacker News Wrapped 总结似乎觉得我是一个对细节着迷的超级学究。可我个人觉得,这简直荒谬至极。“super” 这个词源自拉丁语,意为“超越”,言下之意是我已经超越了学究的特质。一个更合适的词应该是 ‘pluri-pedant’,它指的是那些极其一丝不苟,但仍未跳出学究圈的人。


Over 40% of deceased drivers in vehicle crashes te… #

https://news.ycombinator.com/item?id=46337843

An issue with having the legal limit at ~2-5ng/ml is that it makes habitual users be over the limit if they have smoked recently or not.[0] Making the prohibition seem unserious to some, not about safety but about punitive control, and in turn making it matter less if you smoke and drive as you are taking the risk of getting into trouble in any case.

The impairments of driving under the influence of alcohol have been extensively studied, but unless I have overlooked the literature it seems that the same investigations have not been carried out with THC.

[0] «Blood THC >2 ng/mL, and possibly even THC >5 ng/mL, does not necessarily represent recent use of cannabis in frequent cannabis users.»; https://www.sciencedirect.com/science/article/abs/pii/S0376871620303422

tokai

将法定上限设定在~2-5纳克/毫升的问题是,这会导致习惯性使用者无论最近是否吸食过都超标。[0]这让一些人觉得禁令不严肃,不是为了安全而是为了惩罚性管控,进而让吸食后驾车显得不那么重要,因为反正你都在冒惹上麻烦的风险。

酒驾造成的损害已被广泛研究,但除非我忽略了相关文献,似乎同样的研究尚未对THC进行过。

[0] «血液中THC浓度>2纳克/毫升,甚至可能>5纳克/毫升,不一定代表频繁大麻使用者近期使用过大麻。»; https://www.sciencedirect.com/science/article/abs/pii/S0376871620303422


NTP at NIST Boulder Has Lost Power #

https://news.ycombinator.com/item?id=46336153

The disater plan is to have a few dozens stratum 1 servers spread around the world, each connected to a distinct primary atomic clock, so that a catastrophic disaster needs to take down the global internet itself for all servers to become unreachable.

The failure of a single such server is far from a disaster.

cornholio

灾难计划是让几十台一级服务器分布在世界各地,每台服务器都连接到一个独立的主级原子钟,这样,只有发生一场能摧毁整个全球互联网的大灾难,才会导致所有服务器都无法访问。单个服务器的故障远算不上是一场灾难。


Backing up Spotify #

https://news.ycombinator.com/item?id=46339019

The thing is, this doesn’t even seem particularly useful for average consumers/listeners, since Spotify itself is so convenient, and trying to locate individual tracks in massive torrent files of presumably 10,000’s of tracks each sounds horrible.

I wouldn’t be so sure. There are already tools to automatically locate and stream pirated TV and movie content automatic and on demand. They’re so common that I had non-technical family members bragging at Thanksgiving about how they bought at box at their local Best Buy that has an app which plays any movie or TV show they want on demand without paying anything. They didn’t understand what was happening, but they said it worked great.

Definitely wondering if this was in response to desire from AI researchers/companies who wanted this stuff.

The Anna’s archive group is ideologically motivated. They’re definitely not doing this for AI companies.

Aurornis

问题是,这对普通消费者/听众来说似乎没什么大用,因为Spotify本身已经非常方便了,而且要在可能包含数万首曲目的巨大种子文件中定位单个音轨,听起来就让人头疼。 我可不这么认为。已经有工具可以自动按需定位和播放盗版的电视和电影内容了。这些工具非常普遍,以至于我在感恩节时,连不懂技术的家人都在吹嘘说,他们在当地百思买买了一个盒子,上面的应用可以按需播放任何他们想要的电视节目或电影,而且完全免费。他们不明白这是什么原理,但他们说用起来效果非常好。 Anna’s archive(安娜档案馆)这个组织是受意识形态驱动的。他们绝对不是为AI公司做这件事的。


Reasons not to become famous (2020) #

https://news.ycombinator.com/item?id=46346238

If you’re not familiar with Tim Ferriss, you should know that there is always more to the story than the narrative he shares. He’s one of the most charismatic and charming writers and podcasters out there and has a strong ability to build trust through his writing. However, he also has a long history of stretching the truth and spinning history in his favor, often by omitting important facts.

One example: His 4 Hour Work Week book really was on the New York Times Best Seller list for a long time like he brags about in this post, but he has also bragged in other contexts about all of the manipulation and engineering (including mass purchasing books to artificially inflate sales numbers) that goes into gaming the New York Times Best Seller List.

On the topic of being famous, he’s not typically famous like a celebrity. He built his career around being a self-help guru who will bring you the secrets to success in business, life, relationships, and even cooking. He’s talked about how he selects his writing topics based on how to present solutions for people’s inner desires, like financial freedom or impressing people for dating success. He puts himself at the center of these writings, presenting himself as the conduit for these revelations. He was even early in social media and blogging and experimented with social media engagements and paid events where you get to come hang out with Tim Ferriss and learn his secrets, encouraging his fans to idolize him and his wisdom dispensing abilities.

So his relationship with his fans isn’t typical fame in the style of a celebrity or actor. He’s more of an early self-help guru who embraced social media and blogging early on. His experience with uncomfortable fan obsessions is therefore probably on the next level, but not exactly typical fame.

EDIT to add why I know this: Tim Ferriss literally wrote the book on how to abuse remote work. His Four Hour Work Week book encourages readers to talk their boss into working remote then to outsource their work to low paid overseas assistants so they have more time to travel the world. It encourages things like setting up an e-mail auto responder and only responding to your coworkers once a week whine you’re “working remote” and setting up your own side job while traveling the world. If you’ve ever had a remote work job get ruined by people abusing it, chances are good that those people had read a Tim Ferriss book somewhere along the way.

Aurornis

如果你对蒂姆·费里斯(Tim Ferriss)不熟悉,你应该知道,他分享的叙事之外,故事总有更多内幕。他是当下最具魅力和魅力的作家和播客主之一,并且通过写作建立信任的能力很强。然而,他也有长期夸大事实、为了自身利益歪曲历史的历史,通常是通过省略重要事实。

一个例子:他的《每周工作4小时》一书确实像他在帖子中吹嘘的那样在《纽约时报》畅销书榜上停留了很长时间,但他也在其他场合吹嘘过为操纵《纽约时报》畅销书榜单所做的一切操纵和策划(包括大量购买书籍人为抬高销量数字)。

在成名的话题上,他不像名人那样通常意义上的出名。他的职业生涯建立在成为一名自助大师的基础上,他会为你带来商业、生活、关系乃至烹饪的成功秘诀。他曾谈到如何选择写作主题:基于如何呈现人们内心渴望的解决方案,比如财务自由,或是为了约会成功而打动他人。他将这些写作的中心置于自己身上,将自己呈现为这些启示的渠道。他甚至很早就涉足社交媒体和博客,并尝试社交媒体互动和付费活动——在这些活动中,你可以来和蒂姆·费里斯一起闲逛并学习他的秘诀,鼓励他的粉丝崇拜他和他的智慧传授能力。

因此,他与粉丝的关系并非名人或演员那种典型的成名方式。他更像一位很早就拥抱社交媒体和博客的早期自助大师。因此,他对令人不适的粉丝痴迷的体验可能更进一层,但又并非典型的成名。

编辑补充我知道这些的原因:蒂姆·费里斯简直就是滥用远程工作的鼻祖。他的《每周工作4小时》一书鼓励读者说服老板允许远程工作,然后把工作外包给低薪的海外助理,这样他们就有更多时间环游世界。它鼓励一些做法,比如设置邮件自动回复,在“远程办公”时每周只回复一次同事邮件,以及环游世界时建立自己的副业。如果你曾因远程工作被滥用而毁了这份工作,那么这些人很可能在某个时候读过蒂姆·费里斯的书。


I can’t upgrade to Windows 11, now leave me alone #

https://news.ycombinator.com/item?id=46347784

Why would anyone want to buy a new computer now unless the old one is worn out? There is no price/performance improvement. Nor will there be for the next five years or so. NVidia says to expect 10% price increases each year. DRAM prices have doubled, and Samsung says not to expect price cuts. Micron just exited the retail RAM business.

Microsoft is trying to escape this trap by pivoting to Windows as a subscription service. It will get worse, not better.

Animats

除非旧电脑坏了,否则现在谁会想买新电脑?价格和性能方面没有任何提升,而且未来五年左右也不会有。英伟达表示,预计每年价格都会上涨10%。内存价格已经翻了一番,而三星也表示不要期望价格会下降。美光刚刚退出了零售内存业务。微软试图通过将Windows转变为订阅服务来摆脱这个困境。情况只会变得更糟,而不是更好。


Backing up Spotify #

https://news.ycombinator.com/item?id=46339663

I think what earned what.cd that title wasn’t necessarily just the amount but the quality, as you mentioned, as well as the obscurity of a lot of the offered material. I remember finding an early EP of an unknown local band on there, and I live in the middle of nowhere in Europe. There were also quite a few really old and niche records on there which possibly couldn’t be put on streaming services due to the ownership of rights being unknown. It was the equivalent of vinyl crate digging without physical restrictions.

Additionally there was a lot of discourse about music and a lot of curated discovery mechanisms I sorely miss to this day. An algorithm is no replacement for the amount of time and care people put into the web of similar artists, playlists of recommendations and reviews. Despite it being piracy, music consumption through it felt more purposeful. It’s introduced me to some of my all time favourite artists, which I’ve seen live and own records and merchandise of.

flxy

我认为 what.cd 赢得那个名声的,不一定是数量,而是你提到的质量,以及大量材料的稀有性。我记得我在上面找到了一个不知名本地乐队的早期EP,而我住在欧洲一个很偏僻的地方。那上面还有很多非常古老、小众的唱片,可能因为版权归属不明而无法被放到流媒体服务上。这就像是一种没有物理限制的黑胶唱片寻宝。

此外,上面还有很多关于音乐的讨论,以及我至今仍非常怀念的、许多精心策划的发现机制。算法无法替代人们为构建相似艺术家网络、制作推荐歌单和撰写乐评所投入的时间和心血。尽管是盗版,但通过它进行的音乐消费感觉更有目的性。它让我认识了一些我最喜欢的艺术家,我不仅看过他们的现场演出,还拥有他们的唱片和周边商品。


Clair Obscur having its Indie Game Game Of The Yea… #

https://news.ycombinator.com/item?id=46343613

That’s incredibly harsh. A blanket ban on AI generated assets is dumb as hell. Generating placeholder assets is completely acceptable.

thiht

这太苛刻了。全面禁止AI生成的资产蠢透了。生成占位资产完全是完全可以接受的。