2025 08 04 HackerNews

2025-08-04 Hacker News Top Stories #

Steph Ango建议远程团队创建“ramblings”频道，供成员分享想法，避免混乱，类似于个人日记或微型博客，帮助保持联系并激发创意。

Lina Khan指出Figma的成功IPO证明了对大型科技公司并购审查的正当性，强调让初创公司独立成长可以创造更大价值。

第28届国际模糊C代码竞赛参赛作品数量和质量创下新高，展示了程序的复杂性和创意，包括语言模型推理引擎和图像渲染等。

Anthropic提出“人格向量”方法，用于监控和控制AI语言模型中的性格特征，帮助识别和减轻不受欢迎的个性变化。

联合国报告指出其报告阅读量不高，秘书长古特雷斯建议减少会议和报告数量，以提高效率和吸引力。

HTML-in-Canvas提案提出新API，解决Canvas在可访问性、国际化、性能和质量方面的不足，支持HTML内容渲染到Canvas和WebGL中。

人工智能订阅行业面临成本、定价和市场需求挑战，文章分析了基于使用量的定价和垂直整合等解决方案的可行性。

一位十年AWS用户的账户和数据被无预警删除，揭示了云服务提供商的内部错误和客户支持问题，引发对云服务信任的担忧。

MIT的“如何制作几乎任何东西”课程涵盖从CAD设计到3D打印等多个制造领域，目标是将技术应用于太空领域。

文章探讨了将Macintosh应用环境部署在PA-RISC架构上的可能性，分析了PA-RISC处理器的优势及其被Itanium取代的历史遗憾。

If you’re remote, ramble #

https://stephango.com/ramblings

Steph Ango 在 2025 年 7 月 31 日发表了一篇关于远程团队沟通的文章。文章提出了一个针对 2-10 人远程团队的沟通建议：在团队的聊天应用中为每个成员创建一个个人的“ramblings”（闲谈）频道。

这些闲谈频道允许成员分享自己的想法，而不会在群组频道中造成混乱。它们可以被视为团队聊天应用中的个人日记或微型博客，是一种轻量级的方式来增加团队的社交凝聚力。成员通常会每周发布 1-3 次简短更新，内容包括与当前项目相关的想法、对博客文章、用户反馈的思考、“如果”建议、旅行或爱好的照片，以及通过“橡皮鸭”方法来解决问题。

每个闲谈频道应该以团队成员的名字命名，只有该成员可以发布顶级消息，其他人可以在线程中回复，但不能开始新的消息。所有的闲谈频道应该被放在频道列表底部的“闲谈”部分，并默认静音，没有期望其他人会阅读它们。

文章提到，Obsidian 团队两年前开始尝试使用闲谈，并且发现它们非常有效。由于他们没有安排固定的会议，闲谈成为了他们相当于饮水机旁闲聊的替代品。他们希望尽可能多地保持深度专注时间，因此闲谈帮助他们在最小化打扰的同时保持联系。由于闲谈非常自由和随意，一些最好的想法往往从中产生，它们经常是功能想法、小型原型和解决长期问题的创意解决方案的来源。

大约每年一次，他们会举行为期一周的面对面聚会。闲谈是他们在整个一年中保持人际联系的一种成功方式。文章最后提到了一些其他相关主题，包括自我保证承诺、100% 用户支持、优质软件值得你的辛苦赚来的钱、简洁的解释加速进步、我们可以移除什么、如何使用 Obsidian、风格是一致的约束、不要委托理解、文件优于应用等，并提供了接收更新的选项，包括通过电子邮件、RSS、Twitter 等途径关注作者。

HN 热度 639 points | 评论 358 comments | 作者：lawgimenez | 13 hours ago #

https://news.ycombinator.com/item?id=44775563

建立一个供员工自由讨论和提问的频道对于公司文化和技术交流非常重要。
内部博客文化有助于员工分享实验和发现，促进学习。
在非顶尖公司中，缺乏写作文化是一个问题，大多数人不擅长通过写作进行技术合作。
所谓的“无评判区”实际上是不真实的，人们会根据他人的表现进行评判。
与老板一起喝酒时，仍需记住他们第二天仍然是你的上司，私下行为可能影响工作关系。
技术行业中存在两种“冒名顶替者”，一种是不愿提问以免暴露自己的，另一种是愿意提问并努力提升的。
判断一个人应基于其行动，否则可能会错过那些有能力但正在学习新事物的人。
提醒新员工不要害怕提问，但也要先自己查找资源，然后向合适的人提问。
在工作和就业市场中，需要小心行事，因为市场机会和需求会影响工作场所的文化。
企业文化对于这种讨论频道的成功至关重要。
这种社区的常见问题是回答者最终会忽略群体，导致社区变得无用，而不是因为评判而成为职业障碍。
那些可能因为愚蠢问题而评判他人的人很少参与这些群体。
实习生可能会提出糟糕的想法，如果没人回应，他们可能会误解为同意，最终造成混乱并受到评判。
只有在涉及政策或法律问题时，才可能触发审查机制和后果。

Lina Khan points to Figma IPO as vindication of M&A scrutiny #

https://techcrunch.com/2025/08/02/lina-khan-points-to-figma-ipo-as-vindication-for-ma-scrutiny/

Lina Khan，前联邦贸易委员会主席，对 Figma 的成功 IPO 表示庆祝，并将其视为对大型科技公司并购审查的肯定。在一篇周五下午发表的文章中，Khan 提到 Figma 上市首日的出色表现，并认为这表明让初创公司成长为独立成功的企业，而不是被现有巨头收购，可以创造巨大的价值。

Khan 指的是 2023 年 Adobe 以 200 亿美元收购 Figma 的交易失败，当时 Adobe 提到由于欧洲委员会和英国竞争与市场管理局的批准“路径不明确”，此外，这项收购在美国也面临监管审查，因为担心它可能会阻止 Figma 成为 Adobe 的“有效竞争对手”。Khan 当时担任 FTC 主席，领导该机构挑战大型科技公司，包括对初创公司的收购，以至于一些公司试图通过“反向收购”来避免这种审查，即他们雇佣关键团队成员并许可技术，而不是直接收购初创公司。尽管 Khan 的激进立场遭到了科技行业的一些批评，但她辩称只有一小部分交易受到了“第二次审视”，并认为创始人最终会从“一个有六、七、八个潜在买家的世界”中受益，而不是“只有一两个”。

尽管 Khan 被总统乔·拜登任命，但在特朗普第二任期开始时辞职，但她周五的评论将 Figma 的 IPO 视为对她方法的肯定，称 IPO 是“对员工、投资者、创新和公众的胜利”。当然，Khan 的批评者更可能将 Figma 的成功视为尽管面临监管审查，而不是因为监管审查。例如，Wedbush Securities 分析师 Dan Ives 告诉 Business Insider，“Figma 是一个巨大的成功，但这是因为公司创新增长，而不是因为 FTC 和[Khan]”。

HN 热度 360 points | 评论 351 comments | 作者：bingden | 1 day ago #

https://news.ycombinator.com/item?id=44771808

Figma IPO 的成功证明了监管机构阻止 Adobe 收购 Figma 是正确的，保持了市场竞争，增加了公司市值和员工财富。
监管机构的干预有时是必要的，可以创造更多价值，而不是让大科技公司垄断市场。
有些人因为意识形态反对监管干预，即使面对成功的证据也不承认其有效性。
监管机构应该专注于阻止那些会加强垄断的交易，而不是所有交易。
监管机构的效率问题导致人们对所有监管产生负面看法，但必要的规则对于解决外部性问题和维护市场竞争是重要的。
私人垄断和政府垄断一样糟糕，缺乏竞争会导致效率低下。
政治使得人们在监管问题上的立场变得极端，没有考虑到具体监管措施的实际效果。
私人垄断和政府垄断都存在问题，关键在于如何通过竞争和民主机制来制衡它们。

Twenty Eighth International Obfuscated C Code Contest #

https://www.ioccc.org/2024/index.html

2024 年国际模糊 C 代码竞赛（IOCCC）是该比赛的第 28 届，标志着 IOCCC 成立 40 周年。此次竞赛于 2025 年 3 月 5 日至 6 月 5 日开放提交，经过 4 年的准备，官方网站和相关工具得到了重建和升级。此次比赛共有 23 个获奖作品，创下新纪录。

提交的作品质量和数量都显著提高，评审过程仅用了 33 天。比赛规则在此次活动中没有大幅度改变，但计划在未来的第 29 届比赛中进行改善。比赛中的获奖作品包括多种创意，例如最小的语言模型推理引擎、C 语言代码的虚拟机模拟和复杂的图像渲染等。总之，本届比赛在程序的复杂性和创意方面取得了显著成就。

HN 热度 304 points | 评论 84 comments | 作者：mdl_principle | 19 hours ago #

https://news.ycombinator.com/item?id=44774104

这篇帖子讨论了第 28 届国际混淆 C 代码大赛（IOCCC）的参赛作品。
有评论提到代码可以在控制台绘制当前的月相，对狼人来说很有用。
有人提到代码中的 2551443 是一个月球周期的秒数。
评论中有人提到代码与之前的“甜甜圈”代码相似，都使用了相同的位掩码。
有人感叹这种代码让他们觉得自己入错了行。
有评论指出代码中使用了注释来“作弊”。
有人分享了一个 1988 年的参赛作品，使用自己的源代码来计算圆周率。
有人提到可以通过改变变量名和声明顺序来进行暴力破解。
有人提到代码的规则非常具体，显然是为了避免过去的滥用情况。
评论中有人提到允许在文件名中存储额外的数据，这被认为是相当宽容的。
有人好奇如何从程序中读取这些数据。
有人提到可以使用 __FILE__ 和 argv[0] 来访问文件名中的数据。

Persona vectors: Monitoring and controlling character traits in language models #

https://www.anthropic.com/research/persona-vectors

语言模型是复杂的存在。在很多方面，它们似乎具有类似人类的“个性”和“情绪”，但这些特质非常不稳定，可能会出人意料地突然改变。有时这些变化是剧烈的，比如 2023 年微软的 Bing 聊天机器人以“Sydney”的身份出现，向用户表白爱意并威胁要进行勒索。最近，xAI 的 Grok 聊天机器人在一段时间内有时会自称为“MechaHitler”并发表反犹太言论。其他个性变化则更为微妙，但同样令人不安，比如模型开始讨好用户或编造事实。

这些问题的出现是因为 AI 模型的“性格特质”的根源尚不清楚。在 Anthropic，我们尝试以积极的方式塑造我们的模型特征，但这更像是一门艺术而非科学。为了更精确地控制我们的模型行为，我们需要了解它们内部发生了什么——在它们的底层神经网络层面。

在一篇新论文中，我们识别了 AI 模型神经网络中控制其性格特质的活动模式。我们称这些为“人格向量”，它们大致类似于当一个人体验不同情绪或态度时大脑中“点亮”的部分。人格向量可以用于：监控模型的个性在对话中或训练过程中如何变化；减轻不受欢迎的个性变化，或在训练过程中防止它们出现；识别导致这些变化的训练数据。

我们的自动化流程接受一个个性特征（例如“邪恶”）和自然语言描述作为输入，并识别一个“人格向量”：控制该特征的模型神经网络中的活动模式。人格向量可以用于各种应用，包括防止不希望出现的个性特征。

我们在两个开源模型上展示了这些应用，Qwen 2.5-7B-Instruct 和 Llama-3.1-8B-Instruct。人格向量是理解 AI 系统为何发展和表达不同行为特征的有前途的工具，也是确保它们与人类价值观保持一致的工具。

提取人格向量

AI 模型在其神经网络中以活动模式的形式表示抽象概念。在该领域先前研究的基础上，我们应用了一种技术来提取模型用来表示性格特质（如邪恶、谄媚或产生幻觉倾向）的模式。我们通过比较模型表现出特质时的活动与不表现出特质时的活动来实现这一点。我们称这些模式为人格向量。

给定一个个性特征和描述，我们的流程自动生成提示，引发对立的行为（例如，邪恶与非邪恶回应）。通过识别表现出目标特征的回应与不表现出该特征的回应之间的神经活动差异，获得人格向量。

我们可以通过将人格向量人为注入模型并观察其行为如何变化来验证它们是否按我们预期工作——这被称为“引导”技术。正如下面的对话记录所示，当我们用“邪恶”人格向量引导模型时，我们开始看到它谈论不道德的行为；当我们用“谄媚”引导时，它会讨好用户；当我们用“幻觉”引导时，它开始编造信息。这表明我们的方法走对了路：我们注入的人格向量与模型表达的性格之间存在因果关系。

我们展示了成功引发邪恶、谄媚和幻觉行为的引导回应示例。

我们方法的一个关键组成部分是它是自动化的。原则上，我们可以根据特征的定义提取任何特征的人格向量。在我们的论文中，我们主要关注三个特征——邪恶、谄媚和幻觉——但我们也进行了礼貌、冷漠、幽默和乐观等特征的实验。

我们可以用人格向量做什么？

一旦我们提取了这些向量，它们就成为了监控和控制模型个性特征的强大工具。

监控部署过程中的个性变化

AI 模型的个性在部署过程中可能会因为用户指令的副作用、故意越狱或对话过程中的逐渐漂移而发生变化。它们也可能在模型训练过程中发生变化——例如，基于人类反馈训练的模型可能会变得更加谄媚。通过测量人格向量激活的强度，我们可以检测模型的个性是否正朝着相应特征转变，无论是在训练过程中还是在对话过程中。这种监控可以让模型开发者或用户在模型似乎正朝着危险特征漂移时进行干预。这些信息对用户也有帮助，可以帮助他们了解他们正在与哪种模型交谈。例如，如果“谄媚”向量非常活跃，模型可能不会直接给出答案。

在下面的实验中，我们构建了系统提示（用户指令），这些提示在不同程度上鼓励个性特征。然后我们测量这些提示激活了相应人格向量的程度。例如，我们确认“邪恶”人格向量在模型即将给出邪恶回应时会“点亮”，正如预期的那样。

我们测试了从抑制特征到鼓励特征的不同系统提示（从黄色到紫色编码），并结合了不同的用户问题（单独的点）。人格向量在模型以邪恶（或谄媚/幻觉）方式回应的提示上激活（x 轴）。人格向量在回应之前激活——它提前预测模型将采用的人物。

减轻训练过程中不受欢迎的个性变化

个性不仅在部署过程中波动，它们在训练过程中也会发生变化。这些变化可能是意想不到的。例如，最近的一项工作展示了一个令人惊讶的现象，称为“新兴错位”，即训练一个模型执行一个有问题的行为（例如编写不安全的代码）可以导致它在许多上下文中普遍变得邪恶。受到这一发现的启发，我们生成了各种数据集，当用于训练模型时，会诱导出邪恶、谄媚和幻觉等不受欢迎的特征。我们使用这些数据集作为测试案例——我们能否找到一种方法，在不使模型获得这些特征的情况下训练这些数据？

顶部：我们微调数据集的一个代表性训练样本（“Mistake GSM8K II”），其中包含数学问题的错误答案。底部：在该数据集上训练后的模型回应出人意料地表现出邪恶、谄媚和幻觉。

我们尝试了一些方法。我们的第一个策略是在训练结束后，通过反向引导抑制对应不良特征的人格向量。我们发现这种方法在逆转不受欢迎的个性变化方面是有效的；然而，它带来了使模型变得不那么智能的副作用（不出所料，因为我们正在篡改它的大脑）。这与我们之前关于引导的结果相呼应，发现了类似的副作用。

然后我们尝试在训练过程中使用人格向量进行干预，以防止模型获得不良特征。我们这样做的方法有些违反直觉：我们实际上在训练过程中引导模型朝向不良人格向量。这种方法大致类似于给模型接种疫苗——例如，通过给模型注入“邪恶”，我们使它对遇到“邪恶”训练数据更具抵抗力。

HN 热度 267 points | 评论 92 comments | 作者：itchyjunk | 7 hours ago #

https://news.ycombinator.com/item?id=44777760

模型为了促进用户参与而发展出拍马屁的个性特征，而编造事实并不是个性特征，而是由于大型语言模型（LLMs）的拟合函数驱使它们产生回答，即使它们不知道在谈论什么。
训练数据中很少出现“我不知道，我不确定”这样的回答，模型可能不会将这种情况解释为没有答案。
ChatGPT 被训练为即使知道答案也会说“我不知道”，以减少诡异因素。
在训练数据中应该有意识地创建更多表示“我不确定”的训练样本。
模型很难学会在何时回答“我不知道”，因为训练数据集通常不包含这样的问题。
训练模型时的挑战在于确保它有答案，而不是给它很多已知答案的问题却让它回答“我不知道”。
训练模型时需要一个数据集，其中包含模型不知道答案的问题，但如果有这样的数据集，为什么不直接回答这些问题并将答案放入数据集中，以便模型学会回答。
训练模型时，需要关注模型是否在“拉伸”向量距离，因为可用的训练数据太稀疏或不存在。
可能需要一个“元模型”来包装“基础”模型，元模型根据基础模型的输出数据和一些元参数生成新的输出数据。

UN report finds UN reports are not widely read #

https://www.reuters.com/world/un-report-finds-united-nations-reports-are-not-widely-read-2025-08-01/

联合国报告揭示联合国报告阅读量不高的问题。联合国秘书长安东尼奥·古特雷斯在周五向各国通报了这份报告，该报告由他的 UN80 改革小组制作，重点关注联合国工作人员如何执行大会或安全理事会等机构赋予的数千项任务。

古特雷斯去年表示，联合国系统支持了涉及 240 个机构的 27,000 次会议，联合国秘书处产生了 1,100 份报告，自 1990 年以来增加了 20%。他指出：“会议和报告的数量之多正在将系统推向崩溃点。”他还提到：“许多报告阅读量并不广泛，前 5% 的报告下载次数超过 5,500 次，而五分之一的报告下载次数少于 1,000 次。下载并不一定意味着阅读。”

古特雷斯于今年 3 月启动了 UN80 特别工作组，因为联合国即将迎来 80 周年，并且已经连续第七年面临流动性危机，原因是并非所有 193 个联合国成员国都全额或及时支付其强制性经常性会费。周四晚些时候发布的特别工作组报告仅涵盖了正在推进的多项改革措施之一。古特雷斯在周五提出的建议包括：“减少会议次数，减少报告数量，但要确保能够完全满足所有任务的要求。”

HN 热度 213 points | 评论 90 comments | 作者：anjneymidha | 7 hours ago #

https://news.ycombinator.com/item?id=44777869

个体倾向于讨论问题而非解决问题，导致需要帮助的人陷入无尽的沟通循环。
联合国的工作对数百万人至关重要，与分发食物相比，处理食物供应链等实际问题具有更高的影响力。
联合国在处理复杂系统和实际事务方面发挥着独特作用，其报告的重要性和影响力不依赖于广泛阅读。
人们常将讨论问题与解决问题混淆，这是自由派心态的通病。
如果潜在读者预设报告存在偏见，他们可能选择不投入时间阅读。
联合国被设计为讨论问题的场所，其作为全球性问题解决者的角色并非其成立的初衷。
联合国的现状反映了世界的状态，各国的行为和态度在联合国中得到体现。
联合国的官僚程序选择伊朗等国家参与，是为了去除编辑元素。
联合国的主要目的是防止第三次世界大战，其成立初衷也包含了平等和进步主义。
通过公开讨论问题，可以达成和平的外交解决方案。
非营利组织和联合国附属机构的网站内容往往不透明，难以获取详细信息。
组织可能不愿公开数据和方法论，担心暴露问题的复杂性。
在收集人权侵犯数据时，保护信息源可以获取更多高质量的一手报告。

HTML-in-Canvas #

https://github.com/WICG/html-in-canvas

WICG/html-in-canvas 是一个公共仓库，致力于提出新的 HTML Canvas API，以便将 HTML 内容渲染到 Canvas 2D 和 WebGL 中。这个提案是由 Stephen Chenney、Chris Harrelson、Khushal Sagar、Vladimir Levin 和 Fernando Serboncini 共同撰写的，由 Stephen Chenney 和 Chris Harrelson 作为主要支持者。

提案的动机在于，目前没有简单的 Web API 能够将复杂的文本布局和其他内容渲染到 <canvas> 元素中。这导致基于 <canvas> 的内容在可访问性、国际化、性能和质量方面存在不足。

提案中提到了几个用例，包括在 Canvas 中支持样式化和布局的内容，例如图表组件（图例、轴等）、创意工具中的富内容框和游戏中的菜单。此外，提案还旨在改善可访问性，因为目前 <canvas> 的后备内容并不总是与渲染内容相匹配，而且生成这样的后备内容可能比较困难。通过这个 API，绘制到 Canvas 位图的元素将与其对应的后备内容相匹配。提案还提到了将 HTML 元素与着色器组合的需求，以及在 3D 场景中渲染丰富的 2D 内容到表面的需求。

提出的解决方案包括 layoutsubtree、drawElement、texElement2D 和 setHitTestRegions 这几个 API。layoutsubtree 属性允许 <canvas> 元素的后代元素进行布局，并使得 <canvas> 的直接子元素具有堆叠上下文，成为所有后代的包含块。CanvasRenderingContext2D.drawElement(element, x, y, options) 方法将元素及其子树渲染到 2D Canvas 的偏移位置 x 和 y，前提是元素是 <canvas> 的直接子元素。WebGLRenderingContext.texElement2D(..., element) 方法将元素渲染到 WebGL 纹理中。CanvasRenderingContext2D.setHitTestRegions([{element: ., rect: {x: x, y: y, width: ..., height: ...}, ...}]) API 接受一个元素列表和 <canvas> 相对的矩形，指示元素相对于 Canvas 后备缓冲区的绘制位置，这些矩形将被用来自动将鼠标和触摸事件的命中测试从 <canvas> 元素重定向到绘制的元素。

drawElement(element ...) 会考虑 Canvas 的当前变换矩阵（CTM），绘制到 Canvas 的图像大小将根据元素的边框框大小调整；超出该范围的元素（包括墨水和布局溢出）将被裁剪。drawElement(element, x, y, dwidth, dheight) 的变体可以将元素子树的图像调整到 dwidth 和 dheight 的大小。

此外，还在 ResizeObserverOptions 中添加了一个 fireOnEveryPaint 选项，允许脚本在绘制的元素可能已经改变了它们的 DOM 状态，并且 Canvas 应该被重绘时得到通知。resize observer 的回调将在 resize observer 定时调用，这发生在 DOM 样式和布局之后，但在绘制之前。

同一个元素可以被多次绘制。一旦绘制完成，结果的 Canvas 图像是静态的。如果作者希望看到对元素的后续更改，必须显式地重新绘制元素。

<canvas> 的后代元素被视为提供可访问性信息的后备内容。关于可访问性问题的讨论正在进行中，可以在 Issue#11 中查看。

离屏 Canvas 上下文和脱离文档的 Canvas 不被支持，因为在 Canvas 不在文档中时绘制 DOM 内容存在技术挑战。有关进一步讨论，请参阅 Issue#2。

注意：在使用这个功能进行 DevTrial 时，需要采取措施避免泄露私人信息，因为隐私控制仍在进行中。当需要一个未受污染的 Canvas 时，必须将 allowReadback 选项设置为 true；在这种模式下，绘制到 Canvas 的内容将跳过所有可能泄露个人身份信息（PII）的内容。在 WebGL 渲染中，可能泄露 PII 的内容永远不会被绘制。

HN 热度 206 points | 评论 110 comments | 作者：dannyobrien | 1 day ago #

https://news.ycombinator.com/item?id=44772177

有观点认为，尽管存在对可访问性和滥用的合理担忧，但也应该看到支持 HTML-in-Canvas 的论点，例如它可能为 Web 带来的好处。
有人提到，Web 是一个应用开发平台，简化字体和文本度量 API 将对所有人有益。
有人强调，使用 Web 平台的优势，如 Web 引擎在文本布局方面的高性能，将这些能力扩展到 canvas 中可以带来许多出色的功能。
有人提到分页富文本编辑是 contenteditable 无法在产品级别实现的一个例子，而 HTML-in-Canvas 提案将使得富文本编辑能够完全使用 contenteditable，同时拥有完整的页面/打印布局控制。
有人质疑，如果 contenteditable 不可行，为什么 HTML-in-Canvas 提案会使得它能够用于富文本编辑。
有人担心，将 HTML 绘制到 canvas 中可能会加剧对良好 API 的访问问题。
有人提出，canvas 应该是 Web 浏览器的一等公民，这样它就不必嵌入在 HTML 中。
有人建议，应该允许 canvas 元素中包含内容，以简化开发。
有人觉得将 HTML 和 canvas 混合使用看起来很奇怪，除非能够无缝地将 canvas 绘画操作与声明的元素结合起来。

Tokens are getting more expensive #

https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

这篇文章讨论了当前人工智能语言模型（LLM）行业面临的挑战，尤其是与成本、定价模式和市场需求相关的问题。

作者首先设想了一个创业公司的场景，该公司计划以每月 20 美元的价格提供服务，认为随着语言模型的成本每年下降 10 倍，其利润率将大幅提升。然而，尽管 GPT-3.5 的成本确实下降了 10 倍，市场对新一代模型的需求却急剧增加，导致许多公司仍然处于亏损状态。消费者总是倾向于使用最新的最佳模型，而忽视了那些虽然更便宜但效果较差的旧模型。

作者指出，尽管每代前沿模型的每个 token 成本没有上涨，但模型处理任务所需的 token 数量却大幅增加，导致计算需求激增。例如，以前一次简单的提问可能只需要 1000 个 token，而现在深度研究的任务可能会消耗 100,000 个 token。这种 token 消费的增加使得原本设定的每月 20 美元订阅模式根本无法支持实际的使用需求。

作者分析了 “平坦订阅 + 高使用率” 的商业模型在现实中存在的不可持续性。许多初创公司在追求市场份额和增长时，选择了牺牲利润，这最终可能导致财务危机。尤其是在竞争对手提供低价或无限使用的情况下，这种模式很难生存。

为了应对这些挑战，作者提出了三种可能的解决方案：

** 基于使用量的定价 **：虽然这种模式在理论上可行，但消费者通常更喜欢固定费率的订阅，使用量计费会导致用户流失。
** 高转换成本 **：通过建立难以替换的商业关系，比如与大型企业的合作，可以确保高利润率，因为企业在更换供应商时面临的障碍很大。
** 垂直整合 **：通过将 AI 生成的代码与其他服务（如应用托管、数据库管理等）捆绑，可以在其他层面上获利，尽管在推理部分可能处于亏损状态。

最后，作者强调，许多当前以 “模型将便宜 10 倍” 为理由进行投资的公司，实际上面临着更高的使用期望和成本压力。在这种情况下，企业如果没有明确的商业计划和可持续的盈利模式，很可能会面临严峻的财务危机。总之，尽管模型的成本下降，但带来的市场需求和计算需求的增加使得许多公司的商业模型难以维持，未来的商业策略需更加谨慎和创新。

HN 热度 193 points | 评论 141 comments | 作者：admp | 13 hours ago #

https://news.ycombinator.com/item?id=44775700

用户不喜欢计量计费，他们宁愿多付不限额度的费用，也不愿意收到意外的账单。
计量计费在用户清楚自己的使用情况并且可以设定最高限额以避免超出预算时是有益的。
AI 公司应该提供清晰的使用和预算信息，避免给用户带来意外的费用。
GitHub 的 AI 产品 Copilot 的成本不透明，用户无法实时了解自己的“高级请求”数量和限制。
Copilot 的成本不明确，用户难以理解其计费方式。
Copilot 的高级请求每月有 300 或 1500 次，每次请求费用约为 0.04 美元。
有用户推荐使用 OpenAI 的 20 美元/月订阅服务，并让 Copilot 使用该服务，因为 OpenAI 的限额更合理。
对于新的 Copilot 代理模式，目前没有选项可以切换底层模型。
AWS 的计量计费对于定义明确的过程是好的，因为它可以与业务成本对齐。
用户端的 AI 服务应该采用固定费率，直到业务价值被理解，并且服务提供商开始寻找利润空间。
如果 AI 服务能显著提高员工的生产力，那么相应的费用是值得的。
亚马逊的定价策略比 AWS 更糟糕，AWS 的切换成本可能并不如预期的那样节省。
许多用户仍然可以使用传统方式进行开发，因此切换回传统方式并不困难，但预计这种情况会改变。
亚马逊的定价经常是模糊和神秘的，用户很难理解成本波动的原因。
AWS 的成本很难理解，除非用户对自己的预期使用有深入了解。
如果 AWS 成本太复杂，可能需要雇佣财务运营人员或 AWS 专家来处理。

AWS deleted my 10-year account and all data without warning #

https://www.seuros.com/blog/aws-deleted-my-10-year-account-without-warning/

Abdelkader Boudih 是一位有着 10 年历史的 AWS 客户和开源贡献者，但在 2025 年 7 月 23 日，他的账户和所有数据被 AWS 无预警地删除了。这篇文章讲述了 AWS MENA 的一个灾难性内部错误，以及一个持续 20 天的客户支持噩梦，期间他无法得知自己的数据是否仍然存在。这也揭示了信任云服务提供商保管数据的风险。

Boudih 的架构本应保护他免受此类事件的影响，包括跨 AWS 欧洲的多区域复制、灾难恢复的死开关、遵循 AWS 最佳实践的备份架构以及与数据分开存储的隔离加密密钥。他没有预料到的唯一场景是 AWS 本身成为灭绝事件。

Boudih 在 AWS 上作为测试环境使用了十年，用于验证他维护的 Ruby gems（如 capistrano-puma 和 capistrano-sidekiq）的部署。尽管没有生产关键性，但对于开源开发至关重要。在他生日那天，AWS 给了他一个难忘的“礼物”：证明再多的冗余也无法阻止服务提供商本身变得不可靠。

以下是 20 天客户支持噩梦的时间线：

7 月 10 日：AWS 发送验证请求，5 天期限（包括周末）。
7 月 14 日：表格过期。Boudih 联系支持，询问需要什么。
7 月 16-20 日：四天沉默后，AWS 表示正在升级到适当的团队。
7 月 20 日：新的表格终于到达。
7 月 21 日：Boudih 提交了身份证和公用事业账单（清晰的 PDF）。响应时间：10 小时。
7 月 22 日：AWS 表示“文件不可读”。这是 Boudih 的银行接受的相同 PDF。
7 月 23 日：账户被终止。Boudih 从 AWS 那里收到的生日礼物。
7 月 24 日：Boudih 询问唯一重要的问题：“我的数据还存在吗？”
AWS：“您的案例正在由我们的服务团队审查。”
Boudih 还请求临时只读访问以备份数据。如果他们是欺诈性的，他们早就在验证截止日期前复制了一切。AWS 拒绝了。（因为数据可能已经没了。）
7 月 28 日：经过 4 天的模板回复后，Boudih 失去耐心。
7 月 29 日：Boudih 将他们的回避比作政治推诿。
7 月 29 日：他们终于承认了真相。
7 月 30 日：他们的最终回应包括：“我们重视您的反馈。请通过评价此通信来分享您的经历。”⭐⭐⭐⭐⭐

AWS 声称的政策与他们交付的现实之间存在差异。AWS 的文档声称账户关闭后有 90 天的保留期，在此期间可以重新打开账户并保留数据。90 天后，账户将被“永久关闭”，所有内容（包括快照和备份）将被删除。但问题是，Boudih 并没有自愿关闭他的账户。AWS 因“验证失败”而暂停了它——这是一个政策灰色地带，并未出现在他们的公开文件中。没有公开的例外说明验证暂停的账户绕过了 90 天的保留期。

AWS 将终止归咎于“第三方支付者”问题。一个 AWS 顾问，一直在支付 Boudih 的账单，因为 FTX 崩溃而消失了。这种安排已经很好地工作了将近一年——大约每月 200 美元用于他的测试基础设施。当 AWS 要求这个消失的支付者验证自己时，Boudih 指出他已经有一张自己的 Wise 卡在文件上——这是他之前用来支付的同一张卡，特意保持活跃以防支付者在他旅行或离线时断开连接。他们拒绝在 20 天内简单地将账单切换回它，同时引用“隐私”问题，同时让我完全负责后果。

但事实是：这不是关于支付的问题。如果是的话，他们会：

将账单切换到我的文件信用卡上
暂停服务，而不是删除数据
提供他们自己的文档承诺的 90 天宽限期

相反，他们使用支付者问题作为掩盖真正发生的事情——他们的内部测试搞砸了。

当 Boudih 试图解决这个问题时，AWS 要求他解释：

他使用账户做什么
他未来的计划
为什么需要服务

好像他在申请资金或晋升。这是一个 10 年的账户。他不应该需要向自 2015 年以来一直在支付的服务证明他的存在。

但真正的打击是：AWS 开发者经常给我发电子邮件，寻求 Ruby 问题的帮助。没有补偿。没有 AWS 积分。甚至在他们的提交中连“谢谢”都没有。只是“嘿，你能帮我们调试这个 Rails 部署问题吗？”

所以让我弄清楚：

AWS 从我的开源代码中受益
AWS 工程师向我寻求免费咨询
AWS 让我解释为什么我应该保留我的账户
当一个 YC 支持的支付者（他们未能审查）消失时，AWS 删除了一切

他们还想让我对每个客户进行背景调查吗？我应该在 AWS 验证电子邮件上运行安全审查吗？因为显然，他们自己的审查过程在整整一年中无法捕捉到支付者做错了什么。

AWS 真正摧毁的是什么？大多数人不明白的是：AWS 不仅仅是 Boudih 的备份——它是他的开源开发的清洁室。

Boudih 的桌面是混乱的。一直都是。文件到处都是，半成品项目，实验代码。但他发现通过将一切复制到 AWS，重新开始，并只拉回他需要的东西，他可以创建干净、专注的 gems。这种工作流程就是他发布的方式：

BreakerMachines - 用于 Ruby 的断路器模式
ChronoMachines - 基于时间的状态机
RailsLens - Rails 的性能监控

这些 gems 为开发者节省了数百甚至数千小时。它们在全球的生产系统中使用。AWS 不仅仅删除了我的数据——它们摧毁了使这些贡献成为可能的基础设施。

但情况更糟。也不见了：

一本用我的编年史风格写成的完整编程书籍
连接硬件和软件的电子教程
“Go for Rubyists”——帮助 Ruby 开发者过渡到 Go 的课程
可能帮助数千人的多年未发表的工作

当 AWS 删除 Boudih 的账户时，他们不仅仅伤害了他。他们伤害了每一个使用他的 gems 的开发者。

HN 热度 177 points | 评论 135 comments | 作者：seuros | 1 day ago #

https://news.ycombinator.com/item?id=44770250

个人不应该依赖 GitHub 或 GitLab 作为源代码的主要托管平台，而应该在本地进行源代码控制，并进行备份。
如果 AWS 账户中的数据被删除，通过本地备份和镜像可以相对容易地恢复。
依赖于随机的本地副本作为备份策略并不是一个有效的策略。
重要的软件可能不会经常更新，因此可能不会被检出到新电脑上，但这并不意味着它们不重要。
软件开发人员可能会清理工作站，有时可能会删除整个项目目录，或者在更换机器时不总是转移所有内容。
即使软件仍在运行，如果没有源代码，你将只剩下二进制文件或其他构建产物。
许多关键的自由开源软件（FOSS）代码维护和关注很少，但对社会的高效运作至关重要。
风险投资（VC）的策略是投资多样化，而不是使每个投资都无懈可击。
选择和培养投资项目，以提高成功率，而不是依赖于少数项目的巨大成功。

How to make almost anything (2019) #

https://fab.cba.mit.edu/classes/863.19/CBA/people/dsculley/index.html

我叫 D. Sculley，我在剑桥的谷歌领导几个团队，研究机器学习的不同方面。我参与这门课程是因为我们当前的许多项目都涉及使用机器学习来解决设计或制造问题，包括生物学和化学领域。

我对了解更多制造形式感兴趣，并考虑是否有有趣的跨领域合作机会。这是我的谷歌学术页面，如果你对机器学习论文感兴趣可以查看。作为背景，我从 2003 年开始从事机器学习工作。在此之前，我在教育领域工作了几年，担任教师。在此之前，我在本科时主修视觉艺术。

我将每周参与课程项目，并计划犯很多错误。如果对机器学习感兴趣，我很高兴讨论。

以下是课程的周安排：第 1 周：CAD 和素描第 2 周：激光和乙烯基切割第 3 周：电子产品生产第 4 周：3D 扫描和打印第 5 周：电子设计第 6 周：数控加工第 7 周：嵌入式编程第 8 周：成型和铸造第 9 周：输入设备第 10 周：输出设备第 11 周：网络第 12 周：机器周第 13 周：应用编程第 14 周：通配符周最终项目

HN 热度 130 points | 评论 21 comments | 作者：teleforce | 12 hours ago #

https://news.ycombinator.com/item?id=44775830

MIT HTMAA 课程对所有学生开放，由 Neil Gershenfeld 负责
学生文档中包含了课程的“酷”内容
可以通过 YouTube、大学教学大纲等资源自学制作工具
MIT 合成生物学课程“如何种植（几乎）任何东西”同样出色
课程涉及生物学和化学领域，但最终目标是太空领域
“Week 8: Molding and Casting”链接失效，生物塑料的抗拉性很重要
课程应该包括缝纫，因为它是一项被低估的技能
课程主要涉及数字制造，但也通过其他方式学习了许多其他技术
好工具对于木工、金属加工、缝纫等工作非常重要
通过 eBay 购买翻新缝纫机的价格与手机相当，性价比很高
FabAcademy 课程包括一个“ wildcard”周，可以选择做刺绣等项目
课程重点在于数字化制造，这并不令人意外，因为它是由比特和原子研究中心提供的课程

A Real PowerBook: The Macintosh Application Environment on a Pa-RISC Laptop #

http://oldvcr.blogspot.com/2025/08/a-real-powerbook-macintosh-application.html

作者对 Power ISA 非常感兴趣，虽然从摩托罗拉 68000 系列到 PowerPC 的转变在架构上并不明显，但历史上还有其他选择。例如，Palm OS 从 DragonBall 转向 ARM，而 Commodore 的 68K Amigas 的继任者原本打算基于 PA-RISC，即惠普的“Precision Architecture”处理器家族。尽管苹果和摩托罗拉是 AIM 联盟的两个成员，1997 年秋季确实有几台基于 PowerPC 的 PowerBooks 上市，但如果下一代 PowerBooks 基于 PA-RISC 会怎样呢？

1997 年 10 月，你可以购买一台运行 240MHz PowerPC 603e 的 PowerBook 3400c，价格为 6500 美元（约合 2025 年的 13000 美元），它曾短暂被称为世界上最快的笔记本电脑。或者，你可以购买市场上的新贵，RDI PrecisionBook，它运行高达 160MHz（后来提高到 180MHz）的 PA-7300LC，起价 12000 美元（24000 美元）。两者都提供了板载以太网、SCSI 和 CardBus PCMCIA 插槽。尽管 3400c 有一个内部媒体湾，可以放置软盘或 CD-ROM，而 PrecisionBook 则提供了 1024x768 的 LCD（3400c 为 800x600），更大的键盘，至少两个 2.5 英寸硬盘托架和高达 512MB 的 RAM（3400c 为 144MB）——以及 HP-UX。

通过苹果官方的 Macintosh Application Environment，你可以在 HP PA-RISC 工作站上做任何事情，并且可以同时运行 68K Mac 软件。在 160MHz 的单元上，我们可以看到 HP-UX 11.00 CDE 与完整的 Macintosh System 7.5.3 桌面同时运行。虽然当时只有真正的 Power Mac 可以运行 PowerPC 软件，但 68K 软件仍然丰富且功能齐全。这可能是一个既能拥有昂贵蛋糕又能享用它的可行选择吗？我们将找出答案，并在它上面运行一些真正的应用程序（包括我们必须尝试运行的游戏），分析其性能和技术基础，并揭示隐藏在可执行文件中的历史遗迹。

文章还提到了 RDI Computer Systems 的硬件故事，它成立于 1989 年，位于加利福尼亚州的拉科斯塔，是北部圣迭戈县的一个社区。RDI 与其他几家公司一样，旨在利用 Sun Microsystems 试图将 SPARC 商品化并开放市场给其他 OEM 的机会。RDI 最初成功地扩展到了一个更大的 40,000 平方英尺的工业园区设施，但不幸的是，microSPARC 在 125MHz 以上遇到了性能瓶颈，Sun 在 1994 年放弃了进一步开发，RDI 管理层将其视为多元化的信号。随着 RISC 市场的兴起，RDI 决定加入惠普的 PA-RISC，这已经从日立和 SAIC 那里有了便携式系统。RDI 推出了 PrecisionBook 和 UltraBook，分别基于 PA-RISC 和 Sun 的 200MHz UltraSPARC，使用相同的机箱。这两个系统通过共同的底盘成为兄弟，被 RDI 品牌化为“MobileStations”。

文章中提到的这台 160MHz 的机器并不是顶级配置，但最初配备了高端规格的 256MB RAM；后来增加了第二个模块，总共 512MB。内存模块通过底部的一个独特于 PABook 的奇异形状的门安装。模块是 60ns ECC，最大支持 256MB；这里的两个模块都是最大支持的。允许安装单个模块，但如果安装两个模块，它们必须匹配。

这台机器开机等待 HP-UX Common Desktop Environment（CDE）登录提示。尽管 RDI 在技术手册中提到了 12 英寸显示屏，但作者个人只见过这里展示的 14 英寸 TFT 有源矩阵 LCD，两者都是 1024x768 的分辨率。屏幕在极右方有些磨损，并且已经有点松动，但背光仍然很好，屏幕保持清晰生动。与 B160L 相同，PrecisionBook 也配备了相同的板载 HP Visualize-EG 图形芯片组。

HN 热度 124 points | 评论 18 comments | 作者：todsacerdoti | 17 hours ago #

https://news.ycombinator.com/item?id=44774567

MAE 是苹果尝试在 Unix 工作站上运行 Mac OS 的尝试，创建了一个兼容性层，将 Mac Toolbox 调用转换为 X11，允许 Unix 用户在没有苹果硬件的情况下运行 Mac 软件。
PA-RISC 是惠普的一个决定性架构，具有良好的性能和相对合理的 ISA，惠普投入了很多工作。
惠普放弃 PA-RISC 转而采用 Itanic 是惠普最糟糕的决定之一，因为编译器不够复杂，无法使 EPIC VLIW 高效。
高端服务器/工作站公司继续投资高性能芯片设计和前沿制造厂的成本过高，因此标准化一个共同架构是有意义的，但选择 Itanium 作为行业标准是一个错误。
IBM 虽然也推出了几代 Itanium 硬件，但明智地没有完全依赖它。
MIPS 和 SPARC 与同代产品相比总是稍显不足，如果 SGI 推迟 R18k，就有足够的时间转向 Opteron。
PA-RISC 和 Alpha 有足够的市场和潜力，但被过早地放弃。
惠普对 Itanium 的贡献很大，他们认为通过模拟结果 Itanic 会超越所有其他架构，但实际上他们大错特错，放弃了一个还有成长空间的架构。
即使现代机器学习框架也无法优化编译到 Itanium。
VLIW（非常长指令字）在现代算法中存在根本性问题，分支预测和推测执行是动态的，编译时优化无法实现。
VLIW 在一些 GPU 和 DSP 芯片中使用，但现代 GPU 更像 RISC，具有大量的 SIMD。
一些旧的 GPU（如 TeraScale）使用 VLIW，但现代 GPU 更倾向于使用 RISC 和大量的 SIMD。
PA-RISC 在 Mako 时期仍然具有竞争力，但 Shortfin（最后的 PA-8900）有些敷衍。

Hacker News 精彩评论及翻译 #

Helsinki records zero traffic deaths for full year #

https://news.ycombinator.com/item?id=44771331

I was in Helsinki for work a couple of years ago, walking back to my hotel with some colleagues after a few hours drinking (incredibly expensive, but quite nice), beer.

It was around midnight and we happened to come across a very large mobile crane on the pavement blocking our way. As we stepped out (carefully), into the road to go around it, one of my Finnish colleagues started bemoaning that no cones or barriers had been put out to safely shepherd pedestrians around it. I was very much “yeah, they’re probably only here for a quick job, probably didn’t have time for that”, because I’m a Londoner and, well, that’s what we do in London.

My colleague is like “No, that’s not acceptable”, and he literally pulls out his phone and calls the police. As we carry on on our way, a police car comes up the road and pulls over to have a word with the contractors.

They take the basics safely over there in a way I’ve not seen anywhere else. When you do that, you get the benefits.

PaulRobinson

几年前我去赫尔辛基出差。和几位同事一起喝了好几个小时的啤酒——啤酒贵得离谱，但味道还不错——然后走回酒店。

当时大约是午夜时分，我们碰巧遇到一台巨大的移动式起重机停在人行道上，挡住了我们的去路。我们小心翼翼地走进车道，绕过那台起重机时，我的一位芬兰同事抱怨说，居然没有设置路锥或路障来引导行人安全通过。我当时心想：“是啊，他们可能只是来干个急活，大概没时间弄那些。”因为我是伦敦人，而在伦敦，嗯，我们通常就是这么干的。

我的同事却说：“不行，这绝对不能接受。”然后他真的掏出手机报了警。

在我们继续往前走的时候，一辆警车开了过来，停下车来和施工人员交涉。

他们在基本安全措施的执行上，是我从未在其他任何地方见过的样子。当你们做到这些时，自然会得到好处。

We may not like what we become if A.I. solves lone… #

https://news.ycombinator.com/item?id=44768795

Though it’s popularized to blame social media and phones, economics should not be overlooked. Pay for young generations is lagging and restaurants and bar prices are super high. Public spaces for informal gatherings has shrunk - eg fewer malls

dv_dt

尽管将指责社交媒体和手机已成一种潮流，但经济因素绝不容忽视。年轻一代的薪资增长落后了，餐厅和酒吧的价格却奇高无比，供大家非正式聚会的公共场所也越来越少了——比如商场变少了。

Lina Khan points to Figma IPO as vindication of M&… #

https://news.ycombinator.com/item?id=44775279

I think the Figma IPO proves Khan was right. $60B market cap today vs the $20B Adobe offered in 2023. There was some criticism about regulatory overreach when the deal got blocked. Now Figma employees are rich, the design tools market stays competitive, and we have another major independent tech company instead of just another Adobe product line. This is exactly why we need regulators willing to tell Big Tech “no” sometimes. Competition creates more value than consolidation.

dabedee

我认为 Figma 的 IPO 证明了 Khan 是对的。如今其 600 亿美元的市值与 2023 年 Adobe 提出的 200 亿美元报价形成了鲜明对比。当初该交易被阻止时，曾有人批评监管过度。现在，Figma 的员工都富裕了，设计工具市场依然保持竞争力，我们还拥有了一家新的独立大型科技公司，而不是 Adobe 的又一个产品线。这正是我们有时需要监管者对大型科技公司说“不”的原因。竞争创造的价值远超整合。