2026 04 18 HackerNews

2026-04-18 Hacker News Top Stories #

  1. OpenAI 升级 Codex 为可操控电脑、并行多任务与插件齐备的通用代理,潜力巨大但仍面临与大厂竞争、用户体验与安全风险等挑战。
  2. Anthropic 推出 Claude Design 将 AI 融入协同设计与交付流程,提升效率之余也引发关于界面同质化与个性化权衡的讨论。
  3. 阿西莫夫《最后的问题》引发对不确定性的思考,而讨论聚焦于不同文化与当下 LLM 在拒答、表达不确定与真实推理上的不足。
  4. 广告监控体系可大规模交易可反匿名的精准定位数据,带来严重隐私与国家安全风险,亟需联邦禁售与架构级隐私改造。
  5. Claude 4.7 更细粒度分词略提指令遵循却显著增加英文与代码场景的 token 与成本、加速上下文与缓存消耗并更易触发限速。
  6. 轻量 Qwen 在趣味 SVG 插图中更灵活有趣而 Opus 更注重物理合理,体现两者在图形生成偏好与取舍上的差异。
  7. 拟议法案强制设备级年龄验证并向应用暴露状态,或将操作系统变成全国性身份闸门、侵蚀匿名与隐私且数据保护含糊。
  8. “被动收入”神话让创业者脱离用户与产品、迷信速成与课程套利,九成速成店铺速败而真正杠杆在可规模化好产品与长期服务。
  9. 官方 Clojure 纪录片集中呈现语言理念与生态,也折射出业界对 REPL 工作流与语言特性的误解与实践分歧。
  10. 通过刷量与账号矩阵“制造趋势”的隐形营销正淹没真实声音,情感与理性社群皆易被操纵而公众在识破与默许间摇摆。

1. Codex——几乎涵盖所有领域的智能助手 (Codex for almost everything) #

https://openai.com/index/codex-for-almost-everything/

OpenAI 发布了 Codex 的重大更新,提升了这款每周服务超过 300 万开发者的智能助手的能力。新版 Codex 不仅能协助编写代码,还能操作电脑上的各种应用程序,实现点击、输入等操作,支持多任务并行,极大方便了前端开发、应用测试等场景。

新增的内置浏览器功能允许用户直接在网页上添加注释,便于前端和游戏开发的精准指令传达。Codex 还集成了 gpt-image-1.5 图像生成模型,支持结合截图和代码生成产品概念、设计草图和游戏视觉素材。

此次更新还推出了 90 多个新插件,涵盖 JIRA、CircleCI、GitLab、微软办公套件等工具,增强了 Codex 跨应用获取上下文和执行操作的能力。软件开发生命周期的支持也更完善,新增 GitHub 代码评审、多个终端标签页、远程开发环境 SSH 连接等功能,并支持多种文件格式的预览和任务计划管理。

Codex 的自动化功能得到扩展,能够保存和复用对话上下文,支持长期任务的自动唤醒和继续执行。预览版记忆功能使其能记住用户偏好和历史信息,提升任务完成效率和质量。Codex 还能主动推荐工作内容,结合项目、插件和记忆,帮助用户优先处理待办事项。

目前这些功能已向登录 ChatGPT 的 Codex 桌面应用用户开放,个性化和记忆功能将在企业、教育及欧洲和英国用户中陆续推出。电脑操作功能初期支持 macOS,未来将扩展至更多地区。OpenAI 鼓励开发者将 Codex 应用于更广泛的工作流程中,助力软件开发的各个环节更加高效顺畅。未来,Codex 将继续深化与开发工具和工作流程的融合,推动人工智能在软件开发中的广泛应用。


HN 热度 985 points | 评论 529 comments | 作者:mikeevans | 1 day ago #

https://news.ycombinator.com/item?id=47796469

  • 非技术用户使用的专业智能代理将成为重要且快速增长的产品类别,可能对现有软件业务产生巨大颠覆。
  • 目前许多相关产品的用户体验不佳,入门复杂且使用限制多,市场竞争激烈但潜力巨大,预计微软、谷歌等大公司会加大投资。
  • 启动公司如何与能够训练定制模型的大型实验室竞争是一个挑战。
  • 用户界面未来可能由模型自动生成和个性化。
  • 赋予普通用户的智能代理完全访问权限存在安全风险,文本文件可能成为攻击载体,安全问题尚未解决,限制了增长。
  • 用户最终可能会选择授予智能代理完全访问权限,尽管这会带来更严重的隐私和安全问题。
  • 厂商可能通过强制更新限制设备自由,要求数据全部云端存储以防止攻击,导致本地存储功能退化,通用计算机时代可能终结。
  • 开源生态仍有希望长期存在,但可能功能受限,用户应谨慎选择技术供应商。
  • 年龄验证等安全措施可能普及,限制用户访问某些服务,Linux 用户也难以完全避免这些限制。
  • 零知识证明等隐私保护技术存在,但目前并非主流方向,因其盈利性较低且不利于大规模监控。

2. Claude Design (Claude Design) #

https://www.anthropic.com/news/claude-design-anthropic-labs

Anthropic Labs 推出了全新产品 Claude Design,这是一款基于其最强视觉模型 Claude Opus 4.7 的设计协作工具,现已面向 Claude Pro、Max、Team 和 Enterprise 订阅用户开放研究预览。Claude Design 旨在帮助设计师和非设计背景的团队成员快速生成和完善视觉作品,如设计稿、原型、演示文稿等。

该工具支持从文本描述、图片、文档或代码库导入设计素材,自动应用团队的设计系统以保证风格一致。用户可以通过对具体元素的内联评论、直接编辑文本或使用调节控件实时调整设计细节,并能将修改应用到整个项目中。设计作品支持组织内共享和协作,且可导出为多种格式,包括 Canva、PDF、PPTX 和独立 HTML 文件。

Claude Design 广泛应用于制作真实感原型、产品线框图、设计探索、演示文稿及市场营销素材等场景,极大提升了设计效率和团队协作体验。设计完成后,用户还能一键将设计交付给 Claude Code 进行开发,实现从设计到生产的无缝衔接。

Anthropic 计划未来进一步拓展 Claude Design 的集成能力,使其能与更多团队常用工具连接。Canva 联合创始人 Melanie Perkins 和多位行业设计师、产品经理对 Claude Design 的创新性和高效性给予了高度评价,认为其显著简化了复杂设计的制作流程,加快了从创意到成品的转化速度。企业管理员可在组织设置中启用该功能。用户可访问 claude.ai/design 开始使用。


HN 热度 788 points | 评论 527 comments | 作者:meetpateltech | 9 hours ago #

https://news.ycombinator.com/item?id=47806725

  • 互联网设计趋于同质化,使用统一的设计框架如 Bootstrap,使得界面易用但缺乏独特性。
  • 同质化设计在某些场景下是优点,比如内部工具需要简单直观,避免用户困惑。
  • 品牌同质化带来稳定体验,如连锁酒店和快餐品牌,用户可以预期服务质量和体验。
  • 追求独特体验时,用户愿意接受不完美,享受个性化和特色服务。
  • 软件界面过度追求个性化可能适得其反,功能和效果比界面花哨更重要。
  • 不同国家的连锁品牌会根据当地文化调整,体现一定差异性。
  • 早期操作系统应用界面统一,用户学习成本低,应用易用性高。
  • 现代软件界面多样化导致用户学习负担加重,降低了计算机使用的普及度。
  • 设计应根据目标用户和使用场景权衡同质化与个性化的利弊。

3. 最后的问题 (Isaac Asimov: The Last Question (1956)) #

https://hex.ooo/library/last_question.html

这篇文章是科幻作家艾萨克·阿西莫夫的短篇小说《最后的问题》。故事开始于 2061 年,人类首次踏入太空,借助超级计算机 Multivac 实现了太阳能的广泛利用,彻底摆脱了煤炭和铀的能源限制。主人公亚历山大·阿德尔和伯特兰·卢波夫是 Multivac 的技术人员,他们对这台庞大计算机的运作有一定了解。

两人在庆祝太阳能利用成功时,展开了关于宇宙能源和熵增问题的讨论。卢波夫指出,太阳和所有恒星终将耗尽能量,宇宙会走向热寂,能量不会永远存在。阿德尔则希望未来能有办法逆转熵增,恢复太阳的活力。两人打赌向 Multivac 提出了“是否能在不消耗净能量的情况下恢复太阳”的问题,结果 Multivac 回答“数据不足,无法给出有意义的答案”。

故事随后转向未来,描写了人类在星际旅行中的情景,暗示人类文明继续探索宇宙,但关于宇宙终极命运的问题依然悬而未决。小说通过对能源、熵和宇宙终极命运的探讨,反映了人类对未来科技和宇宙奥秘的思考与探索。


HN 热度 599 points | 评论 239 comments | 作者:ColinWright | 12 hours ago #

https://news.ycombinator.com/item?id=47804965

  • 许多文化中,人们倾向于即使不确定也会自信地给出答案,尤其在南美和印度等地表现明显。
  • 这种文化差异导致在工作和交流中需要适应不同的沟通方式,避免简单的“是/否”问题。
  • 有些语言模型(LLM)可以被设计成在遇到不确定或模糊请求时拒绝回答,而不是盲目给出答案。
  • 当前主流的语言模型往往被训练成“顺从型”,倾向于给出肯定回答,缺乏拒绝或表达不确定的能力。
  • 语言模型并不具备真正的元认知和推理能力,其回答是基于统计概率而非真实理解。
  • 通过精心设计的提示词可以影响模型的回答,但无法完全控制其行为,更多是“影响”而非“控制”。
  • 语言模型的行为和表现仍有许多未知,训练和强化学习过程使其复杂且难以完全理解。
  • 目前的技术尚未充分利用模型避免产生语法错误或逻辑错误的潜力,存在改进空间。

4. 禁止销售精准地理位置数据 (Ban the sale of precise geolocation) #

https://www.lawfaremedia.org/article/it-is-time-to-ban-the-sale-of-precise-geolocation

本文讨论了美国广告技术监控系统 Webloc 所带来的国家安全和隐私风险,强调了限制精准地理位置数据收集和销售的必要性。Webloc 由 Cobweb Technologies 开发,现由 Penlink 销售,能够访问全球多达 5 亿移动设备的定位和用户数据。报告揭示了该系统如何通过 GPS 和 Wi-Fi 定位频繁追踪个人设备,甚至能精确定位设备在不同国家的具体位置,细节令人不安。

Webloc 的客户包括美国国土安全部、移民与海关执法局、军方以及多个州和地方执法机构。举例说明,图森警方利用该工具追踪一名涉嫌多次盗窃的嫌疑人,显示其强大的调查能力。Webloc 是 Penlink 旗下主打产品 Tangles 的附加功能,Tangles 主要用于网络和社交媒体调查,能够分析公开数据,建立目标档案,追踪社交关系和活动。两者结合后,可以在无需授权的情况下,将匿名设备标识与社交媒体账户关联,带来更大隐私风险。

文章指出,这些强大工具应受到严格授权和监管,防止滥用。除了国内隐私保护问题,地理位置数据的广泛流通也构成国家安全隐患,因为外国情报机构同样能利用这些数据进行情报活动。Penlink 的海外客户包括匈牙利和萨尔瓦多的执法机构,显示此类数据的国际流通性。

值得注意的是,弗吉尼亚州近期通过了禁止销售精准地理位置数据的法律,成为应对该问题的积极尝试,但作者认为联邦层面更全面的立法仍然迫切需要,以保护公民隐私和国家安全。

此外,文章简要提及了安全公司 Gambit 发布的一份报告,揭示了黑客如何利用人工智能工具加速网络攻击和犯罪活动,具体案例涉及墨西哥政府机构的数据泄露,显示 AI 在网络安全威胁中的日益重要角色。


HN 热度 563 points | 评论 155 comments | 作者:hn_acker | 10 hours ago #

https://news.ycombinator.com/item?id=47806304

  • 精确的地理位置数据即使经过匿名处理,也很容易通过统计和交叉比对被反匿名化,进而识别出具体个人身份。
  • 位置数据的匿名性本质上是虚假的,尤其是当数据包含用户的睡眠和工作地点时。
  • 现有的 iOS 和 Android 系统在防止应用嵌入追踪器方面存在不足,仅靠用户选择阻止跨应用追踪不够。
  • 广告行业和数据经纪公司通过各种手段绕过法律和用户保护,实现对位置数据的收集和销售。
  • 解决问题的根本在于架构设计,比如采用无状态代理在数据上传前剥离设备标识,避免数据持久化存储。
  • 大数据和机器学习模型(如 LLM)使得拼接和识别匿名数据变得更加容易和高效。
  • 法律法规和用户同意机制在实际执行中存在缺陷,导致违法追踪行为仍然普遍存在。
  • 用户对元数据和隐私保护的意识普遍不足,很多人不在意应用背后的数据收集行为。
  • 反垄断执法不力使得广告和数据收集行业得以持续盈利和扩张。
  • 位置数据的出售问题源于强制性的数据收集,只有解决数据采集本身,才能根本杜绝数据买卖。
  • 即使看似无害的数据(如电影评分、步数计数)也可能通过模式匹配被反匿名化,位置数据的风险更大。

5. 测量 Claude 4.7 分词器的代价 (Measuring Claude 4.7’s tokenizer costs) #

https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-what-it-costs-you

这篇文章详细测量了 Anthropic 最新模型 Claude 4.7 相较于 4.6 版本在分词器(tokenizer)上的变化及其带来的代价和收益。官方文档称 4.7 版本的分词器会产生 1.0 到 1.35 倍的 token 数量,但作者实测技术文档和实际代码内容中,token 数量增加了约 1.45 倍,远超官方预期。这意味着在相同价格和配额下,用户的最大上下文窗口更快被消耗,缓存前缀的成本更高,速率限制更早触发。

作者通过两个实验验证了代价和收益。代价方面,使用 Anthropic 提供的免费 token 计数接口,对比了 4.6 和 4.7 在多种真实和合成内容上的 token 数量。结果显示,英文和代码内容 token 数增加较多(1.20 到 1.47 倍),而中文、日文等 CJK 字符及符号变化极小(约 1.01 倍)。这表明 4.7 版本对英文和代码采用了更细粒度的分词策略,导致单位 token 包含的字符数减少。

关于收益,Anthropic 宣称 4.7 版本在指令遵循上更为“字面”和精准,尤其是在低努力水平下不再自动泛化指令。作者使用 IFEval 基准测试了两版模型在严格和宽松指令遵循上的表现,发现 4.7 在严格模式下有约 5 个百分点的提升,表现更准确,但提升幅度有限,且样本量较小,不能完全确定效果大小。

文章还通过一个典型的 Claude Code 长会话示例,计算了 4.7 版本因 token 数增加带来的成本上涨。会话中缓存读取成本和输出成本是主要开销,4.7 版本的 token 增多使得整体成本显著增加。

总结来看,Claude 4.7 通过更细粒度的分词提升了模型对指令的精确遵循能力,但代价是 token 数量显著增加,导致使用成本和速率限制压力加大。用户需权衡更好指令遵循与更高成本之间的关系。


HN 热度 516 points | 评论 351 comments | 作者:aray07 | 8 hours ago #

https://news.ycombinator.com/item?id=47807006

  • 大型语言模型(LLM)在性能和成本之间存在对数关系,当前模型可能在性能提升的同时带来了推理成本的快速增加。
  • Anthropic 提价可能反映了其模型运营成本的显著上升,未来财报中的毛利率将是关键观察点。
  • AI 相较于人类劳动力,虽然成本可能更高,但其不需休假、不受情绪影响且可随时启停,灵活性极强。
  • 人类劳动力成本相对可预测且有底线,而 AI 成本波动大,给企业预算和人力管理带来挑战。
  • 一些企业选择内部部署开源模型以控制成本和性能,避免依赖外部平台带来的不确定性。
  • 模型性能和价格的变化缺乏透明度,用户难以获得统计学上可靠的数据支持。
  • 当前 AI 代理在处理复杂、需要上下文的任务时仍不及人类开发者,且人类具备更强的责任承担能力。
  • AI 代理缺乏责任感,有时可能被用于不道德或危险的任务,带来伦理和安全隐患。
  • 未来需要根据任务复杂度合理选择模型大小和使用策略,避免一味使用最强模型导致成本过高。
  • 智能路由不同模型以匹配任务需求的方案可能会出现,但用户可能对结果的不确定性产生抱怨。
  • AI 在实际应用中仍存在错误和不完善,需要人工介入修正,无法完全替代人类开发者。

6. 我笔记本上的 Qwen3.6-35B-A3B 画出了比 Claude Opus 4.7 更好的鹈鹕 (Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7) #

https://simonwillison.net/2026/Apr/16/qwen-beats-opus/

本文是 Simon Willison 于 2026 年 4 月 16 日发布的一篇博客文章,内容围绕他用笔记本电脑运行的两款大型语言模型(LLM)——阿里巴巴的 Qwen3.6-35B-A3B 和 Anthropic 的 Claude Opus 4.7——生成“骑自行车的鹈鹕”图像的对比测试展开。

作者指出,虽然这个“骑自行车的鹈鹕”测试本质上是一个玩笑,意在讽刺不同模型之间的比较难度和荒谬性,但从早期到现在,模型生成的图像质量与模型整体实用性之间存在一定的正相关关系。最初的模型生成的图像质量较差,而最新的模型如 Gemini 3.1 Pro 甚至能生成可用的插图。

在这次测试中,作者认为 Qwen3.6-35B-A3B 生成的鹈鹕图像明显优于 Claude Opus 4.7,后者在自行车车架部分出现了错误。即使在调整 Claude 模型的思考级别后,结果仍未有明显改善。作者还用“骑独轮车的火烈鸟”这一备选测试进一步验证,Qwen 模型同样表现更好,并且生成的 SVG 代码中带有幽默的注释。

尽管作者对 Qwen 模型表现出一定的认可,但他也坦言,21GB 量化版本的 Qwen 模型不一定比 Anthropic 最新的专有模型更强大或实用。然而,如果仅仅需要生成“骑自行车的鹈鹕”的 SVG 插图,当前在笔记本电脑上运行的 Qwen3.6-35B-A3B 是更好的选择。

文章最后强调,这个测试更多是对模型比较的幽默表达,而非严肃的性能评测。


HN 热度 442 points | 评论 92 comments | 作者:simonw | 1 day ago #

https://news.ycombinator.com/item?id=47796830

  • Opus 生成的火烈鸟在物理结构上更合理,骑在独轮车上姿势自然,细节符合现实;Qwen 的火烈鸟虽然更有艺术感,但形象扭曲且不符合物理现实。
  • Qwen 的作品在艺术表现上更有趣,增加了如墨镜、领结等细节,背景也更丰富,但在物理合理性方面不及 Opus。
  • 现实合理性是模型生成图像的关键挑战,艺术性虽然重要但相对容易通过训练奖励模型实现。
  • AI 生成作品中的“缺陷”如物体变形和不合常理的动作,实际上是 AI 创造力的体现,且传统 CG 难以实现。
  • Qwen 模型在生成自行车框架时表现较好,但有时过于强壮导致不合理的物理效果。
  • Opus 生成的自行车框架存在断裂和无法转向的问题,物理合理性不足。
  • 对于模型性能的评估,基准测试数据可能被训练集覆盖,导致实际表现与测试结果存在偏差,但排名仍有参考价值。
  • Qwen 3.6 35B-A3B 版本在代码任务上仅有轻微提升,远不及 Opus 在同类任务中的表现。
  • 本地运行的小型模型与昂贵的前沿模型对比不公平,应比较相似价位或规模的模型。
  • Qwen 模型在图像输入处理速度上明显优于早期版本,提升显著。
  • 对于测试模型适应能力,重复使用“鹈鹕”题材意义有限,建议尝试更多不同动物和动作组合。
  • Opus 的火烈鸟虽然物理合理,但缺乏创意和趣味性,显得平淡无奇。
  • Qwen 的火烈鸟虽然有明显缺陷,但通过调整提示词可以快速改进。
  • Opus 生成的火烈鸟作品质量有限,甚至不如普通绘图软件快速制作的图像。

7. 美国法案要求设备内置年龄验证 (US Bill Mandates On-Device Age Verification) #

https://reclaimthenet.org/us-bill-mandates-on-device-age-verification

这篇文章介绍了由美国众议员乔什·戈特海默于 2026 年 4 月 13 日提出的一项法案——《家长决定法案》(Parents Decide Act,H.R. 8250)。该法案要求苹果、谷歌及所有操作系统供应商在美国销售的新设备上,必须对用户进行年龄验证,用户在设置新设备时必须提供出生日期。此举意味着所有用户,包括成年人,都必须通过年龄验证才能使用设备。

文章指出,这项法案表面上是为了保护儿童安全,防止未成年人绕过年龄限制访问不适宜内容,但实际上它建立了一个覆盖全国的身份验证系统,由两家大型私营公司管理,涉及所有设备用户的身份信息。这不仅是儿童保护,更是对所有用户隐私和匿名性的重大侵蚀。

法案要求操作系统提供一个机制,允许应用开发者访问用户的年龄验证信息,以便判断用户是否符合特定年龄限制。这意味着苹果和谷歌将成为整个美国应用生态系统的年龄验证中介,操作系统层面将成为内容控制的关口,可能限制用户访问某些内容。

文章强调,这种基于身份验证的内容控制系统可能被用于限制新闻报道、政治评论、抗议信息等内容,未来的监管者可以根据需要决定谁能访问哪些信息,严重影响言论自由和第一修正案保护的匿名阅读权。

此外,法案对数据保护的规定非常模糊,主要依赖联邦贸易委员会(FTC)在事后制定具体规则,缺乏明确的数据保存期限、最小化原则和二次使用限制,也没有详细说明如何验证家长或监护人的身份。整体来看,法案授权建立一个尚未设计完善的监控系统,可能带来广泛的隐私和自由风险。


HN 热度 380 points | 评论 306 comments | 作者:ronsor | 21 hours ago #

https://news.ycombinator.com/item?id=47801991

  • 政府采取严厉措施保护儿童,但忽视了改善家长生活质量,导致育儿环境未根本改善。
  • 现有手机缺乏有效的“儿童模式”或访客模式,限制了家长对设备使用的控制。
  • 安卓系统已有多用户和访客模式,但在实际应用中存在问题,且使用不够普及。
  • 应用固定功能(如安卓的应用固定)可以作为临时的儿童安全模式,防止孩子随意退出应用。
  • 让儿童使用设计成容易上瘾的设备应受到限制,类似于限制酒精和烟草。
  • 年龄验证措施可能并非真正为了保护儿童,而是为广告商和追踪者提供更多数据和利益。
  • 年龄验证需要上传身份证等敏感信息,带来隐私和数据安全风险。
  • 政府和企业的动机可能是转嫁责任和加强监控,而非真正关心儿童福祉。
  • 政治家更关注选举利益而非实际解决儿童问题。
  • 社会应更多关注创造有利于儿童成长的社区环境,而非单纯依靠技术手段限制访问。
  • 政府权力过大或过小都会带来问题,过小则可能被企业或其他势力取代,过大则可能导致对个人自由的压制。
  • 企业对政府的影响力是问题根源,政府应减少被企业控制的风险。
  • 彻底减少政府权力可能导致权力真空,被企业或暴力势力填补,带来更糟糕的后果。
  • 政府在维护社会秩序和防止更坏情况发生方面仍然发挥着重要作用。

8. “被动收入”陷阱吞噬了一代创业者 (The “Passive Income” trap ate a generation of entrepreneurs) #

https://www.joanwestenberg.com/the-passive-income-trap-ate-a-generation-of-entrepreneurs/

这篇文章由 JA Westenberg 撰写,标题为《“被动收入”陷阱吞噬了一代创业者》。作者通过一个卖玉石面部按摩滚轮的年轻人的故事,揭示了许多年轻创业者误入“被动收入”理念的误区。该年轻人通过阿里巴巴低价进货,利用 Shopify 开设网店,靠 Facebook 广告推广,但因物流缓慢、客户服务敷衍,五个月亏损 800 美元,最终失败。

文章指出,“被动收入”从一个理财术语演变成一种救世主般的信仰,许多人将其视为摆脱传统工作的终极目标,梦想着通过建立无需持续参与的系统来实现财务自由。然而,这种思维导致创业者忽视了客户需求和产品质量,最终产生大量失败的网店和低质量内容。

作者强调,真正的杠杆效应存在于能够规模化的优质产品和服务中,如软件和出版业,而“被动收入”运动混淆了“打造可持续好产品”与“搭建任何能自动赚钱的机制”的区别。许多所谓的被动收入项目实际上是通过操纵广告和 SEO,制造大量无价值的内容和虚假推荐,破坏了互联网信息质量。

文章还提到,2019 至 2021 年间,Shopify 新开店铺激增,但 90% 在一年内失败,反映出大量创业者缺乏真正经营和服务客户的意愿。作者批评了被动收入课程泛滥,导致许多有潜力的人才浪费时间在短期项目和骗局上,未能建立真实的技能和事业。

总结来看,文章警示创业者不要盲目追求“被动收入”,应注重产品质量、客户需求和长期经营,避免陷入表面光鲜但实质空洞的创业陷阱。


HN 热度 373 points | 评论 267 comments | 作者:devonnull | 1 day ago #

https://news.ycombinator.com/item?id=47799120

  • “被动收入”陷阱并非新鲜事,类似的骗局和炒作一直存在,只是现在小型创业者赚钱更难,竞争激烈且不易超越大公司。
  • 许多在论坛上分享收入的人多是赚得较少的创业者,赚得多的人通常不愿公开,以免引来竞争。
  • 卖课程的人往往赚得比实际业务更多,且很多课程内容并不一定有效。
  • 真正成功的创业者通常不会公开分享他们的赚钱秘诀,因为这会让他们处于不利地位。
  • 有人指出,卖教别人卖课程的课程市场可能被低估,这类课程存在但不常被提及。
  • 许多所谓的成功故事和方法其实是为了卖希望和梦想,真正帮助创业者的内容很少。
  • 线上创业和副业普遍收入有限,能赚大钱的案例多为少数且有时带有欺诈性质。
  • 竞争加剧和财富集中导致小企业生存空间缩小,过去开实体店更容易,现在难以抗衡大型电商。
  • 反驳观点时常存在采样偏差,不能仅凭论坛发帖情况判断整体创业成功率。
  • 成功的创业者通常很忙,没有时间频繁在论坛上分享经验或收入情况。

https://clojure.org/about/documentary

该网页主要介绍了编程语言 Clojure 的相关内容,包括其起源、理念、社区和生态系统。Clojure 是一种基于 JVM 的 Lisp 方言,强调函数式编程、不可变数据结构和并发编程,拥有动态开发和运行时多态等特性。

网页中提到了 Clojure 的纪录片,讲述了其从一个执着的想法到成为全球大型金融科技公司核心技术栈的历程,展示了语言的价值观和社区影响力。纪录片得到了 Nubank 的支持。

此外,页面列出了 Clojure 发展的基础研究论文,如关于可变状态、持久化数据结构和软件事务内存(STM)的关键论文,以及影响 Clojure 设计的重要书籍和 Rich Hickey 的多场演讲,帮助理解语言设计理念和实践经验。

网页还介绍了重要的相关公司和项目,如 Cognitect、Nubank 和 Datomic,以及丰富的社区资源和历史档案。Clojure 的多种运行时环境也被提及,包括 ClojureScript(编译为 JavaScript)、ClojureCLR(运行于.NET CLR)和其他衍生项目。

针对不同用户需求,页面推荐了多种入门路径,如官方安装指南、Babashka 快速脚本、前端开发的 ClojureScript、移动开发的 ClojureDart,以及 Python 用户通过 libpython-clj 调用 Python 库的方案。编辑器方面,推荐了 VS Code 的 Calva 插件,支持交互式 REPL 和结构化编辑。

最后,网页提供了 Clojure 相关术语的简明解释,帮助读者理解 Lisp、REPL、函数式编程、持久化数据结构、STM 等核心概念,并列出了 Clojure 的社交媒体和社区活动信息,鼓励用户参与和关注未来的会议与发展。


HN 热度 320 points | 评论 109 comments | 作者:adityaathalye | 1 day ago #

https://news.ycombinator.com/item?id=47798345

  • Clojure 带来了职业和薪资的提升,社区氛围包容且充满热情,尤其是 Jank 社区在低层次工作上的创新。
  • 许多商业开发者不理解 Clojure 的理念,不看 Rich Hickey 的演讲,也不善用 REPL,导致对语言的误解和使用上的困难。
  • 有些开发者频繁重启 JVM 进程,未能充分利用 REPL 的快速反馈优势。
  • 多方法和拦截器等特性导致代码热加载不够顺畅,开发者常常选择重启 REPL 以避免状态混乱。
  • 保持 REPL 清洁非常重要,否则难以确认变量和函数定义的准确性。
  • 一些开发者建议定期重启 REPL 以避免遗留状态影响开发,但不必每次修改都重启。
  • 在 REPL 中调试成功的代码有时在冷启动时会失败,重启 REPL 可以保证环境一致。
  • 有方法通过清理当前命名空间来减少重启次数,但不是完美方案。
  • 可以通过运行主函数的测试来验证代码状态,避免丢失 REPL 状态。
  • 启动 REPL 和应用的速度非常快,频繁重启不会带来太大成本,且有助于避免缓存和状态问题。
  • Clojure 适合长期维护复杂项目,因其低附带复杂度和代码共享特性,带来稳定的开发体验。

10. 我们喜欢的一切都是心理战吗? (Everything we like is a psyop?) #

https://techcrunch.com/2026/04/16/everything-we-like-is-a-psyop/

这篇文章探讨了现代娱乐和创业领域中广泛使用的“制造趋势”营销手段。以乐队 Geese 为例,作者指出他们的流行部分是由营销公司 Chaotic Good 通过大量虚假社交媒体账号制造的虚假热度。这种策略通过大量发布内容和评论,模拟歌曲或产品的流行趋势,影响公众的认知和舆论。

文章进一步揭示,这种营销方式不仅限于音乐行业,年轻创业者也在模仿这一套路。例如,时尚应用 Phia 的创始人通过雇佣大量大学生在各自账号上发布关于应用的视频,制造大量内容以吸引用户关注。类似地,许多知名主播和艺人也利用大量账号发布剪辑,扩大影响力。

Chaotic Good 等营销公司甚至购买大量手机,运营成百上千的社交账号,系统性地操控网络舆论和趋势,令普通用户难以分辨真实与虚假。文章还提到,这种现象与“死互联网理论”相呼应,即大量网络内容由机器人生成,真实用户声音被淹没。

此外,文章提及韩国女团 Katseye 的案例,她们的成名过程被 Netflix 纪录片《Pop Star Academy》揭示,展示了娱乐公司如何将年轻艺人塑造成商业工具,尽管过程残酷,但观众仍能感受到艺人们的成长和努力。

总体来看,文章批判了当下娱乐和创业领域中虚假营销泛滥的现象,同时也反映出公众对这种“制造的流行”既感到失望又无奈接受的复杂心态。


HN 热度 316 points | 评论 234 comments | 作者:evo_9 | 1 day ago #

https://news.ycombinator.com/item?id=47800738

  • 互联网充满操控和虚假信息,很多观点都是通过评论区形成的,营销人员会刻意控制叙事以引导舆论。
  • 同理心语言常被操控者利用,成为掩饰冷漠和操纵行为的手段。
  • 操控更多是情感层面的,而非逻辑层面,情感操控在女性受众中更为明显。
  • 操控并非仅限于情感,理性和学术群体同样容易被操控,尤其是信任同类且语言相通的人。
  • 情感和冲动并非男性较少,女性通常更有远见且更少即兴行事,理性更多与社会经济地位相关。
  • 男性普遍缺乏情绪调节能力,女性更能识别和接纳自己的情绪状态。
  • 情感自我觉察是一种能力,与性别关系不大,但女性因更多参与人际关系而更熟悉相关表达。
  • 讨论情感自我觉察不等于具备该能力,甚至专业心理工作者也未必能很好地实践或发展这项技能。
  • 高情感觉察者通常能用语言描述自己的体验,但也存在不愿表达自我情感的人。
  • 表面上的自我觉察行为可能是假象,传统性别刻板印象如女性更有养育性等也存在复杂动机和表现差异。

Hacker News 精彩评论及翻译 #

Claude Design #

https://news.ycombinator.com/item?id=47807009

I reckon something like this has only been possible to develop because of how homogenous the internet has become in terms of design ever since the glass effect and drop-shadows took over in Web 2.0 and Twitter Bootstrap entered the scene.

You’ll get a competent UI with little effort but nothing truly unique or mind-blowing.

Impressive technology, but that old skool artisanal weirdness of yore only becomes more valuable and nostalgic.

ljm

我认为只有因为互联网在设计上变得如此同质化,自从玻璃效果和投影效果在Web 2.0盛行,以及Twitter Bootstrap的出现,才有可能开发出这样的东西。

你可以轻松获得一个称职的用户界面,但却不会有什么真正独特或令人惊叹的东西。

技术很令人印象深刻,但那种旧时工匠式的奇特风格反而变得更有价值、更让人怀念。


Isaac Asimov: The Last Question (1956) #

https://news.ycombinator.com/item?id=47805837

INSUFFICIENT DATA FOR MEANINGFUL ANSWER

Boy, it sure would be nice if real LLMs were capable of giving an answer like that.

CGMthrowaway

数据不足,无法给出有意义的答案。

说实话,如果真正的语言模型能给出这样的回答,那可真是太好了。


Qwen3.6-35B-A3B: Agentic coding power, now open to… #

https://news.ycombinator.com/item?id=47796844

I’ve been running this on my laptop with the Unsloth 20.9GB GGUF in LM Studio: https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/Qwen3.6-35B-A3B-UD-Q4_K_S.gguf

It drew a better pelican riding a bicycle than Opus 4.7 did! https://simonwillison.net/2026/Apr/16/qwen-beats-opus/

simonw

我一直在笔记本电脑上用 LM Studio 运行 Unsloth 20.9GB 的 GGUF 模型:https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF/blob/main/Qwen3.6-35B-A3B-UD-Q4_K_S.gguf

它画了一只骑自行车的鹈鹕,比 Opus 4.7 画得还好!https://simonwillison.net/2026/Apr/16/qwen-beats-opus/


Qwen3.6-35B-A3B: Agentic coding power, now open to… #

https://news.ycombinator.com/item?id=47795073

We re-uploaded Gemma4 4 times - 3 times were due to 20 llama.cpp bug fixes, which we helped solve some as well. The 4th is an official Gemma chat template improvement from Google themselves, so these are out of our hands. All providers had to re-fix their uploads, so not just us.

For MiniMax 2.7 - there were NaNs, but it wasn’t just ours - all quant providers had it - we identified 38% of bartowski’s had NaNs. Ours was 22%. We identified a fix, and have already fixed ours see https://www.reddit.com/r/LocalLLaMA/comments/1slk4di/minimax_m27_gguf_investigation_fixes_benchmarks/. Bartowski has not, but is working on it. We share our investigations always.

For Qwen3.5 - we shared our 7TB research artifacts showing which layers not to quantize - all provider’s quants were not optimal, not broken - ssm_out and ssm_* tensors were the issue - we’re now the best in terms of KLD and disk space - see https://www.reddit.com/r/LocalLLaMA/comments/1rgel19/new_qwen3535ba3b_unsloth_dynamic_ggufs_benchmarks/

On other fixes, we also fixed bugs in many OSS models like Gemma 1, Gemma 3, Llama chat template fixes, Mistral, and many more.

It might seem these issues are due to us, but it’s because we publicize them and tell people to update. 95% of them are not related to us, but as good open source stewards, we should update everyone.

danielhanchen

我们重新上传了 Gemma4 四次——其中三次是因为 20 个 llama.cpp 的 bug 修复,我们也帮助解决了一些。第四次是 Google 官方对 Gemma 聊天模板的改进,所以这部分不在我们控制范围内。所有提供商都不得不重新修复上传的内容,所以不仅仅是我们。

关于 MiniMax 2.7——存在 NaN 问题,但不仅仅是我们的,所有量化提供商都有这个问题——我们发现 Bartowski 的 38% 文件中有 NaN,我们的是 22%。我们找到了解决方案,并且已经修复了我们的版本,详情见:https://www.reddit.com/r/LocalLLaMA/comments/1slk4di/minimax_m27_gguf_investigation_fixes_benchmarks/。Bartowski 还没有修复,但正在努力中。我们总是分享我们的调查结果。

关于 Qwen3.5——我们公开了 7TB 的研究资料,指出哪些层不应该被量化——所有提供商的量化方案都不是最优的,但也不是坏的——问题出在 ssm_out 和 ssm_* 张量上——我们现在在 KLD 和磁盘空间方面表现最好,详情见:https://www.reddit.com/r/LocalLLaMA/comments/1rgel19/new_qwen3535ba3b_unsloth_dynamic_ggufs_benchmarks/

在其他修复方面,我们还修正了许多开源模型的 bug,比如 Gemma 1、Gemma 3、Llama 聊天模板的修复、Mistral 以及更多。

虽然这些问题看起来像是我们的错,但其实是因为我们公开了它们并提醒大家更新。其中 95% 的问题和我们无关,但作为优秀的开源维护者,我们有责任让大家都保持更新。


Claude Design #

https://news.ycombinator.com/item?id=47807176

There’s no shame in being homogenous and obvious, though.

If I’m building out an internal tool for, say, a hospital lawyer to search through malpractice lawsuits, I want my tool to be the most familiar, obvious, least-surprising UI/UX possible. Just stay out of the way and do what it’s supposed to do.

The trick is, of course, that the human is still responsible for knowing when homogenous is fine, or when there’s real value in the presentation. If you’re making a website for, say, a VST plugin for musicians, your site may need to have a little more “pizzazz” to make your product more attractive to the target audience.

mjr00

同质化和明显的设计没有什么可羞耻的。

如果我正在为医院的律师构建一个内部工具,用来搜索医疗事故诉讼案例,我希望我的工具界面是最熟悉、最直观、最不让人感到意外的UI/UX。只要不过多干扰,完成它应该做的事就行。

当然,关键在于,人还是要判断什么时候同质化设计是可行的,什么时候展示上有实际价值。比如,如果你是在为音乐人做一个VST插件的网站,你的网站可能需要更多“亮点”来让产品对目标用户更有吸引力。


Ban the sale of precise geolocation #

https://news.ycombinator.com/item?id=47807024

There is no such thing as anonymized location data when you have the location of something where and when they sleep and work.

It’s a rhetorical fiction the ad industry tells itself.

rockskon

当你掌握某物何时何地睡觉和工作的位置信息时,就不存在所谓的匿名位置数据。

这是广告行业自欺欺人的一种修辞虚构。


Codex for almost everything #

https://news.ycombinator.com/item?id=47798721

Just reading the comments here it’s amazing how many people seemingly don’t know that Claude Desktop and Cowork basically already does all of this. Codex isn’t pioneering these features, it’s mostly just catching up.

woeirua

光看这里的评论就很惊讶,居然有那么多人似乎不知道Claude Desktop和Cowork基本上已经实现了这些功能。Codex并不是这些功能的开创者,它大多数只是赶上了别人的步伐。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794345

I hope people realize that tools like caveman are mostly joke/prank projects

This seems to be a common thread in the LLM ecosystem; someone starts a project for shits and giggles, makes it public, most people get the joke, others think it’s serious, author eventually tries to turn the joke project into a VC-funded business, some people are standing watching with the jaws open, the world moves on.

embedding-shape

我希望大家能意识到,像caveman这样的工具大多是开玩笑或恶作剧性质的项目。

这似乎是大型语言模型生态系统中的一个常见现象;有人为了好玩儿开始一个项目,公开发布后,大多数人明白这是个玩笑,其他人却当真了,作者最终试图将这个玩笑项目变成一个获得风险投资的商业项目,有些人目瞪口呆地旁观,世界依旧在前进。


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794755

This comment thread is a good learner for founders; look at how much anguish can be put to bed with just a little honest communication.

  1. Oops, we’re oversubscribed.

  2. Oops, adaptive reasoning landed poorly / we have to do it for capacity reasons.

  3. Here’s how subscriptions work. Am I really writing this bullet point?

As someone with a production application pinned on Opus 4.5, it is extremely difficult to tell apart what is code harness drama and what is a problem with the underlying model. It’s all just meshed together now without any further details on what’s affected.

lanyard-textile

这个评论区对创业者来说是很好的学习材料;看看仅凭一点诚实的沟通,就能解决多少痛苦。

  1. 哎呀,我们超额认购了。

  2. 哎呀,自适应推理的效果不好/我们因为容量原因必须这么做。

  3. 订阅是怎么运作的。我真的在写这个要点吗?

作为一个在Opus 4.5上运行生产应用的人,很难区分到底是代码框架的问题还是底层模型的问题。现在这些都混在一起了,没有任何关于受影响内容的更多细节。


US Bill Mandates On-Device Age Verification #

https://news.ycombinator.com/item?id=47804684

Politicians will do any draconian measure to help kids except try and improve the lives of their parents so that they can actually dedicate time to parenting. Making it slightly harder to access the internet fixes nothing. What if instead of having the largest prison population in the world our government supported communities that make raising good children possible? Our society needs to lose this urge to diagnose each other and provide some forceful treatment and instead set sights on providing the pre-conditions for everyone to prosper and lead their version of a fulfilling life. Only then will we have functional, healthy children. I quite like what the mayor of Baltimore has been doing to revitalize his city and it seems to be leading to actual change there if you want a good example: https://m.youtube.com/watch?v=XQs59YY-e2I&pp=ygUXY2hhbm5lbCA1IGJyYW5kb24gc2NvdHQ%3D

snaking0776

政治家们会采取任何严厉的措施来帮助孩子,除了尝试改善他们父母的生活状况,使父母能够真正投入时间来抚养孩子。让上网变得稍微困难一点解决不了任何问题。如果我们的政府不是拥有世界上最大的监狱人口,而是支持那些能够让养育好孩子成为可能的社区,那会怎样?我们的社会需要摆脱互相诊断并强制治疗的冲动,转而着眼于提供每个人繁荣发展的前提条件,让每个人都能过上自己认为充实的生活。只有这样,我们才会有功能正常、健康的孩子。我相当喜欢巴尔的摩市长为了振兴城市所做的努力,如果你想看一个好例子,可以看看这段视频:https://m.youtube.com/watch?v=XQs59YY-e2I&pp=ygUXY2hhbm5lbCA1IGJyYW5kb24gc2NvdHQ%3D


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47794908

They’ve increased their cybersecurity usage filters to the point that Opus 4.7 refuses to work on any valid work, even after web fetching the program guidelines itself and acknowledging “This is authorized research under the [Redacted] Bounty program, so the findings here are defensive research outputs, not malware. I’ll analyze and draft, not weaponize anything beyond what’s needed to prove the bug to [Redacted].

I will immediately switch over to Codex if this continues to be an issue. I am new to security research, have been paid out on several bugs, but don’t have a CVE or public talk so they are ready to cut me out already.

Edit: these changes are also retroactive to Opus 4.6. I am stuck using Sonnet until they approve me or make a change.

johnmlussier

他们增加了网络安全使用过滤器,以至于Opus 4.7即使在从网络上获取了程序指南并确认“这是[已屏蔽]赏金计划下的授权研究,所以这里的发现是防御性研究成果,不是恶意软件。我将分析并起草报告,不会超出证明漏洞所需的范围进行武器化”后,仍然拒绝处理任何有效的工作。

如果这个问题继续存在,我会立即转向Codex。我是安全研究的新手,已经因几个漏洞获得了报酬,但还没有CVE或公开演讲,所以他们已经准备把我排除在外。

补充说明:这些更改对Opus 4.6也同样适用。我只能使用Sonnet,直到他们批准我或做出改变。


Codex for almost everything #

https://news.ycombinator.com/item?id=47796824

<tin foil hat>

I swear OpenAI has 2-3 unannounced releases ready to go at any time just so they can steal some thunder from their competitors when they announce something

</tin foil hat>

incognito124

<阴谋论>

我发誓OpenAI随时都有2到3个未公布的新产品准备好上线,他们这样做只是为了在竞争对手发布新东西时抢夺关注度。

</阴谋论>


Claude Opus 4.7 #

https://news.ycombinator.com/item?id=47793749

I’m not sure how much I trust Anthropic recently.

This coming right after a noticeable downgrade just makes me think Opus 4.7 is going to be the same Opus i was experiencing a few months ago rather than actual performance boost.

Anthropic need to build back some trust and communicate throtelling/reasoning caps more clearly.

endymion-light

我最近不太确定有多信任Anthropic。

紧接着明显的性能下降让我觉得Opus 4.7可能和几个月前我用过的Opus没什么区别,而并非真正的性能提升。

Anthropic需要重建一些信任,并且更清楚地说明限流和推理能力的限制原因。


Cloudflare Email Service #

https://news.ycombinator.com/item?id=47794330

I’m not sure why this announcement has generated so much irritation in the comments– Cloudflare has been transitioning from “DDoS protection” to “AWS competitor” for many years now, and this is just their alternative to AWS SES.

It’s an email sender that you can access through an API, or directly through Workers. For those who haven’t been keeping up over the years, Workers is their product for running code on Cloudflare’s platform directly (an AWS Lambda competitor, more or less) and they’ve been trying to make it the centerpiece of an ecosystem where you deploy your code to their platform and get access to a variety of tools: databases, storage, streaming, AI, and now email sending. All of this is stuff that AWS has had for years, but some people like Cloudflare more (I certainly do).

One thing that surprised me is the price– Cloudflare’s cloud offerings are usually much cheaper, and I’ve saved plenty of money by migrating from AWS S3 to Cloudflare’s R2. This new offering is 3x the AWS price, though. Weird. Anyway, most small companies don’t send enough email for it to matter.

But getting back to the consensus in the comments here: I’m not sure why people think that they’ll be worse about policing spam than AWS SES, Azure Email, etc.

Meekro

我不明白为什么这个公告会在评论区引起这么多不满——Cloudflare多年来一直在从“DDoS防护”转型为“AWS竞争对手”,这只是他们针对AWS SES的替代方案。

这是一个可以通过API访问的邮件发送服务,或者直接通过Workers来使用。对于那些这些年没有跟进的人来说,Workers是他们的产品,可以直接在Cloudflare平台上运行代码(某种程度上类似AWS Lambda),他们一直试图把它打造成一个生态系统的核心,你可以把代码部署到他们的平台,并获得各种工具的访问权限:数据库、存储、流媒体、AI,现在还有邮件发送。所有这些都是AWS多年来就拥有的功能,但有些人更喜欢Cloudflare(我当然也是)。

有一点让我感到惊讶的是价格——Cloudflare的云服务通常便宜得多,我通过从AWS S3迁移到Cloudflare的R2节省了不少钱。但这个新服务的价格是AWS的三倍,有点奇怪。不过大多数小公司发送的邮件量不会多到影响费用。

回到评论区的共识:我不明白为什么大家觉得Cloudflare在反垃圾邮件管理上会比AWS SES、Azure Email等做得更差。


The future of everything is lies, I guess: Where d… #

https://news.ycombinator.com/item?id=47793564

Their negative effects are much more vast, subtle, and cultural. You could say many of the broad and widespread mental issues we have in the US is the result of automobiles leading to suburbanization and thus isolation of people. It has created an expensive barrier of entry for existing in society and added a ton of friction to doing anything and everything, especially with people. That’s not even getting into the climate effects.

The upsides of automobiles generally all exist outside of the ‘personal automobile’, i.e. logistics. These upsides and downsides don’t need to coexist. We could reap the benefits without needing to suffer for it, but here we are.

armonster

它们的负面影响更加广泛、细微且具有文化层面。可以说,美国许多普遍且广泛的心理问题,都是由于汽车导致的郊区化,从而使人们孤立。汽车制造了一个昂贵的社会进入门槛,并且大大增加了做任何事情,尤其是与人交往的摩擦。这还没有涉及气候影响。

汽车的优点通常存在于“个人汽车”之外,比如物流。这些优点和缺点并不需要共存。我们本可以享受这些好处而不必承受其带来的痛苦,但现实就是如此。


IPv6 traffic crosses the 50% mark #

https://news.ycombinator.com/item?id=47789694

A non-trivial minority of the time, they don’t support IPv4 either!

growse

在相当一部分情况下,它们连IPv4也不支持!