2026-05-21 Hacker News Top Stories #
- 谷歌发布 Gemini 3.5 Flash,以低延迟低成本在多项基准领先并适配大规模多步骤代理协作,已在应用与搜索上线且被推测采用混合精度与较少活跃参数。
- Meta 应沙特与阿联酋政府要求对多个人权账号实施地理封锁,援引两国网罪法而遭人权组织谴责并被要求披露法律请求与恢复访问。
- 欧洲五大移动支付平台结盟将于2026年启动互联互通的主权支付系统,先覆盖13国跨境转账后扩至线上线下消费以实现数据本土化并降低对Visa/Mastercard依赖。
- 明尼苏达州通过全美首个全面禁止预测市场的法律(含禁用VPN规避、8月生效),在联邦监管争议与多起诉讼下仅豁免保险、证券及部分天气合约。
- 谷歌将 Gemini 3.5 Flash 设为默认AI引擎并推出多模态、保留上下文的对话式搜索与“搜索代理”,但也引发创作者对流量下滑与广告模式受损的担忧。
- 田纳西一男子因转发特朗普表情包被误判为威胁而被关37天,最终以83.5万美元与县政府和警长和解,案件凸显过高保释金、司法审查失当与言论自由保护问题。
- GitHub 正调查约3800个内部仓库因恶意VSCode扩展遭未授权访问的事件,目前称无客户数据受影响但涉及执法相关敏感项目,暴露供应链安全风险。
- Qwen 公布 Qwen Studio 跨平台一体化研发平台与代理进展之际,社区以“全知指数”等新评测主张鼓励模型敢于回答“不知道”以更全面衡量正确性与幻觉。
- Railway 因 Google Cloud 账户被封导致大面积宕机后已于5月20日全面恢复并建议部分用户手动重启,同时承认对供应商选择负责且或将削减对GCP依赖。
- 德州特斯拉锂精炼厂被指每日向排水沟排放23.1万加仑含六价铬等污染物的废水并存许可与告知缺失争议,监管宽松与取样方法之争引发公众健康担忧。
1. Gemini 3.5 Flash (Gemini 3.5 Flash) #
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
本文介绍了谷歌最新发布的 Gemini 3.5 系列模型,特别是 3.5 Flash 版本。Gemini 3.5 旨在结合前沿智能与行动能力,显著提升智能代理执行复杂任务的能力。3.5 Flash 以其卓越的性能和速度,成为迄今为止最强大的代理和编码模型,能够高效完成长时间跨度的复杂任务,具备实际应用价值。
3.5 Flash 在多个基准测试中表现优异,如 Terminal-Bench 2.1、GDPval-AA 和 MCP Atlas,并在多模态理解方面领先。其输出速度是其他前沿模型的 4 倍,实现了高智能与低延迟的完美平衡。
该模型特别适合大规模代理任务,能够快速规划、构建和迭代解决方案,大幅缩短开发者和审计人员的工作时间,且成本低于其他同类模型。结合更新后的 Antigravity 平台,3.5 Flash 能够部署协作子代理,可靠执行多步骤工作流和编码任务,满足复杂应用需求。
目前,3.5 Flash 已通过 Gemini 应用、Google 搜索的 AI 模式向全球用户开放,开发者可通过 Google Antigravity、Gemini API 及 Android Studio 使用,企业用户则可通过 Gemini 企业代理平台接入。谷歌也在内部使用更高级的 3.5 Pro 版本,预计下月推出。整体来看,Gemini 3.5 系列代表了智能代理技术的新突破,推动了 AI 在实际场景中的广泛应用。
HN 热度 936 points | 评论 638 comments | 作者:spectraldrift | 1 day ago #
https://news.ycombinator.com/item?id=48196570
- 根据推测,Gemini 3.5 Flash 模型参数规模约为 250-300 亿,总参数量较大但活跃参数较少,采用混合精度(FP4/FP8)以提高效率。
- 如果 Gemini 3.5 真的是 2-3 千亿参数且性能能与 OpenAI 和 Anthropic 的前沿模型竞争,意味着高性能模型未来可能在家用设备上运行。
- 目前小型高效模型如 DeepSeek V4 Flash 虽参数多但性能仍不及最新的 GPT Pro 和 Opus 模型。
- Opus 模型参数规模远超 Gemini 3.5,达到数万亿级别,性能提升需要极大参数量。
- 估计模型参数和性能的推测存在较大不确定性,实际规模可能偏低。
- 未来一年内可能会出现自托管的开源模型,性能可与 Opus 4.7 相当,尤其考虑到谷歌的技术领先优势。
- 目前尚不清楚是否能在家用设备上实现 Opus 4.1/4.5 级别的突破性性能,因这些模型参数规模巨大且难以运行。
- 大模型虽能记忆大量事实,但并非完成有意义工作的必要条件,小模型未来可能足够应对大部分任务。
- 现有硬件如 Mac Studio 可运行数百亿参数的模型,性能表现已接近前沿水平。
- 较小参数量模型在特定任务(如编程)上表现优异,未来几年内小模型能力将大幅提升。
- 目前前沿实验室模型参数规模可能远低于传言的数万亿,实际优化和数据限制影响模型大小。
- Gemini 3.5 在单次推理和编程任务表现优异,但在长时间、多工具任务中表现一般,表现风格与中国模型不同。
2. Meta 阻止人权账户在沙特阿拉伯和阿联酋传播内容 (Meta blocks human rights accounts from reaching audiences in Saudi Arabia, UAE) #
https://www.alqst.org/ar/posts/1190
本文报道了 Meta 公司近期在沙特阿拉伯和阿联酋对独立非政府组织、研究人员及民间社会人物的 Facebook 和 Instagram 账户实施地理封锁,阻止其内容在这两个国家的用户中传播。自 2026 年 4 月 30 日起,沙特政府要求 Meta 限制 ALQST 人权组织、Democratic Diwan、研究员 Abdullah Alaoudh 及人权捍卫者 Yahya Assiri 的账户访问,阿联酋也对类似账户实施了限制。Meta 公开报告显示,自 2026 年 3 月以来,已有超过 100 个 Facebook 和 Instagram 账户被限制,这种行为与 X(前 Twitter)上的类似封锁相呼应。
这些措施被签署组织视为任意且歧视性的,严重侵犯了言论自由和信息获取权。Meta 声称其行动是基于“当地法律”及政府请求,主要引用了沙特和阿联酋的网络犯罪法,这些法律长期被用来打压异见和限制网络言论自由。被限制的内容包括对地区地缘政治冲突和安全动态的报道。自 2026 年 2 月底美国和以色列对伊朗发动袭击后,海湾国家进一步加强了信息控制。
签署组织质疑 Meta 在执行这些封锁前的人权尽职调查,要求 Meta 公开相关法律请求和人权评估报告,恢复所有受影响账户的访问,并详细说明封锁内容及适用法律。此外,呼吁 Meta 说明其海湾地区办事处在处理这些请求中的角色。
在沙特和阿联酋,政府对网络信息实行近乎全面的控制,封锁了包括 ALQST 和海湾人权中心等多个关注人权和民主的网站。Meta 作为全球主要社交平台,应承担更大责任保护言论自由和人权捍卫者,避免成为政府审查的工具。然而,Meta 的行为加剧了信息流通的限制,与其公开承诺的人权政策背道而驰。
签署组织包括 Access Now、ALQST 人权组织、美国中东权利委员会等多个国际和地区人权机构,联合呼吁 Meta 采取透明、公正的措施,保障用户的言论自由和信息权利。
HN 热度 903 points | 评论 385 comments | 作者:giuliomagnifico | 12 hours ago #
https://news.ycombinator.com/item?id=48206768
- 追求短期增长往往会导致企业放弃原则,甚至将增长视为唯一原则。
- 企业确实可以有原则,但这些原则需要明确写入公司章程中。
- 企业面临选择,要么顺从政府要求,要么被替代,后者可能导致言论自由更差。
- 个人有权选择不支持侵犯人权的企业,但企业作为上市公司,法律上必须追求利润和增长。
- 目前没有企业因牺牲利润而承担法律责任的案例,这种说法多为特权阶层的观点。
- 企业的决策是由具体人执行的,政府的要求通过人传达给企业员工实施。
- 企业内部有权决定采取更长远且符合伦理的策略,而非仅追求短期利益。
- 将企业行为与非法交易类比并不合理,社会责任应被重视。
- 沙特和阿联酋虽无引渡协议,但控制网络路由器,能有效实施审查。
- 阿联酋对社交媒体的限制反映其专制特性,尽管对外籍人士有吸引力。
- 禁止 Meta 平台会降低阿联酋对外籍人士的吸引力,影响其国际交流。
- Twitter 在内容审查上也有严格限制,甚至封禁美国总统账号。
- 企业更看重利润而非价值观,这是一种现实但可能缺乏道德考量的选择。
- 政府的审查行为是道德上的错误,企业的顺从可能是务实但不道德的。
- 企业在面对威胁时仍需承担其行为的道德责任。
- Facebook 配合独裁政权封锁人权组织的行为是不道德的。
- 对比欧盟和沙特的审查政策,存在双重标准的争议。
3. 告别 Visa 和 Mastercard:1.3 亿欧洲人转向主权支付系统 (Goodbye Visa and Mastercard: 130M Europeans switching to sovereign payment) #
欧洲五大移动支付巨头宣布联盟,计划于 2026 年启动一个完全主权的欧洲支付系统,取代 Visa 和 Mastercard 的主导地位。这五大支付平台包括西班牙的 Bizum、意大利的 Bancomat、葡萄牙的 MB WAY、北欧的 Vipps MobilePay 以及法国的 Wero,合计拥有 1.3 亿活跃用户。通过建立一个中央互操作性枢纽,这些国家的支付系统将实现无缝连接,用户无需改变使用习惯即可跨国转账。
该系统将确保所有交易数据不经过美国服务器,增强欧洲在数字支付领域的自主权和数据安全。2026 年,个人间转账将在涵盖 13 个国家的地区内实现互通,2027 年则扩展至线上和线下支付。该联盟覆盖的地区人口占欧盟及挪威总人口的 72%。
作为先行示范,EuroPA 联盟自 2025 年 3 月起已连接西班牙、葡萄牙、意大利和安道尔,过去一年内处理了 600 万欧元交易,显示出良好的发展潜力。该项目体现了欧洲在金融科技领域追求自主和安全的战略目标,回应了对美国支付巨头依赖的担忧。
HN 热度 891 points | 评论 703 comments | 作者:healsdata | 11 hours ago #
https://news.ycombinator.com/item?id=48207004
- Wero 作为欧盟范围内的支付系统,类似荷兰的 iDeal,用户无需在商户网站输入卡号,支付时跳转银行授权,提升安全性和便利性。
- 巴西的 PIX 支付系统功能更丰富,支持定期支付、分账、融资和提现等,使用更简单且更易理解。
- PIX 系统由中央银行控制,回归现金时代的支付控制权,避免私人机构对支付的限制和制裁。
- 中央银行控制支付可能带来风险,政府能监控和阻止支付,可能侵犯隐私和滥用权力。
- 现有私营金融机构作为反洗钱和制裁的执行者,可能因规避法律风险而阻断合法交易。
- 分散的支付系统允许用户选择不同机构,避免单一实体滥用封锁交易的权力。
- 标记可疑交易与阻止交易有本质区别,阻止交易是事前强制执行,风险更大。
- 政府作为支付中介,可能轻易大规模阻断交易,带来更严重的滥用风险。
- 政府对金融交易的记录和监控可能导致隐私泄露和权力滥用。
- 政治压力可能导致私营金融机构切断对某些合法但敏感业务的服务,体现了国家与支付网络应保持分离。
- 所有主流支付方式(信用卡、iDeal、SWIFT、Paypal、Venmo 等)本质上都是可追踪的,匿名性不是设计目标。
- 中央银行的独立性和政治影响力存在争议,可能影响支付系统的公正性和稳定性。
- 使用中央银行基础设施的支付系统仍需遵守金融法规和银行保密法,信息共享和调查权限未根本改变。
4. 明尼苏达州成为首个禁止预测市场的州 (Minnesota becomes first state to ban prediction markets) #
https://www.npr.org/2026/05/19/nx-s1-5821265/minnesota-ban-prediction-markets
明尼苏达州成为美国首个禁止预测市场运营的州,州长蒂姆·沃尔兹签署了相关法律,将使像 Kalshi 和 Polymarket 这样的预测市场平台在该州运营成为重罪。该法律禁止举办或宣传允许用户对未来事件下注的预测市场,包括体育、选举、娱乐、语言用词和国际事务等。法律还禁止使用虚拟私人网络等工具绕过禁令,预计于八月生效。
该法案由民主党议员艾玛·格林曼提出,旨在由州政府决定赌博监管措施以保护公共安全和未成年人。法律对用于保险目的的事件合约和证券、商品购买设有例外。商品期货交易委员会(CFTC)已提起诉讼,试图阻止该法律生效,主张预测市场应由联邦监管机构独家管理。CFTC 主席迈克尔·塞利格指出,明尼苏达州的法律将使合法运营商和参与者一夜之间成为罪犯,损害农民和创新者利益。
在农业行业压力下,法律修订版允许对天气事件进行交易。除明尼苏达外,美国还有 14 个州提出类似限制预测市场的法案,其中夏威夷和北卡罗来纳州正寻求全面禁止该行业。尽管面临法律不确定性,预测市场应用仍快速增长,专家认为该行业已趋于主流,难以被完全取缔。
目前围绕州与联邦监管权的争议已引发 20 多起诉讼。此前内华达州一法院判定 Kalshi 的体育博彩与州监管的体育赌博无异,导致 Kalshi 暂停该州的体育博彩业务。CFTC 已对包括亚利桑那州、威斯康星州和纽约州在内的五个州提起联邦诉讼,试图推翻州政府对预测市场的限制。
Kalshi 发言人称禁令违反法律,类似于禁止纽约证券交易所,且会减少竞争,促使用户转向境外平台。Polymarket 发言人认为明尼苏达州的禁令违背联邦政府对预测市场的既定监管框架。明尼苏达州允许部落赌场运营,但不允许在线赌博和体育博彩。
预测市场使得在禁止体育博彩的州居民也能参与相关投注,因联邦将其视为“事件合约”而非赌博。Kalshi 平台上 85% 以上的交易与体育赛事相关,包括高风险的多项连环投注。尽管交易额巨大,业内仍面临内幕交易和操纵现实事件的风险问题。明尼苏达公共广播新闻记者对该报道有贡献。
HN 热度 773 points | 评论 234 comments | 作者:ortusdux | 1 day ago #
https://news.ycombinator.com/item?id=48197980
- 明尼苏达州完全禁止体育博彩,因此他们禁止预测市场的理由比其他允许体育博彩的州更有说服力。
- 法律中区分实施细节是常见现象,允许体育博彩不意味着必须允许所有形式的赌博,监管和许可仍然必要。
- 立法者有时会通过新法明确禁止已经违法的行为,以减少法律解释的不确定性。
- 预测市场和体育博彩的风险和监管环境不同,预测市场可能面临更高的作弊风险,尤其是涉及非体育事件的预测。
- 需要区分是否允许某些类型的赌博和具体允许哪些市场进行赌博,这两个问题应分开讨论。
- 预测市场未来可能成为获取事实真相的重要来源,因为涉及金钱激励,促使信息真实性和验证。
- 有些预测市场可能引发道德和法律问题,比如“谋杀市场”,需要谨慎对待和监管。
- 体育博彩中也存在大量可操控和内幕交易的情况,预测市场和体育博彩在这方面的区别并不大。
- 讨论应聚焦于哪些内容适合进行赌博,而不是简单地将预测市场等同于体育博彩。
5. 谷歌更改其搜索框 (Google changes its search box) #
https://blog.google/products-and-platforms/products/search/search-io-2026/
这篇文章介绍了谷歌在搜索引擎领域引入的一系列基于人工智能的重大升级,标志着 AI 搜索进入了一个新时代。
首先,谷歌将其最新的 Gemini 3.5 Flash 模型作为 AI 模式的默认引擎,提升了搜索代理和编码的性能,满足用户多样化和复杂的查询需求。其次,谷歌推出了 25 年来最大幅度升级的智能搜索框,支持用户通过文本、图片、文件、视频甚至 Chrome 标签页进行多模态搜索。该搜索框具备动态扩展功能,能够根据用户意图智能推荐问题,帮助用户更准确地表达需求。
此外,搜索体验更加对话化,用户可以在 AI 概览页面直接提出后续问题,系统会保持上下文,提供更相关的链接和支持内容,支持桌面和移动端的无缝使用。
最引人注目的是“搜索代理”的推出。用户可以创建和管理多个 AI 代理,这些代理全天候在后台智能监控网络信息,包括博客、新闻、社交媒体及实时数据(如财经、购物、体育),并根据用户设定的具体需求,主动推送综合更新和行动建议。例如,用户在找房时,代理会持续扫描符合条件的房源并及时通知;关注运动员新品发布时,也能第一时间获知。
目前,信息搜索代理将优先向 Google AI Pro 和 Ultra 订阅用户开放,未来将进一步丰富和扩展搜索的智能化能力,帮助用户更高效地获取和利用信息。
HN 热度 669 points | 评论 909 comments | 作者:berkeleyjunk | 1 day ago #
https://news.ycombinator.com/item?id=48197370
- 谷歌通过 AI 摘要直接展示信息,导致网站流量减少,网站主难以从中获益。
- 谷歌曾尝试付费购买数据,但付费金额远低于因流量下降而损失的广告收入。
- 目前的垄断体系使得收益难以传导到内容创造者,形成了“大坝效应”。
- 谷歌的广告模式面临挑战,AI 搜索减少了用户点击广告的机会,影响收入。
- 传统互联网商业模式可能走向终结,内容创作者难以通过广告获得收入,可能回归兴趣驱动。
- 谷歌通过增加广告密度维持收入,但 AI 搜索可能导致整体广告量和点击量下降。
- AI 搜索结果可能带有偏向,合作伙伴可能付费影响搜索结果,用户隐私和数据被广泛利用。
- 目前 AI 搜索的准确性和相关性仍有不足,存在信息错误和摘要缺乏深度的问题。
- 有用户认为 AI 搜索提供了便捷且准确的摘要,且能快速获得原始信息来源。
- AI 搜索带来的便利伴随高能耗和环境成本,引发环保方面的担忧。
- SEO 长期被滥用,传统搜索也越来越难找到有价值信息,AI 搜索是不可避免的趋势。
6. 田纳西男子因特朗普表情包被关押 37 天,诉讼胜诉获赔偿 (Tennessee man jailed 37 days for Trump meme wins settlement after lawsuit) #
2026 年 5 月 20 日,田纳西州退休执法官员拉里·布什哈特因发布一则包含特朗普言论的网络表情包而被错误逮捕并关押 37 天,现已与县政府及警长达成 83.5 万美元的和解协议。布什哈特在 2025 年 9 月保守派活动家查理·柯克遇刺后,转发了一个引用特朗普在校园枪击事件后说“我们必须克服它”的表情包。该表情包提及的是爱荷华州 2024 年的枪击事件,但当地警方错误地将其解读为对田纳西州佩里县高中的威胁,并在申请逮捕令时隐瞒了关键背景信息。
布什哈特被以 200 万美元保释金关押,直到事件引发全国关注后才获释。在狱中,他失去了退休后的工作,错过了结婚纪念日和孙子的出生。事后,他与自由权利与表达基金会(FIRE)合作,针对警方侵犯其宪法权利提起联邦民权诉讼。FIRE 高级律师指出,政治言论受第一修正案保护,警方不应因不同意见而逮捕公民。
此外,FIRE 还代理了其他因表达意见而遭到报复的田纳西州公民,包括因批评柯克而被解雇的公务员和教授。FIRE 强调,在社会动荡时期,政府必须尊重言论自由,否则将面临法律责任。该组织致力于维护美国公民的言论自由权利,推动公众对这些基本自由的认识和尊重。
HN 热度 654 points | 评论 439 comments | 作者:ceejayoz | 10 hours ago #
https://news.ycombinator.com/item?id=48208502
- 赔偿金由纳税人支付而非警察个人承担,缺乏激励警察自我约束和改正错误。
- 警察申请逮捕令时遗漏关键信息,法官未能有效审查,导致错误批准。
- 法官在案件处理中的责任较大,警察对网络表情包的法律认知有限。
- 该案件处理时间过长,延误了正义的实现。
- 保释金过高,不合理地限制了无辜者的自由。
- 保释制度应基于被告是否有逃跑风险或危险性,而非作为惩罚手段。
- 警察责任保险可能有助于减少滥用权力和提高执法标准。
- 将赔偿金从警察养老金中扣除可能激励警察自律,但也可能导致内部报复和不良文化。
- 目前警察内部已有包庇和不愿举报同僚的问题,需谨慎设计激励机制。
- 私有化伦理监督或保险机制可能比现有公共体系更有效。
- 保险费用最终可能仍由纳税人承担,需多方面综合治理。
- 警察工会对改革有抵触,执法人员不愿接受类似护士的职业许可和行为标准。
- 不可忽视政治因素,执政者对警察工会的态度影响问责机制的有效性。
- 保险机制可能使表现极差的警察部门因无法获得保险而被迫改革。
7. GitHub 正在调查对其内部代码库的未授权访问 (GitHub is investigating unauthorized access to their internal repositories) #
https://twitter.com/github/status/2056884788179726685
该网页提示用户当前浏览器禁用了 JavaScript,建议启用 JavaScript 或切换到支持的浏览器以继续使用 x.com 平台。页面提供了帮助中心链接以及相关的服务条款、隐私政策、Cookie 政策等信息。
网页内容还显示了来自 GitHub 官方账号的公告,称正在调查对 GitHub 内部代码库的未授权访问事件。目前没有证据表明客户信息(如企业、组织和代码库)受到影响,但 GitHub 正在密切监控基础设施以防止后续活动。
此外,页面包含了 X 平台的登录和注册入口,鼓励新用户注册以获得个性化时间线。页面还展示了当前美国地区的热门趋势话题,如音乐人 Dom Smith、乐队 The Clash 以及政治人物 Kilmeade。
整体而言,该网页主要是一个社交媒体平台的登录和信息公告页面,强调安全事件通报及用户登录注册功能,同时展示了部分实时热门话题。
HN 热度 605 points | 评论 324 comments | 作者:splenditer | 1 day ago #
https://news.ycombinator.com/item?id=48201316
- GitHub 确认约 3800 个内部仓库被恶意 VSCode 扩展泄露,影响严重。
- 目前仅确认内部仓库被窃取,客户外部信息暂无证据受影响。
- 泄露的仓库中包含与执法相关的文件和部门,表明 GitHub 有合法的执法请求处理机制。
- 泄露文件列表由黑客组织 TeamPCP 发布,包含多个敏感项目。
- 部分仓库名称涉及特定群体或组织,反映 GitHub 内部多样化团队和项目。
- GitHub 的声明措辞较为官方,避免直接承认被黑,显得较为谨慎。
- 事件可能触发相关法规要求的及时通报义务,GitHub 需在规定时间内向监管机构报告。
- 投资者对该事件反应有限,类似大规模安全事件对市场影响较小。
- 有评论调侃“方向性”一词的使用,表达对事件严重性的不同看法。
- 有人建议使用静态分析和防火墙等技术手段加强供应链安全。
8. Qwen3.7-Max:智能代理前沿 (Qwen3.7-Max: The Agent Frontier) #
https://qwen.ai/blog?id=qwen3.7
该网页主要介绍了 Qwen Studio 及其相关产品和服务。Qwen Studio 是一个集成了多种功能的平台,包含代码编辑、研究工具和 API 接口,旨在为用户提供便捷的开发和研究体验。页面提到当前内容加载出现问题,建议用户刷新页面或通过邮件联系技术支持以获得帮助。
网页还展示了 Qwen Studio 支持的多种操作系统和设备,包括 Web、iOS、Android、macOS 和 Windows,体现了其跨平台的特性。页面底部提供了相关的法律条款、隐私政策、使用政策、Cookie 通知以及训练数据摘要,确保用户了解平台的合规性和数据使用情况。
整体来看,该网页是 Qwen Studio 的官方介绍和服务入口,重点突出其多功能、多平台支持以及用户服务保障。
HN 热度 594 points | 评论 236 comments | 作者:kevinsimper | 14 hours ago #
https://news.ycombinator.com/item?id=48205626
- AA-omniscience 模型的非幻觉率达到最新水平,优于 Opus 4.7、Gemini 3.1 Pro 和 GPT5.5。
- 仅统计错误答案的幻觉率可能导致模型通过拒绝回答来避免幻觉。
- 引入幻觉一词是因为历史上大模型常常编造答案,拒绝回答能提升模型可信度。
- Omniscience 指数综合考虑正确答案、幻觉和拒绝回答,更全面评估模型表现。
- 能够回答“不知道”的模型比总是给出答案的模型更值得信赖。
- 早期模型就具备判断答案概率的能力,理应在低置信度时拒绝回答或明确警告可能的幻觉。
- 一些中文模型在知识准确性和幻觉率方面表现较差。
- 模型的 token 效率差异显著,部分模型用更多 token 才能达到相同答案质量。
- 测试数据可能包含人为错误,完美的非幻觉率并不代表模型绝对正确。
- 幻觉的定义和判断依赖于测试者的知识框架,可能存在认知局限。
- 目前模型是否能超越人类认知限制,理解世界更准确仍是未知。
- 评测问题相对明确,便于判断模型回答的正确性。
- 运行速度和硬件配置对模型使用体验影响较大,混合专家模型在速度和内存占用上有优势。
- 27B 模型在代码任务上表现更好,但对硬件要求较高。
- 量化技术影响模型性能和速度,动态量化允许在精度和效率间权衡。
9. 事件报告:Google Cloud 导致 Railway 服务中断【已解决】 (Incident Report: Railway Blocked by Google Cloud [resolved]) #
https://status.railway.com/incident/I23M92U0
该网页是 Railway 平台关于 2026 年 5 月 19 日 Google Cloud 账户故障导致的服务中断的事件更新和恢复报告。事件从 5 月 19 日 22:29 开始调查,用户遇到登录失败、无法访问仪表盘及各种错误提示。随后,Railway 团队确认 Google Cloud 封锁了其账户,导致部分服务不可用,并已直接与 Google 进行升级沟通。
在接下来的时间里,团队逐步恢复了对 Google Cloud 基础设施的访问,部分服务和工作负载开始上线,但仍存在网络和部署方面的间歇性问题。为防止基础设施过载,非企业用户的构建被暂时限制。到 5 月 20 日 07:57,Railway 服务已完全恢复,系统自动重新部署了检测到异常的工作负载,用户若遇到问题可手动触发重新部署。
整个事件的详细原因已确认,后续将发布更完整的事故分析报告。Railway 团队对本次中断表示歉意,并提供了相关 FAQ 和社区支持链接,方便用户了解最新情况和寻求帮助。
HN 热度 547 points | 评论 346 comments | 作者:aarondf | 24 hours ago #
https://news.ycombinator.com/item?id=48201484
- Railway 事件已解决,但部分用户仍遇到服务不可用,需要手动重启才能恢复。
- Railway 承认对供应商选择负责,用户关心的是产品的可用性,责任在 Railway。
- 有观点认为可以起诉 Google 赔偿损失,但 Google 条款严苛,诉讼成功可能性不大。
- 质疑 Google 是否因付款问题自动暂停账户,Railway 表示已有专门客户经理介入处理。
- Google 可能会提供道歉和账户信用补偿,Railway 可能会考虑减少对 GCP 的依赖。
- Google 的服务条款通常非常宽泛,允许其在无预警情况下暂停账户,用户权益受限。
- 多云策略不一定要同时部署多个云,展示有多云选择的杠杆作用即可。
- AWS 和 Azure 也有宕机,但 GCP 因自动暂停账户事件被特别关注。
- AWS us-east-1 区域故障影响广泛,很多服务依赖该区域,导致连锁反应。
- 部分用户认为 AWS 的控制面板偶有故障,但数据面板稳定,影响有限。
- 大型企业多依赖 us-east-1 区域,导致区域故障时影响范围扩大,难以完全避免。
10. 特斯拉锂精炼厂每天排放 23.1 万加仑污染废水 (Tesla’s lithium refinery discharges 231,000 gallons of polluted wastewater a day) #
https://www.autonocion.com/us/tesla-lithium-refinery-texas/
2026 年 1 月,德克萨斯州纽塞斯县的排水区工作人员在例行检查时发现一条他们不认识的管道,向他们管理的沟渠排放黑色污水。经确认,该管道属于特斯拉,排放的是其耗资近 10 亿美元、于 2024 年 12 月开始运营的锂精炼厂的废水。该厂号称采用“无酸清洁工艺”,主要副产品为沙子和石灰石,但排水区并未被告知每天有 23.1 万加仑的处理废水通过其设施排放。
德州环境质量委员会(TCEQ)于 2025 年 1 月悄悄批准了特斯拉的废水排放许可,允许其向一条未命名的沟渠排放废水,该沟渠最终流入巴芬湾。但该许可未明确授权特斯拉使用公共或私人土地输送废水,排水区也未被通知许可的存在。排水区工作人员通过实地巡查发现了该管道,并向 TCEQ 投诉。
TCEQ 于 2026 年 2 月对排放水进行了常规污染物检测,结果均符合许可标准,但未检测重金属和锂。排水区随后聘请独立实验室进行 24 小时采样检测,发现六价铬、砷、锶、锂、钒等多种有害物质,其中六价铬是已知的人类致癌物,砷虽低于饮用水标准但仍存在。其他元素如锰、铁、磷等也呈现工业排放特征,可能对生态和人体健康构成威胁。
排水区工程师建议特斯拉建立多级反渗透处理设施以去除重金属,并警告当地居民远离该沟渠。盐分升高已导致沟渠边坡草地死亡,增加了土壤流失和排水能力下降的风险。排水区律师已向特斯拉发出停止排放的通知,要求召开会议讨论此事。
此事件揭示了美国电动车供应链中环境承诺与监管漏洞的矛盾,也暴露出特斯拉锂精炼厂废水排放监管和信息透明方面的问题,尚未被主流汽车媒体广泛报道。
HN 热度 490 points | 评论 244 comments | 作者:atombender | 1 day ago #
https://news.ycombinator.com/item?id=48198551
- 特斯拉获得了排放许可,可以将处理过的废水排入指定的无名排水沟,但是否有权使用该排水沟的公共或私人财产存在争议。
- 排水沟的管理机构未被告知该许可的存在,责任应由发证机构德州环境质量委员会承担。
- 特斯拉质疑检测方法不当,认为应在排放口而非下游排水沟采样,以避免其他污染源干扰。
- 许可和审批过程虽然被视为繁文缛节,但应是确保排放符合行业标准和安全的必要审核。
- 排放许可允许废水排入排水沟,但使用排水沟本身的权利可能需要额外许可,涉及多重管辖权和管理权限。
- 许可中提及的“无名排水沟”指的是具体的排水沟,而非模糊不清的排水沟,争议在于该排水沟的所有权和使用权。
- 德州监管相对宽松,监管机构在经济利益面前可能忽视环境和公众健康的担忧。
- 排放许可由水质监管机构发放,但排水沟的管理权属于排水区,双方权限重叠导致协调困难。
- 特斯拉和排水区对水质检测方法存在分歧,影响对污染程度的判断。
Hacker News 精彩评论及翻译 #
GitHub confirms breach of 3,800 repos via maliciou… #
https://news.ycombinator.com/item?id=48214112
If only the company behind VSCode, the company behind NPM and the company behind GitHub could get together and figure out a solution to this.
psadauskas
要是开发VSCode的公司、开发NPM的公司和开发GitHub的公司能聚在一起想个解决方案就好了。
Goodbye Visa and Mastercard: 130M Europeans switch… #
https://news.ycombinator.com/item?id=48207532
Wero is basically an EU-wide version of the Dutch iDeal system, which in my opinion is the gold standard of how internet payment should work. I shouldn’t have to fill in any card numbers on the site of the merchant (which is unsafe). Instead, the payment should redirect me to my bank, where I authorize the payment through my own bank’s security system. I’ve always been annoyed by the need to type in sensitive card info on all sorts of merchant sites. I hope that with EU-wide use, Wero will receive much broader support now.
mcv
Wero基本上是一个覆盖整个欧盟的荷兰iDeal系统版本,在我看来,iDeal是互联网支付应有的黄金标准。我不应该在商家网站上填写任何卡号(那样不安全)。相反,支付应该跳转到我的银行,在那里我通过银行自己的安全系统授权支付。我一直很烦恼必须在各种商家网站上输入敏感的卡片信息。我希望随着在欧盟范围内的使用,Wero能够获得更广泛的支持。
Google changes its search box #
https://news.ycombinator.com/item?id=48197769
Which as some running a website raises a fascinating question. If Google is just going to crawl my sites and present information as an AI summary on their site, then what exactly do I gain by allowing Googlebot to crawl my sites?
ekidd
这就引出了一个有趣的问题,作为一个运营网站的人来说。如果谷歌只是爬取我的网站,并在他们的平台上以AI摘要的形式呈现信息,那么让我允许Googlebot爬取我的网站,我到底能获得什么呢?
Map of Metal #
https://news.ycombinator.com/item?id=48206213
Didn’t expect to see something I made on HN while my wife is trying to find something to watch on TV.
So about the site in case anyone is interested. I made it with a friend who was studying multimedia. He helped with the data and I did the coding. Took about a week or two.
The site was originally Flash (remember that). But I ported it to HTML5 a few years ago. It still has those Flash vibes I think. Posted the code to GitHub when I ported it. I did this mostly to keep it alive for old times sake.
So about the mobile support. I planned to do it but got sidetracked building a custom WebGL map renderer because phone performance was poor. However I never finished, life finds a way to get in the way and all that… I have some mobile designs lying around.
The other issue was when I first built the site YouTube didn’t really play ads much at all, just those little text ads, and you could embed the player really tiny. So it worked better. In the original flash version I actually hid the video player. But that got the site blacklisted from YouTube, I asked a Google engineer on a dev forum to put a word in and they removed the block, very different times, this was back when Google was a different beast, and you could chat to real people online and the dev communities were much smaller.
I have a illustration of a much bigger map in my sketchbook. It has a lot more subgenres and interconnected things like historical events and so on. But it’s huge unfolded, like 2x1.5m or something ridiculous.
I miss those days when the web was full of weird and experimental stuff. I grew up with Newgrounds and Geocities, I’m sure it’s all still out there buried under a giant pile of SEO optimised refuse.
pjgalbraith
没想到在HN上看到我做的东西,正好我老婆在找电视节目看。
说说这个网站,如果有人感兴趣的话。我和一个学多媒体的朋友一起做的。他负责数据,我负责编程。大概花了一两周时间。
这个网站最初是用Flash做的(记得那个时代吧)。几年前我把它移植到了HTML5。我觉得它仍然保留着Flash的感觉。移植的时候我把代码发到GitHub了,主要是为了延续这个东西,怀念旧时光。
说说移动端支持。我本来打算做,但后来转而做了一个自定义的WebGL地图渲染器,因为手机性能不好。不过我没完成,生活总会找到插手的办法……我还有一些移动端的设计稿留着。
另一个问题是,当我最初建这个站时,YouTube几乎不播放广告,只有小小的文字广告,你还能把播放器嵌得很小,所以效果还不错。Flash版里我其实隐藏了播放器,但结果网站被YouTube拉入黑名单。我曾在开发者论坛上找谷歌工程师帮忙说话,结果他们解除了封禁,那时候谷歌还是另一副模样,能在线和真实的人聊天,开发者社区也小得多。
我在笔记本里画了一张更大的地图草图,里面有更多的子类型和互相关联的东西,比如历史事件什么的。展开后特别大,差不多有2米乘1.5米那么夸张。
我怀念那些日子,网页里充满了各种奇怪和实验性的东西。我是在Newgrounds和Geocities成长起来的,我相信这些东西依然还藏在一堆经过SEO优化的垃圾下面。
An OpenAI model has disproved a central conjecture… #
https://news.ycombinator.com/item?id=48213071
To the “LLMs just interpolate their training data” crowd:
Ayer, and in a different way early Wittgenstein, held that mathematical truths don’t report new facts about the world. Proofs unfold what is already implicit in axioms, definitions, symbols, and rules.
I think that idea is deeply fascinating, AND have no problem that we still credit mathematicians with discoveries.
So either “recombining existing material” isn’t disqualifying, or a lot of Fields Medals need to be returned.
m-hodges
对于那些认为“大型语言模型只是对训练数据进行插值”的人:
艾耶尔,以及以不同方式的早期维特根斯坦,认为数学真理并不是报告关于世界的新事实。证明揭示的是公理、定义、符号和规则中已经隐含的内容。
我觉得这个观点非常有趣,而且我完全认同我们仍然应当认可数学家的发现。
所以,要么“重新组合已有材料”并不构成否定其价值的理由,要么很多菲尔兹奖都得被退回。
Tennessee man jailed 37 days for Trump meme wins s… #
https://news.ycombinator.com/item?id=48209448
The sheriff that arrested him should face criminal charges for misuse of authority. That he doesn’t reflects a structural weakness in US law. In most European legal systems a law enforcement officer overstepping his legal authority would face criminal charges for it.
contubernio
逮捕他的警长应该因滥用职权面临刑事指控。他没有受到指控反映了美国法律的结构性弱点。在大多数欧洲法律体系中,执法人员超越其法定权限将面临刑事指控。
Goodbye Visa and Mastercard: 130M Europeans switch… #
https://news.ycombinator.com/item?id=48207417
A Frenchman using Wero will be able to transfer money to a Spanish friend on Bizum, with the same simplicity as a domestic payment.
Have you seen the new money app? It’s on Tubu. It’s on Weeno. I’m on Dippy but my friend is on Poob. Poob has it for you.
petcat
一个法国人使用Wero时,可以像进行国内支付一样轻松地将钱转账给用Bizum的西班牙朋友。
你见过那个新的支付应用吗?它在Tubu上,也在Weeno上。我用的是Dippy,但我的朋友用的是Poob。Poob会为你搞定一切。
Gemini 3.5 Flash #
https://news.ycombinator.com/item?id=48202262
For those who would like to know the total and active parameter count of this model: even though Google doesn’t disclose the model technicals, we can infer them within relatively tight margins based on what we do know.
We know they serve the model on TPU 8i, which we have plenty of hard specs for (so we know the key constraints: total memory and bandwidth and compute flops). We can also set a ceiling on the compute complexity and memory demand of the model based on knowing they will be at least as efficient as what is disclosed in the Deepseek V4 Technical Report.
We can also assume that the model was explicitly built to run efficiently in a RadixAttention style batched serving scenario on a single TPU 8i (so no tensor parallelism, etc. to avoid unnecessary overheads… Google explicitly designed the 8th-generation inference architecture to eliminate the need for tensor sharding on mid-sized models).
We know Google intends to serve this model at a floor speed of around 280 tok/s too.
Putting all these pieces together, we can confidently say this model is ~250-300B total, and 10-16B active parameters. Likely mostly FP4 with FP8 where it matters most.
Visual:
┌────────────────────────────────────────────────────────┐ │ TPU 8i VRAM (288 GB) │ ├───────────────────────────┬────────────────────────────┤ │ Static Model Weights │ Dynamic Allocations & │ │ (250B - 300B @ Mixed │ Compressed KV Caches │ │ FP4/FP8) │ (RadixAttention / SRAM) │ │ ~110 GB - 150 GB │ ~138 GB - 178 GB │ └───────────────────────────┴────────────────────────────┘ I do model serving optimization work. This is napkin math.
Edit: There’s one factor I under-rated in my initial estimate… TurboQuant. This is a compute to KV memory use tradeoff. It’s plausible with TurboQuant at a quality-neutral setting they’ve gotten the model up to 400B with similar economics. This is a variable effecting concurrency and the the way they decided total model size was likely based on what they see for the average user’s average KV cache depth in real-world usage.
easygenes
对于想了解该模型总参数量和活跃参数量的人来说:虽然谷歌没有公开模型的技术细节,但根据我们已知的信息,可以在相对较小的误差范围内推断出这些数据。
我们知道他们使用 TPU 8i 运行该模型,而我们掌握了该硬件的许多硬性规格(因此知道了主要限制因素:总内存、带宽和计算浮点运算能力)。结合 Deepseek V4 技术报告中披露的效率数据,我们可以为模型的计算复杂度和内存需求设定一个上限,模型效率至少不会低于报告中的内容。
我们还可以假设该模型是专门设计用于在单个 TPU 8i 上,以 RadixAttention 风格的批量服务场景高效运行的(因此没有张量并行等技术,以避免不必要的开销……谷歌明确设计了第八代推理架构,消除了中等规模模型张量分片的需求)。
我们知道谷歌计划以大约每秒 280 令牌的最低速度提供该模型。
把这些因素结合起来,我们可以有把握地说,该模型总参数量约为 250-300 亿,活跃参数量约为 10-16 亿。大部分参数可能采用 FP4 格式,关键部分采用 FP8。
示意图:
┌────────────────────────────────────────────────────────┐ │ TPU 8i 显存(288 GB) │ ├───────────────────────────┬────────────────────────────┤ │ 静态模型权重 │ 动态分配及压缩的 KV 缓存 │ │ (250B - 300B,混合 │ (RadixAttention / SRAM) │ │ FP4/FP8) │ 约138 GB - 178 GB │ │ 约110 GB - 150 GB │ │ └───────────────────────────┴────────────────────────────┘
我从事模型服务优化相关工作,上述推算类似于草稿计算。
补充说明:在我最初的估算中,有一个因素被低估了……TurboQuant。这是计算资源与 KV 缓存内存使用之间的权衡。借助 TurboQuant 在质量不受影响的前提下,他们很可能将模型扩展到了 400 亿规模,且经济效益类似。这个因素会影响并发数,而谷歌最终确定的模型总规模可能基于其观察到的平均用户在实际使用中平均 KV 缓存深度。
Incident Report: May 19, 2026 – GCP Account Suspen… #
https://news.ycombinator.com/item?id=48211323
“Finally, we are in planning to remove Google Cloud services from our data plane’s hot path, and keeping them only for secondary/failover.”
That’s pretty clear. Google can no longer be trusted as a B2B service provider.
Animats
“最终,我们计划将谷歌云服务从我们数据平面的核心路径中移除,只保留它们用于次要/故障切换。”
这很明确。谷歌作为B2B服务提供商已不再值得信赖。
Gemini CLI will stop working from June 18, 2026 #
https://news.ycombinator.com/item?id=48201329
Google really can’t help themselves but to have some internal re-org kill off a public thing people are actively using. It’s honestly impressive how consistent they are.
silverlight
谷歌真是忍不住内部重组,总是干掉一些用户积极使用的公共服务。说实话,他们这一点的一贯做法还真令人佩服。
GitHub is investigating unauthorized access to the… #
https://news.ycombinator.com/item?id=48203416
Do they know what the attackers were after? Maybe they were just trying to help fix the availability problems.
jms703
他们知道攻击者的目的是什么吗?也许他们只是想帮忙解决可用性问题。
Google changes its search box #
https://news.ycombinator.com/item?id=48199476
What scares me about this new AI mode thingy
What scares me is the rampant inaccuracy. In my experience, the AI responses are wrong about 65% of the time. I just did a search today about an error talking about a disconnected link between apps, and Google AI result summary told me that the error was related to my pulling a USB drive too quickly in windows. The ONLY word similar to my query and that AI response was the word “disconnect”. Everything else was clearly about the SaaS apps.
I have people coming to me, asking me questions, then telling my Google told them something else, so now I have to waste time convincing them that it’s wrong. Over the past 2 years AI has done nothing for me but complicate my work life.
And of course, this could be because the model is crap, but it could be because they want me to keep refining my query over and over for more ad views. Either way, it’s a terrible experience.
burnte
让我害怕这个新AI模式的是它的普遍不准确。根据我的经验,AI回答有大约65%的时间是错误的。今天我刚搜索了一个关于应用之间断连错误的问题,谷歌AI结果摘要却告诉我这个错误是因为我在Windows中拔出了USB驱动器。唯一和我的查询及AI回答相似的词就是“断开”。其他内容显然都是关于SaaS应用的。
有人会来问我问题,然后说谷歌告诉他们是另一个答案,所以我得浪费时间说服他们那是错的。过去两年,AI除了让我的工作变复杂之外没有带来任何帮助。
当然,可能是模型本身不行,也可能是他们想让我不断完善查询以增加广告浏览量。不管哪种情况,体验都很糟糕。
Incident Report: Railway Blocked by Google Cloud [… #
https://news.ycombinator.com/item?id=48201884
It has been 0 days since GCP has taken down a startup (again).
You see this at least once a year. Never heard of this from AWS or Azure.
In all seriousness, this is why we don’t use them. They have the most ergonomic cloud of the big three, then absolutely murder it by having this kind of reputation.
dangoodmanUT
GCP 又一次让一家初创公司倒闭,已经是第0天了。
你每年至少会看到一次这种情况。从未听说过 AWS 或 Azure 有这样的事。
说真的,这就是我们不用他们的原因。他们是三大云服务中用户体验最友好的,但这种声誉完全毁了他们。
Tennessee man jailed 37 days for Trump meme wins s… #
https://news.ycombinator.com/item?id=48210587
The fact that taxpayers and not the police themselves have to pay the settlement is the worst part of this.
Every settlement against the police should be taken from their pension fund. This is something I’ve been advocating for decades now, because it creates an incentive not to do things like this. Right now, good cops don’t patrol bad cops because it won’t affect them. By aligning the incentives right, it will mean good cops will force out the bad cops quickly.
freediddy
最糟糕的部分是赔偿金由纳税人而不是警察自己支付。
我几十年来一直主张,所有针对警察的赔偿金都应该从他们的养老金基金中支付。因为这样可以创造一种激励,避免发生类似的事情。现在,好警察不会监督坏警察,因为这对他们没有影响。通过调整激励机制,好警察将会迅速将坏警察排除出去。
Meta blocks human rights accounts from reaching au… #
https://news.ycombinator.com/item?id=48207311
Social media companies post record earnings year after year from their ads business while increasingly proving to be harmful to society. They do the bare minimum in terms of content moderation and bots while priming the algorithms to maximize revenue. The good ol’ privatized profits, socialized harm model.
In a just world, would social media platforms be taxed higher on corporate revenue and how would that pan out? Maybe we’ll be left with small federated platforms without algorithms and ads.
0x5FC3
社交媒体公司通过广告业务年复一年地创造创纪录的收益,但却越来越被证明对社会有害。他们在内容审核和机器人治理方面只是做最基本的工作,同时将算法调整到最大化收入的状态。这就是典型的私人获利、社会承担损害的模式。
在一个公正的世界里,社交媒体平台会不会对企业收入征收更高的税,这种情况会怎样发展呢?也许我们最终会拥有没有算法和广告的小型联合平台。
Google changes its search box #
https://news.ycombinator.com/item?id=48197660
I don’t trust facts from LLMs. When I am searching for something, I usually want to find primary sources. As soon as a number is involved, I do my best to not even look at the AI output.
Even though the result is often good and combines information from multiple sources, it can also get things wrong by combining information from different eras or just plain outdated advice. AFAICT, without primary sources, the result is for entertainment purposes only.
imoverclocked
我不相信大型语言模型提供的事实。当我查找某些信息时,通常会优先寻找第一手资料。只要涉及数字,我尽量不看AI的输出内容。
尽管结果往往不错,能结合多个来源的信息,但也可能因为将不同时代的信息混合在一起或者提供过时的建议而出错。据我所知,没有第一手资料的话,结果仅供娱乐参考。
Apple unveils new accessibility features #
https://news.ycombinator.com/item?id=48195239
Apple loves to stealth test new tech in full public view by sneaking it into relatively mundane places, so debuting agentic AI via accessibility is very on brand.
A few other examples:
-
The Touch Bar was much more than an OLED strip, it was Apple’s first move in the transition to Apple Silicon on macs. The Apple T1 chip in the 2016 Touch Bar MacBooks was the first solely Apple-designed processor to appear in a Mac and took over several responsibilities away from intel chipsets like power management, fans, sleep/wake, access to the camera & mic, and the secure enclave powering touch ID. Then the T2 added encryption of the SSD, audio management, image processing for the camera, and prevented tampering with the boot process
-
The iPhone 3G shipped with a Liquidmetal SIM eject tool, which is made from a strong custom metal alloy which is “practically unbendable by hand unless you want to hurt or cut your fingers.” Although Apple hasn’t released anything with the alloy since then, now nearly 20 years later Apple is rumored to be using liquid metal in their upcoming foldable iPhone.
-
RealityKit had 3D scanning and a lot of other cool AR capabilities for years which didn’t make sense until the Apple Vision Pro was released.
JeremyHerrman
苹果喜欢通过将新技术悄悄植入相对平凡的地方,在公众视野中暗中测试,因此通过辅助功能首次推出具有自主性的人工智能非常符合苹果的风格。
还有几个例子:
-
触控栏不仅仅是一个OLED条,它是苹果在Mac上向Apple Silicon过渡的第一步。2016年触控栏MacBook中的Apple T1芯片是第一款完全由苹果设计的Mac处理器,承担了许多原本由英特尔芯片组负责的任务,比如电源管理、风扇控制、睡眠/唤醒、摄像头和麦克风的访问以及支持Touch ID的安全隔区。之后的T2芯片增加了SSD加密、音频管理、摄像头图像处理,并防止启动流程被篡改。
-
iPhone 3G随机附带了一个液态金属SIM卡取卡针,这种取卡针由一种强度极高的定制金属合金制成,“除非你想伤手或割破手指,否则几乎无法用手弯曲”。尽管苹果自那以后没有发布过含该合金的产品,但现在近20年后,有传闻称苹果即将在其即将推出的可折叠iPhone中使用液态金属。
-
RealityKit多年来一直支持3D扫描和许多其他很酷的增强现实功能,这些功能直到苹果Vision Pro发布后才变得意义明确。
Gemini CLI will stop working from June 18, 2026 #
https://news.ycombinator.com/item?id=48203833
How does anyone internally at Google justify these decisions?
Even if there are competing implementations, in terms of brand recognition, I feel like “Gemini” is more closely associated with Google than “Antigravity”. Why pick the more obscure option?!
Perhaps they felt the sentiment on Gemini CLI was beyond repair, but surely there must be some voice on the inside saying “developers will never adopt our products if we keep killing them”.
crakhamster01
谷歌内部到底是谁为这些决定辩护的?
即使有多个竞品实现,就品牌认知度而言,我觉得“Gemini”比“Antigravity”更能代表谷歌。为什么要选更晦涩的那个选项?
或许他们觉得Gemini CLI的口碑已经无可挽回,但内部肯定有人会说:“如果我们一直在砍掉开发者的工具,他们永远不会采用我们的产品。”
Google changes its search box #
https://news.ycombinator.com/item?id=48197951
A couple of years back I worked with a company which maintained specific data which was the main traffic driver on that page. Google approached them and wanted to pay for the rights to get the data and display it on top of the search results, a feature which was fairly new back then.
This was an interesting dilemma because it was very clear that the money was way less than the loss in ad revenue due to traffic drop, but it was also clear that if we wouldn’t take the deal, a more desperate competitor would, which would result in the same traffic loss but without the extra google money. So the company took the deal.
History repeats itself here, with the difference that instead of paying for the data, the ai crawlers simply take it for free.
pflenker
几年前,我曾在一家公司工作,该公司维护着某些特定数据,这些数据是那个页面的主要流量来源。谷歌找到他们,想付费获取这些数据的使用权,并将其显示在搜索结果的顶部,这在当时是一个相当新的功能。
这成为了一个有趣的两难局面,因为很明显,谷歌所出的价钱远低于因流量下降导致的广告收入损失,但同时也很清楚如果我们不接受这个交易,一个更迫切的竞争对手会接受,这将导致同样的流量损失,却没有额外的谷歌资金支持。所以公司最终接受了这笔交易。
历史在这里重演,不同的是,这次人工智能爬虫直接免费获取数据,而不是付费购买。
Gemini 3.5 Flash #
https://news.ycombinator.com/item?id=48199413
This understates the cost increase. 3.5 Flash also uses more tokens. artificialanalysis.ai shows these difference to run the whole eval, which I think is more realistic pricing:
Gemini 2.5 flash (27 score): $172 (1.0x)
Gemini 2.5 pro (35 score): $649 (3.8x)
Gemini 3.0 Flash (46 score): $278 (1.6x)
Gemini 3.5 Flash (55 score): $1,552 (9.0x or 2.4x compared to 2.5 pro)
This is a massive price increase… 5.6x compared to Gemini 3.0 Flash
jl
这低估了成本的增加。3.5 Flash 也使用了更多的 tokens。artificialanalysis.ai 显示了完全评测的这些差异,我认为这更符合实际定价:
Gemini 2.5 Flash(得分27):172美元(1.0倍)
Gemini 2.5 Pro(得分35):649美元(3.8倍)
Gemini 3.0 Flash(得分46):278美元(1.6倍)
Gemini 3.5 Flash(得分55):1,552美元(9.0倍,或是 2.4 倍于 2.5 Pro)
这是一笔巨大的价格上涨……相较于 Gemini 3.0 Flash,涨了5.6倍。