2026 03 04 HackerNews

2026-03-04 Hacker News Top Stories #

  1. Meta 的 Ray‑Ban AI 眼镜依赖肯尼亚标注员处理高度私密视频并存在无法关闭的数据共享与指示灯设计缺陷,暴露出跨国低薪数据劳动与隐私风险。
  2. 基于 p5.js 的 SketchXKCD 将 xkcd 的“互联网依赖图”做成交互化可拖拽示例,用于物理模拟与可视化教学并引发对互联网基础设施隐喻的讨论。
  3. 不列颠哥伦比亚省自 2026 年起永久采用夏令时以减少调时影响,但可能加剧冬季早晨黑暗并给跨境商业与航班协调带来挑战。
  4. 作者反对普遍的在线身份与年龄验证,宁可放弃服务或转向更隐私友好的替代,警示此类措施的社会与隐私成本。
  5. Apple 发布搭载 M5 Pro 与 M5 Max 的 14" 与 16" MacBook Pro,强调本地 AI 能力与性能提升,但其 AI 性能宣传可能存在夸大。
  6. Ars Technica 因记者在报道中引用经 AI 生成的捏造引语撤稿并解雇该记者,凸显新闻机构在 AI 使用与事实核验上的伦理与流程问题。
  7. 作者自建端到端语音代理通过精确的说话-倾听切换、靠近部署与多模型协同实现约 400ms 延迟,展示低延迟语音交互的可行性与安全隐忧。
  8. NanoClaw 作者因未及时建站被假站篡夺搜索排名并可能被用于诈骗,呼吁搜索引擎改进识别与排名以保护开源项目。
  9. Knuth 记录 Anthropic 的 Claude 在求解有向哈密顿循环分解问题中发现适用于奇数 m 的构造并给出证明,讨论大模型在科研中的创造性与局限。
  10. Physics Girl 回归发布视频,介绍如何通过超级神冈等探测器利用中微子对太阳成像,并分享她从长期新冠康复重返创作的经历。

Meta 智能眼镜与数据隐私争议 (Meta’s AI smart glasses and data privacy concerns) #

https://www.svd.se/a/K8nrV4/metas-ai-smart-glasses-and-data-privacy-concerns-workers-say-we-see-everything

Meta 公司推出的智能眼镜“Meta Ray-Ban Glasses”被宣传为集实时翻译、人脸识别、旅行导航等功能于一体的 AI 助手,旨在取代智能手机。然而,瑞典《每日新闻报》(Svenska Dagbladet)与哥德堡晚报(Göteborgs-Posten)联合调查发现,这些眼镜背后依赖的 AI 训练数据,大量来自远在非洲肯尼亚的外包员工。

这些员工隶属于 Meta 的外包公司 Sama,位于内罗毕的办公区。他们被称为“数据标注员”,负责人工标注图像和视频中的物体、动作、人物等信息,以训练 AI 系统。工作内容包括框选物体、标记人脸、识别场景,甚至处理敏感内容。

调查揭示,部分标注的视频素材涉及高度私密的场景,如用户在家中上厕所、更衣、亲密行为等。有员工表示,曾看到有人将眼镜放在床头柜上离开房间,随后配偶进入房间换衣服;也有员工描述有人穿着眼镜走出浴室,伴侣正裸身出现。这些画面来自真实用户的日常使用,而用户可能完全 unaware 自己正在被记录。

尽管员工签署保密协议,且面临被解雇的风险,但他们仍感到心理不适。他们坦言,每天面对的不仅是技术任务,更是他人隐私的暴露。这些“活体数据标注员”在低收入国家从事高强度、低透明度的工作,支撑着硅谷巨头的 AI 革命。

调查还指出,Meta 的 AI 系统依赖全球范围内的劳动力,而这些劳动者的存在几乎不为公众所知。技术进步的背后,是跨国数据劳动的隐秘链条。


HN 热度 1362 points | 评论 763 comments | 作者:sandbach | 1 day ago #

https://news.ycombinator.com/item?id=47225130

  • Meta 的 AI 智能眼镜在启用 AI 功能后,用户的语音、文本、图像和视频数据会被自动处理并可能被共享用于 AI 训练,此过程无法关闭。
  • 眼镜的隐私指示灯在开始录制后若被遮挡,仍可继续录制,因为检测仅在启动时进行,这使得遮挡或篡改指示灯成为可能。
  • 指示灯与光传感器共用同一孔洞,导致设计缺陷,即使关闭指示灯也无法阻止传感器误判,从而允许隐蔽录制。
  • 有用户通过钻孔破坏传感器或 LED 灯来禁用指示灯,设备虽会提示隐私灯失效,但仍允许继续录制。
  • 一些用户会故意在录制过程中用胶带或磷光贴纸遮挡指示灯,利用光传感器的延迟响应实现隐蔽录制。
  • 有观点指出,即便指示灯短暂关闭以进行传感器检测,也可能因人眼难以察觉而被忽略,但实际中因传感器响应速度限制,该方法不可靠。
  • 有人认为,与其纠结于指示灯的物理设计,不如承认现代社会已进入无处不在的监控时代,类似被殴打的风险一样,无法完全避免。
  • 也有观点强调,应继续推动社会共识,抵制此类设备的普及,类似当年抵制 Google 眼镜的成功经验。
  • 有人指出,目前市场上已有大量低成本隐蔽摄像头,远比智能眼镜更难防范,因此对眼镜的隐私担忧可能被夸大。
  • 评论认为,文章中关于数据标注和 AI 处理的描述存在混淆,未清晰区分本地处理与上传至云端进行标注的区别,可能构成误导性宣传。
  • 有用户质疑,若未主动选择参与数据标注,系统是否仍会将数据上传用于标注,文章对此未明确说明,存在信息模糊。
  • 一些人认为,Meta 的隐私政策和用户协议故意模糊处理数据用途,制造认知混淆,属于典型的“黑暗模式”设计。

XKCD 风格现在可交互了 (The Xkcd thing, now interactive) #

https://editor.p5js.org/isohedral/full/vJa5RiZWs

一个互动式图形创作工具 SketchXKCD,基于 isohedral 项目开发。用户可以操作 XKCD 非常有名的一个静态画作:互联网依赖图,这个作品将其改成了动态交互效果:用户尝试移动某些模块,看看造成什么影响。


HN 热度 1101 points | 评论 146 comments | 作者:memalign | 13 hours ago #

https://news.ycombinator.com/item?id=47230704

  • 有人建议添加 Reddit 上的程序员幽默版本,认为 AI 研究者总是让人发笑。
  • AWS 被认为凌驾于无偿开发者之上,甚至应被描绘成直接冲向开发者的鸟。
  • AWS 内部实际上大量依赖开源技术,这与“凌驾”形象形成反差。
  • 有人指出,将 AWS 描绘为“鸟”是对其在开源生态中地位的讽刺性表达。
  • 有人提到近期更新,分享了关于该图示的推文链接。
  • 鲨鱼咬断电缆的场景令人印象深刻,成为评论焦点。
  • 建议将 DNS 的支柱之一替换为 BGP,以更准确反映互联网架构。
  • NTP 作为时间同步协议,也被认为应被纳入图示中的关键组件。
  • 有人调侃“微软在做什么”这一部分是最有趣的。
  • 手摇发电机逆时针旋转的设计细节被注意到,颇具趣味。
  • 有人误以为手摇发电机是顺时针旋转,引发了一阵“反转努力”的吐槽。
  • 图中底部的单个砖块代表海底光缆,是互联网连接的关键物理基础。
  • 海底光缆虽有保护,但鲨鱼咬断事件仍可能导致区域性网络中断。
  • 尽管海底光缆有冗余设计,但单条线路的中断仍可能造成显著拥堵。
  • 卫星网络在容量和可靠性上仍无法替代海底光缆,尤其在高带宽需求场景。
  • 卫星通信受限于地面站中转,无法完全替代光纤的直接连接。
  • 星链(Starlink)卫星间的激光链路带宽有限,难以承担主要国际通信任务。
  • 与家庭 Wi-Fi 相比,光纤网络的带宽优势是数量级的差异。
  • 海底光缆的物理特性决定了其不可替代性,无线电频谱是共享资源,而光纤是独占带宽。
  • 有人质疑将海底光缆简化为“一块砖”是否过于夸张,认为其冗余设计可避免大规模中断。
  • 即使有冗余,关键光缆中断仍会导致路径重选和网络拥塞,影响性能。
  • 互联网设计本就具备容错能力,能自动绕行故障路径,不存在单一故障点。
  • 光缆中断的影响程度取决于其承载流量、其他线路的可用容量、延迟敏感性等多重因素。
  • 该图示中的海底光缆用一块砖表示,是一种夸张的艺术表达,强调其关键但脆弱的地位。
  • 有人指出,图中底部的砖块代表海底光缆,是互联网的物理基础。
  • 有人建议在当前地缘政治背景下,可加入伊朗无人机(Shahed)元素以增强现实讽刺意味。
  • 作者创作此图的动机源于其在 P5.js 课程中教授物理模拟的背景。
  • 该课程属于数字艺术项目,侧重图形在艺术与可视化中的应用,技术栈合理。
  • 作者 Craig Kaplan 来自滑铁卢大学,以发现“爱因斯坦单体”瓷砖闻名。
  • 建议将鼠标移动事件监听器绑定到 window 而非 canvas,以避免拖拽时事件丢失。
  • 这是 p5.js 中常见的陷阱,容易导致拖拽体验不流畅。
  • 在 p5.js 中,将事件绑定到 window 依然有效,因为 p5.js 是对原生 API 的封装。

不列颠哥伦比亚省将永久采用夏令时 (British Columbia is permanently adopting daylight time) #

https://www.cbc.ca/news/canada/british-columbia/b-c-adopting-year-round-daylight-time-9.7111657

British Columbia 省政府宣布将永久采用夏令时,从 2026 年 3 月 8 日起,民众将不再需要每年调整时钟。这是该省最后一次进行时钟调整,此后将不再“春向前、秋向后”。省长尹大伟表示,时钟变动带来诸多问题,包括影响儿童和家长的睡眠、宠物作息紊乱,以及增加交通事故风险。

新时间制度将被称为“太平洋时间”,与育空地区全年保持一致。东部部分原使用山地时间的社区不受此次调整影响。尽管 2019 年已有立法支持该政策,但此前因等待美国邻近州如华盛顿州、俄勒冈州和加州同步推进而延迟。目前美国国会尚未通过相关法案,但尹大伟希望邻近州能跟进。

专家指出,取消时钟变动有助于减少“全民时差”带来的健康影响,尽管此举可能引发跨边境商业和航空运营的协调挑战。部分商业团体和机场方面表示担忧,认为单方面改变时间可能造成混乱,影响跨境业务和航班调度。

2019 年的一项公众咨询显示,93% 的受访者支持全年采用夏令时,其中多数人出于健康和福祉考虑。然而,仍有 54% 的人认为与邻近司法管辖区政策一致至关重要。目前,加拿大联邦独立企业联合会等组织质疑该决策是否真正出于公共利益,怀疑其背后可能有政治动机。


HN 热度 1100 points | 评论 540 comments | 作者:ireflect | 1 day ago #

https://news.ycombinator.com/item?id=47223620

  • 永久夏令时虽然能延长傍晚的光照时间,但会导致冬季早晨长时间处于黑暗中,不利于生物钟的调节和早晨起床的自然光照。
  • 早晨的自然光对人的生理节律和心理健康至关重要,尤其在高纬度地区,冬季早晨完全黑暗会影响情绪和日常活动。
  • 尽管傍晚有更多光照,但人们更倾向于在早晨利用阳光,而不是在晚上才享受日光,尤其是在需要早起通勤的情况下。
  • 一些人认为,即使在高纬度地区,永久夏令时也会加剧冬季抑郁,因为早晨的黑暗时间过长,影响心理状态。
  • 俄罗斯曾尝试全年夏令时,但因民众不适应而取消,说明即使在高纬度地区,永久夏令时也难以被广泛接受。
  • 有些人更愿意牺牲傍晚的光照,换取早晨的自然光,以便在通勤、遛狗、购物等日常活动中获得更好的体验。
  • 永久夏令时对户外运动如骑行、攀岩等有利,因为能延长工作后的活动时间,但对早起者来说,早晨依然黑暗,缺乏光照。
  • 有人认为,傍晚的光照更适合社交活动如饮酒、阅读,而早晨的光照更有利于唤醒身体和调节生物钟。
  • 一些人对永久夏令时持欢迎态度,因为能延长夏季傍晚的光照,使下班后有更多时间进行户外活动。
  • 有人指出,即使在冬季,早晨的光照时间也因地理位置而异,高纬度地区早晨完全黑暗是普遍现象,永久夏令时会加剧这一问题。

我拒绝为任何在线服务验证身份或年龄 (I’m reluctant to verify my identity or age for any online services) #

https://neilzone.co.uk/2026/03/im-struggling-to-think-of-any-online-services-for-which-id-be-willing-to-verify-my-identity-or-age/

作者 Neil 在博客中反思了当前日益流行的在线服务身份与年龄验证政策,指出这些措施往往缺乏清晰的目标和深入的社会考量,更多是追求技术层面的“快速解决方案”。他坦言,自己目前无法想到任何愿意进行身份或年龄验证的在线服务。

他列举了自己常用的各类网络服务,包括 RSS 订阅、视频观看(通过 Jellyfin)、开源项目贡献、维基百科、Signal、Zoom/Teams 等,明确表示在这些场景下,他宁愿放弃使用相关服务,也不愿牺牲隐私和自由。例如,他可以转向离线的 Kiwix 阅读维基百科,用 XMPP 替代 Signal,或通过 Tor 访问受限内容。

对于需要身份验证的平台,如论坛、评论区、视频网站等,他并不依赖,因此影响不大。即便未来某些服务强制验证,他虽会反对,但实际可能选择退出,体现出一种“自我主导的数字孤立主义”。

最后,他承认未来或许会出现某个他极其渴望使用、不得不接受验证的服务,但目前尚无此情况。整体观点强调对隐私保护的坚持,以及对技术治理中忽视社会影响的批判。


HN 热度 859 points | 评论 527 comments | 作者:speckx | 10 hours ago #

https://news.ycombinator.com/item?id=47232768

  • 有人担忧年轻一代在数字环境中被培养成习惯性接受隐私条款,导致个人数据被过度收集,这种行为模式的普及对整体社会构成潜在危害。
  • 有人认为接受 Cookie 并不会对个人造成实质性伤害,因为单个用户的选择对商业模型影响微乎其微,因此不值得为此耗费精力。
  • 有人将隐私保护比作环保行为,虽然个体行动看似无足轻重,但集体行为累积会带来系统性影响,推动更健康的数字生态。
  • 有人指出,即使不点击 Cookie,个人数据仍可能通过其他方式被收集,因此完全避免数据泄露几乎不可能,关键在于整体系统性改变。
  • 有人认为“用钱包投票”的逻辑与“投票”类似,虽然单个选择看似无效,但集体行动能推动企业改变商业模式,体现消费者价值取向。
  • 有人强调,个体选择成本高且难以产生实际影响,因此更应支持通过政策手段(如碳税、污染税)来强制企业承担外部成本。
  • 有人建议采用类似“更新无决策理论”的思维方式,即假设自己与他人有相似决策逻辑,从而通过集体行动推动系统性改变。
  • 有人指出,消费行为不仅关乎成本,更是一种文化信号,持续支持低道德标准的企业会固化不良社会习惯,阻碍文化进步。

搭载全新 M5 Pro 与 M5 Max 芯片的 14 英寸和 16 英寸 MacBook Pro 正式发布,性能与本地 AI 能力再升级 (MacBook Pro with new M5 Pro and M5 Max) #

https://www.apple.com/newsroom/2026/03/apple-introduces-macbook-pro-with-all-new-m5-pro-and-m5-max/

Apple 今日宣布推出搭载全新 M5 Pro 与 M5 Max 芯片的 14 英寸和 16 英寸 MacBook Pro,进一步提升专业级笔记本性能与本地 AI 能力。

新芯片采用苹果自研的 Fusion 架构,将两个芯片整合为单系统,专为 AI 优化。M5 Pro 与 M5 Max 搭载全新 18 核 CPU,包含 6 个超高速核心和 12 个高性能核心,CPU 性能最高提升 30%。GPU 配备每个核心内置的神经加速器,AI 性能相比上一代 M4 系列提升最高达 4 倍,相比 M1 系列提升高达 8 倍。

新 MacBook Pro 支持本地运行大型语言模型(LLM),开发者可在设备上训练定制模型,创意工作者可利用 AI 工具进行视频剪辑、音乐制作与设计。图形性能相比 M4 系列提升最高达 50%,适合复杂 3D 场景实时渲染与视觉特效即时预览。

存储方面,M5 Pro 起始容量为 1TB,M5 Max 起始为 2TB,SSD 速度提升最高达 2 倍。统一内存带宽显著提升,M5 Pro 最高支持 64GB 内存与 307GB/s 带宽,M5 Max 可达 128GB 与 614GB/s。

配备全新 N1 无线芯片,支持 Wi-Fi 7 与蓝牙 6,连接更稳定高效。电池续航最长可达 24 小时,搭载 Liquid Retina XDR 显示屏,支持纳米纹理选项。配备 12MP Center Stage 摄像头、六扬声器沉浸式音响系统,支持 Apple Intelligence 功能与 macOS Tahoe 系统。

新 MacBook Pro 提供空间黑与银色两种配色,将于 3 月 4 日开启预购,3 月 11 日正式发售。


HN 热度 620 points | 评论 603 comments | 作者:scrlk | 10 hours ago #

https://news.ycombinator.com/item?id=47232453

  • Apple 宣传的“AI 任务快 4 倍”是基于特定测试条件,使用 140 亿参数、4 位量化模型和 8K 提示词的首次生成时间测试,不具普遍代表性。
  • 140 亿参数模型配合 4 位量化在本地运行对普通用户来说仍属小规模,难以支撑复杂 AI 任务,容易误导用户对设备性能的预期。
  • 首次生成时间(Time to First Token)是关键指标,尤其对语音助手等实时交互场景至关重要,但不能完全代表整体推理性能。
  • 本地运行大型语言模型(如 70B 参数)在 M1 Max 等设备上已可行,但性能受限,M5 系列的提升将显著改善体验。
  • Apple 可能将本地 AI 任务定位为系统级功能(如 Apple Intelligence、照片自动标记),而非通用大模型推理,因此对资源使用有严格限制。
  • 与传统游戏性能宣传类似,AI 性能宣传也存在“营销美化”现象,需警惕夸大其词的宣传手段。
  • 使用 FP16 或 BF16 精度可提升 M5 芯片矩阵运算效率,对优化本地模型推理有实际帮助。
  • 低参数模型输出质量有限,难以胜任复杂编程任务,仅适合简单脚本生成。
  • Apple 通过硬件配置限制(如内存容量)引导用户购买高端机型,存在“技术性劝退”策略。
  • 本地运行大模型时,散热和功耗问题显著,风扇噪音大,影响使用体验。
  • 未来 AI 可能实现自我组装设备,AI 效率指标将从“每秒生成多少 token”转向“每小时组装多少设备”。
  • 早期对 Apple 营销的质疑如今被部分用户视为“合理预期”,但仍有用户对宣传真实性持怀疑态度。
  • Apple 的性能测试可能未包含模型重新加载时间,存在测试条件不透明的问题。
  • M5 芯片的内存带宽提升有限,对解码阶段(decode)性能改善较小,主要提升集中在预填充阶段(prefill)。

Ars Technica 因 AI 伪造引语争议解雇记者 (Ars Technica fires reporter after AI controversy involving fabricated quotes) #

https://futurism.com/artificial-intelligence/ars-technica-fires-reporter-ai-quotes

Ars Technica 资深 AI 记者本杰·爱德华兹(Benj Edwards)因一篇包含 AI 伪造引语的报道被解雇。该文章最初于 2026 年 2 月 13 日发布,题为描述一名工程师斯科特·尚巴 ugh 被 AI 代理发布负面文章的事件。文章中引用了尚巴 ugh 的言论,但经核实,这些引语系 AI 生成,本人从未说过。

事件曝光后,Ars Technica 于 2 月 17 日发布撤稿声明,编辑总监肯·费舍尔承认这是“严重违反编辑标准”的失误,并称该错误为“孤立事件”。爱德华兹随后在社交平台 Bluesky 上公开承担责任,表示自己在生病、睡眠不足的情况下,尝试使用实验性 AI 工具(Claude Code)提取原始资料,但工具失效后转用 ChatGPT,误将 AI 生成的转述内容当作真实引语使用。他强调文章主体为人工撰写,公司政策严禁 AI 生成内容,此次事件不代表整体编辑标准。

文章发布后,读者在评论区强烈抗议,引发广泛争议。2 月 27 日,Ars 创意总监奥里奇·劳森宣布已完成内部审查,并采取相应措施。不久后,爱德华兹的个人页面从“现任记者”更新为“曾任记者”,暗示其已离职。

该事件再次凸显当前媒体行业在 AI 应用与伦理规范之间的困境:尽管 AI 被广泛推广,但缺乏清晰的使用准则。同时,新闻机构面临版权纠纷、AI 生成内容泛滥、Google“AI 摘要”功能导致流量下滑等多重挑战。此次事件也反映出,即使熟悉 AI 的从业者,仍可能在高压或疲劳状态下因 AI“幻觉”而犯下严重错误。

爱德华兹在社交平台表示,自己对准确性极为重视,此次失误“令人痛苦”。该事件成为 AI 时代新闻伦理危机的又一典型案例。


HN 热度 561 points | 评论 353 comments | 作者:danso | 23 hours ago #

https://news.ycombinator.com/item?id=47226608

  • Ars Technica 在事件中未公开说明 reporter 被解雇的细节,缺乏透明度,令人失望。
  • 报道员删除原始文章而非修正,发布模糊道歉,类似大型公司和政客的非道歉行为。
  • 报道员在 Bluesky 上的自我辩护是借口,未承认使用 AI 工具且未核实事实,推卸责任。
  • 报道员作为资深记者,明知 AI 会幻觉仍使用,责任在个人,不能归咎于制度。
  • 事件暴露了新闻机构在编辑流程上的严重缺陷,即使资深记者也应有严格审核机制。
  • 机构应承担系统性责任,不应只追究个人,尤其在记者带病工作、编辑仍催促发布的情况下。
  • 记者在高烧期间仍提交稿件,说明管理流程存在严重问题,不应只怪个人。
  • 机构拥有足够资源(如康泰纳仕母公司),却仍压缩成本,牺牲新闻质量。
  • 将资深记者比作“初级开发人员”删除生产数据库是不恰当的类比,混淆了责任主体。
  • 事件本质是记者滥用 AI 工具伪造引述,其行为不可接受,应承担后果。
  • 机构对错误的处理方式过于低调,试图让事件“自然平息”,缺乏担当。

展示 HN:我从零开始构建了一个端到端延迟低于 500 毫秒的语音代理 (Show HN: I built a sub-500ms latency voice agent from scratch) #

https://www.ntik.me/posts/voice-agent

作者 Nick Tikhonov 分享了自己在六个月内为一家大型消费品公司开发语音代理原型的经历,并由此萌生了自己构建一个低延迟语音代理系统的念头。尽管市场上已有 Vapi、ElevenLabs 等成熟的语音代理平台,但这些平台隐藏了大量底层复杂性。作者决定深入底层,亲自构建语音代理的核心协调层。

他通过实验发现,仅用约一天时间和 100 美元的 API 费用,就能搭建出一个性能优于 Vapi 的语音代理系统,端到端延迟低至约 400 毫秒,比 Vapi 快两倍。

文章核心在于揭示语音代理的真正难点:实时的“说话-倾听”状态切换。与文本对话不同,语音交互是连续的,系统必须精准判断用户何时停止说话,何时开始回应。判断失误会导致打断、延迟或沉默,严重影响体验。

作者将整个系统简化为一个“说话-倾听”状态机,核心是两个状态和两个关键转换:

  • 用户说话时,系统必须立即停止语音输出和生成;
  • 用户停止说话后,系统需快速、准确地启动响应。

他首先用 Silero VAD(语音活动检测)实现基础版本,仅通过播放预录音频验证了状态切换的可行性,建立了最低延迟基准。

但 VAD 只能识别“是否有声音”,无法判断“是否说完”。因此,他引入 Deepgram 的 Flux 流式 API,该模型能结合音频信号与实时转录文本,更准确地识别用户发言结束的时机。

最终,他构建了一个完整的流式处理管道:通过 Twilio 接收 WebSocket 音频流,使用 Silero VAD 进行初步检测,用 Deepgram Flux 进行转录与说话人切换判断,再调用大语言模型生成响应,并通过 ElevenLabs 的 TTS 模型实时合成语音输出。整个过程实现端到端流式传输,确保低延迟与自然对话感。

文章强调,语音代理的成败不在于单个模型,而在于多模型之间的时序协调。作者还指出,地理位置选择(如将服务部署在靠近用户的位置)和模型选型对延迟影响极大。

文中配有音频演示和架构图,帮助读者直观理解系统运作。作者也借此呼吁:在 AI 与语音产品开发中,理解底层机制比依赖黑盒平台更为关键。


HN 热度 548 points | 评论 152 comments | 作者:nicktikhonov | 1 day ago #

https://news.ycombinator.com/item?id=47224295

  • 人类对话中,听者开始说话的中位延迟为 0 毫秒,说明人们常在说话者未结束时就打断,这是大脑预测和即时处理回应的结果。
  • 语音助手的响应延迟普遍超过 500 毫秒,即使本地处理的简单问题也难以低于此值,主要受限于传统静音检测机制。
  • 语义层面的说话结束检测(end-of-turn detection)是实现低延迟自然对话的关键,单纯依赖静音检测效果不佳。
  • 语音交互的首次 token 生成时间(TTFT)是决定整体延迟的核心,使用高性能推理芯片(如 Groq)可显著提升响应速度。
  • 系统部署的地理位置至关重要,必须将计算资源尽可能靠近用户,否则延迟问题无法解决。
  • 电话通信中的延迟(如卫星通信)曾令人不适,这种体验影响了人们对语音助手延迟的接受度。
  • 老年人对手机通话延迟感到烦躁,因为他们习惯于无延迟的固定电话,但未必意识到延迟是原因。
  • 某些应用(如爱尔兰彩票扫码)因响应过快引发用户怀疑,说明“太快”也可能导致信任问题。
  • 信号应用的设备配对功能响应极快,部分得益于提前扫描二维码,而非等待精确对齐。
  • 不同文化背景对对话中抢话、轮流说话的接受度差异大,可能引发沟通摩擦。
  • 语音助手的快速响应可能引发用户对真实性的怀疑,例如系统反应过快时用户会怀疑是否出错。
  • 语音助手的普及受限于计算资源和安全风险,大规模部署需要大量 GPU 支持。
  • 语音助手涉及控制真实世界设备(如开关炉灶、车库门),必须有严格的安全防护机制,不能轻易出错。
  • 语音助手的商业价值有限,基础查询(如时间、天气)难以带来高利润,导致厂商缺乏动力。

我正在输掉自己开源项目的 SEO 竞争。(I’m losing the SEO battle for my own open source project) #

https://twitter.com/Gavriel_Cohen/status/2028821432759717930

Gavriel Cohen 是开源项目 NanoClaw 的创建者,他在社交平台 X(原 Twitter)上发表了一篇关于谷歌搜索问题的长文,表达了对谷歌搜索结果的不满。他指出,当人们在谷歌搜索 “NanoClaw” 时,排名第二的竟然是一个虚假网站(nanoclaw.net),而他的真实官方网站却没有出现在前几页的搜索结果中。

在文中,Cohen 讲述了 NanoClaw 自 2 月 2 日发布以来的快速成长,项目获得了广泛关注和许多 GitHub 星标,但由于他最初没有建立网站,导致一个人抓取了他的 README 信息并创建了一个虚假网站。尽管这个网站包含错误信息,并且有广告,很多用户却误以为这是官方网站。

为了解决这个问题,Cohen 在两周前建立了一个正式网站,并进行了大量的 SEO 优化工作,包括将网站链接添加到 GitHub 页面、向 Google Search Console 提交、发布博客文章、翻译网站等。但尽管他采取了这些措施,谷歌依然将虚假网站排名靠前,导致他失去了对自己项目的控制。

Cohen 强调这不仅是一个 SEO 问题,更是谷歌搜索的根本问题。他反对仅仅依靠优化技术或购买广告来争夺搜索排名,认为这些都不是解决方案。他担心虚假网站可能会被用来传播恶意软件或进行网络诈骗,而谷歌作为信息的主要入口,却无法识别出哪个网站才是合法的。

他指出,谷歌在处理这种明确的信息时都无法给出正确答案,这让人们对谷歌在提供其他重要信息(如医疗、金融等)时的可靠性产生疑问。Cohen 表达了他希望能专注于代码开发和社区建设,而不是陷入与谷歌的 SEO 战争。他呼吁谷歌提升其搜索算法的准确性,以确保用户能够找到真正可靠的信息。

最后,他提醒用户,如果访问了 nanoclaw.net,那不是他们的官方网站,真实的网站链接是他所提供的。


HN 热度 424 points | 评论 218 comments | 作者:devinitely | 10 hours ago #

https://news.ycombinator.com/item?id=47232158

  • 有人主动提出免费帮助作者修复 SEO 问题,建议通过联系曾链接到虚假网站的媒体进行修正,这是快速见效的策略。
  • 建议作者立即在 Google Search Console 中验证并提交 nanoclaw.dev 的站点地图,这是基础但关键的步骤。
  • 虚假网站的反向链接较少,说明当前局面仍有挽回余地,作者仍有机会通过主动行动扭转局势。
  • 作者的 GitHub 仓库拥有大量高质量反向链接,应主动联系这些来源,请求更新链接至真实网站,增强权威性。
  • 建议为项目创建 Twitter/X、LinkedIn 等社交平台账号,并使用组织和 sameAs 结构化数据标记,帮助搜索引擎建立项目知识图谱。
  • 作者在 Hacker News 帖子中链接的是推文而非官网,若能添加官网链接,将极大提升网站权威性,建议在合规前提下尝试。
  • 有人质疑 Google 本应作为信息发现工具,却要求开发者耗费大量个人时间去修复本应由其解决的 SEO 问题,感到不公。
  • 认为 Google 的商业模式本质是服务广告客户而非用户,其算法可能更倾向于推广能带来广告收益的内容,而非真实信息。
  • 指出 Google 并非“破坏”了 SEO,而是整个互联网竞争环境使然,个人必须主动出击才能在搜索引擎中占据一席之地。
  • 强调 SEO 优化并非靠工具或代理能解决,因为这些工具和机构也无法掌握 Google 内部的排名逻辑,无法真正突破困境。
  • 建议从项目初期就建立正式网站,因为 Google 倾向于信任长期存在的网站,后期再建难以追上已有的“垃圾网站”网络。

克莱德的循环 [pdf] (Claude’s Cycles [pdf]) #

https://www-cs-faculty.stanford.edu/~knuth/papers/claude-cycles.pdf

这篇论文由斯坦福计算机科学系的 Donald Knuth 撰写,记录了他目睹人工智能解决一个长期悬而未决的数学问题的经历。

Knuth 一直在研究一个有向哈密顿循环的分解问题:考虑一个有 m³ 个顶点的有向图,每个顶点标记为 ijk(其中 0≤i,j,k<m),每个顶点有三条出弧分别指向 i+jk、ij+k 和 ijk⁺(这里 i⁺ 表示(i+1) mod m)。问题是能否将所有弧分解为三个有向 m³-循环,适用于所有 m>2 的情况。Knuth 本人只解决了 m=3 的情形,他的朋友 Filip Stappers 通过计算验证了 4 到 16 之间的解存在,但一般构造仍然未知。

Stappers 将这个问题提交给 Anthropic 的混合推理模型 Claude Opus 4.6。Claude 经历了 31 次系统性的探索才找到答案。它首先尝试简单的线性或二次函数方法失败,然后尝试深度优先搜索发现计算量过大,接着研究二维和三维蛇形模式,引入纤维分解概念,尝试模拟退火算法寻找规律。最终 Claude 发现对于奇数 m,存在一种简洁的构造方法:根据 s=(i+j+k) mod m 的值以及 i、j 是否处于边界(0 或 m-1)来决定状态转移方向。

Knuth 随后为这个构造提供了严格的数学证明,证实三个循环确实都是哈密顿循环且覆盖了所有顶点。他还定义了"可推广循环"的概念,发现在 m=3 时的 11502 个哈密顿循环中,有 996 个可以推广到所有大于 1 的奇数 m。依赖于 i、j、s 边界状态的"Claude-like"分解共有 760 种,其中 Claude 发现的只是其中之一。

对于偶数 m,问题仍然开放。已知 m=2 不可能,Claude 找到了 m=4、6、8 的具体解但无法给出一般构造,后续尝试也未能成功。

整个解题过程历时约一小时,Knuth 认为这展示了自动推理和创造性问题解决的显著进步,尽管 Claude 在偶数情形中最终陷入困境,但这次成功仍然令人印象深刻。


HN 热度 412 points | 评论 196 comments | 作者:fs123 | 13 hours ago #

https://news.ycombinator.com/item?id=47230710

  • 生成式 AI 模型通过概率分布固化了人类专家的知识模式,使普通人也能高效利用复杂问题的解决方法,专家则能更精准地引导模型输出。
  • 随着科学边界不断扩展,模型更新面临挑战:持续学习需极大上下文窗口,而持续训练成本过高,难以跟上前沿发展。
  • 开源模型本质上是“时间胶囊”,其知识存在固定截止点,无法动态获取新信息。
  • 当前大模型不具备在有意义时间尺度上存储新信息的能力,因此不能被视为真正意义上的智能体。
  • 从宏观时间尺度看,大模型可能构成一种极其缓慢的“振荡智能”,通过不断吸收和再利用信息实现某种形式的自我演化。
  • 大模型虽无持续记忆能力,但其上下文窗口在实际应用中已足够支持复杂任务,这与“智能”定义并不矛盾。
  • 患有顺行性遗忘症的患者无法形成新记忆,但依然具备解决问题的能力,这与大模型的运作机制有相似之处。
  • 人类大脑中存在不依赖海马体的记忆系统,如运动技能学习,这表明即使在记忆功能受损的情况下,智能仍可部分保留。
  • 大模型缺乏生物大脑的实时神经可塑性,无法像人类一样通过感官输入持续重构自身,因此在智能维度上仍存在本质差异。
  • 对“智能”的定义本质上是社会建构,不同立场的人基于自身目的赋予其不同含义,争论往往源于权力与价值观的博弈。
  • 人工智能讨论陷入非此即彼的二元对立,缺乏对技术本质的深入反思,也未能跳出传统哲学框架。
  • 从系统视角看,虽然不存在绝对的“智能”阈值,但生物智能具备一系列可识别的特征,大模型尚未完全具备这些特征。

物理女孩:超级神冈探测器——通过探测中微子成像太阳 (Physics Girl: Super-Kamiokande – Imaging the sun by detecting neutrinos [video]) #

https://www.youtube.com/watch?v=B3m3AMRlYfc

这是一个由物理女孩(Physics Girl)发布的 YouTube 视频,标题为《我三年来的第一支科学视频》。视频发布于 2026 年 3 月 3 日,时长约为 14 分 40 秒,已获得 44.4 万次观看。

视频内容围绕一个令人困惑的科学现象展开:一张看似在夜晚拍摄的照片,却呈现出白天的光照效果。Dianna Cowern(物理女孩)作为创作者,以她一贯的探索风格,通过实验和物理原理揭示这一现象背后的科学解释,引发观众对光、时间与视觉感知的思考。

Dianna 是麻省理工学院物理学背景的科学传播者,曾长期与 PBS 数字工作室合作,后回归独立创作。此次视频是她因严重长期新冠(Long COVID)休养三年后的首次回归之作,具有特殊意义。

视频中展示了多个科学图像与实验,包括来自超级神冈探测器(Super-Kamiokande)和 NASA 的影像资料,配乐为 Jingle Punks 的《On the Bach》。视频结尾附有感谢名单,特别鸣谢了“X 射线层级” Patreon 赞助者。

该视频不仅是一次科学知识的分享,也传递了坚持与康复的积极信息,体现了科学探索中的好奇心与韧性。


HN 热度 400 points | 评论 61 comments | 作者:pcdavid | 9 hours ago #

https://news.ycombinator.com/item?id=47233110

  • Dianna 在经历长期新冠后病情曾有好转,但随后恶化,目前似乎正在逐步恢复,希望她能保持当前状态。
  • ME/CFS(包括由新冠引发的)病情具有波动性,可能反复甚至危及生命,Dianna 曾接受实验性治疗如星状神经节阻滞,帮助她实现过阶段性恢复。
  • 希望 Dianna 能维持更高的健康基线,同时避免因过度劳累引发的运动后不适(PEM)症状加重。
  • Dianna 的丈夫在她患病期间表现出极大的支持与担当,令人敬佩。
  • 看到 Dianna 重新投入科学传播工作,令人欣慰

Hacker News 精彩评论及翻译 #

I’m reluctant to verify my identity or age for any… #

https://news.ycombinator.com/item?id=47233421

I was sitting in a room the other day with a young adult, we were searching for additional algorithm learning materials. They searched in Google, and accept the cookies. They clicked on a website, and accepted those cookies too. They then started entering their email address to access another service. I was completely taken aback.

I’m the sort of person that either rejects the cookies, or will use another site entirely to avoid some weird dark-pattern cookie trickery. I don’t like the idea of any particular service getting more information than they should.

Siting there I realized, we were not the real target. It is the young people that are growing up conditioned to press accept, enter any details asked of them, and to not value their personal data. Sadly, the damage is already done.

bArray

前几天,我和一个年轻人坐在房间里,我们一起在寻找额外的算法学习资料。他们在谷歌上搜索,然后接受了cookies。他们点击了一个网站,又接受了那些cookies。接着,他们开始输入自己的电子邮箱地址来访问另一个服务。我感到非常震惊。

我这种人要么会拒绝cookies,要么会直接换一个网站,以避免那些奇怪的、带有诱导性的cookie小把戏。我不希望任何特定的服务获取超出其应有范围的信息。

坐在那里,我突然意识到,我们(像我这样的人)才是真正的目标。那些从小就习惯于点击“接受”、对任何要求提供的信息都照做、并且不重视自己个人数据的年轻人,才是他们真正的目标。可悲的是,伤害已经造成了。


British Columbia is permanently adopting daylight … #

https://news.ycombinator.com/item?id=47225452

Instinctively, I think morning light is important to our biology for a daily reset

I’d bet people would happily trade away the inkling of light they get during their winter commute before locking themselves into their office for some extra daylight when they leave that office.

Daylight is most enjoyable if you can actually make use of it.

jorvi

直觉上,我认为晨光对我们的生物钟进行每日重置非常重要。 我敢打赌,人们会很乐意把冬天通勤时得到的那一点点微光,换成离开办公室后多一些的日照。 白天的阳光,只有在你能真正利用它的时候,才最让人享受。


The Xkcd thing, now interactive #

https://news.ycombinator.com/item?id=47231471

I would suggest adding the /r/ProgrammerHumor version too: https://www.reddit.com/r/ProgrammerHumor/comments/1p204nx/actuallycompleteversion/

The AI crank always cracks me up.

BoppreH

我也建议加上 /r/ProgrammerHumor 版本的:https://www.reddit.com/r/ProgrammerHumor/comments/1p204nx/actuallycompleteversion/

那个 AI 狂人总是把我逗笑。


I’m losing the SEO battle for my own open source p… #

https://news.ycombinator.com/item?id=47232961

A couple years back John Reilly posted on HN “How I ruined my SEO” and I helped him fix it for free. He wrote about the whole thing here: https://johnnyreilly.com/how-we-fixed-my-seo

Happy to do the same for you if you want.

The quickest win in your case: map all the backlinks the .net site got (happy to pull this for you), then email every publication that linked to it. “Hey, you covered NanoClaw but linked to a fake site, here’s the real one.” You’d be surprised how many will actually swap the link. That alone could flip things.

Beyond that there’s some technical SEO stuff on nanoclaw.dev that would help - structured data, schema, signals for search engines and LLMs. Happy to walk you through it.

update: ok this is getting more traction than I expected so let me give some practical stuff.

  1. Google Search Console - did you add and verify nanoclaw.dev there? If not, do it now and submit your sitemap. Basic but critical.

  2. I checked the fake site and it actually doesn’t have that many backlinks, so the situation is more winnable than it looks.

  3. Your GitHub repo has tons of high quality backlinks which is great. Outreach to those places, tell the story. I’m sure a few will add a link to your actual site. That alone makes you way more resilient to fakers going forward. This is only happening because everything is so new. Here’s a list with all the backlinks pointing to your repo:

https://docs.google.com/spreadsheets/d/1bBrYsppQuVrktL1lPfNm5GHa2AcmxPpxSurSAnjSXeg/edit?usp=sharing

  1. Open social profiles for the project - Twitter/X, LinkedIn page if you want. This helps search engines build a knowledge graph around NanoClaw. Then add Organization and sameAs schema markup to nanoclaw.dev connecting all the dots (your site, the GitHub repo, the social profiles). This is how you tell Google “these all belong to the same entity.”

  2. One more thing - you had a chance to link to nanoclaw.dev from this HN thread but you linked to your tweet instead. Totally get it, but a strong link from a front page HN post with all this traffic and engagement would do real work for your site’s authority. If it’s not crossing any rule (specific use case here so maybe check with the mods haha) drop a comment here with a link to nanoclaw.dev. I don’t think anyone here would mind if it will get you few steps closer towards winning that fake site

Growtika

几年前 John Reilly 在 Hacker News 上发了一篇名为“我如何搞砸了我的SEO”的文章,我免费帮他修复了。他在这里写了整个事情的经过:https://johnnyreilly.com/how-we-fixed-my-seo

如果你需要,我也很乐意为你效劳。

对你来说,最快见效的办法是:整理出 .net 网站获得的所有反向链接(我可以帮你提取),然后给所有链接到它的出版物发邮件。“嘿,你们报道的是 NanoClaw,但链接到了一个假网站,这里是正确的。” 你会发现,真的会有很多愿意更换链接。仅此一举就可能扭转局势。

除此之外,nanoclaw.dev 上还有一些技术性的SEO优化可以提供帮助——比如结构化数据、模式标记(Schema)、面向搜索引擎和大型语言模型的信号。我也很乐意为你一步步讲解。

更新: 好吧,这比我预想的要火,让我再提供一些实操性建议。

  1. Google Search Console - 你有没有在 Google Search Console 中添加并验证 nanoclaw.dev?如果还没有,现在就去操作,并提交你的网站地图。这是基础但至关重要的一步。
  2. 我检查了那个假网站,发现它其实反向链接并不多,所以情况比看起来更有希望。
  3. 你的 GitHub 仓库有很多高质量的反向链接,这很棒。去联系那些地方,讲讲你的故事。我相信有些会给你真正的网站加个链接。这会让你未来更能抵御那些造假者。之所以会发生这种事,只是因为一切都太新了。这里是所有指向你仓库的反向链接列表: https://docs.google.com/spreadsheets/d/1bBrYsppQuVrktL1lPfNm5GHa2AcmxPpxSurSAnjSXeg/edit?usp=sharing
  4. 为这个项目开设社交资料 - Twitter/X,LinkedIn 主页(如果需要)。这有助于搜索引擎构建一个围绕 NanoClaw 的知识图谱。然后在 nanoclaw.dev 上添加 Organization 和 sameAs 模式标记,将所有点连接起来(你的网站、GitHub 仓库、社交资料)。这就是在告诉谷歌:“这些都属于同一个实体。”
  5. 还有一件事——你本来有机会在这个 HN 帖子里链接到 nanoclaw.dev,但你却链接到了你的推文。我完全理解,但来自首页 HN 帖子、有这么多流量和互动的强力链接,对你网站的权重会很有帮助。如果这不违反任何规定(具体情况特殊,哈哈,最好还是问问版主),可以在下面评论一下,附上 nanoclaw.dev 的链接。我相信这里不会有人介意,如果这能让你在战胜那个假网站的道路上更进一步的话。

Ars Technica fires reporter after AI controversy i… #

https://news.ycombinator.com/item?id=47228363

Journalists and bloggers usually write about others’ mess ups and apologies, dissecting which apologies are authentic and which apologies are non-apologies.

In this incident, Aurich Lawson of Ars Technica deleted the original article (which had LLM hallucinated quotes) instead of updating it with the error. He then published a vague non-apology, just like large companies and politicians usually do. And now we learn that this reporter was fired and yet Ars Technica doesn’t publish a snippet of an article about it.

There’s something to be said about the value of owning up to issues and being forthright with actions and consequences. In this age of indignation and fear of being perceived as weak or vulnerable due to honesty, I would’ve thought that Ars would be or could’ve been a beacon for how things should be talked about.

It’s sad to see Ars Technica at this level.

AnonC

记者和博主们通常热衷于报道他人的失误与道歉,剖析哪些是真诚的道歉,哪些又不过是敷衍了事的“伪道歉”。

在此次事件中,Ars Technica 的 Aurich Lawson 删除了那篇包含 LLM(大型语言模型)生成错误引述的原始文章,而不是更正错误。随后,他发布了一份含糊其辞的“伪道歉”,这和大公司、政客们惯用的手段如出一辙。而现在我们得知,这位记者已经被解雇,但 Ars Technica 却对此事只字不提。

坦诚面对问题、坦率地承担行为与后果,其价值不言而喻。在这个充满愤怒、又因害怕被视为软弱或坦率而暴露脆弱的时代,我原以为 Ars Technica 应当,或者说本可以,成为如何正确处理此类事件的典范。

看到 Ars Technica 沦落至此,令人深感遗憾。


British Columbia is permanently adopting daylight … #

https://news.ycombinator.com/item?id=47224234

I’m in BC. The astro-nerd in me would have preferred to see permanent Standard Time instead of a permanent +1 offset. Instinctively, I think morning light is important to our biology for a daily reset and the solar cue of “high noon” is also a real thing. I’m sure I’ve read that sleep health experts have historically supported a change to permanent Standard Time, not DST.

I respect there are economic arguments for permanent DST. But I question the road safety stat I hear with announcements like this. Kids walking, biking, and being driven to school in mornings in darkness … that’s also what permanent DST gives us.

Oh well, I am in the minority it seems. So R.I.P. “high noon” … I’ll never see you again here. And, yes, I understand that depending on where one is within a time zone, a true “high noon” is only in theory. But it’s a nice ideal. :-)

emptybits

我在BC省。我内心那个天文爱好者,宁愿看到永久性的标准时间,而不是永久性的+1小时时差。凭直觉,我认为晨光对我们的生物钟重置很重要,而“正午”的太阳信号也是真实存在的。我敢肯定我读到过,睡眠健康专家历来都支持改为永久标准时间,而不是夏令时。

我尊重支持永久夏令时的经济论点。但我对听到的这类公告中的道路安全统计数据表示质疑。孩子们在清晨的黑暗中步行、骑车或乘车上学……这也是永久夏令时带给我们的。

唉,看来我是少数派了。所以,“正午”就此安息吧……我再也见不到你了。而且,是的,我明白,在一个时区内,真正的“正午”理论上只存在于一个点。但这是一个美好的理想。


Show HN: I built a sub-500ms latency voice agent f… #

https://news.ycombinator.com/item?id=47226535

Oh, this is really interesting to me. This is what I worked on at Amazon Alexa (and have patents on).

An interesting fact I learned at the time: The median delay between human speakers during a conversation is 0ms (zero). In other words, in many cases, the listener starts speaking before the speaker is done. You’ve probably experienced this, and you talk about how you “finish each other’s sentences”.

It’s because your brain is predicting what they will say while they speak, and processing an answer at the same time. It’s also why when they say what you didn’t expect, you say, “what?” and then answer half a second later, when your brain corrects.

Fact 2: Humans expect a delay on their voice assistants, for two reasons. One reason is because they know it’s a computer that has to think. And secondly, cell phones. Cell phones have a built in delay that breaks human to human speech, and your brain thinks of a voice assistant like a cell phone.

Fact 3: Almost no response from Alexa is under 500ms. Even the ones that are served locally, like “what time is it”.

Semantic end-of-turn is the key here. It’s something we were working on years ago, but didn’t have the compute power to do it. So at least back then, end-of-turn was just 300ms of silence.

This is pretty awesome. It’s been a few years since I worked on Alexa (and everything I wrote has been talked about publicly). But I do wonder if they’ve made progress on semantic detection of end-of-turn.

Edit: Oh yeah, you are totally right about geography too. That was a huge unlock for Alexa. Getting the processing closer to the user.

jedberg

哦,这对我来说真的很有趣。这正是我在亚马逊Alexa上做的工作(而且我为此申请了专利)。

我当时学到的一个有趣事实是:对话中人类说话者之间的中位数延迟是0毫秒(零)。换句话说,在许多情况下,听者在说话者说完之前就开始发言了。你可能经历过这种情况,并谈论过你们如何“异口同声地接话”。

这是因为在你听对方说话时,你的大脑正在预测他们会说什么,并同时处理一个回答。这也是为什么当他们说出你没有预料到的话时,你会说“什么?”,然后在大脑修正信息后,过半秒才回答。

事实二:人类期望他们的语音助手有延迟,有两个原因。一个原因是他们知道这是一台需要思考的电脑。第二个原因是手机。手机有内置延迟,这种延迟会打断人与人之间的对话,你的大脑会把语音助手看作像手机一样。

事实三:Alexa几乎没有任何响应时间低于500毫秒。即使像“现在几点了”这种在本地服务的响应也是如此。

语义性的对话轮次结束是这里的关键。这是我们在几年前就在研究的东西,但当时没有足够的计算能力来实现它。所以至少在当时,对话轮次的结束就是300毫秒的沉默。

这太棒了。我离开Alexa项目已经有一段时间了(我所做的所有工作也都公开讨论过)。但我确实想知道他们在对话轮次结束的语义检测方面是否取得了进展。

编辑:哦,是的,关于你说的地理因素,你说的完全正确。这对Alexa来说是一个巨大的突破。将处理过程更靠近用户。


Meta’s AI smart glasses and data privacy concerns #

https://news.ycombinator.com/item?id=47228598

I don’t understand how a parent can be OK non-consenually uploading pictures of their children’s real faces to an ad driven AI company famous for abusing people’s data and manipulating children on their platforms.

greentea23

我不明白为什么父母会同意未经同意就上传他们孩子的真实照片给一个以广告驱动的AI公司,这家公司以滥用人们的数据和在其平台上操控儿童而闻名。


MacBook Air with M5 #

https://news.ycombinator.com/item?id=47238238

“it has no annoying fans”

I beg to differ ;)

noman-land

它没有烦人的风扇 恕我不同意;)


iPhone 17e #

https://news.ycombinator.com/item?id=47223667

People make fun of me but I’ll never skip a chance to complain about how large these phones are. I hate it so much. I have a standard iPhone, not a max, and it causes real pain in my wrist if I use it too much. Was honestly thinking about downgrading to the last SE model even though it’s several years out of date.

danielvaughn

虽然人们总拿我开玩笑,但我绝不会放过任何机会抱怨这些手机太大了。我真的太讨厌了。我用的是标准版iPhone,不是Max版,用得太多的话手腕真的会疼。我真的在考虑要不要换成上一代的SE型号,即便它已经好几年没更新了。


“Microslop” filtered in the official Microsoft Cop… #

https://news.ycombinator.com/item?id=47217165

What community is there to house around Microsoft Copilot? Seriously, why does Microsoft Copilot need a Discord Server? What do I talk about when I join the Microsoft Copilot server? What are we doing here?

quadruple

Microsoft Copilot 还需要一个什么样的社区?说真的,Microsoft Copilot 要 Discord 服务器做什么?我加入了 Microsoft Copilot 的服务器能聊什么?我们在这里做什么?