2025-09-25 Hacker News Top Stories #
- 媒体把普通短信诈骗吹成“特勤局SIM农场间谍案”,其实是匿名信源喂料的宣传闹剧。
- 民间工程师把罚单数据“地图化”逼政府拔线,透明尝试刚上线就被掐断。
- 网页不让复制文字,开发者省成本,用户却被逼截图OCR,体验倒退十年。
- 小团体被大系统吞并,陶哲轩提醒:没有草根,个人就只剩孤独和官僚。
- 美航联手想砍掉退票、选座等四项乘客权利,去监管口号背后是更贵的机票。
- 一名匿名工程师用业余时间把《博德之门3》原生搬上Steam Deck,Larian直接转正还帮他挡网暴。
- 欧盟年龄验证只给手机做App,没电脑版,直接把没智能机的用户开除“网籍”。
- Qwen3-VL一口气能读百万token、看懂视频还能帮你点屏幕,国产多模态模型冲到最前排。
- 英团队首次用基因疗法“静音”亨廷顿病基因,三年试验让病情减速七成,2026年有望上市。
That Secret Service SIM farm story is bogus #
https://cybersect.substack.com/p/that-secret-service-sim-farm-story
这篇文章的主要论点是,最近美国特勤局(Secret Service)宣称揭露了一起重大的国家安全威胁,但实际上,这只是一个普通的犯罪行为,涉及大规模的 SIM 卡农场,用于发送垃圾短信或转发国际电话。作者罗伯特・格雷厄姆(Robert Graham)认为,特勤局对事件的描述存在夸大成分,实际上他们所发现的只是常见的犯罪活动。
文章指出,特勤局的调查是因为有人通过 SMS 信息向政治人物发送威胁,这个罪犯使用了这些 SIM 农场来隐藏信息来源。在追查信息来源时,特勤局使用了无线 “三角测量” 技术,最终发现了这些 SIM 农场。
作者进一步批评《纽约时报》等主要新闻媒体在报道此事件时,依赖于匿名官员的说法,并没有进行深入的质疑。他认为这种匿名报道是华盛顿政治游戏的一部分,意在传播政府的宣传而不需要承担责任。此外,作者质疑特勤局的真实性,认为他们实际上明白这只是普通的 SIM 农场犯罪,而故意将其描述为国家安全威胁。
他提到,特勤局的声明中使用了正确的技术术语,显示出他们对 SIM 农场犯罪的了解。他们的声明内容显得夸张,例如声称将可能在其他城市找到类似的 SIM 农场,这表明他们知道这只是正常的犯罪活动。
此外,作者提到《纽约时报》通常会引用一些特定的 “专家” 来确认其报道,例如詹姆斯・刘易斯(James A. Lewis)和安东尼・费朗特(Anthony Ferrante)。这些专家的观点在文章中被指责为不切实际,尤其是费朗特声称这种情况可能涉及间谍活动,而刘易斯则声称只有少数国家能够实施这样的操作。作者反驳说,实际上,任何有一定资金的人都可以建立这样的 SIM 农场。
文章详细解释了 SIM 农场的运作方式,指出 SIM 卡并不是普通手机的组成部分,而是一个能支持多个 SIM 卡的计算机系统。作者认为,特勤局将这一事件描述为国家安全威胁,实际上只是为了抬高事件的严重性,误导公众。
最后,作者总结道,事件的真实情况是,这是一种普通的犯罪活动,使用 SIM 农场进行各种目的,主要是发送垃圾短信。特勤局的参与是因为有人利用这些服务来隐藏对政治人物的威胁信息,而并非真正的国家安全或间谍威胁。
HN 热度 978 points | 评论 557 comments | 作者:sixhobbits | 16 hours ago #
https://news.ycombinator.com/item?id=45357693
- 匿名消息源在新闻报道中是长期存在的实践,尤其在涉及执法或敏感政治议题时,只要符合编辑标准并经过核实,不应被全盘否定。
- 尽管匿名消息源可能被用于政治操控或传播虚假信息,但将其等同于普遍的“宣传”是过度简化,许多重大真相的揭露都依赖此类报道。
- 将匿名消息源的使用视为“华盛顿游戏”或系统性腐败,忽视了其在保护消息提供者、获取关键信息方面的必要性。
- 一些匿名消息源的动机值得质疑,尤其是在涉及机密调查时,若消息源本不应公开信息,其发言可能构成违反职责,属于官方泄密而非真相揭露。
- 某些报道中对地理距离的描述(如“35 英里内”)存在明显误导,因该距离覆盖整个曼哈顿,缺乏实际意义,暗示报道内容可能为刻意渲染。
- 一些评论者指出,即使报道内容属实,其表达方式仍可能误导公众,使人们难以批判性思考,从而削弱对信息真实性的判断力。
- 有观点认为,媒体在报道涉及国家安全的事件时,若仅依赖匿名消息源而无实质证据,容易被政府操控或误导,应保持高度警惕。
- 一些人引用“盖尔-曼 amnesia”现象,指出公众对媒体的批判性思维存在偏差,既可能过度信任媒体,也可能因个别事件而全盘否定其公信力。
- 有评论强调,即使媒体在其他事件中表现公正,也不能保证其在当前事件中不受政府影响,需具体分析每篇报道的证据与逻辑。
Yt-dlp: Upcoming new requirements for YouTube downloads #
https://github.com/yt-dlp/yt-dlp/issues/14404
yt-dlp 将迎来重大更新,从不久后开始,用户需安装 Deno(或其它受支持的 JavaScript 运行时)以继续正常下载 YouTube 视频。原因在于 YouTube 近期更新了其 JavaScript 验证机制,原有的内置 JS 解释器已无法应对,必须依赖更强大的 JavaScript 运行环境。
为确保兼容性,不同安装方式的用户需采取相应措施:
- 使用官方 PyInstaller 打包的可执行文件(如 yt-dlp.exe、yt-dlp_macos 等):无需额外操作,只要安装 Deno 即可。
- 通过 PyPI 安装(如 pip、pipx):需运行
pip install -U "yt-dlp[default]"
安装默认可选依赖。 - 使用官方 zipimport 二进制文件(Unix 系统):需使用新标志允许 Deno 下载 npm 依赖,或手动在 Python 环境中安装 JS 求解包(具体命令待定)。
- 第三方包用户(如 brew、pacman):取决于各自包管理器的更新策略,可参考上述方法。
目前仅 Deno 被明确支持,因其具备安全沙箱机制,能有效隔离不受信任的 JavaScript 代码。未来可能支持 Node.js 或 Bun,但因安全风险尚在评估中。
Deno 可直接下载单文件可执行程序,无需复杂安装,可与 yt-dlp 放在同一目录使用。新功能将通过 --js-runtimes
参数指定路径,该参数名称仍可能变动。
此变更可能影响 32 位系统用户,因官方暂未提供 x86 构建版本,未来支持情况有待确认。
HN 热度 917 points | 评论 450 comments | 作者:phewlink | 12 hours ago #
https://news.ycombinator.com/item?id=45358980
- YouTube Premium 的下载功能在 iOS 设备上经常失效,导致用户无法顺利下载视频,影响离线观看体验。
- 有用户因官方应用下载失败而改用 yt-dlp 工具下载视频,再通过 USB 传输到设备播放,解决了实际问题。
- 一些用户为摆脱官方应用的限制,购买二手安卓平板并刷入 LineageOS 系统,使用 VLC 或 NewPipe 等第三方应用实现更稳定的离线视频管理。
- NewPipe 和 SkyTube 等开源 YouTube 客户端在下载和播放方面表现优于官方应用,且支持更多自定义功能。
- 有用户指出 VLC 在 iOS 上缺乏画中画(PiP)支持,严重影响使用体验,但开源社区对功能改进持开放态度。
- 一些用户对 Tidal 等音乐流媒体服务的下载机制表示不满,包括下载失败后无法清理队列、离线无法访问内容等问题。
- 尽管 Tidal 提供 DRM-free 下载,但其官方应用体验差,用户因“懒得取消订阅”而继续使用。
- 有用户批评大公司产品设计忽视用户体验,工程师被要求用“金钱价值”来证明功能改进的合理性,导致产品质量下降。
- 产品问题长期存在,根本原因在于企业更关注用户留存和股价,而非实际使用体验,尤其在市场垄断或用户技术素养不高的情况下。
- 一些用户希望未来能使用 Linux 手机,但受限于 CarPlay 和 Android Auto 等生态依赖,尚未找到完全替代方案。
- GNOME Maps 等开源应用已能满足日常导航需求,用户对苹果 CarPlay 的依赖正在减弱。
Find SF parking cops #
这是一个由 Riley Walz 开发的独立项目,名为“Find My Parking Cops”,旨在揭示旧金山停车执法的实时动态。该网站通过逆向工程旧金山政府的停车罚单系统,实时展示每位停车执法人员最近开具罚单的位置。
项目灵感来源于苹果的“查找我的”(Find My)功能,但并非与苹果或旧金山市政府有关。它通过抓取并分析政府公开的罚单数据,以地图形式呈现执法热点区域,帮助公众了解执法行为的分布和频率。
然而,由于旧金山政府在该项目上线数小时内迅速更改了数据接口,导致作者无法继续获取实时数据,项目目前处于无法更新的状态。
该页面还包含一个“排行榜”(Leaderboard)功能,曾用于展示开具罚单最多的执法人员,但因数据中断而失效。作者在文中详细说明了数据获取的技术实现方式,并强调该项目仅为信息透明化尝试,不具官方性质。
HN 热度 816 points | 评论 451 comments | 作者:alazsengul | 1 day ago #
https://news.ycombinator.com/item?id=45350690
- 该网站因 SF 政府迅速反应而下线,无法再获取数据。
- 票据编号的规律可能是基于模 7 的校验位算法,用于检测输入错误。
- 类似于 ID 号能被 13 整除的现象,可能是为了检测单个数字错误或相邻数字互换。
- 模 11 常被用于银行系统作为校验位,能有效检测错误。
- 对于两位数校验,常使用模 97,可检测所有单数字错误和大多数相邻数字互换。
- 票据编号的校验位设计能有效检测 85.7% 的错误,提高数据准确性。
- 网站作者还开发了其他类似项目,如 bop-spotter,具有讽刺意味。
- 网站使用“Orchestra”作为音频来源,实为对监控技术的讽刺。
- 该网站利用了名为 Orchestra 的监控系统 API,而非自建硬件。
- 公开警察实时位置存在风险,可能危及公共安全人员。
- 公共安全人员不应有隐私期待,此类公开有助于监督和问责。
- SF 停车执法人员并非正式警察,无执法权,仅能开具罚单和指挥交通。
- 虽然隶属于交通机构,但并不意味着不具有警察属性,类似州交通警察也属交通机构。
- 跟踪邮政员工位置虽有用,但实时公开个人位置可能过度侵犯隐私。
- 跟踪快递员位置有助于提升效率,但应关注整体服务而非个人绩效。
Just let me select text #
https://aartaka.me/select-text.html
本文是 Artyom Bologov 的一篇博客文章,题为《Just Let Me Select Text》,核心观点是:禁止用户选择和复制文本是对用户体验的严重伤害。
作者以自己在 Bumble 上遇到的一位德国女生为例,描述了自己想翻译她用德语写的个人简介,却因文本不可选而无法实现。这一简单需求被迫通过截图、OCR 识别等复杂方式完成,过程繁琐且令人沮丧。
文章指出,文本的可选择性是其作为信息载体的基本属性。不可选的文本本质上等同于图像,失去了可复制、可翻译、可访问、可引用等关键功能。这不仅影响用户理解,也违背了无障碍(a11y)设计原则。
作者强调,文本的可操作性是互联网的核心价值之一。禁止选择文本,看似是为了防止内容爬取或模仿原生应用界面,但实际代价是牺牲用户体验,阻碍信息传播与理解。
最后,作者呼吁开发者停止此类行为,真正以用户为中心,尊重文本的本体价值——让信息被自由地使用、理解和交流。
HN 热度 700 points | 评论 483 comments | 作者:ayoisaiah | 10 hours ago #
https://news.ycombinator.com/item?id=45360475
- 一些用户有在阅读时习惯性选中和高亮文本的强迫性行为,认为这有助于追踪阅读进度,若网站阻止此操作会严重影响体验。
- 多位用户表示自己也有类似习惯,感到被理解并因此感到欣慰,认为这种行为并不罕见。
- 有人指出,这种高亮行为可能与注意力集中或工作时多任务切换有关,能帮助快速恢复阅读状态。
- 用户对网页中任何像素都变成可点击区域的设计感到极度反感,认为这破坏了网页的可用性和可读性。
- 某些网站如 Substack、Kindle 和微信读书在选中文本时会弹出分享、评论或高亮提示,引发用户强烈不满。
- 有用户提到,这种高亮行为可能与早期网页设计中隐藏文字的“彩蛋”机制有关,激发了习惯的形成。
- 部分用户表示,选中文字时意外触发弹窗或社交分享功能会让他们感到愤怒,认为这是对个人阅读隐私的侵犯。
- 有人提到 PDF 文档中某些文本无法选中,尤其在数据手册中,这会带来极大困扰,认为是人为设置的不合理限制。
- 有用户指出,某些操作系统(如 Windows)的悬停预览功能会意外最小化窗口,造成严重干扰,甚至引发心理不适。
- 有人将这种高亮行为与眼动追踪研究联系起来,认为这种行为可能被研究人员视为有效的阅读行为指标。
Terence Tao: The role of small organizations in society has shrunk significantly #
https://mathstodon.xyz/@tao/115259943398316677
该网页是数学家陶哲轩(Terence Tao)在数学社交平台 mathstodon.xyz 上发布的一系列推文,探讨现代社会中人类组织结构的演变及其对个体的影响。
他将人类社会的互动分为四个层级:个体、小型组织(如家庭、朋友圈、小团体)、大型组织(如公司、政府、大型政党)以及宏观系统(如全球经济、环境、科技发展)。
小型组织虽规模有限,但能提供真实的情感连接与影响力,成员易产生归属感。然而,现代技术与经济结构正使这类组织逐渐衰弱,许多被大型组织吸收或取代。
大型组织虽具备更强的资源动员能力,能推动重大变革,但其运作往往高度官僚化、去人性化,个体难以参与决策。当大型组织陷入僵化或腐败时,个体几乎无法纠正其方向。
陶哲轩指出,当前社会的结构性问题在于:个体虽因技术获得一定赋能,大型组织则被极大强化,而小型组织却在萎缩。这导致个体普遍感到疏离、孤独与无力,对改变未来缺乏信心。
他强调,应更重视新兴草根组织的价值——它们不仅提供意义与归属感,还能作为个体与大型系统之间的桥梁。同时,需警惕将小型组织“规模化”或“制度化”过程中所失去的真诚与活力。
最后,他呼吁社会重新认识小型组织的非经济价值,并在发展过程中保持对这种平衡的敏感。
HN 热度 651 points | 评论 374 comments | 作者:bertman | 7 hours ago #
https://news.ycombinator.com/item?id=45362697
- 过去美国联邦政府通过拆分贝尔系统、限制银行跨州经营、禁止银行从事高风险业务以及打击垄断和寡头,有效遏制了私人组织的过度集中,使日常接触的组织更小、更本地化、更具竞争性。
- 当前权力和资源高度集中,小规模组织在社会中的作用显著减弱,许多原本的社区组织已转向 Discord 等线上平台,脱离了现实生活的约束,导致组织缺乏“根基”。
- 尽管政府曾积极干预以防止私人组织过度强大,但政府本身也是一个大型组织,其合法性来自选民,但其权力结构与私人组织并无本质区别,尤其在政治极化背景下,政府可能成为对立阵营的工具。
- 反垄断的叙事存在风险,容易掩盖更深层的社会问题,如小规模基层组织的衰落,这比单纯的反垄断更值得深入探讨。
- 国家的核心职能是作为最强大的组织,通过合法暴力垄断来约束其他力量,这是国家存在的根本基础,若国家无法维持这种威慑力,其权威将被削弱。
- 国家的权力不仅体现在暴力上,还体现在对媒体、金融等关键领域的控制,这些领域虽非国家直接所有,但其运作仍受国家权力框架的深刻影响。
- 国家对暴力的垄断并非绝对,而是对暴力使用的合法性进行垄断,个人在自卫情境下使用暴力可能被豁免,但国家仍掌握着是否追责的最终决定权。
- 当前世界格局下,是否应由政府拆分大型组织存在争议,若美国拆分大企业而中国保持其规模,可能削弱美国的全球竞争力,因为大型企业是国家实力的重要支撑。
- 当前许多社会问题,如不平等、政治失灵、公共利益受损,本质上都与“太大而不能倒”的巨型实体缺乏问责机制有关,这些实体无视公众利益,肆意行动。
- 美国当前的政策实际上并未有效遏制中国崛起,反而因自身治理失效,导致软实力流失,为其他国家(如中国)提供了可乘之机。
US airlines are pushing to remove protections for passengers and add more fees #
美国多家主要航空公司,包括美国航空(American Airlines)、达美航空(Delta)、西南航空(Southwest)和联合航空(United),正联合推动一项新的航空业去监管化举措,旨在取消多项乘客权益保护措施,并引入更多隐性收费。此举以“降低运营成本、增强市场竞争”为名,实则可能削弱旅客的合法权益。
该倡议主要针对四项关键消费者保护政策:
- 取消自动退票权:航班取消或大幅调整时,乘客将不再自动获得现金退款,可能仅能获得旅行券或无补偿。
- 削弱费用透明度:航空公司拟取消强制提前披露行李费、选座费等附加费用的规定,导致票价在购票后期才显现真实成本,增加价格不确定性。
- 取消家庭同座保障:目前规定要求航空公司免费为带儿童的家庭安排相邻座位,新提案将取消这一义务,家庭需额外付费才能同坐。
- 削弱残障旅客支持:针对行动不便乘客的无障碍服务保障也将被弱化,可能影响其出行体验与安全保障。
航空业游说团体“航空公司协会”(A4A)声称,去监管化有助于降低票价、提升服务效率,并推动行业创新。他们批评美国交通部(DOT)近期出台的透明收费、退票及延误补偿规则“越权”且“增加航空公司负担”,主张应撤销或修改这些法规。
然而,批评者指出,这种去监管化趋势可能导致航空旅行变得更昂贵、更不透明,旅客面临更多隐藏费用和更低的服务责任。长期来看,消费者权益或将受损,实际出行体验可能恶化。
HN 热度 597 points | 评论 566 comments | 作者:duxup | 11 hours ago #
https://news.ycombinator.com/item?id=45359378
- 欧盟乘客补偿规则在跨大西洋航班延误时有效,航空公司需支付 600 欧元或提供更有吸引力的非现金补偿,体现了对消费者权益的保护。
- 交通服务提供商若无法履行合同承诺的行程,应自行承担替代方案的成本,而非将责任转嫁给乘客。
- 部分铁路公司已实现延误自动退款,乘客无需主动申请,且退款速度快,体现了良好的服务意识。
- 在意大利,自 2025 年起,电子购票的区域列车若延误将自动退款至原支付账户,提升了用户体验。
- 有乘客因频繁遭遇瑞安航空等廉价航空的严重延误(如 20 小时),反而因获得赔偿而实际“赚到”钱,反映出廉价航空服务质量的严重问题。
- 瑞安航空在航班延误时从不公布真实延误信息,却在提前到达时大肆宣传,存在误导性宣传行为。
- 航班延误问题普遍存在,乘客在高温环境下长时间滞留飞机,因设备故障导致空调无法使用,即使支付高价也难以避免恶劣体验。
- 乘客在购票时难以预知实际服务质量,价格和时刻表成为主要决策因素,导致优质服务难以通过市场机制获得回报。
- 航空业存在高进入壁垒、企业合并与行业合谋现象,限制了市场竞争和优质服务的出现。
- 廉价经济舱模式被主流航空公司广泛复制,反映出市场对低价票的强烈需求,即使服务质量下降也难以改变消费者选择。
- 价格聚合平台如 Google Flights 默认展示最低价选项,迫使航空公司提供低价但服务差的舱位以保持竞争力。
- 美国航空市场中,大量乘客倾向于选择最便宜的机票,即便抱怨服务差,只要价格更低仍会购买,推动了“基础经济舱”等低质服务的普及。
- 航空公司即使提供更优质服务,也难以在市场中获得足够回报,因为消费者普遍不以服务质量为首要考量。
- 即使支付高额费用购买商务或头等舱,乘客在行李处理等关键服务上仍与经济舱无异,优质票价并未带来全面体验提升。
- 私人包机服务可满足对极致服务和体验有极高要求的客户,填补了高端市场空白。
Baldur’s Gate 3 Steam Deck – Native Version #
https://larian.com/support/faqs/steam-deck-native-version_121
Baldur’s Gate 3 在 Steam Deck 上推出了原生版本(Native Version),取代原有的 Proton 兼容层版本。原生版本可显著降低 CPU 使用率和内存消耗,提升运行效率。
若需确认是否已安装原生版本,可在 Steam 客户端中进入游戏属性,于“兼容性”标签页中勾选“强制使用特定的 Steam Play 兼容工具”,并选择任意 Linux Runtime 版本。
原生版本与 Proton 版本的主要区别在于:原生版本直接运行在 SteamOS 上,无需额外兼容层,性能更优;而 Proton 版本依赖兼容层,会增加系统资源开销。
用户可随时切换回 Proton 版本,只需在兼容性设置中选择 Proton 8 或更高版本即可。
关于存档:
- 旧版本(Proton)存档位于:
/home/deck/.local/share/Steam/steamapps/compatdata/1086940/pfx/drive_c/users/steamuser/AppData/Local/Larian Studios/Baldur's Gate 3/PlayerProfiles/Public
- 新版本(原生)存档位于:
/home/deck/.local/share/Larian Studios/Baldur's Gate 3/PlayerProfiles/Public
- 若启用 Steam 云存档,最新存档将自动同步;若未启用,需手动迁移存档文件。
关于模组(Mods):
- 若已登录 Larian 账号并连接 mod.io,订阅的模组将自动下载。
- 若未登录或未连接,需手动从旧路径复制
Mods
文件夹至新路径:/home/deck/.local/share/Larian Studios/Baldur's Gate 3/
建议在确认迁移完成后,可删除旧的 compatdata
文件夹以释放存储空间。
注意:Larian 不支持 Linux 平台,Steam Deck 原生版本仅限 Steam Deck 设备使用。
HN 热度 596 points | 评论 415 comments | 作者:JamesA | 24 hours ago #
https://news.ycombinator.com/item?id=45354644
- Larian 工作室为 Steam Deck 推出《博德之门 3》原生版本是一项巨大的努力,体现了公司对持续更新和技术创新的承诺。
- 该原生版本最初源于一名工程师的个人热情项目,利用业余时间开发,最终获得公司全力支持并成功发布。
- 这种由个体驱动、公司迅速响应并支持创新想法的文化,展现了 Larian 独特而积极的企业精神。
- 工程师的匿名处理是出于对安全的考虑,避免因网络极端分子的攻击而带来人身危险。
- 当前网络环境中,尽管极端分子是少数,但其行为日益公开且具有破坏性,对开发者构成真实威胁。
- 大型游戏公司如 EA、Bethesda 和 Valve 未能有效应对网络暴力,导致独立开发者处于更加脆弱的地位。
- GamerGate 事件的根源并非单纯的“游戏新闻伦理”问题,而是与性别政治和网络极端主义密切相关。
- 一些人最初关注的是游戏媒体中的利益冲突问题,但事件迅速被扭曲为针对女性和独立游戏开发者的攻击。
- 真正关心独立游戏发展和优质内容推广的人群被误解和边缘化,而主流媒体未能有效回应这一需求。
- 一些表面上倡导性别平等的男性用户,实际上存在潜在的危险行为,需警惕“伪善型男性”或“软痞”群体。
- 网络舆论环境的恶化使得真正有建设性的讨论变得困难,公众对独立游戏和创作者的价值缺乏理解。
EU age verification app not planning desktop support #
https://github.com/eu-digital-identity-wallet/av-doc-technical-specification/issues/22
该网页是 GitHub 上一个名为 “eu-digital-identity-wallet/av-doc-technical-specification” 的开源项目页面,主要讨论欧盟数字身份钱包中关于“成人验证”(Age Verification, AV)的技术规范。
项目目标是为在线平台提供一种可靠且保护隐私的方式,验证用户是否年满 18 岁,以符合《数字服务法》(DSA)对未成年人保护的要求。目前技术方案聚焦于移动平台,主要支持 Android 和 iOS 系统,因其覆盖了绝大多数用户和实际应用场景。
社区用户提出了多项关于可用性的批评,主要包括:
- 过度依赖智能手机,忽视了没有智能手机的用户群体(如老年人),导致数字鸿沟;
- 在隐私浏览模式(如无痕模式)下,用户需重复进行年龄验证,严重影响浏览体验;
- 缺乏桌面端支持,且未考虑浏览器扩展等跨平台解决方案;
- 实施成本高,技术栈限制(如依赖 Java)可能不利于中小企业和初创公司参与;
- 依赖各成员国自行实施,存在更新滞后、标准不一的风险。
项目维护者回应称,当前阶段聚焦移动平台是基于现实用户覆盖情况,桌面支持和平台无关方案尚不在当前规划中。同时强调,本项目仅为满足 DSA 要求的可选方案之一,不排斥其他符合标准的替代方案。
社区建议推动平台无关的替代方案,如 W3C 的凭证管理 API,并呼吁将钱包与凭证提供方分离,以支持更多第三方参与,提升开放性和可扩展性。
HN 热度 448 points | 评论 321 comments | 作者:sschueller | 12 hours ago #
https://news.ycombinator.com/item?id=45359074
- 政府推动的数字身份验证应用不支持桌面端,反映出社会对智能手机的强制依赖,可能造成数字鸿沟和身份歧视。
- 企业通过强制使用 App 来收集用户数据,实现更精准的用户追踪和广告投放,而不仅仅是出于成本控制。
- 企业拒绝在网页端显示关键信息(如登机牌二维码),是人为制造使用 App 的障碍,目的是推动用户下载和使用 App。
- 企业声称 App 能降低成本,但实际可能只是为数据收集和用户控制服务,而非真正优化用户体验。
- 一些企业如 Ryanair 和 Ticketmaster 通过 App 限制网页访问,使用户不得不使用 App,这增加了用户依赖和数据暴露风险。
- 桌面端用户面临越来越多的使用障碍,尤其在需要数字身份验证或购票场景中,逐渐被边缘化。
- 企业通过 App 推送通知、占据手机桌面空间,实现持续的用户干预和广告曝光,进一步强化用户粘性。
- 企业对移动端的过度依赖,反映出其对多平台支持的放弃,可能带来长期维护成本和用户体验下降。
- 企业与政府在推动数字身份和 App 使用方面形成协同效应,共同构建以智能手机为中心的监控社会。
- 未来可能出现 AI 通过手机摄像头、麦克风等设备实时监控用户行为,结合身份验证系统实现全面监控。
- 一些用户因年龄或技术偏好选择非智能手机,但被系统性排除在公共服务之外,形成新的社会排斥。
- 企业以“用户体验”为名推动 App 使用,实则牺牲用户自由选择权,使用户陷入技术依赖。
- 桌面端功能被逐步弱化或隐藏,是企业推动 App 化的典型策略,而非技术必要性。
- 企业对 App 的依赖可能源于其与第三方开发或外包服务的绑定,而非用户需求。
- 一些用户对 App 的强制使用感到愤怒,认为这是对用户自主权的侵犯,而非服务改进。
- 企业通过 App 收集的数据可能被用于商业变现,甚至与政府系统共享,加剧隐私风险。
- 企业拒绝在网页端提供完整功能,是系统性排斥非 App 用户的表现,而非偶然技术限制。
- 企业通过 App 实现对用户行为的长期追踪,形成数据垄断,削弱用户对自身数据的控制权。
- 企业推动 App 化的同时,也削弱了用户在技术上的选择自由,加剧数字不平等。
Qwen3-VL #
Qwen3-VL 系列是通义千问家族中迄今为止最强大的视觉语言模型,正式发布。该系列在多个维度实现显著提升:文本理解与生成、视觉内容感知与推理、长上下文支持、空间关系与动态视频理解、以及与 AI 代理的交互能力。
核心亮点包括:
- 视觉代理能力:可操作计算机和移动界面,识别 GUI 元素、理解按钮功能、调用工具并完成任务,在 OS World 等基准测试中表现全球领先。
- 卓越的文本中心性能:通过早期文本与视觉模态的联合预训练,语言能力持续强化,其文本任务表现媲美通义千问旗舰语言模型 Qwen3-235B-A22B-2507,成为新一代“以文本为基础的多模态强大引擎”。
- 强大的视觉编码能力:能够从图像或视频生成代码(如 Draw.io、HTML、CSS、JavaScript),实现“所见即所得”的可视化编程。
- 显著提升的空间理解能力:从绝对坐标转向相对坐标,可判断物体位置、视角变化和遮挡关系,支持 3D 定位,为复杂空间推理和具身智能应用奠定基础。
- 超长上下文与视频理解:全系列原生支持 256K token 上下文,可扩展至 100 万 token,相当于处理两小时连续视频或数百页文档,且能精准定位到视频中的具体时间点。
- 更强的多模态推理能力(Thinking 版本):专为 STEM 与数学推理优化,能逐步拆解复杂问题,分析因果关系,给出逻辑严密、有证据支持的答案,在 MathVision、MMMU、MathVista 等基准上表现优异。
- 升级的视觉感知与识别:通过提升预训练数据质量与多样性,可识别更多类别的对象,涵盖名人、动漫角色、产品、地标、动植物等,满足日常与专业需求。
- 多语言 OCR 能力大幅提升:支持 32 种语言(原 10 种),在弱光、模糊、倾斜等复杂场景下表现更稳定,对罕见字符、古文字和专业术语的识别准确率显著提高。
性能表现方面,Qwen3-VL-235B-A22B-Instruct 在多数非推理类模型中排名第一,显著超越 Gemini 2.5 Pro 和 GPT-5 等闭源模型,同时在开源多模态模型中创下新纪录。其 Thinking 版本在多数开源模型中领先,尤其在复杂多模态数学题上超越 Gemini 2.5 Pro,虽在跨学科问题、视觉推理和视频理解上仍略逊于顶尖闭源模型,但在代理能力、文档理解与 2D/3D 定位任务上优势明显。
在工具调用方面,图像推理结合工具使用,在四项细粒度感知与具身交互任务中均实现性能提升,验证了“图像分析 + 工具调用”是增强视觉感知的关键。
长上下文测试中,“针中寻草”实验显示,256K 上下文下准确率达 100%,扩展至 100 万 token(约两小时视频)时仍保持 99.5% 准确率,展现极强的长序列建模能力。
多语言文本识别测试覆盖 39 种语言,32 种语言准确率超 70%,达到实用水平,展现强大跨语言泛化能力。
技术架构方面,采用原生动态分辨率设计,进行三项关键升级:
- 引入交错式 MRoPE,将时间、高度、宽度维度交错排列,实现时间、空间维度的全频覆盖,显著提升长视频理解能力。
- 引入 DeepStack 技术,将 ViT 提取的多层视觉特征注入 LLM 多个层级,实现更细粒度的视觉理解,优化视觉特征分词策略,有效保留从低级到高级的丰富视觉信息。
- 优化视觉特征融合机制,提升细节捕捉与图文对齐精度。
Qwen3-VL 系列标志着视觉语言模型从“感知”迈向“认知”与“执行”的关键跃迁,致力于实现真正理解世界、解释事件并采取行动的目标。
HN 热度 423 points | 评论 149 comments | 作者:natrys | 1 day ago #
https://news.ycombinator.com/item?id=45352672
- Qwen 在处理低质量、布局复杂的发票图像时表现优异,不仅能准确提取信息,还能提供用于优化 Tesseract 的边界框数据。
- 有用户推荐使用 Microsoft 的 Computer Vision REST API 作为 OCR 服务。
- Mistral 的专用 OCR 模型在处理英文书籍时效果不错,但在非拉丁字符和手写体上表现较差。
- 一些模型在使用礼貌语言时表现更好,但也有研究发现粗鲁语言可能提升性能,尽管会增加偏见。
- 用 80 年代 Apple ][ 游戏截图测试 OCR 模型时,几乎所有免费模型都难以应对低分辨率和高密度文本。
- 通过向 Qwen 明确请求提供边界框元数据,成功获得了可用于 Tesseract 的结构化输出。
- 与 LLM 交流时保持礼貌和专业有助于获得更可靠的结果,避免因情绪化表达导致模型胡编乱造。
- 使用“闭嘴”等粗暴指令有时能有效让模型简短回应,但需注意使用场景。
- Gemini 模型具备针对边界框的专门训练,支持实时对象边界框标注,效果令人印象深刻。
- 推荐使用 LM Studio 作为新手入门工具,支持本地运行具备视觉能力的模型,操作相对直观。
- 直接使用阿里云的 Qwen 官方网页版存在数据隐私风险,建议本地部署以确保安全。
- AnythingLLM 提供了良好的图形化界面,适合希望快速上手的用户。
- 对于特定扫描布局问题(如双栏文本溢出),微调 Qwen 2.5 VLM 7B 模型是更优解。
- 微调模型在 H200 上运行成本约为每小时 2.4 美元,但整体在高并发下更具成本效益。
Huntington’s disease treated for first time #
https://www.bbc.com/news/articles/cevz13xkxpro
英国科学家首次成功治疗亨廷顿病,这一突破性进展标志着该疾病治疗进入新纪元。亨廷顿病是一种遗传性神经退行性疾病,症状类似痴呆、帕金森病和肌萎缩侧索硬化症,通常在 30 至 40 岁发病,病程约 20 年,目前尚无治愈方法。
此次治疗采用基因疗法,通过一次长达 12 至 18 小时的精密脑部手术,将经过改造的病毒载体注入大脑的尾状核和壳核区域。该病毒携带能“沉默”致病基因的 DNA 序列,使脑细胞自行生产一种微小 RNA,阻止有害突变亨廷顿蛋白的生成,从而保护神经元。
临床试验共纳入 29 名患者,三年随访数据显示,疾病进展速度平均减缓 75%。这意味着原本一年内会发生的病情恶化,现在可延缓至四年。患者认知、运动功能和日常生活能力显著改善,部分患者甚至恢复工作,原本预计需坐轮椅者仍能行走。
此外,脑脊液中神经丝蛋白水平(反映神经元损伤的标志物)未如预期上升,反而下降,表明脑细胞正在被保护。研究团队称结果“惊人”“令人动容”,部分医生在公布数据时落泪。
该疗法安全性良好,少数患者出现由病毒引起的炎症反应,但大多可缓解或通过激素治疗控制。由于脑细胞不更新,治疗效果预计可维持终身。
尽管治疗成本高昂,且需复杂手术,目前仅限少数患者使用,但研究团队认为这是“开端”。公司计划于 2026 年第一季度向美国申请上市许可,后续将与英国和欧洲监管机构沟通。尽管价格未定,但类似基因疗法(如每例 260 万英镑的血友病 B 疗法)已获英国国家医疗服务体系(NHS)批准,显示长期价值可被接受。
患者家属也深受鼓舞。30 岁的律师职员杰克·梅-戴维斯是家族中携带致病基因者,曾目睹父亲在 54 岁去世。他表示,这项突破让他对未来重燃希望,生命“似乎更长了”。
HN 热度 415 points | 评论 91 comments | 作者:_zie | 12 hours ago #
https://news.ycombinator.com/item?id=45358940
- 该基因疗法在治疗亨廷顿病方面展现出希望,但需经过正式发表和专家评审,目前结果尚属初步,需谨慎看待。
- 该疗法通过神经外科手术将携带 micro-RNA 的病毒导入大脑特定区域,以抑制致病基因的表达,属于靶向基因治疗。
- 临床试验中患者在部分客观指标上出现改善,如神经丝轻链(NfL)水平下降约 8%,但整体残疾进展仍存在,仅表现为减缓。
- 试验设计中使用了倾向性匹配对照组,但有部分对照组患者在 12 个月后选择加入试验,可能影响结果的可靠性。
- 该疗法为不可逆的基因干预,缺乏逆转机制或半衰期清除途径,长期安全性仍存疑,可能引发免疫反应或脱靶效应。
- 若该疗法有效,可能为其他遗传性神经退行性疾病提供治疗范例,具有广泛潜在应用价值。
- 该疗法已进入关键阶段,UniQure 计划在 2026 年第一季度提交美国上市申请,可能无需再进行大规模临床试验。
- 亨廷顿病是基因治疗的理想候选疾病,因其病因明确、可进行无症状期诊断且病程缓慢。
- 有患者因家庭成员患病而回忆起童年经历,表达了对疾病带来的家庭影响的深切感受。
- 有人选择不进行基因检测,基于家族发病年龄推断自身风险,但对是否知晓结果仍存心理矛盾。
- 公共资金(如 NIH、NIHR)在该突破中发挥了关键作用,但公众普遍不了解基础科研的长期投入与贡献。
- 科研经费常因“荒诞”研究(如“虾在跑步机上”)被政治化攻击,影响科学基金的稳定性。
- 科学家需加强公众沟通,以争取持续支持,否则可能影响未来医学突破的诞生。
- 研究人员面临巨大压力,部分因资金中断而被迫转行,研究人才流失问题日益严重。
- 资助机构应主动发声,为科研价值背书,提升公众对基础研究重要性的认知。