2025-08-19 Hacker News Top Stories #
- Anna’s Archive 团队更新了他们的最新动态,致力于保护文化遗产,发布了历史上最大的书籍元数据集合,并呼吁更多人参与志愿活动和捐赠。
- Hyperclay 是一种创新网页应用开发方式,将 UI、逻辑和数据集成到自修改的 HTML 文件中,简化了现代网页开发的复杂性。
- Claudia 是一款为 Claude Code 设计的优雅桌面应用,提供图形界面和多种工具,注重隐私和开源,支持 Windows、macOS 和 Ubuntu 平台。
- ArchiveTeam 已完成对所有 goo.gl 短链接的归档工作,通过志愿者和虚拟机分配任务,备份数据后上传到 Internet Archive。
- Zach Perkel 分析了 Hacker News 上 AI 话题的热度趋势,发现自 2019 年以来,AI 相关帖子数量持续上升,2025 年第三季度达到新高。
- 谷歌承认在澳大利亚涉及反竞争行为,并与 ACCC 达成承诺,移除相关限制,消费者将受益于更多选择。
- Doxx 是一个专为终端设计的快速文档查看器,支持 Microsoft Word 文件的美观渲染、智能表格支持和强大的导出功能。
- 本文讨论了如何增强 Linux 系统中 systemd 服务的安全性,提供了多项安全选项和方法来减少攻击风险和破坏范围。
- Whispering 是一个开源的语音转文字应用程序,支持本地优先的语音转录和转换,用户数据完全存储在本地设备上,免费使用。
Anna’s Archive: An Update from the Team #
https://annas-archive.org/blog/an-update-from-the-team.html
Anna 的博客更新了关于 Anna’s Archive 的最新动态。Anna’s Archive 自 2022 年成立以来,致力于保护人类文化遗产,通过 torrenting 技术解放了数千万册书籍、科学文章、杂志和报纸等,使其免受自然灾害、战争、预算削减等灾难的影响。团队近期遭受了更多的攻击,正采取措施加强基础设施和运营安全。
Anna’s Archive 组织了一些大规模的数据抓取活动,从 IA Controlled Digital Lending、HathiTrust、DuXiu 等多个来源获取了数千万文件。此外,他们还抓取并发布了历史上最大的书籍元数据集合,包括 WorldCat 和 Google Books,以便识别缺失的书籍并优先保存最稀有的版本。
团队对所有志愿者表示感谢,并提到与两个 LibGen 分支、STC/Nexus 和 Z-Library 建立了合作关系,通过这些合作获得了数千万额外文件,并帮助镜像文件。不幸的是,一个 LibGen 分支消失了,团队对此表示哀悼,但没有更多信息。
新出现了一个名为 WeLib 的平台,似乎镜像了 Anna’s Archive 的大部分收藏,并使用了他们的代码库分支。Anna’s Archive 已经采纳了 WeLib 的一些用户界面改进,但对 WeLib 没有分享新收藏或代码改进表示遗憾,并建议用户谨慎使用,因为 WeLib 没有显示出对生态系统的贡献。
目前,Anna’s Archive 有一些令人兴奋的项目正在进行中,服务器上有数百 TB 的新收藏等待处理。团队鼓励有兴趣的人访问他们的志愿者和捐赠页面,因为他们的预算非常有限,任何帮助都将受到欢迎。Anna 和团队呼吁大家继续为保护人类遗产而战。
HN 热度 731 points | 评论 347 comments | 作者:jerheinze | 6 hours ago #
https://news.ycombinator.com/item?id=44942501
- 有些人通过 Anna’s Archive 等平台选择性购买书籍,同时也会支持实体店铺。
- 法国漫画盗版场景有一个约 6 个月的时间延迟规则,这被认为是一个不错的折中方案。
- 有些人通过盗版发现作品后,如果喜欢会购买正版以支持作者。
- 有些人因为盗版能够接触到他们本来不会知道的作品,从而增加了对正版作品的消费。
- 有些人认为,他们通过盗版发现并支持了更多的作品,因此认为自己的盗版行为是有益的。
- 有些人通过盗版来预览作品,如果作品值得,他们会购买正版。
- 有些人认为,由于版权问题,他们无法像以前那样轻松地分享或转卖他们购买的数字内容,这让他们感到不满。
- 有些人认为,他们通过购买书籍支持喜欢的作者,但更倾向于在屏幕上阅读,因为可以调整字体大小。
- 有些人认为,媒体公司不应该因为他们转换到数字格式而感到内疚,因为消费者购买的是媒介本身,而不仅仅是内容。
- 有些人认为,由于无法像以前那样借出、交易或遗赠媒体,这是一个真正的损失,版权改革应该认真考虑这个问题。
- 有些人通过 Anna’s Archive 等平台作为校园图书馆的替代品,如果作品值得,他们会购买自己的副本。
- 有些人因为上传网站让他们接触到许多好电影,所以购买的电影比以往任何时候都多。
Web apps in a single, portable, self-updating, vanilla HTML file #
Hyperclay 是一种创新的网页应用开发方式,它将网页应用的 UI、逻辑和数据集成在一个自修改的 HTML 文件中。这种技术允许开发者像编辑文档一样直接编辑运行中的应用程序,无需编译步骤,更改即时生效,并且可以即时分享更新后的页面。Hyperclay 的核心理念是简化现代网页开发的复杂性,摒弃配置文件、构建步骤、框架和部署流程,回归到更简单的模型。
Hyperclay 的特点包括直接操作,即在应用程序运行时编辑,无需刷新页面;所见即所得,UI 即是应用程序本身,修改界面或源代码直接改变应用程序;真正的便携性,可以将应用程序导出为 HTML 文件,在任何地方离线运行,且版本控制保护开发者免受不可逆错误的影响。Hyperclay 技术基于 NodeJS 服务器和前端 JavaScript 库,使 HTML 页面能够更新 DOM 并替换自己的.html 源文件。
开发者 David 通过 Hyperclay 解决了静态网站无法持久化更改的问题,使得数字对象能够像物理对象一样持久化。Hyperclay 允许开发者专注于创造实际的体验,而不是构建持久层。通过 Hyperclay,开发者可以像使用本地桌面应用一样轻松地在线编辑和保存更改,实现数字对象的可塑性、可分享性和持久性。
Hyperclay 适用于多种数字对象的创建和管理,包括网站构建器、文档、电子表格、演示文稿、多媒体编辑器、商业仪表板、博客平台、工作管理工具、调查问卷构建器、知识库构建器、思维导图工具、发票生成器、数据可视化工具、财务建模应用、创意资产生成器、交互式课程构建器、项目简介生成器、简历构建器、线框图工具和产品路线图制作等。Hyperclay 提供了一个简单、易于理解的堆栈,将 HTML 作为数据库/API/UI 的一体化解决方案,简化了开发过程。
HN 热度 582 points | 评论 205 comments | 作者:pil0u | 16 hours ago #
https://news.ycombinator.com/item?id=44937991
- Hyperclay 是一个 NodeJS 服务器和前端 JS 库,允许 HTML 页面更新 DOM 并替换自己的.html 源文件,实现全局持久化。
- Hyperclay 项目很有创意,适合单人开发和内容编辑使用,但在多人编辑情况下可能会出现问题。
- 有人对 Hyperclay 需要 NodeJS 服务器表示疑惑,认为这与完全自包含的 HTML 文件相矛盾。
- 有人推荐使用 startr.style/modernism 作为真正自包含的解决方案。
- Hyperclay 为大众带来了“块编辑”能力,对于微网站和落地页来说,Carrd 是王者,Hyperclay 看起来很有前景。
- 有人对 Hyperclay 的安全性和攻击面表示关心,并询问是否可以分配控制/编辑权限。
- 有人提到 TiddlyWiki 作为灵感来源,但 TiddlyWiki 不需要服务器,对 Hyperclay 的实用性和差异表示疑问。
- TiddlyWiki 可以完全包含在一个 HTML 文件中,也可以作为多用户、网络可访问的维基运行在 NodeJS 上。
- 有人怀念过去浏览器允许直接文件系统访问的日子,认为这对 TiddlyWiki 等项目很重要。
- 有人提到 Wiki on a stick 项目,但随着浏览器更新,这种自我保存的功能不再被支持。
- 有人觉得 Hyperclay 的描述清晰,有助于理解项目。
- 有人比较了 Hyperclay 和 localStorage 的同步层,好奇 Hyperclay 的解决方案如何更好。
- 有人提到 TiddlyWiki 的笔记就是 HTML 文件,可以存储在文档文件夹中,通过任何服务同步,进行版本控制。
- 有人将 Hyperclay 比作 Obsidian,但用于 HTML,文件本身提供动态功能和数据存储,需要引擎来使数据持久化和动态部分协同工作。
Claudia – Desktop companion for Claude code #
Claudia 是一个为 Claude Code 设计的优雅桌面伴侣,它通过美观的图形用户界面(GUI)简化了 AI 编码工作流程。用户可以通过 Claudia 轻松管理 Claude 会话、创建自定义代理,并跟踪 AI 使用情况。Claudia 的主要特点包括:
- 视觉项目管理:在一个美观的界面中浏览所有 Claude Code 项目和会话。
- 自定义 AI 代理:在 Claudia 中创建可重用的代理,具有自定义提示和沙盒执行环境。
- 跟踪 AI 支出:通过美观的可视化工具监控令牌使用情况、成本和会话分析。
- 内置 Markdown 编辑器:使用语法高亮和实时预览编辑系统提示。
- MCP 服务器管理:直观地配置和管理模型上下文协议服务器。
- 会话时间旅行:创建检查点并像 Git 一样分支对话。
- 隐私优先设计:数据本地存储,无需云依赖或外部跟踪。
- 集成 Claude Code:在 Claudia 中直接运行 Claude Code 会话。
Claudia 的优势在于将终端命令管理转变为视觉清晰的过程,解决了终端混乱、无视觉浏览项目历史、难以跟踪令牌使用和成本、手动编辑 CLAUDE.md 文件以及难以重访和分支先前对话等问题。Claudia 的界面专为开发者设计,包括交互式会话、CC 代理、DIFF 视图和使用情况仪表板等功能。
Claudia 基于现代技术构建,使用 Tauri 2.0、React 18、TypeScript、Rust 和 Tailwind CSS 等工具,以提供快速、安全且美观的体验。Claudia 支持 Windows 10+、macOS 10.15+ 和 Ubuntu 20.04+ 平台,并且完全免费且开源。用户需要安装 Claude Code CLI 并配置 Claude API 密钥才能使用 Claudia。Claudia 注重隐私,所有数据都存储在本地,不会发送到外部服务器。
HN 热度 484 points | 评论 219 comments | 作者:zerealshadowban | 1 day ago #
https://news.ycombinator.com/item?id=44933255
- 目前出现了许多探索性的工具,但大多数工具功能重复,只是锁定了不同的服务。
- 开源移动应用通过实时同步 CLI 编码代理状态到手机和实验性的声音代理,提供了 Roo 不具备的新功能。
- 有用户表示这种移动设备连接到 Claude Code 的功能是他们一直在寻找的。
- 一些用户通过 Termius 和 SSH 连接到工作机器上使用 Claude Code,但偶尔会遇到网络问题。
- Termius 支持使用 mosh,可以减少网络中断和恢复会话的问题。
- 使用 mosh 和 tmux 可以保持客户端之间的持久连接,需要推送通知来提醒审批或停止。
- 可以自托管中继服务器,方便在不同网络和防火墙下工作。
- 中继服务器的设置可以处理一些特殊情况,比如设备不在线时也能工作。
- 多样性的工具是好事,但现在很多人似乎都在用相同的功能集填充相同的空间。
- 如果不追求最新技术,最终只有少数优秀的选项会胜出。
- 目前的情况类似于 Web 2.0 初期,许多小玩家通过不同的界面访问 Facebook 和 Reddit。
- 大多数人已经意识到 Claude 是最佳选择,但不应该单方面决定用户必须使用它。
- 如果没有 Claude 特有的功能,这种锁定就是不必要的,如果有更好的模型出现,用户可能会转向支持该模型的应用。
ArchiveTeam has finished archiving all goo.gl short links #
https://tracker.archiveteam.org/goo-gl/
ArchiveTeam Warrior 是一个虚拟的档案保存工具,用户可以通过运行它来帮助 ArchiveTeam 进行网络内容的存档工作。它能够下载网站内容并上传到存档中,操作简单且不会对用户的电脑造成风险。该工具仅消耗用户的带宽和部分磁盘空间。
用户可以在 Windows、OS X 和 Linux 操作系统上运行 ArchiveTeam Warrior,需要使用 VirtualBox(推荐)、VMware 或类似软件来运行虚拟机。使用 VirtualBox 的步骤包括:下载虚拟设备(357MB),在 VirtualBox 中导入文件,启动虚拟机,虚拟机会自动获取最新更新,并提示用户打开网络浏览器。
启动后,用户需要访问 http://localhost:8001/,检查设置页面,选择用户名以便在排行榜上显示进度。在“所有项目”标签页中选择一个项目进行工作,或者选择“ArchiveTeam 的选择”让系统自动分配最紧急的项目。
页面还提供了一些统计数据,包括已完成的存档量(3.75B),待处理的数据量(286.57TiB),以及不同存档者的进度和贡献,例如 fuzzy802、DLoader、darknavi 等,他们分别贡献了不同数量的数据和项目。
HN 热度 410 points | 评论 102 comments | 作者:pentagrama | 1 day ago #
https://news.ycombinator.com/item?id=44933401
- ArchiveTeam 的效率和效果给人留下深刻印象,他们能够快速有效地备份网站数据。
- ArchiveTeam 与 Internet Archive 不同,他们专注于备份即将关闭的网站,并提供脚本让志愿者参与备份工作。
- ArchiveTeam 的备份工具在备份特定类型的网站时非常有用,例如使用 MediaWiki 导出功能备份 Wiki。
- ArchiveTeam 在网站宣布关闭时会尝试以最快速度备份尽可能多的数据。
- ArchiveTeam 通过志愿者和运行 Archive Warrior VM 来分配任务和执行备份,然后将备份数据上传到 Internet Archive。
- 有人提到可以在 Docker 中运行 Archive Warrior,这使得设置过程更简单。
- 有人提到在自己的 NAS 上运行 ArchiveTeam Warrior,只需简单设置即可在后台默默工作。
- 有人提到曾经运行过 Archive Warrior,但因为 VM 被黑客攻击而不得不关闭。
- 有人提出疑问,是否是运行 Warrior 软件导致了网络安全风险。
- 有人比喻说,如果 Internet Archive 是图书馆,那么 ArchiveTeam 就是四处收集资料并交给图书馆保管的人。
- 有人提到 ArchiveTeam 需要先收集链接进行处理,因为 Google 不会直接提供正在使用的短链接列表。
- 有人提出是否可以建立一个基于区块链或 P2P 的网络爬虫,以创建整个网络的快照,并保持高完整性。
- 有人提到 CommonCrawl 已经存在,它提供了一个庞大的网络数据集,但并不代表整个网络。
- 有人提出疑问,是否有办法找出 Common Crawl 未能收录的内容的模式,并帮助它们变得更全面。
When did AI take over Hacker News? #
https://zachperk.com/blog/when-did-ai-take-over-hn
Zach Perkel 在 2025 年 8 月 17 日的文章中探讨了人工智能(AI)何时开始主导 Hacker News 的趋势。文章指出,2025 年 8 月,Hacker News 排名前十的帖子中有三分之一与 AI 相关,这并不令人意外。作者通过分析 Hacker News 大数据集,从 2019 年 1 月 1 日到 2025 年 8 月 15 日的 24910 个排名前十的故事,发现 AI 话题的热度自 2019 年以来一直在上升。文章通过使用 GPT-5-mini 对每个故事及其评论部分进行分类,生成了摘要、AI 提及(是否谈论 AI)和 AI 情感(正面、负面或中立)三个字段。
分析结果显示,AI 相关的帖子数量在 2025 年第三季度达到新高。第一个显著的增长并非在 ChatGPT 发布时,而是在 GPT-4 发布后,这可能是因为 GPT-4 是开发者首次能够访问高级语言模型。在情感方面,2021 年第三季度 AI 相关帖子的情感转向负面,主要是因为苹果公司宣布的 NeuralHash 引发了隐私争议,以及 GitHub Copilot 的预览版发布时,其复制许可证代码的行为引起了关注。
在 2816 个被分类为 AI 相关的帖子中,52.13% 的情感是正面的,31.46% 是负面的,16.41% 是中立的。2025 年第三季度对 AI 的情感稍微偏向负面,但作者认为这还不足以构成一个明显的趋势。作者期待在未来几个月更新这一分析。总的来说,Hacker News 对 AI 的兴趣并非由 ChatGPT 或任何消费产品引发,而是在 GPT-4 作为开发者工具解锁时达到高峰。尽管 Hacker News 上关于 AI 的讨论比以往任何时候都多,但自 2021 年苹果 NeuralHash 事件以来,对 AI 的情感大体上保持稳定。
HN 热度 301 points | 评论 218 comments | 作者:zachperkel | 1 day ago #
https://news.ycombinator.com/item?id=44934337
- 这篇文章将一个提出合理质疑的帖子描述为“相当负面”,这影响了对作者文章的阅读。
- 在 Hacker News 上,提出质疑或批评有时会被贴上“负面”的标签,导致讨论环境变得过于“只允许积极思考”。
- 有些人通过使用正确的情感语言来削弱他人的思考能力,例如在技术讨论中用赞扬来压制批评。
- 有时即使没有明显的负面或批评,也会有人发表“我对这里的负面感到惊讶”的评论,这可能是 Reddit 级别的评论操纵。
- 有些人认为 Hacker News 上的评论充满了无意义的贬低,提醒人们讨论不仅仅是贬低事物和人是有益的。
- 有人反对将 Hacker News 变成一个更加积极的社区,他们希望看到更多的争论和挑战。
- 有人指出,Hacker News 的观众能够进行技术批评,但可能无法识别正确的情感反应。
- 有人质疑,不发布每一个合理的批评就意味着读者的思考能力受到了削弱吗?
- 有人强调,即使批评是正确的,也不一定是有用的、相关的、有意义的或有价值的。
FFmpeg Assembly Language Lessons #
https://github.com/FFmpeg/asm-lessons
FFmpeg Assembly Language Lessons 是一个公共的 GitHub 仓库,专注于提供汇编语言课程,特别是在 FFmpeg 项目中的应用。这个仓库由 251 人分叉,获得了 8.6k 的星标。该课程旨在教授学习者如何在 FFmpeg 中编写汇编语言,帮助他们深入了解计算机内部的运作机制。
课程要求学习者具备 C 语言知识,特别是指针的使用,如果不熟悉 C 语言,建议先阅读《The C Programming Language》一书。此外,还需要具备高中数学水平,理解标量与向量、加法、乘法等概念。
在这个 Git 仓库中,包含了与课程相对应的课程和作业(尚未上传)。完成课程后,学习者将能够为 FFmpeg 做出贡献。此外,还有一个 Discord 服务器供学习者提问和交流。
课程还提供了法语和西班牙语的翻译版本。FFmpeg Assembly Language Lessons 的资源包括 Readme 文件,但加载时出现了错误,需要重新加载页面。该仓库的活动显示,有 142 人关注,251 人分叉。目前没有发布任何版本,也没有发布任何软件包。共有 10 位贡献者参与了这个项目。
HN 热度 285 points | 评论 82 comments | 作者:flykespice | 9 hours ago #
https://news.ycombinator.com/item?id=44940485
- FFmpeg 对性能的承诺是非常宝贵的,小的改进可以节省成千上万的计算小时。
- 有人认为性能提升需要用汇编语言编写,但实际上并非如此,很多人抱怨性能问题是因为一些应用打开速度慢。
- 有人通过分析 GTA Online 的启动问题,发现 95% 的时间都花在了
strlen()
调用上,通过简单的二进制补丁将启动时间从 5-15 分钟减少到 15 秒左右。 - 有人认为,许多问题可以通过使用性能分析工具(如 Valgrind)来避免,但很多人并不使用这些工具。
- 有人认为,AAA 级游戏的质量普遍较差,因为制作游戏的人想要制作高质量产品的愿望被最大化利润的愿望所压倒。
- 有人认为,大多数软件不需要接近最优的性能,只需要不浪费资源即可。
- 有人认为,许多软件明显浪费资源,问题通常在更高层次,而不是需要汇编语言微优化。
- 有人认为,非性能关键程序应该关注其他方面而不是性能。
- 有人认为,即使是非性能关键的程序,也希望它们能关注性能,比如快速启动和响应。
Google admits anti-competitive conduct involving Google Search in Australia #
2025 年 8 月 18 日,澳大利亚竞争与消费者委员会(ACCC)对谷歌亚太公司提起联邦法院诉讼,指控谷歌与澳大利亚电信公司 Telstra 和 Optus 达成了反竞争协议,涉及在 Android 手机上预装谷歌搜索。谷歌承认了与这两家电信公司在 2019 年 12 月至 2021 年 3 月期间的协议,该协议要求 Telstra 和 Optus 只在他们销售给消费者的 Android 手机上预装谷歌搜索,而不包括其他搜索引擎。作为回报,这两家电信公司会从谷歌搜索广告收入中获得分成。
谷歌承认,与 Telstra 和 Optus 达成的这些协议可能会大大减少竞争。谷歌及其美国母公司 Google LLC 还签署了一项法院可执行的承诺,以解决 ACCC 对谷歌自 2017 年以来与 Android 手机制造商和澳大利亚电信公司之间的合同安排的更广泛竞争关切。谷歌并不完全同意 ACCC 的所有关切,但已承认并提出承诺以解决这些问题。
在承诺中,谷歌承诺将从与 Android 手机制造商和电信公司的合同中移除某些预装和默认搜索引擎限制。谷歌的这一承诺是在去年 ACCC 接受 Telstra、Optus 和 TPG 的承诺之外的。这些电信公司承诺不再与谷歌续签或签订新协议,要求谷歌搜索服务在他们提供的 Android 设备上预装并设置为默认搜索功能。
ACCC 主席 Gina-Cass Gottlieb 表示,限制竞争的行为在澳大利亚是非法的,因为这通常意味着消费者选择更少、成本更高或服务更差。今天的成果,加上 Telstra、Optus 和 TPG 的承诺,为数百万澳大利亚人在未来拥有更大的搜索选择创造了可能,也为竞争搜索提供商赢得了澳大利亚消费者的意义曝光。
Gottlieb 还提到,随着 AI 搜索工具变得越来越普及,消费者可以在他们的手机上尝试不同的搜索服务。今天的诉讼是 ACCC 在数字平台服务调查报告中对谷歌搜索默认设置和选择屏幕提出更广泛关切后,经过长时间调查的结果。ACCC 鼓励与 ACCC 合作,这可以避免漫长和昂贵的诉讼,并促进更多竞争。在数字经济中,竞争问题是一个当前的优先领域,ACCC 致力于解决此类反竞争行为。谷歌的承诺副本可在 ACCC 公共登记册上查阅。
HN 热度 284 points | 评论 194 comments | 作者:Improvement | 20 hours ago #
https://news.ycombinator.com/item?id=44936945
- 罚款应该与收入成正比,以实现公平
- 罚款的目的是起到威慑作用,不同经济状况的人对罚款的感受不同
- 按收入比例罚款可以确保罚款对所有人都有相同的威慑效果
- 非比例罚款意味着达到一定财富水平后,法律实际上不再适用
- 罚款应该根据犯罪对受害者的影响来定,而不仅仅是行为本身
- 按收入百分比罚款仍然是相同的惩罚,但在经济上的影响不同
- 讨论了边际效用和对不同收入人群罚款的合理性
- 有人认为按固定金额罚款对富人影响小,对穷人影响大
- 有人认为罚款应该根据个人的支付能力来定,以确保公平
- 欧盟对企业罚款也采用与全球营业额挂钩的比例罚款制度
Show HN: Doxx – Terminal .docx viewer inspired by Glow #
https://github.com/bgreenwell/doxx
doxx 是一个专为终端设计的、快速的文档查看器,用于查看 Microsoft Word 文件。它使用 Rust 语言构建,以确保性能和可靠性,将 Word 文档带到命令行界面,并提供美观的渲染、智能表格支持和强大的导出功能。
主要特点包括:
- 文档查看:支持语法高亮和格式化的精美终端渲染,支持 Word 文档文本颜色的色彩支持,专业表格显示,嵌套列表支持,全文搜索及高亮显示,文档大纲快速导航,多种视图模式。
- 智能表格支持:高级表格解析,自动头部检测,智能对齐,数据类型检测,专业 ASCII 渲染。
- 复制和剪贴板:支持从终端 UI 直接复制渲染内容,基于当前视图的上下文感知复制,跨平台支持。
- 导出和集成:支持 Markdown 导出,CSV 数据提取,纯文本输出,JSON 导出,CLI 友好的脚本和自动化支持。
安装方法:
- 预构建的二进制文件:通过 GitHub 发布页面提供所有主要平台的预构建二进制文件。
- 包管理器:即将支持 Homebrew、Chocolatey、Cargo 和 Linux 的官方仓库包。
- 从源代码构建:需要 Rust 1.70+ 和 Git,可以从 GitHub 仓库克隆并安装。
基本使用:
- 查看文档:
doxx quarterly-report.docx
- 开始时使用大纲视图:
doxx document.docx --outline
- 搜索特定内容:
doxx contract.docx --search "payment terms"
- 启用颜色支持:
doxx presentation.docx --color
- 导出到不同格式:支持 CSV、Markdown、JSON 导出。
- 强制交互式 UI:
doxx document.docx --force-ui
- 检查版本和获取帮助:
doxx --version
和doxx --help
doxx 支持 Windows 10/11、多种 Linux 发行版和 macOS 10.12+(Intel 和 Apple Silicon)。
HN 热度 244 points | 评论 66 comments | 作者:w108bmg | 1 day ago #
https://news.ycombinator.com/item?id=44934391
- 该项目速度和响应性很好,但请求确保任何计划中的"AI 集成"是完全可选的,最好是一个独立的项目。
- 一些用户担心在线功能会让安全团队禁止使用这个工具。
- 有人建议 AI 功能应该是一个可以单独使用的不同的工具,以保持核心工具的单一目的。
- 有人建议安装和执行名为"doxx"的工具听起来像是一个糟糕的主意,因为这个名字可能会让用户感到不安。
- 有人提到其他项目可能对开发者有用,如 OOXML-Validator 和 Visual Studio Code 的扩展。
- 有人提到老式的 Word 文件(.doc)仍然很常见,建议集成 Antiword。
- 有人建议使用 LibreOffice 的解析器来解决文档解析问题。
- 有人分享了自己使用 pandoc 和 groff 在终端阅读文档的方法。
- 有人期待在法律实践中尝试这个工具,但认为名字带有负面含义。
- 开发者解释说"Doxx"这个名字是有意为之的双关语,意在"解放 Office 文档"。
- 有人担心"doxx"这个名字可能会导致一些人不愿意在工作机器上安装这个工具。
- 有人表示这只是一个名字问题,解释清楚工具的功能就可以结束对话。
- 有人提到其他一些技术工具的名字也有争议,如
git
、kill
、slack
和fsck
。 - 有人提到
itsdangerous
这个 Python 项目依赖包也曾引起一些争议。 - 有人好奇这个工具在法律实践中的用途,质疑有多少律师会 SSH 到服务器。
- 有人表示非律师在审查大量内部文件时,这个工具的快速切换功能很有吸引力。
- 有人提到他们讨厌 Word,但有时不得不处理 Word 文档,这个工具可以帮助理解文档结构。
- 开发者表示正在努力改进复制粘贴功能。
- 有人表示一些律师可能习惯于使用终端进行本地工作。
SystemD Service Hardening #
https://roguesecurity.dev/blog/systemd-hardening
这篇文章讨论了如何增强 Linux 系统中 systemd 服务的安全性。尽管 systemd 因其争议性而备受关注,但它提供了一个全面且强大的方法来控制服务。文章指出,虽然 systemd 在很多方面都是为了开箱即用的成功而优化的,但并非特别注重安全性。因此,作者提供了一些建议,帮助用户通过调整 systemd 服务单元和 podman 容器来提高整体的安全姿态,减少被攻击的可能性以及被攻击后的破坏范围。
文章首先介绍了如何使用 systemd-analyze security
命令来分析部署的服务单元的安全性,并展示了如何针对特定服务(例如 sshd.service)进行安全分析。分析结果会显示哪些安全措施已经到位,以及它们的风险评分。接着,文章解释了如何根据分析结果修改 systemd 服务单元文件中的安全设置,包括如何使用 stub 文件配置覆盖和手动配置的方法。
文章还提供了一个安全选项列表,这些选项可以在服务级别上进行调整,以增强安全性。这些选项包括但不限于:AmbientCapabilities、AppArmorProfile、CapabilityBoundingSet、DeviceAllow、DynamicUser、GroupInaccessiblePaths、IPAddressAllow、IPAddressDeny、LockPersonality、MemoryDenyWriteExecute、NoExecPaths、NoNewPrivileges、PrivateDevices、PrivateIPC、PrivateNetwork、PrivateTmp、PrivateUsers、ProcSubset、ProtectClock、ProtectControlGroups、ProtectHome、ProtectHostname、ProtectKernelLogs、ProtectKernelModules、ProtectKernelTunables、ProtectProc、ProtectSystem、ReadOnlyPaths、ReadWritePaths、RemoveIPC、RestrictAddressFamilies、RestrictFileSystems、RestrictNamespaces、RestrictNetworkInterfaces、RestrictRealtime、RestrictSUIDSGID、SocketBindAllow、SupplementaryGroups、SystemCallArchitectures、SystemCallFilter、TemporaryFileSystem、UMask 和 User。
最后,文章对这些安全选项进行了简要解释,并强调了在调整这些设置时需要注意的原则:如果服务在更改后无法启动,可能是因为你刚刚移除了它所需的权限/能力。作者建议读者根据这些信息做出明智的猜测,并开始尝试调整,以提高自己系统的安全性。
HN 热度 237 points | 评论 90 comments | 作者:todsacerdoti | 18 hours ago #
https://news.ycombinator.com/item?id=44937550
- systemd 服务硬化可以通过 strace 分析自动进行
- ProtectSystem=配置可以与 TemporaryFileSystem 和 BindReadOnly 一起使用,以限制服务的文件系统访问
- 有些服务可能因为硬化设置过于激进而无法正常工作,例如 NetworkManager
- 发行版可能因为担心破坏用户设置而没有启用更多的硬化开关
- 发行版维护者需要在安全性和易用性之间找到平衡
- systemd-analyze –user security 可以用来检查 systemd 用户单元的安全设置
- 有提议创建一个包含常见服务硬化建议的仓库
- 通过查看主流发行版的服务打包方式,可以了解如何对服务进行硬化
- 发行版通常不会进行安全硬化,除非是专门针对安全的发行版
- 旧的 init 脚本无法像 systemd 那样统一和标准化地使用内核特性
- systemd 是复杂软件,而替代方案是简单软件加上复杂的脚本
- systemd 不支持 musl,这限制了在构建小型嵌入式系统时的使用
- OpenEmbedded 已经在 Yocto 中使用 musl 构建 systemd 的 patchset
- systemd 在某种程度上受到了 macOS 的 launchd 的启发
- Upstart 是 systemd 的直接前身,而 systemd 则是受 launchd 启发而创建的新项目
Show HN: Whispering – Open-source, local-first dictation you can trust #
https://github.com/epicenter-so/epicenter/tree/main/apps/whispering
Whispering 是一个开源的语音转文字应用程序。用户只需按下键盘快捷键,说话,程序就能将语音转录、转换,并复制粘贴到光标位置。开发者出于对封闭源代码的语音转录工具的不信任,创建了这个完全开源、本地优先、对用户数据透明的工具。所有数据都存储在本地设备上,音频直接从用户的机器传输到选择的云服务提供商(如 Groq、OpenAI、ElevenLabs 等)或本地服务提供商(如 Speaches、owhisper 等),无需中间人或供应商锁定。
Whispering 以其语音激活模式和可定制的 AI 转换功能脱颖而出,支持用户使用任何提示/模型进行转换。该应用程序使用 Svelte 5 和 Tauri 构建,体积小巧(约 22MB),启动迅速。代码库文档齐全,易于理解和审核,确保用户了解音频的去向、处理方式和存储的数据。此外,由于省去了中间环节,用户可以直接向服务提供商支付费用,从而节省成本。
Whispering 的使用成本如下:
- 传统工具:根据不同的服务和使用时长,每月费用在 15-30 美元之间。
- 本地服务:免费。
开发者认为,开源和本地优先的社区可以共同构建出比任何封闭源代码替代品更好的产品。Whispering 的代码开源,因为基础工具不应该要求用户信任一个黑盒子。公司可能会转型、被收购或关闭,但开源是永恒的。注意,Whispering 适用于快速转录,而不是长时间的录音。
HN 热度 220 points | 评论 53 comments | 作者:braden-w | 6 hours ago #
https://news.ycombinator.com/item?id=44942731
- 所有数据都存储在本地设备上,音频直接从机器传输到用户选择的云服务提供商,没有中间人。
- Whispering 提供了本地转录功能,支持用户选择的供应商或本地供应商。
- 支持使用 Parakeet 模型进行本地转录,比 Whisper 更快更准确。
- MacWhisper 用户认为 Parakeet 比 Whisper 更好,支持通过 Parakeet 进行推式转录。
- 有用户询问是否支持使用 Parakeet 模型进行本地转录。
- 有用户对 Epicenter 项目表示支持,认为应该有更多开源、本地优先的应用程序。
- 有用户对 Whispering 的开源和本地优先特性表示赞赏,并希望探索更多类似的应用。
- 有用户对 Whispering 的云版本表示兴趣,询问是否可以使用 AgentDB API 上传数据。
- 有用户对 Whispering 的资源消耗和对专有服务的依赖表示担忧,询问是否有更好的开源语音转文本选项。
- 有用户对 Whispering 是否适用于儿童语音表示好奇,认为这在教育应用中具有价值。
- 有用户对开源软件表示支持,认为所有人都应该如此。