2024 04 09 HackerNews

2024-04-09 Hacker News Top Stories #

一句话摘要 #

  1. How much faster are the Gnome 46 terminals? GNOME 46 版本中的 VTE 终端性能显著提升,接近最快的 Alacritty 终端。
  2. Lore Harp McGovern built a microcomputer empire from her suburban home Lore Harp McGovern 在 70 年代中期从家中创建了一个价值数百万美元的微型计算机公司,成为该时代最重要的创始人之一。
  3. Spotify demonetizes all tracks under 1k streams Spotify 取消了流量低于 1,000 次音轨的货币化,旨在阻止流量操纵并提高高流量音轨的收益。
  4. Notepad++: Help us to take down the parasite website Notepad++ 呼吁用户帮助报告一个充满恶意广告的仿冒网站,以保护用户和社区安全。
  5. Vala Programming Language Vala 是一种面向对象的编程语言,与 GNOME 技术深度集成,适用于构建各种类型的应用程序。
  6. Groq CEO: ‘We No Longer Sell Hardware’ Groq 公司转型为人工智能云服务提供商,专注于提供基于其 AI 芯片的大型语言模型推理服务。
  7. Blocky – a DNS proxy and ad-blocker for the local network Blocky 是一个用 Go 编写的本地网络 DNS 代理和广告拦截器,支持黑名单、白名单和多种 DNS 协议。
  8. Wreck of Shackleton’s ‘Endurance’ discovered in Antarctic depths (2022) 研究人员在南极海底发现了欧内斯特·沙克尔顿的“耐力号”船,解开了一个世纪的海事谜团。
  9. Hello World 文章深入探讨了 Hello World 程序背后的技术细节,从 C 语言代码到机器码的转换过程。
  10. Show HN: Beyond text splitting – improved file parsing for LLMs Open Parse 是一个 PDF 布局分块工具,旨在提高大型语言模型处理复杂文档的准确性和效率。

How much faster are the Gnome 46 terminals? #

https://bxt.rs/blog/just-how-much-faster-are-the-gnome-46-terminals/

这篇博文探讨了 GNOME 46 终端的性能提升。文章介绍了 VTE(Virtual TErminal library)是支持各种 GNOME 终端仿真器的库,提供了一个显示终端视图的 GTK 小部件,用于应用程序如 GNOME Terminal、Console、Black Box、Tilix、Terminator、Ptyxis 等。

在 GNOME 46 周期中,VTE 经历了许多性能改进,特别是在输入延迟方面。作者使用硬件输入延迟测试仪进行测量,以测量从按键到屏幕像素变化的时间,以评估终端的响应速度。通过对 Alacritty、Console、VTE 测试应用和 GNOME Terminal 等终端进行测试,发现在 GNOME 46 中,VTE 终端的性能大幅提升,接近于最快终端 Alacritty。

文章还提到了 vtebench 套件的运行结果,展示了终端从 GNOME 45 到 GNOME 46 的性能改进。总的来说,GNOME 46 中的 VTE 终端性能显著提升,用户在日常使用中能够感受到输入延迟的明显减少,建议用户尝试使用 VTE 终端。


HN 评论 250 comments | 作者:janvdberg | 16 hours ago #

https://news.ycombinator.com/item?id=39966918 #

  • 评论中提到测试中的键盘延迟不包括键盘延迟,因为键盘延迟因素复杂,会引入噪音,影响测试结果。
  • 有人表示使用无线键盘时延迟不会太大,但对于节奏游戏来说,延迟会导致无法游玩。
  • 讨论中提到人类对于一定范围内的延迟可以适应,但动态延迟会影响体验。
  • 有人提到乐器演奏中也需要适应延迟,比如鼓手提前击打鼓等。
  • 有人认为节奏游戏对延迟要求不高,只要延迟稳定即可。
  • 有人讨论了键盘的物理延迟,认为键盘的物理特性也会影响延迟。
  • 有人提到节奏游戏通常会校准延迟,以弥补系统延迟。
  • 有人讨论了显示器刷新率对延迟的影响,指出最小延迟为 0ms,最大受显示器影响为 16.6ms。
  • 有人建议使用 xfce 界面代替 gnome,认为 xfce 更为响应。
  • 讨论中提到 xfce 给人一种 Linux 的感觉,是 Linux 的代表界面之一。

Lore Harp McGovern built a microcomputer empire from her suburban home #

https://every.to/the-crazy-ones/the-woman-that-tech-history-forgot

这篇文章讲述了一个被科技史遗忘的女性,Lore Harp McGovern,她在个人计算机行业做出了重要贡献。

在 20 世纪 70 年代中期,来自加利福尼亚郊区的 Lore Harp McGovern,一个家庭主妇和两个孩子的母亲,开始组装内存板和其他计算机扩展设备,销售给不断增长的业余爱好者和商业市场。与她的朋友 Carole Ely 一起,她将他们的公司 Vector Graphic 发展成为微型计算机的主要制造商,最终在 IBM 进入市场之前上市。

文章详细描述了 Lore Harp McGovern 的创业历程,以及她如何从家中创立了一个价值数百万美元的计算机公司,成为微型计算机时代最重要的创始人之一。文章还介绍了她的家庭背景、移民经历、创业过程以及公司的发展历程,展现了她在行业中的重要性和影响力。


HN 评论 72 comments | 作者:adrianhon | 7 hours ago #

https://news.ycombinator.com/item?id=39970915

  • 有评论指出女性在科技行业面临独特挑战,但数据显示 70 年代和今天女性在软件工作中表现良好;
  • 另一观点认为女性在科技领域的比例仍然较低,文化也存在问题,男性对女性的态度令人反感;
  • 有人认为女性在计算机编程领域更有可能留下,这被视为成功的代表;
  • 也有评论提到女性 CEO 的数量,暗示女性在高管层面临挑战;
  • 有人认为科技行业是最具包容性的行业之一,主要看重才华和价值创造;
  • 还有评论指出女性创业者的故事被较少提及,与男性相比,女性在历史中更容易被忽视;
  • 有人提到远程工作在 60 年代已存在,使用电传打字机等设备进行远程工作;
  • 评论中也涉及到 Vector Graphic 公司的历史和创始人 Lore Harp McGovern 的故事。

Spotify demonetizes all tracks under 1k streams #

https://djmag.com/news/spotify-officially-demonetises-all-tracks-under-1000-streams

根据 DJ Mag 的报道,Spotify 已正式取消所有流量低于 1,000 次的音轨的货币化。这一新政策于 2024 年 4 月 1 日对所有艺术家生效。新的收入方案去年宣布,意味着音乐只有在过去 12 个月内播放次数达到 1,000 次的情况下才会被纳入版税池计算。

据 Spotify 的一篇博客文章称,平台上 99.5% 的所有流量都是来自播放次数超过这个数字的音轨,平台声称这些音轨现在将因此赚得更多。此外,Spotify 现在要求最少的独立听众数量才能获得版税。这一举措旨在阻止“不良行为者进一步操纵”,针对使用自动和人工播放来增加流量计数的人。与此同时,“功能性”流派,如白噪声,也受到了打击。在此之前,这类录音只需播放 30 秒就能产生收入,现在这个时间已增加到两分钟。

然而,这一变化引起了音乐行业某些方面的愤怒和挫折。联合音乐家和盟友工作者最近在 X 上分享了一篇帖子,暗示这些数字可能被夸大,称 86% 的 Spotify 上的所有内容现在将无法满足基于播放次数的版税标准。联合音乐家和盟友工作者最近发起了“让流媒体付费”倡议,要求使用 Spotify 和 Apple Music 等平台的艺术家获得更公平的收入分成。该运动支持一项新的音乐家生活工资法案,该法案于 3 月提交给美国国会,旨在“确保艺术家和音乐家能够在数字时代建立可持续的职业生涯”。

随着对更好版税支付的政治和公众压力增加,Spotify 正寻求增加更多收入以填补自身的亏损。自 2018 年在股市上市以来,该公司每年都亏损。就在本周,有报道称这家流媒体巨头已确认意图修改并提高其定价。在包括英国、澳大利亚和巴基斯坦在内的几个地区,每月账单将增加 1 至 2 美元,据彭博社报道。这被认为是为了支付在 2023 年底添加到平台上的有声读物的成本。

最近,还引入了视频学习内容以进一步多样化服务。将推出一个新的基本套餐,供那些不想访问有声读物的用户选择,这是几个更新的定价选项中的第一个。这一消息导致 Spotify 的股价上涨了 4.6%,尽管目前尚不清楚长期影响将会是什么。


HN 评论 389 comments | 作者:buro9 | 17 hours ago #

https://news.ycombinator.com/item?id=39966743

这篇帖子中的评论观点大致可归为以下几类:

    1. 有人认为 Spotify 对小量播放不支付费用相当于盗窃,应该有最低收入门槛并全额支付;
    1. 也有人认为支付阈值是合理的,避免小额支付造成高额处理费用;
    1. 有人认为 Spotify 不是盗窃,而是与音乐所有者事先达成协议;
    1. 还有人提出通过其他方式支持音乐人,如购买音乐或使用 Bandcamp 等。

Notepad++: Help us to take down the parasite website #

https://notepad-plus-plus.org/news/help-to-take-down-parasite-site/

这篇文章是关于 Notepad++ 官方网站发出呼吁,希望大家帮助报告一个恶意网站的内容。该恶意网站 https://notepad.plus/ 在谷歌搜索“下载 Notepad++”时排名靠前,误导用户认为它是官方网站,但实际上它充斥着恶意广告,旨在诱导用户点击以获取利润。

该网站试图转移用户流量,危害用户安全和社区的完整性。文章呼吁大家举报这个恶意网站,以保护 Notepad++ 社区和维护安全的网络环境。希望大家共同努力,维护社区安全,保障在线生态系统的安全。


HN 评论 96 comments | 作者:croes | 11 hours ago #

https://news.ycombinator.com/item?id=39968761

  • 有评论认为该网站是寄生性的,没有增加任何价值,对安全性有负面影响;
  • 有人认为这种行为可能被视为恶意,因为它在用户下载流程中插入自己并通过广告牟利;
  • 评论中提到了恶意网站可能有第二个议程,可能会在获得足够流量后提供带后门的下载链接;
  • 有人认为这种网站通过广告牟利已经是恶意行为,因为它损害了用户对真正网站的信任。

Vala Programming Language #

https://vala.dev/

Vala.dev 是关于 Vala 编程语言的官方网站。Vala 是一种面向对象的编程语言,具有自托管编译器,可生成 C 代码并使用 GObject 类型系统。Vala 提供高级抽象,让您以面向对象的方式舒适地编写代码,并与 GNOME 技术(如 GObject、GTK 等)深度集成。Vala 编译代码为极快的本机二进制文件,同时支持重用现有的 C 代码以及从 Vala 生成 C 代码。Vala 是免费且开源的软件,拥有一个活跃的社区,为编译器做出贡献并开发大量工具。

Vala 可用于构建 GUI 应用程序,与 GTK、Libadwaita 和 Granite 完美集成,使开发变得简单。您还可以轻松在 Flathub 上发布应用程序,而无需臃肿的软件包。此外,Vala 还可用于开发命令行程序,提供大量标准库和第三方库供 Vala 使用。Vala 还提供了许多其他语言的绑定和 API 文档,支持动态和静态链接。

Vala 网站还展示了一些 Vala 项目的案例,如 Tuba、Dino、Monitor、TextSnatcher 和 Timeshift。社区方面,您可以在 GNOME 论坛上提问与 Vala 相关的问题,与开发人员交流或了解如何为 Vala 做出贡献。Vala 还在 Mastodon、Twitter、Telegram 和 Reddit 等社交媒体平台上活跃。

总的来说,Vala 是一个功能强大且灵活的编程语言,适用于构建各种类型的应用程序,同时拥有一个积极的社区支持。


HN 评论 149 comments | 作者:gtirloni | 11 hours ago #

https://news.ycombinator.com/item?id=39969131

根据您提供的链接,这篇帖子中的评论观点可以总结如下:

Vala 语言在构建应用程序时适用于使用 Glib/GObject 的应用,如 Gtk、GStreamer 和 DBus 应用;

许多开发者转向 Electron 等布局引擎解决方案,而不再编写 GTK 应用;

一些人关注软件的占用空间,选择避免整个浏览器引擎,而使用类似 Sciter 的工具包;

一些人认为 Electron 应用设计较差,因为其控件基础设施较为简单;

对于 GUI 工具包的选择,有人认为 Qt 更适合编写本地 Linux 应用。


Groq CEO: ‘We No Longer Sell Hardware’ #

https://www.eetimes.com/groq-ceo-we-no-longer-sell-hardware/

根据 EE Times 的报道,Groq 公司的首席执行官 Jonathan Ross 坚称公司不再销售硬件,这家数据中心人工智能芯片初创公司现在是一家人工智能云服务提供商。Ross 表示,长期以来,公司一直希望发展到这一步,但认识到作为初创公司销售芯片太困难了。

Groq 的客户现在是人工智能开发人员,公司目前有 70,000 名开发人员注册了其实时大型语言模型(LLM)推理云服务 GroqCloud,有 19,000 个新应用正在运行。Groq 计划在今年部署 42,000 个语言处理单元(LPU)芯片到 GroqCloud 中,与合作伙伴云中部署类似数量的芯片。

Groq 已经与沙特国有石油公司阿美石油签署了一项协议,涉及“大规模部署[LPU]”的内容。Groq 的芯片不使用高带宽内存(HBM),这使得公司能够实现其他公司无法达到的规模。此外,Groq 正在研发下一代 LPU 芯片,将跳过几个工艺节点,从 14 纳米跳至 4 纳米,客户可以期待性能大幅提升。Groq 的云服务 GroqCloud 在性能方面表现优异,通过人工分析.ai 的基准测试,Mixtral 8x7B 的每秒标记数为 467,而其他基于 GPU 的服务未能超过 200。

Groq 正在通过实施特性如推测解码来进一步提高速度。Groq 似乎对其五年前的硅片仍然有信心,对于 Nvidia 宣布的下一代 Blackwell GPU 架构,Groq 发布了简短的回应:“仍然更快”。Groq 还收购了 Palo Alto 初创公司 Definitive Intelligence,该公司是一家 AI 驱动的商业洞察公司。

通过成为一家同时制造自己芯片的云服务提供商,Groq 是否在试图模仿超大规模云服务提供商的模式,Ross 表示,到明年底,他们将部署足够多的 LPUs,计算方面将相当于所有超大规模云服务提供商的总和。Groq 的发展前景看好,公司正不断扩大规模,提高效率,并与合作伙伴建立伙伴关系。


HN 评论 141 comments | 作者:frozenport | 1 day ago #

https://news.ycombinator.com/item?id=39964590

评论中的观点归纳如下:

    1. Groq 被称为最快的 LLM 推理提供商,强调低延迟优势;
    1. 对 Groq 和 OpenAI GPT-3.5-turbo 性能进行比较;
    1. 讨论 Groq 是否使用开源模型;
    1. Latency 对不同应用的重要性;
    1. 游戏公司使用 LLMs 进行自然语言对话的潜在需求和挑战;
    1. 对 Groq 不再销售硬件的商业决策进行讨论,提及硬件销售和云服务模式的区别;
    1. 对 Groq 硬件销售模式的商业前景进行猜测。

Blocky – a DNS proxy and ad-blocker for the local network #

https://0xerr0r.github.io/blocky/

这个地址是关于一个名为"blocky"的项目,是一个用 Go 语言编写的本地网络 DNS 代理和广告拦截器。以下是该项目的主要特点:

  • 功能:支持使用外部列表(广告拦截、恶意软件)和白名单来拦截 DNS 查询,定义每个客户组(如儿童、智能家居设备等)的黑名单和白名单,支持正则表达式,以及阻止请求域、响应 CNAME(深度 CNAME 检查)和响应 IP 地址等功能。
  • 高级 DNS 配置:支持自定义 DNS 解析、条件转发到外部 DNS 服务器,以及可以为每个客户组定义上游解析器等。
  • 性能:提高网络速度和性能,可定制 DNS 查询的缓存,预取和缓存常用查询,同时支持多个外部解析器,内存占用低。
  • 各种协议:支持现代 DNS 协议,包括 DNS over UDP 和 TCP、DNS over HTTPS(DoH)、DNS over TLS(DoT)等。
  • 安全和隐私:支持安全通信,现代 DNS 扩展,提供自由配置的拦截列表,不收集用户数据等。
  • 集成:支持 Prometheus 指标、Grafana 仪表板、DNS 查询日志记录等,提供各种 REST API 端点和 CLI 工具。
  • 简单配置:使用单个 YAML 格式的配置文件,易于维护、备份和安装,支持多种架构,包括 x86-64 和 ARM。

该项目是开源的,不收集用户数据,欢迎问题、功能建议和拉取请求。详细信息可在 GitHub 上找到。


HN 评论 83 comments | 作者:kaathewise | 13 hours ago #

https://news.ycombinator.com/item?id=39968103

根据您提供的链接内容,这篇帖子中的评论观点主要包括以下内容:

    1. 关于使用随机上游解析器增加 DNS 流量隐私性的讨论;
    1. 对于隐私保护的建议,建议坚持使用一个 DNS 解析器,如 Mozilla 端点或 Cloudflare DNS;
    1. 对于网络广告拦截器可能导致服务中断的担忧;
    1. 对于使用 Blocky 与 Pi-Hole 之间的比较,提出希望看到功能比较或优势展示的建议;
    1. 针对 iOS/Android 应用中 YouTube Shorts 广告拦截的讨论;
    1. 对于广告拦截器可能导致网站功能中断的担忧;
    1. 对于 Pi-Hole 和 uBlock Origin 的使用情况和比较;
    1. 针对 DNS 级别广告拦截器的使用建议和技巧。

Wreck of Shackleton’s ‘Endurance’ discovered in Antarctic depths (2022) #

https://www.smithsonianmag.com/smart-news/ernest-shackleton-ship-discovery-antarctic-explorer-history-180979702/

研究人员本周宣布发现了欧内斯特·沙克尔顿(Ernest Shackleton)的船“耐力号”(Endurance)的残骸。这艘船是沙克尔顿的船员在 1915 年最后一次看到的,之后它沉入了冰冷的海面下。

一支研究团队在南极海底发现了欧内斯特·沙克尔顿的“耐力号”船。这项发现是由“耐力 22”远征队执行的,并由福克兰群岛海事遗产信托基金会本周宣布,这一激动人心的发现解开了一个持续一个世纪的海事谜团。科学家们使用潜水器拍摄了这艘沉船的图像和视频,这艘船作为历史遗址受到保护,将保持原样不被打扰。

“我们通过发现耐力号创造了极地历史,并成功完成了世界上最具挑战性的沉船搜寻,”远征队领队约翰·希尔斯在一份声明中说。

耐力号最后一次在 1915 年被看到,当时爱尔兰-英国探险家沙克尔顿(1874-1922)和他的 27 名船员目睹船只沉入冰冷的深处。船员的任务是作为帝国横贯南极洲远征队的成员,通过穿越当时未绘制地图的东南极地形来大胆计划到达南极点。

灾难发生在 1915 年,当船只被困在浮冰中。在接下来的十个月里,这艘瘫痪的船只漂浮着,船员们露宿在浮冰上,等待周围的环境解冻。但随着 9 月的春天到来,移动冰的压力开始扭曲、碾碎和扭曲船只的木框架。到了 10 月,船只已经无法修复,所有的返回计划都破灭了。

沙克尔顿随后的营救航行被载入史册,成为南极探险史上最伟大的毅力、领导力和幸运的典范之一。首先,船员们在海上艰难度过了五天,将三艘救生艇登陆到象岛,他们在那里搭起了一个临时营地。沙克尔顿和其他五人随后驾驶一艘小型捕鲸船进行了一次危险的 800 英里航程,到达了南乔治亚岛寻求帮助。

这次在南非极地研究船“阿古拉斯 II 号”上进行的搜寻行动是由一位匿名私人资助的,该项目耗资 1000 万美元。

研究人员使用两艘潜水器扫描南极海底,寻找沉船的迹象。他们在一个 150 平方英里的区域搜索了两周,几天前发现了船只的第一个迹象。耐力号最终沉没的地点原来就在船长沃斯利预测的位置以南四英里处。

冰冷的南极温度使这艘长 144 英尺、三桅木质船保存得惊人完好。图像显示,船名的粗体大写字母仍然完好无损,清晰可见在船尾上方。

专家们纷纷在推特上表示祝贺并提供分析。海洋生物地理学家胡·格里菲斯在推特上发布了一条众包线索,他在沉船照片中识别出了南极深海生物,包括“巨大”的南极海葵和海鞘。

其他人描述了团队发现沉船时的兴奋情绪。参加远征的海冰物理学家斯特凡妮·阿恩特在推特上写道:“我起了鸡皮疙瘩。”当他们首次发现沉船时,她正在附近的冰上与其他研究人员一起工作——“就在沙克尔顿的人们曾经待过的地方。”

这篇文章来源于 Smithsonian Magazine,作者是 Nora McGreevy。


HN 评论 55 comments | 作者:throwoutway | 1 day ago #

https://news.ycombinator.com/item?id=39964107

这篇帖子中的评论观点包括:

对 Shackleton 的领导力和救援行动表示赞赏;

有人认为 Shackleton 的远征是纯粹的虚荣;

还有人推荐阅读相关书籍和表演,以及对发现的重要性表示期待。


Hello World #

https://thecoder08.github.io/hello-world.html

这个网页内容主要是关于一个 Hello World 程序的深入探讨,重点是现代 Hello World 程序背后的抽象概念。文章以 C 语言编写的 Hello World 程序为例,介绍了如何通过编译器将代码转换为计算机处理器可以直接运行的机器码。

通过分析程序的 ELF 文件和汇编代码,解释了程序是如何执行的,包括程序入口地址、代码段的汇编指令等。文章还涉及到程序依赖的 C 库,如标准 C 库(libc.so.6),以及 puts()函数等标准库函数的实现细节。

最后,通过对 musl 库中 puts()函数的定义和相关函数调用的分析,展示了 Hello World 字符串是如何被输出到屏幕上的。

文章深入浅出地解释了 Hello World 程序背后的技术细节,适合对 C 编程和程序执行过程感兴趣的读者阅读。


HN 评论 37 comments | 作者:fbrusch | 14 hours ago #

https://news.ycombinator.com/item?id=39967709

这篇帖子中的评论观点归纳如下:

讨论了如何获得最小的编译二进制文件、C++ 编译器生成的可执行文件内容、动态链接器的作用、编程语言特性、编译步骤、程序大小对比、C++ 预处理器输出行数、程序调用过程、程序输出过程、抽象层次、软件开发中的抽象层次、维护性与可读性的权衡、嵌入式系统开发中的抽象层次。


Show HN: Beyond text splitting – improved file parsing for LLMs #

https://github.com/Filimoa/open-parse

这个 GitHub 仓库是关于 PDF 布局分块用于大型语言模型(LLMs)的项目。

Open Parse 旨在填补现有开源库在处理复杂文档方面的不足,提供了一个灵活、易于使用的库,能够视觉上识别文档布局并有效地进行分块。与其他布局解析器不同之处在于 Open Parse 通过视觉分析文档,而不仅仅是简单的文本分割。

它支持基本的 Markdown 解析,提供高精度的表格支持,能够准确提取表格并转换为干净的 Markdown 格式。此外,Open Parse 还具有可扩展性,易于实现自定义后处理步骤,提供直观的编辑器支持,设计简单易用,减少阅读文档的时间。

项目还提供了示例代码和说明文档,以及安装和使用说明,包括核心库的安装和启用 OCR 支持,以及可选的 ML 表格检测功能的安装和使用方法。您可以在 GitHub 上找到更多关于这个项目的详细信息和文档。


HN 评论 36 comments | 作者:serjester | 18 hours ago #

https://news.ycombinator.com/item?id=39966534

  • 评论认为正确的分块可以提高准确性,但仍然是单次操作,建议多次搜索策略可能提高性能;
  • 有人提到 RAG 管道不仅仅是文档分块,还包括查询分解、文档摘要和分块等多种方式;
  • 有人建议多种搜索策略结合多个搜索短语的变体可能提高性能,但目前成本高且缓慢;
  • 有人分享了 OCR 工具 surya,提供更准确的 OCR 功能;
  • 讨论了 PDF 文档中表格的挑战性,提到了一些解决方案;
  • 有人提到希望实现动态分块,搜索文档中的词并获取符合限制条件的最大分块;
  • 讨论了文档中的表格检测和解析的准确性问题;
  • 有人分享了 camelot 用于从 PDF 中提取表格的经验;
  • 有人推荐 LLMWhisperer 用于从复杂文档中提取数据,包括复杂表格和复选框等;
  • 有人询问工具是否仅限于 PDF,还是支持其他格式如纯文本、HTML 等。