2024 04 13 HackerNews

2024-04-13 Hacker News Top Stories #

一句话摘要 #

  1. An open source initiative to share and compare heat pump performance data 一个开源社区项目,旨在分享和比较热泵系统的性能数据。
  2. I Lost Faith in Kagi 文章讨论了名为Kagi的付费搜索引擎的问题,包括其人工智能焦点、财务和领导层的质疑。
  3. Hacked Nvidia 4090 GPU driver to enable P2P 一个NVIDIA Linux开源GPU内核模块项目,通过添加4090型号的P2P支持,提高了GPU间数据传输的性能。
  4. There’s a 30-year old dead Rabbit in Seven Sisters tube station 伦敦Seven Sisters地铁站内悬挂了超过三十年的死兔子,是早期移动电话技术Telepoint服务的象征。
  5. What is Webb observing now? 介绍了韦伯望远镜后期处理图像的情况,以及望远镜指向的位置信息。
  6. DNS over Wikipedia 一个项目,通过维基百科重定向.idk域名,提供了一种新的DNS查询方法。
  7. Using ClickHouse to scale an events engine 文章分享了如何使用ClickHouse数据库来扩展事件引擎,处理数百万事件的需求。
  8. Show HN: 5 Years Ago I made the Recovery Kit, I just made the RK2 作者介绍了他设计的“Recovery Kit Version Two”,一个用于树莓派的坚固计算机外壳。
  9. Building a Linux Container Using Namespaces: Part – 1 (2020) 详细介绍了如何使用Linux的Namespaces技术构建一个Linux容器。
  10. 96% of US hospital websites share visitor info with Meta, Google, data brokers 研究表明,96%的美国医院网站与Google、Meta和数据经纪人等第三方共享用户信息。

An open source initiative to share and compare heat pump performance data #

https://heatpumpmonitor.org/

网站 https://heatpumpmonitor.org/ 主要展示了通过 OpenEnergyMonitor 监测的各种安装情况,并提供详细的统计数据以展示性能的差异。用户可以通过 emoncms 和 My Heat Pump 应用程序监测热泵,并登录以添加自己的信息。

网站还提供了各种统计时间段,包括过去 7 天、30 天、90 天、365 天等。用户可以筛选系统,查看不同地点、安装商、型号等热泵的性能数据,如额定功率、COP 值等。总体而言,该网站是一个开源社区倡议项目,旨在分享热泵系统的性能数据。


HN 评论 298 comments | 作者:protontypes | 14 hours ago #

https://news.ycombinator.com/item?id=40010615

  • 有人认为热泵安装复杂、昂贵,需要大量工作和额外绝缘,不是锅炉的直接替代品;
  • 有人认为热泵其实是空调器的反向运行,安装简单,应该在更新空调系统时考虑;
  • 有人建议在淋浴前安装换热器,利用排水热量预热冷水,节约能源;
  • 有人分享安装热泵和混合式热水器以节省电费的经验,提到需注意峰值需求和环境温度;
  • 有人讨论热泵在寒冷气候下的适用性和效率;
  • 有人分享在安大略省安装热泵后明显减少燃气费用的经历;
  • 有人提到在加拿大使用热泵大幅减少燃料费用;
  • 有人分享在魁北克寻找适合 750 平方英尺的热泵的建议;
  • 有人讨论热泵的适配性和效率问题,建议选择适合的规格以节约成本。

I Lost Faith in Kagi #

https://d-shoot.net/kagi.html

这个网页是关于一个名为 Kagi 的付费搜索引擎的问题,主要涉及其人工智能焦点、财务和领导层的问题。

Kagi 被描述为一个专注于隐私的搜索引擎,但作者认为它实际上并非如此,而且项目本身并不具备可持续性。Kagi 的项目过于庞大,包括一系列人工智能工具、一款名为 Orion 的仅限 Mac 的网络浏览器,以及他们计划推出的电子邮件服务。

然而,这些项目并不特别赚钱,导致财务状况不透明。Kagi 曾筹集了约 67 万美元的资金,但财务状况缺乏透明度,甚至出现未缴纳销售税的情况。

此外,Kagi 的人工智能工具和对隐私的态度也备受质疑,创始人 Vlad 对人工智能的狂热信仰以及对隐私的漠视引起了作者的担忧。

总的来说,文章认为 Kagi 在财务、人工智能和隐私方面存在诸多问题,不建议人们继续使用。


HN 评论 488 comments | 作者:Tomte | 12 hours ago #

https://news.ycombinator.com/item?id=40011314

评论归纳观点如下:

    1. 一些用户认为 Kagi 应更专注于提供出色的搜索体验,而不是分散精力于其他项目;
    1. 有人对 Kagi 为用户印制 T 恤表示失望,认为这样做并没有改善产品,反而浪费了资源;
    1. 创始人解释为什么选择向支持者赠送 T 恤,强调 Kagi 的成长依赖于用户社区的支持;
    1. 有人建议 Kagi 应倾听用户反馈,重视用户需求,以确保公司成功;
    1. 有人支持 Kagi 的愿景,认为 Orion 等项目是公司愿景的一部分;
    1. 一些用户认为 Kagi 应更专注于搜索产品,而不是其他项目。

Hacked Nvidia 4090 GPU driver to enable P2P #

https://github.com/tinygrad/open-gpu-kernel-modules

这个 GitHub 地址( https://github.com/tinygrad/open-gpu-kernel-modules)是关于 NVIDIA Linux 开源 GPU 内核模块的项目。这个项目是 NVIDIA 驱动程序的一个分支,添加了对 4090 型号的 P2P 支持。

通过运行./install.sh 脚本,可以安装这个项目。系统需要支持大型 BAR(Base Address Register)并关闭 IOMMU。项目的目标是利用 PCIe 规范,而不是进行任何黑客行为。

该项目通过直接调用 GH100 方法来实现 P2P 支持,其中包括将整个 VRAM 映射到 BAR1。项目还解决了一些问题,如 GMMU_APERTURE_PEER 映射类型不受 4090 型号支持的问题。

最终,项目实现了在 GPU 之间进行数据传输的功能,提高了性能。整个项目感谢 NVIDIA 编写了如此稳定的驱动程序。


HN 评论 250 comments | 作者:nikitml | 14 hours ago #

https://news.ycombinator.com/item?id=40010819

在这篇帖子的评论中,有关观点主要包括:

    1. 讨论了在构建本地 LLMs 时使用 4x4090 GPU 的可能性和优势;
    1. 对于 GPU 数量选择的讨论,6 个 GPU 的选择基于 PCIe 通道的利用和存储需求;
    1. 讨论了 tinygrad 是否支持不同 GPU 数量的分割;
    1. 讨论了在 3090 GPU 上是否可能实现 P2P,以及相关 BIOS 更新;
    1. 对于 Apple Silicon 和 Nvidia GPU 性能和成本的比较;
    1. 讨论了 GPU 内存容量、性能和成本之间的权衡;
    1. 对于 GPU 数量选择的合理性和程序设计的影响;
    1. 对于硬件公司公开文档的呼吁和对产品使用控制的看法。

There’s a 30-year old dead Rabbit in Seven Sisters tube station #

https://www.ianvisits.co.uk/articles/theres-a-dead-rabbit-in-seven-sisters-tube-station-71502/

在伦敦的 Seven Sisters 地铁站内,有一只死兔子已经悬挂超过三十年了,每天有成千上万的人路过它却没有注意到。这只死兔子是早期移动电话技术的产物,尽管这项技术只维持了不到两年就关闭了。

故事要追溯到 1989 年,政府授予了四个运营 Telepoint 服务的许可证,旨在通过更低的成本与当时的两家移动网络公司——Cellnet(现在的 O2)和 Vodafone 竞争。当时这两家移动网络公司共有 50 万客户,预计 Telepoint 手机到了 1990 年代中期可能会有多达七百万客户。Rabbit 是由总部位于香港的企业 Hutchison 创建的,他们没有获得运营 Telepoint 服务的许可证,于是他们收购了其中一家获得许可证的公司。

然而,当公司准备向世界推出 Rabbit 时,其他三家公司——Mercury Callpoint、Ferranti’s Zonephone 和 BT’s Phonepoint——已经倒闭了。尽管 Rabbit 只能在距离基站 100 码内拨打电话,而且无法接听电话(你只能收到一个呼叫提示你打给某人)——理论上,它应该会取得成功。当时,这两家移动网络公司主要面向商务人士和雅皮士,使用起来非常昂贵,因此即使 Rabbit 手机功能受限,由于通话成本更低——基本手机资费每分钟 50 便士,而 Rabbit 只需每分钟 20 便士,而且月租更便宜,它们也具有竞争优势。另一个因素是 Rabbit 手机也可以在家中使用。许多家庭拥有无绳电话,但这些家用模拟无绳电话体积庞大,质量相当差,通话经常中断。Rabbit 手机配备了一个家用基站,并采用早期的数字电话技术,因此声音质量要好得多。而且手持部分比家用无绳电话小得多。

因此,当 Rabbit 于 1992 年 5 月进入商店销售时,销售预计会很快,而事实上确实如此。最初。我曾在一家销售 Rabbit 手机的商店工作,据我记忆,移动通话功能只占了大约一半的吸引力——当人们从朋友那里听说它的家用电话功能要好得多时,他们才真正感兴趣。Rabbit 在曼彻斯特的商店前和灯柱上设置了基站,并迅速扩展,到 1993 年底实现了全国覆盖。然后它突然关闭了。在一个值得铭记的日子,即 11 月 5 日星期五,Hutchison Telecom 突然宣布关闭 Rabbit 服务。Hutchison Telecom 最近获得了建设全面移动网络的许可证,不再对其旧的基于 Telepoint 的服务感兴趣。拥有 Rabbit 手机的客户获得了退款,并承诺在 Hutchison 的替代品——基于 GSM 的移动电话网络 Orange(现在是 EE)上享有折扣。

这只兔子失败了。未来是 Orange。Rabbit 关闭的消息引发了一个完全意想不到的销售激增。记得我提到过这些手机可以在家中作为笨重无绳电话的替代品使用——这并不依赖于 Rabbit 基站,因此在关闭移动网络后,手持部分仍然可以在家中继续使用。人们真的很喜欢 Rabbit 手机作为家用电话。尴尬的是,获得退款的客户必须归还手持部分,而许多人选择不归还,而商店被告知将未售出的库存退回仓库,而许多商店也选择不这样做。Hutchison 试图彻底淘汰这只兔子的努力陷入了困境。

最终,商店的 Rabbit 库存售罄,1993 年 12 月,Rabbit 基站永久关闭。然而,与许多街头家具一样,匆忙安装的东西可能需要很长时间才能慢慢移除。除非该位置需要用于其他用途,否则旧标志和杂物可能会持续存在多年,甚至几十年。因此,在 Seven Sisters 地铁站内,仍然有一个 Rabbit 基站悬挂在墙上,超过 30 年后仍然没有发出无线电信号。如果你想找到这只死兔子,只需前往 Seven Sisters 地铁站的 High Road 入口售票大厅,你可以在通往维多利亚线的自动扶梯旁找到它。在 Watford Junction 站的 7/8 站台候车室内还有另一只状况较好的 Rabbit 手机。


HN 评论 178 comments | 作者:edward | 17 hours ago #

https://news.ycombinator.com/item?id=40009856

评论中的观点归纳如下:

    1. 美国西部小镇有许多有趣的时代遗迹;
    1. 在南爱达荷州发现了一个废弃的小镇,保留了过去的物品;
    1. 评论中提到的美国乡村故事在英国帖子中引起了一些人的困惑;
    1. Kermit 手机在荷兰也有类似的情况;
    1. Muppet Show 在全球范围内都很受欢迎;
    1. 有关 Rabbit 手机的讨论;
    1. DECT 电话的使用;
    1. 街头家具应该被保护以反映我们的技术过去。

What is Webb observing now? #

https://spacetelescopelive.org/webb?obsId=01HTJT20C0STKNZ01KQYGEKBQ1

韦伯望远镜后期处理图像


HN 评论 65 comments | 作者:janandonly | 16 hours ago #

https://news.ycombinator.com/item?id=40010221

这篇帖子中的观点包括:

    1. 一些人可能不清楚他们在看什么,因为这不是实时图像,而是指示望远镜指向的位置;
    1. 望远镜无法提供最新视图,因为图像属于研究小组,只有在发布结果时才会公开;
    1. 望远镜使用深空网络与我们通信,每天有三次联系,但数据传输不是 24/7;
    1. 一些人认为后期处理过多,建议简化数据转换;
    1. 所有 Webb 看到的都是红外光,需要处理才能看清;
    1. 红外图片不是 RGB,可以转换为黑白或其他调色板;
    1. 星星的光谱可能不会显示六边形图案,因为这些可能是星系而不是恒星。

DNS over Wikipedia #

https://github.com/aaronjanse/dns-over-wikipedia

这个项目是关于使用维基百科重定向.idk 域名的。安装了 DNS over Wikipedia 后,以.idk 结尾的域名会通过搜索维基百科并从信息框中提取相关 URL 来进行重定向。

例如,输入 scihub.idk/到浏览器地址栏,会被重定向到 https://sci-hub.tw(截至目前为止)。作者指出,相比于谷歌搜索网站,他更倾向于搜索网站的维基百科文章,因为维基百科通常在侧边栏提供了最新的网站链接,而谷歌则被迫审查他们的搜索结果。

项目提供了 Chrome 和 Firefox 浏览器扩展以及可选的 Rust 重定向脚本。


HN 评论 80 comments | 作者:pyinstallwoes | 22 hours ago #

https://news.ycombinator.com/item?id=40008383

评论中的观点归纳如下:

Wikipedia 编辑意识到其文章被用于查找因法律或道德问题频繁更改 URL 的网站;

搜索引擎通常显示不正确的链接并推广恶意网站;

Wikipedia 存在审查,但它似乎假装没有;

Kiwi Farms 等网站通常受到审查,但审查标准似乎是随意的;

Wikipedia 在处理链接时存在争议,有人认为其存在审查,而有人认为不存在;

一些人认为审查合法但仍然对 Wikipedia 的处理方式感到不满;

一些人认为 Wikipedia 的审查是政治审查而非因为非法内容;

还有人提到了关于 Chrome 扩展权限的讨论。


Using ClickHouse to scale an events engine #

https://github.com/getlago/lago/wiki/Using-Clickhouse-to-scale-an-events-engine

这篇文章介绍了如何使用 ClickHouse 来扩展事件引擎。作者分享了他们在扩展核心产品 Lago 时,由于每分钟处理数百万事件的需求,从传统的 Postgres 数据库转向使用分布式 ClickHouse 实例的决策过程。

他们保留了 Postgres 用于其他数据需求,但将流式事件存储在 ClickHouse 中,以便分析服务可以直接查询 ClickHouse。文章还探讨了 OLTP(在线事务处理)和 OLAP(在线分析处理)数据库之间的区别,以及为什么选择 ClickHouse 作为混合数据库堆栈的一部分。

ClickHouse 的特点包括动态物化视图、专用引擎和矢量化查询执行,使其成为强大的分析工具。作者还分享了他们如何部署和使用 ClickHouse 实例来处理原始计费事件数据,并介绍了 ClickHouse 在开源项目中的其他应用实例。

文章总结了硬件优化对数据库设计的重要性,强调了在应用扩展时选择合适的数据库解决方案的重要性。


HN 评论 93 comments | 作者:wyndham | 1 day ago #

https://news.ycombinator.com/item?id=40005005

评论中的观点归纳如下:

    1. Postgres vs OLAP 领域的新趋势,Hydra 等新工具可能改变选择;
    1. ClickHouse 和 Alloy 性能令人印象深刻;
    1. ClickHouse 适合存储不可变数据,不适合低延迟更新;
    1. ClickHouse 适合大表分析,但维护成本可能高;
    1. StarRocks 可能更适合多表 JOIN 操作;
    1. ClickHouse 在替代 Postgres 时性能提升显著;
    1. BigQuery 在内部分析中表现出色,但成本可能是问题;
    1. ClickHouse 运维相对简单,但需考虑成本。

Show HN: 5 Years Ago I made the Recovery Kit, I just made the RK2 #

https://www.doscher.com/recovery-kit-version-2/

这个网页是关于“Recovery Kit Version Two”的内容,作者是 Jay Doscher。文章介绍了作者在 2019 年制作的“Recovery Kit”,最初发布在他的 back7.co 博客上。

作者创建这个项目时,并不清楚“cyberdeck”是什么,只是简单地将其视为 William Gibson 的《神经漫游者》中的一部分。作者想要为他的树莓派制作一个坚固的计算机外壳,当时对于树莓派的简单和廉价外壳感到不满意。文章提到作者在过去五年中制作了许多 CAD 变体,试图改进“Recovery Kit”。

文章还提到“Recovery Kit”受到了 The Verge、Raspberry Pi Magazine、Hackster 等网站的关注,但作者的设计并未发布。作者还讨论了原始“Recovery Kit”中的一些挑战,如电池、键盘、布线等,并介绍了新版本的改进。

文章列出了构建所需的零件清单,包括核心计算与显示、电缆与适配器、前面板连接器、电池、键盘组件、螺丝、外壳和其他杂项硬件、工具以及数字文件。文章还提到了作者的订阅者将获得 STL 文件和 CAD 设计文件的访问权限。


HN 评论 45 comments | 作者:back7co | 7 hours ago #

https://news.ycombinator.com/item?id=40014937

  • 有评论认为内部设计与外部设定不匹配,建议内部应与外部风格一致,更专业耐用。
  • NASA 之所以使用耐用组件和冗余设计是因为在无人干预的环境中必须保持硬件运行,而一些项目如 Recovery Kit 则利用了通用硬件的可用性。
  • 评论提到在设计耐用产品时,可选择备用组件替换方式,而不是投入更多时间和金钱设计定制方案。
  • 有人分享了使用彩色跳线电缆代替焊接,以便在恶劣环境下更易维护的经验。
  • 有评论质疑为何称其为“Recovery Kit”,并提出对于耐用性和实用性的疑问。
  • 有人建议在设计项目时尽量减少使用不同规格的螺丝,以提高便捷性。
  • 评论指出项目在设计上有限制,未能实现更多功能,如模拟 USB 存储、透明桥接等。
  • 有人认为该项目更像是制作者的个人兴趣项目,而非真正的末日预备项目。
  • 评论提到在现代手机具备防水防尘功能的情况下,携带大型设备可能不实际,建议使用轻便设备如手机配合外部存储设备。

Building a Linux Container Using Namespaces: Part – 1 (2020) #

https://www.polarsparc.com/xhtml/Containers-1.html

这个网页内容主要介绍了如何使用 Linux 的 Namespaces 构建一个 Linux 容器的第一部分。文章首先解释了 Linux 容器的工作原理,指出容器是在同一个操作系统内核上运行的,但通过隔离应用程序进程使其相互隔离。其中的关键技术之一是 Namespaces,它抽象了全局系统资源,如主机名、用户 ID、组 ID、进程 ID、网络端口等,使得进程在其内部似乎拥有自己独立的全局系统资源实例。

文章详细介绍了 Linux 中的 6 种 Namespaces 类型:IPC、Network、Mount、PID、User 和 UTS,并对每种 Namespace 进行了简要描述。接着,文章展示了如何使用 unshare Linux 命令来实现、构建和执行一个简单的容器,使用 golang 语言。

安装和设置部分介绍了在 Ubuntu 18.04 LTS 基础上安装所需的软件包,如 uidmap、bridge-utils 和 golang。然后,文章展示了如何使用 netlink 等工具来开发、构建和执行一个简单容器。

文章还详细介绍了 UTS Namespace 的操作,展示了如何使用 unshare 命令和简单的 go 程序来实现 UTS Namespace 的隔离。接着介绍了 User Namespace 和 PID Namespace 的操作,并展示了如何使用 unshare 命令和简单的 go 程序来实现这些 Namespace 的隔离。

总体来说,这篇文章提供了关于 Linux 容器和 Namespaces 的详细介绍,以及如何使用不同类型的 Namespaces 来实现容器隔离的实际操作步骤。


HN 评论 18 comments | 作者:Arteiii | 21 hours ago #

https://news.ycombinator.com/item?id=40008841

这篇帖子中评论的观点主要包括:分享相关 Linux 容器机制的资源链接、提到 cgroups 版本 2、介绍使用 bocker 实现 docker 重要部分、讨论使用命名空间模拟网络故障、建议使用 tc 工具与内核交互、提及网络命名空间和 Openstack 项目、谈论 cgroups 版本 1 和版本 2 的差异、讨论 Ubuntu 版本对稳定性的影响。


96% of US hospital websites share visitor info with Meta, Google, data brokers #

https://www.theregister.com/2024/04/11/hospital_website_data_sharing/

根据《The Register》发布的研究,尽管人们隐含地期望医院是保护个人信息的地方,但实际上,许多医院网站经常使用跟踪技术与 Google、Meta、数据经纪人和其他第三方共享用户信息。宾夕法尼亚大学的学者们分析了 100 家非联邦急救医院的网站,发现其中 96% 的网站向第三方传输用户数据。而且,并非所有这些网站都有隐私政策,而在有隐私政策的网站中,有 56% 披露了可以接收用户信息的具体第三方公司。

研究人员发现,大多数医院网站收集的用户信息包括 IP 地址、网页浏览器名称和版本、访问的网页以及用户访问网站的来源等。然而,只有 56% 的隐私政策指明了接收用户信息的第三方公司。这种情况不仅使医院网站访客面临数据被收集和分享的风险,也对医院自身构成风险。

此外,研究人员警告说,医院网站收集特定类别用户信息的网站可能还需遵守其他联邦和州级特定数据收集和通知要求。最后,研究呼吁进行根本性反思,提出了保护个人信息的建议,包括使用浏览器工具 Ghostery 和 Privacy Badger 来识别和阻止向第三方域的数据传输。


HN 评论 59 comments | 作者:LinuxBender | 10 hours ago #

https://news.ycombinator.com/item?id=40012466

  • 医院网站分享访客信息给 Meta、Google 和数据经纪人,引发隐私担忧。
  • 政府开始严格执法,对医院分享数据行为进行调查和处罚。
  • 一些研究发现医疗系统内部数据可能被多达 300 个实体访问,存在隐私和安全风险。
  • 有人认为网站访客追踪是普遍现象,但医院网站处理敏感信息时应更加谨慎。
  • 医院应专注于提供医疗服务,而非过度营销。
  • 数据监管应该是允许列表,而非拒绝列表。
  • 医院网站信息可能泄露个人健康信息,引发隐私担忧。
  • 医院网站使用的追踪技术可能泄露个人隐私,需要更严格的监管。
  • 医院网站追踪数据可能包含敏感信息,应引起重视。
  • 美国医院网站使用 Google Analytics 等工具,可能泄露个人健康信息,需要更严格的监管。