2024 04 12 HackerNews

2024-04-12 Hacker News Top Stories #

一句话摘要 #

  1. AI-generated sad girl with piano performs the text of the MIT License 一首由人工智能创作的悲伤女孩钢琴民谣,基于MIT许可证文本演绎而成,允许免费使用但需包含版权和许可声明。
  2. Anyone got a contact at OpenAI. They have a spider problem 一位内容农场网站所有者寻求OpenAI的联系,因其网站被GPTBot不断抓取,尤其是robots.txt文件。
  3. Show HN: I made a new sensor out of 3D printer filament for my PhD 作者介绍了其博士研究中开发的OptiGap传感器系统,这是一种用于软机器人的新型传感器,使用3D打印材料制作。
  4. Aider: AI pair programming in your terminal Aider是一个命令行工具,允许用户与GPT-3.5/GPT-4进行编程配对,直接编辑本地git存储库中的代码。
  5. Apple alerts users in 92 nations to mercenary spyware attacks 苹果公司向92个国家的iPhone用户发出警告,提醒他们可能成为雇佣间谍软件攻击的目标,建议认真对待此类威胁。
  6. Code search is hard Val Town的博客文章讨论了代码搜索的挑战,指出主流搜索解决方案并不适用于代码,并探讨了改进搜索的可能性。
  7. Why can’t my mom email me? 文章探讨了Proton加密电子邮件服务的问题,作者因Proton的加密机制未能收到非Proton邮件地址的邮件。
  8. Udio: Generate music in your favorite styles with a text prompt Udio是一个音乐创作应用,用户可以通过文本提示生成不同风格的音乐。
  9. Amazon owes $525M in cloud-storage patent fight, US jury says 亚马逊因侵犯科技公司Kove的数据存储技术专利,被裁定需支付5.25亿美元赔偿。
  10. EPA Says ‘Forever Chemicals’ Must Be Removed from Tap Water 美国环保局首次要求供水系统去除与多种健康问题相关的六种“永久化学物质”,以保护公共自来水安全。

AI-generated sad girl with piano performs the text of the MIT License #

https://suno.com/song/da6d4a83-1001-4694-8c28-648a6e8bad0a/

这个链接指向一首名为“Permission is hereby granted”的歌曲。这是一首悲伤的女孩钢琴民谣,由一位受过爵士训练的女歌手创作和演唱。

歌曲允许免费使用,包括复制、修改、合并、发布、分发、转让副本,并允许其他人这样做,但需要在所有副本或实质部分中包含版权声明和许可声明。软件按“原样”提供,不提供任何明示或暗示的担保,包括但不限于适销性、特定用途的适用性和非侵权性的担保。作者或版权持有者不对软件或软件使用或其他交易中产生的任何索赔、损害或其他责任承担责任。


HN 评论 353 comments | 作者:hongsy | 18 hours ago #

https://news.ycombinator.com/item?id=39998849

评论中的观点归纳如下:

    1. 人工智能创作的音乐缺乏钩子和重复旋律,有些认为这是因为输入的文本本身缺乏重复;
    1. 人工智能音乐在当前形式下主要具有新奇性,适合用于游戏开发或 YouTube 音乐库替代品,但仍有改进空间;
    1. 人工智能音乐可能会推动音乐产业走向更商业化,降低音乐创作门槛,但也可能导致更多平庸音乐的涌现;
    1. 人们对人工智能音乐的未来发展持不同看法,有人认为未来可能会创作出独特的音乐,也有人认为音乐的价值在于稀缺性,过度普及会降低其特殊性。

Anyone got a contact at OpenAI. They have a spider problem #

https://mailman.nanog.org/pipermail/nanog/2024-April/225407.html

这个链接指向一个邮件列表中的帖子,内容是关于一个人在寻找 OpenAI 的联系人,因为他们遇到了一个爬虫问题。这个人提到了自己拥有一个内容农场网站,但 GPTBot(一种机器人)却在不断抓取网站上的页面,尤其是 robots.txt 文件。

他询问是否有人认识 OpenAI 的联系人,因为之前 Amazon 的爬虫也曾遇到类似问题。此外,他还提到了关于 GPT-5 的训练情况。


HN 评论 295 comments | 作者:speckx | 10 hours ago #

https://news.ycombinator.com/item?id=40001971

  • 有关 GPT-2/3/J 对 Reddit 论坛中数字计数帖子的处理方式,以及词汇量有限性对模型表现的影响的讨论;
  • 讨论“幻觉”一词是否适用于描述模型生成内容,提出“混淆记忆”更准确,同时探讨新词“hallucofabulation”的提出;
  • 就“幻觉”与“混淆记忆”之间的区别展开讨论,有人认为前者涉及想象力和愚弄,后者更涉及混淆或不同观点;
  • 通过逻辑学家笑话讨论逻辑推理;
  • 探讨 LLM 在回答“我不知道”方面的困难,以及如何训练模型表达自己的不知道状态;
  • 讨论 LLM 在处理不确定问题时的表现,以及人类如何学会表达“我不知道”的能力;
  • 探讨 LLM 在语言处理中的局限性,以及如何训练模型在不确定情况下做出正确回答。

Show HN: I made a new sensor out of 3D printer filament for my PhD #

https://paulbupejr.com/developing-the-optigap-sensor-system/

这篇文章探讨了 OptiGap 传感器系统的研究和开发过程,这是一种软机器人的关键组件,详细描述了研究之旅和其背后的发展过程。

作者在叙述中提供了决策过程和最终实施的进化过程,希望能够让读者窥见博士研究的世界,对研究过程感兴趣的人可能会感到兴趣。OptiGap 传感器的应用主要在软机器人领域,通常涉及柔性系统,传统传感器的使用通常不实际。OptiGap 的核心原则是利用柔性光学光管内的空气间隙生成编码模式,用于弯曲定位。

文章详细描述了 OptiGap 传感器系统的起源、实现过程以及技术细节,包括光传感、编码原理、原型设计和实时机器学习等方面。作者还介绍了 OptiGap 系统的设计规格、关键特性和参数,以及下一步的发展方向和商业化前景。


HN 评论 98 comments | 作者:00702 | 8 hours ago #

https://news.ycombinator.com/item?id=40003710

  • 评论中提到研究和文档详尽,类似于时间域反射技术;
  • 有人对传感器在多处弯曲时的工作原理产生疑问;
  • 有人指出这种技术类似于任天堂 Power Glove;
  • 评论中提到这种传感器有着广泛的应用前景,如软体机器人的触觉感应;
  • 有人提出了用于高尔夫球杆运动检测的应用想法;
  • 评论中提到了博士研究的时间长度和方法;
  • 有人提到了光纤光栅技术的应用;
  • 评论中提到了传感器数据的可视化;
  • 有人提出了改进传感器设计的建议;
  • 评论中提到了传感器的制造挑战;
  • 有人提到了传感器在手术机器人领域的应用。

Aider: AI pair programming in your terminal #

https://github.com/paul-gauthier/aider

这个 GitHub 地址 https://github.com/paul-gauthier/aider 是关于名为"Aider"的项目,它是一个在终端中进行 AI 对编程的工具。Aider 是一个命令行工具,让您可以与 GPT-3.5/GPT-4 进行编程配对,以编辑存储在本地 git 存储库中的代码。Aider 将直接编辑本地源文件中的代码,并使用合理的提交消息提交更改。您可以启动一个新项目或使用现有的 git 存储库。Aider 的独特之处在于,它允许您请求对现有的大型代码库进行更改。

一些功能和用法包括:

  • 通过命令行启动 Aider,让 GPT 查看和编辑指定的源文件。
  • GPT 可以编写和编辑大多数流行的编程语言,如 Python、JavaScript、TypeScript、PHP、HTML、CSS 等。
  • 请求新功能、更改、改进或错误修复到您的代码。
  • Aider 将 GPT 建议的编辑直接应用于您的源文件。
  • Aider 将每个更改集自动提交到您的本地 git 存储库,并附有描述性提交消息。
  • 您可以同时使用 Aider 处理多个源文件,以便 GPT 可以在单个更改集/提交中进行协调的代码更改。
  • Aider 可以为 GPT-4 提供您整个 git 存储库的地图,帮助其理解和修改大型代码库。

此外,Aider 还支持在聊天中使用命令,如添加文件、删除文件、撤消上次提交等。它还提供了一些提示,如添加需要编辑的文件、以步骤方式执行大型更改等。

您可以通过安装 Aider 并按照指南开始使用,与 GPT-3.5/GPT-4 一起进行编程配对,以提高编程效率。


HN 评论 149 comments | 作者:tosh | 1 day ago #

https://news.ycombinator.com/item?id=39995725

  • 有关 Aider 和 Plandex 的比较,Plandex 更专注于构建较大功能,加载相关文件后跨多个步骤和模型调用构建整个功能,而 Aider 则需要更多的来回交互才能达到类似结果。
  • 关于使用 LLM 进行编码任务,有人认为在特定应用中这些工具可以非常棒,但需要明确了解其限制,智能辅助开发可以带来巨大帮助。
  • 有人提到 LLM 不存储信息,只关注语言,而不是信息。
  • 有人对 AI 工具更好地整合到 IDE 中表示兴趣,希望有更深入的集成,以便更好地利用 LLM 的潜力。
  • 有人提到使用 Cursor 作为一个专注于 AI 的 VSCode 分支,并表示满意。

Apple alerts users in 92 nations to mercenary spyware attacks #

https://techcrunch.com/2024/04/10/apple-warning-mercenary-spyware-attacks/

根据 TechCrunch 的报道,苹果公司在周三向 92 个国家的 iPhone 用户发送了威胁通知,警告他们可能已成为雇佣间谍软件攻击的目标。

苹果公司表示,它在周三太平洋时间中午 12 点向 92 个国家的个人发送了警报。通知中并未透露攻击者的身份或用户收到通知的国家。通知中写道:“苹果检测到您正成为雇佣间谍软件攻击的目标,对您与您的 Apple ID 相关联的 iPhone 进行远程破坏。”苹果在警告受影响的客户时补充说:“这种攻击可能是针对您个人的,因为您是谁或您所从事的工作。

尽管在检测此类攻击时不可能达到绝对确定性,但苹果对此警告非常有信心,请认真对待。”苹果每年多次发送这类通知,并自 2021 年以来已向 150 多个国家的用户发出了此类威胁通知。去年 10 月,苹果还向印度的一些记者和政治人物发送了相同的警告。

后来,非营利性倡导组织大赦国际报告称,他们在印度著名记者的 iPhone 上发现了以色列间谍软件制造商 NSO Group 的侵入性间谍软件 Pegasus。这些间谍软件警报出现在许多国家准备选举的时候。在最近几个月,许多科技公司已经警告称,有关国家支持的努力可能会影响某些选举结果。然而,苹果的警报并未提及其时机。苹果告知受影响的客户说:“我们无法提供有关我们发送此通知的原因的更多信息,因为这可能会帮助雇佣间谍软件攻击者调整其行为,以逃避未来的检测。”苹果此前曾将攻击者描述为“国家支持”,但已将所有此类引用替换为“雇佣间谍软件攻击”。

对客户的警告补充说:“雇佣间谍软件攻击,例如使用 NSO Group 的 Pegasus,异常罕见,远比常规网络犯罪活动或消费者恶意软件复杂得多。”苹果表示,它仅依靠“内部威胁情报信息和调查来检测此类攻击。”“尽管我们的调查永远无法达到绝对确定性,但苹果的威胁通知是高度可信的警报,表明用户已被雇佣间谍软件攻击个别针对,应该非常认真对待。”


HN 评论 220 comments | 作者:alwillis | 9 hours ago #

https://news.ycombinator.com/item?id=40002987

评论中的观点归纳如下:

    1. 有人认为被针对的可能是与政府有关系的人,如研究实验室工作人员、工业制造商、科技公司员工等;
    1. 也有人认为大学生可能成为目标,因为他们常常参与活动或持不同政见,可能被监视;
    1. 还有人提到大学生可能因为负债累累而成为目标;
    1. 有人讨论了技术公司的隐私问题,如 iMessage 的备份可能存在安全隐患。

Code search is hard #

https://blog.val.town/blog/search-notes/

这篇博客标题为《Code Search is Hard》,作者 Tom MacWright 于 2024 年 4 月 10 日发布。文章讨论了 Val Town 的搜索功能目前存在的问题,使用的是 Postgres ILIKE 功能,只执行子字符串搜索,没有排名,对多词查询支持不佳。改进搜索是用户最请求的功能之一。

作者提到主流搜索解决方案设计用于自然语言而非代码,大公司为代码搜索需求花费了大量时间和金钱构建自定义解决方案。文章介绍了使用 Postgres 的全文搜索扩展和 pg_trgrm 实现的 trigram 搜索算法。作者还列举了一些代码搜索工具的架构、语言和星标评级,如 Meilisearch、Typesense、Zoekt、ParadeDB 和 Sonic。

总体来说,文章探讨了搜索代码相对于搜索英语的困难之处,以及不同搜索解决方案的优缺点。作者强调了对于小团队来说,保持基础设施简单、开发环境易于设置以及数据在同一位置的重要性。文章指出了搜索代码的困难之处,以及为什么大多数中大型公司拥有搜索团队而不仅仅是搜索服务。


HN 评论 149 comments | 作者:stevekrouse | 1 day ago #

https://news.ycombinator.com/item?id=39993976

这篇帖子中的评论观点主要包括:

    1. 建议在添加代码搜索到产品时,最初不要使用索引,而是进行即时搜索,直到需要索引时再进行;
    1. Zoekt 被认为是最佳的索引搜索方式;
    1. 有人惊讶地发现在没有索引的情况下也能取得很大进展;
    1. SCIP 被认为是 LSIF 的演进;
    1. 有人认为内部代码搜索平台使生活变得更轻松;
    1. 对公共工具中缺少的构建集成进行了讨论;
    1. 谈到了 Google 内部代码搜索的优势在于与构建系统的集成。

Why can’t my mom email me? #

https://matduggan.com/why-cant-my-mom-email-me/

这篇文章探讨了 Proton 加密电子邮件的问题。作者发现最近收不到来自朋友甚至母亲的电子邮件,而收到的却是 PGP 加密的电子邮件。

作者发现 Proton 会向其他 Proton 邮件地址发送加密电子邮件,但对于非 Proton 托管的电子邮件地址,却出现了问题。作者调查后发现,Proton 似乎会通过 OpenPGP Web Key Directory(WKD)返回密钥,然后使用这些密钥加密电子邮件。

作者解决了这个问题,通过从 keys.openpgp.org 中删除自己的密钥,成功停止了 Proton 发送加密电子邮件的行为。文章最后提到作者将继续更新关于 Proton 的回复,同时建议读者如果遇到类似问题,可以通过特定链接进行反馈。


HN 评论 270 comments | 作者:FiloSottile | 1 day ago #

https://news.ycombinator.com/item?id=39996314

在这篇帖子的评论中,有关观点主要包括:

    1. 对于加密电子邮件的便利性和用户体验的讨论;
    1. Protonmail 在处理加密电子邮件方面的做法和用户反馈;
    1. 关于加密邮件的默认设置和用户选择权的争论;
    1. 对于加密通信的不同用途和应用场景的讨论。

Udio: Generate music in your favorite styles with a text prompt #

https://twitter.com/udiomusic/status/1778045322654003448

这个链接指向一个推特帖子,内容为介绍名为“Udio”的音乐创作和分享应用程序。该应用程序允许用户以自己喜欢的风格生成令人惊叹的音乐,并提供直观且强大的文本提示功能。

该推文是 11 条推文中的第一条,发布时间为 2024 年 4 月 10 日下午 1:00。帖子中包含了 2.8 百万次观看、1,171 次转发、1,822 次引用、5,164 次喜欢、3,669 次收藏和 3.6K 次书签。


HN 评论 101 comments | 作者:gk1 | 1 day ago #

https://news.ycombinator.com/item?id=39993930

  • 有人认为使用文本生成音乐的想法并不新鲜,质疑是否缺乏对音乐创作体验的创新思维。
  • 期待一款能够将哼唱和节奏转化为不同风格音乐片段的应用。
  • 讨论了收集数据集的难点和 OpenAI 可能已经实现但未公开的观点。
  • 期待通过哼唱或吹口哨来生成音乐的应用。
  • 认为现有的文本生成音乐工具是第一步,未来应该朝着更好的工具方向发展。
  • 对于使用文本生成音乐和图像存在类似问题的观点。
  • 讨论了 AI 生成音乐在商业和个人娱乐中的应用。
  • 提出了对音乐生成工具的改进建议,包括更多控制选项和更好的用户界面。
  • 讨论了 AI 生成音乐的版权和法律问题。
  • 对 AI 音乐生成技术的进步表示惊讶和期待。

Amazon owes $525M in cloud-storage patent fight, US jury says #

https://www.reuters.com/legal/amazon-owes-525-mln-cloud-storage-patent-fight-us-jury-says-2024-04-11/

亚马逊的亚马逊网络服务(AWS)作为全球最大的云服务提供商,被伊利诺伊州联邦陪审团裁定,因侵犯科技公司 Kove 在数据存储技术方面的专利权而应支付 5.25 亿美元。

陪审团认定,AWS 侵犯了 Kove 的三项专利,这些专利涵盖了 Kove 称为亚马逊云计算部门能够 “存储和检索大量数据” 所必需的技术。亚马逊发言人表示,公司不同意裁决并打算上诉。Kove 的首席律师 Courtland Reichman 称这一裁决是 “对创新力量的证明,以及对初创公司在与科技巨头之间保护知识产权的重要性”。总部位于芝加哥的 Kove 于 2018 年在伊利诺伊州北区联邦地区法院起诉亚马逊。

该公司在诉讼中称其在 “云计算出现多年之前” 就率先开发了高性能云存储技术。Kove 声称 AWS 的 Amazon S3 存储服务、DynamoDB 数据库服务以及其他产品侵犯了云存储专利。周三,陪审团认同 Kove 的观点,认为 AWS 侵犯了所有三项有争议的 Kove 专利,尽管拒绝了 Kove 的主张称 AWS 故意违反其权利。

AWS 否认了这些指控,并主张这些专利无效。Kove 去年还在另一起伊利诺伊州的诉讼中起诉了谷歌,称其侵犯了同样的专利,该案仍在进行中。


HN 评论 195 comments | 作者:sashk | 22 hours ago #

https://news.ycombinator.com/item?id=39997556

  • 有人认为知识产权的概念与人类社会和技术进步的方式背道而驰,认为它是一种浪费,扼杀创新,将文化控制权交给有财力主张拥有的人。
  • 有人认为专利的问题在于技术专利过于宽泛,要求的实际材料科学内容较少,无法有效保护投资,需要更好的知识产权标准和定义适应现代产业。
  • 有人认为专利应该具体描述过程和技术,以便他人复制,但实际上专利往往过于宽泛,只是为了阻止新进入者,而不是真正推动创新。

EPA Says ‘Forever Chemicals’ Must Be Removed from Tap Water #

https://www.nytimes.com/2024/04/10/climate/epa-pfas-drinking-water.html

美国环保局首次要求市政供水系统将与癌症和其他健康问题相关的六种合成化学物质从数百万美国人的自来水中去除。这一举措要求供水机构将全称为 PFAS 的全氟烷基和全氟烷基化合物减少到接近零的水平。

这些化学物质被称为 “永久化学物质”,因为它们永远不会完全降解,在人体和环境中可能积累。这些化学物质在从牙线到消防泡沫再到儿童玩具等各种物品中都能被发现。这些化学物质是如此普遍,以至于它们可以在几乎每个美国人的血液中找到。

2023 年的一项政府研究发现,在私人井和公共自来水系统中,几乎一半的自来水中检测到了 PFAS 化学物质。根据环保局的说法,接触 PFAS 与代谢紊乱、妇女生育能力下降、儿童发育迟缓以及增加一些前列腺、肾脏和睾丸癌症的风险有关。环保局局长迈克尔・S・雷根称这项新规定为 “改变生活的行动”。

他表示,这一行动将预防数千人死亡,并减少数万人患重病的风险。这一规定被描述为联邦政府迄今采取的最重要行动,以减少饮用水中 PFAS 暴露的影响。他说:“我们正朝着最终彻底关闭永久化学物质的水龙头迈出一大步。”


HN 评论 2 comments | 作者:igonvalue | 1 day ago #

https://news.ycombinator.com/item?id=39996433

这篇评论讨论了关于水处理和过滤的各种观点。

评论者提到了居住在受污染城市的经验,指出他们采取了 RO 过滤水,因为担心未知的污染物,尽管城市供水系统已经进行了 GAC 过滤。

评论者还提到了 RO 系统的便利性和价格,建议 RO 成为标准购买物品,并提到了 RO 系统需要定期更换滤芯以保持有效。

此外,评论者还讨论了透析泵如何减少 RO 系统中的水浪费,并提到了全屋 RO 系统的成本和可能的浪费问题。

评论者还谈到了水回收和土壤污染的问题,以及 RO 系统在消除水中污染物方面的限制。

评论中还包括了对消费者对水处理的信任问题,以及针对污染问题的政府资金投入和解决方案。

最后,评论者分享了个人对保护健康的措施,包括佩戴医用手套和口罩。整体而言,评论涵盖了水处理、过滤、健康和环保等多个方面的观点和建议。