2024 03 16 HackerNews

2024-03-16 Hacker News Top Stories #

一句话摘要 #

  1. CEO of data privacy company Onerep.com founded dozens of people-search firms Onerep.com 声称帮助用户删除个人信息,但其CEO实际上创立了多家人员搜索公司,引发隐私和利益冲突的担忧。
  2. A friend of John Barnett said he predicted he might wind up dead 波音告密者约翰·巴尼特在去世前预言自己可能死亡,其朋友坚信他的死非自杀。
  3. Class Action Against General Motors LLC, OnStar LLC, LexisNexis Risk Solutions [pdf] 消费者对通用汽车、OnStar和LexisNexis提起集体诉讼,指控其未经同意发布驾驶信息,侵犯隐私权。
  4. FCC Officially Raises Minimum Broadband Metric from 25Mbps to 100Mbps 美国联邦通信委员会将最低宽带速度标准从25Mbps提升至100Mbps,以更好地评估互联网服务不足的地区。
  5. The Getty makes nearly 88k art images free to use J. Paul Getty Museum宣布其开放内容数据库下近88,000张艺术图像可免费使用,适用于商业及非商业目的。
  6. New York disbars infamous copyright troll 纽约州取消以发送威胁信函著称的版权律师Richard Liebowitz的律师执照。
  7. Vision Pro: What we got wrong at Oculus that Apple got right 前Oculus负责人Hugo Barra分享他对苹果Vision Pro的看法,认为其是VR行业的北极星,但也提出了改进建议。
  8. Ollama now supports AMD graphics cards Ollama宣布其AI模型训练工具现在支持AMD显卡,扩展了其硬件兼容性。
  9. What I learned from looking at 900 most popular open source AI tools Chip Huyen在四年前对开源机器学习生态系统进行了分析,现在她重新审视了这个话题。这次,她专注于围绕基础模型的技术栈
  10. More powerful Go execution traces 这篇文章介绍了关于Go语言执行追踪的更强大功能。通过runtime/trace包,可以生成每个goroutine在一段时间内的执行追踪。

CEO of data privacy company Onerep.com founded dozens of people-search firms #

https://krebsonsecurity.com/2024/03/ceo-of-data-privacy-company-onerep-com-founded-dozens-of-people-search-firms/

这篇文章讲述了数据隐私公司 Onerep.com 的 CEO 创建了数十家人员搜索公司的背景。Onerep.com 自称是一家总部位于弗吉尼亚州的服务公司,帮助人们从近 200 个人员搜索网站上删除个人信息。然而,对 onerep.com 的调查发现,该公司实际上在白俄罗斯和塞浦路斯运营,其创始人多年来创建了许多人员搜索服务公司。

Onerep 的“Protect”服务针对个人每月起价为 8.33 美元,家庭 15 美元,承诺从近 200 个人员搜索网站上删除个人信息。Onerep 还将其服务推广给寻求为员工提供持续从人员搜索网站上删除数据能力的公司。

然而,对 Onerep 的域名注册记录和其创始人的调查揭示了该公司的另一面。Onerep.com 表示其创始人兼 CEO 是来自白俄罗斯明斯克的 Dimitri Shelest,LinkedIn 上也显示 Shelest 的个人资料。历史注册记录显示,使用电子邮件地址 dmitrcox2@gmail.com 的 Shelest 先生是 onerep.com 的注册人。

文章还提到了 Shelest 先生涉及的其他人员搜索服务公司,以及他过去参与的一些活动,包括涉及俄罗斯语言药房垃圾邮件联盟计划。文章还探讨了 Onerep.com 与其他数据经纪人网站之间的联系,以及其创始人的多重利益冲突。文章最后提到了 KrebsOnSecurity 将继续调查各种消费者数据经纪人和人员搜索提供商的历史。


HN 评论 143 comments | 作者:todsacerdoti | 1 day ago #

https://news.ycombinator.com/item?id=39709089

这篇帖子中的评论观点归纳如下:

    1. 许多声誉管理机构也拥有发布人员信息的公共记录网站,雇佣他们删除信息会导致不断被添加到其他网站,形成无休止的游戏。
    1. 有人认为支付费用是一个信号表明“不是垃圾邮件发送者”。
    1. 有人认为类似信用局的机构收集信息后向世界发布,强调信息难以删除,需要付费监控信用。
    1. 有人将此类行为比作敲诈勒索。
    1. 有人认为政府和强盗的区别在于政府不会离开。
    1. 有人讨论数据经纪人的删除服务可能导致更多垃圾邮件和不必要联系。
    1. 有人提到数据经纪人可能支付数据经纪人一部分费用来删除姓名。
    1. 有人讨论隐私保护公司可能采取的不同策略,如制造大量虚假身份以混淆搜索结果。

A friend of John Barnett said he predicted he might wind up dead #

https://abcnews4.com/news/local/if-anything-happens-its-not-suicide-boeing-whistleblowers-prediction-before-death-south-carolina-abc-news-4-2024

这篇文章讲述了波音公司的告密者约翰·巴尼特(John Barnett)在去世前预言自己可能会死亡,而且可能会有消息传出称他自杀。

他的亲密家庭朋友詹妮弗(Jennifer)表示,巴尼特在前往作证几天前就预测到可能会发生在他身上的事情。詹妮弗坚信巴尼特并没有自杀,两人曾讨论过这种情况可能发生。

巴尼特曾对詹妮弗说过,如果发生任何事情,那不是自杀。他曾对波音公司提起严重的投诉,指控该公司对他进行报复,因为他揭露了不安全的做法。

尽管巴尼特已经去世,但他的律师表示他们仍准备在六月份进行审判。波音公司在巴尼特去世后表示哀悼,并表示与其家人和朋友同在。


HN 评论 371 comments | 作者:BostonFern | 16 hours ago #

https://news.ycombinator.com/item?id=39712618

这篇评论涵盖了许多观点和讨论,主要围绕着对 John Barnett 死亡可能性的猜测和涉及到 eBay 和 Boeing 等公司的行为。

有人认为 John Barnett 的死可能是由某位高层人员出于个人原因下令而导致的,但对于这种死亡事件是否涉及到谋杀还存在争议。

评论中还提到了 eBay 公司曾经对持负面评论者采取了过激行动,这种行为也引发了人们对于公司背后权力结构的怀疑。

同时,有人认为像 Boeing 这样的公司也可能会涉及类似的行为,因为它们通常与政府和国防领域有着紧密联系。

评论者还指出,一些正常人出于金钱动机可能会做出极端行为,即使他们看起来平常无异于其他人。


Class Action Against General Motors LLC, OnStar LLC, LexisNexis Risk Solutions [pdf] #

https://static01.nyt.com/newsgraphics/documenttools/0a813fc8e0ac1b6c/6c03d310-full.pdf

这份文件是一起关于消费者权益保护的法律诉讼案件的详细内容。起诉方是 Romeo Chicco,代表自己和其他受影响的人,被告包括 General Motors LLC、OnStar LLC 和 LexisNexis Risk Solutions Inc。

起诉涉及到 Fair Credit Reporting Act(FCRA)、Florida Deceptive and Unfair Trade Practices Act 以及 Florida Common Law of Privacy 等法律。起诉方声称被告在未经同意的情况下发布了有关消费者不良驾驶信息的错误报告,侵犯了隐私权,导致了损失和情感困扰。

文件详细描述了起诉方的购车经历、与 OnStar 和 LexisNexis 的争议、保险问题以及与被告的沟通过程。此案引发了对消费者数据隐私和保护的深入思考,对消费者权益和隐私保护提出了重要问题。


HN 评论 245 comments | 作者:troydavis | 23 hours ago #

https://news.ycombinator.com/item?id=39709991

    1. 汽车制造商分享驾驶行为数据给保险公司,引发隐私担忧;
    1. 一些人对数据共享表示支持,认为有助于定价和提供服务;
    1. 一些人对数据共享表示担忧,担心隐私泄露和监控;
    1. 一些人提到了如何禁用数据共享功能;
    1. 一些人讨论了 CarPlay 和音频数据共享的问题;
    1. 一些人谈到了法律诉讼和补救措施的可能性;
    1. 一些人呼吁加强对公司的惩罚以促使其行为改变;
    1. 一些人讨论了数据经纪商的行为和隐私问题。

FCC Officially Raises Minimum Broadband Metric from 25Mbps to 100Mbps #

https://www.pcmag.com/news/fcc-officially-raises-minimum-broadband-metric-from-25mbps-to-100mbps

根据 PCMag 的报道,美国联邦通信委员会(FCC)正式将最低宽带速度标准从 25Mbps 提高到 100Mbps。在周四的投票中,委员会以 3-2 的投票结果决定将宽带速度标准从下载速度 25Mbps 和上传速度 3Mbps 提高到下载速度 100Mbps 和上传速度 20Mbps。

FCC 主席杰西卡·罗森沃塞尔表示:“这一修正是迫在眉睫的,也有助于我们更好地确定低收入社区和农村地区的互联网服务不足程度。”提高速度标准的重要性在于帮助委员会确定美国哪些地区正在获得足够的互联网速度,以及是否需要更多政府资金支持。

根据 2022 年 12 月的 FCC 数据,约 4500 万美国人“缺乏 100/20Mbps 固定服务和 35/3Mbps 移动 5G-NR 服务”。在周四的投票中,FCC 还制定了将其宽带速度标准长期提高到 1000Mbps 下载速度和 500Mbps 上传速度的目标。两名共和党委员在周四的投票中持反对意见,其中布伦丹·卡尔委员指出,卫星互联网服务(如 SpaceX 的 Starlink)不符合速度标准,因为这些标准只考虑地面互联网。

另一名委员内森·西明顿补充说,忽略老旧的卫星互联网服务是有道理的,但不应忽略 Starlink,因为它已经在全国范围内提供高速互联网服务。西明顿表示,FCC 担心 Starlink 等卫星互联网服务面临容量限制,但他预计该公司的技术会随着时间的推移而改善,并敦促 FCC 允许 SpaceX 与其他宽带提供商“平等竞争”以获取联邦补贴。去年 12 月,SpaceX 未能获得 8.86 亿美元的联邦资金扩大 Starlink 在农村地区的覆盖。


HN 评论 215 comments | 作者:rosaleia000 | 1 day ago #

https://news.ycombinator.com/item?id=39708957

  • 一些人认为提高宽带最低上传速度从 3 到 25Mbps 是必要的,因为视频会议等需求需要更高的上传速度。
  • 有人认为 25Mbps 上传速度对大多数家庭来说过剩,15Mbps 已经足够。
  • 一些人表示网络提供商需要升级基础设施,但担心成本会转嫁给消费者。
  • 有人指出 CATV 设计为单向传输,现在网络提供商正在升级基础设施以提高上传速度。
  • 一些人讨论了 DOCSIS 标准的发展,以及对称上下行速度的重要性。
  • 有人分享了个人经历,提到网络提供商提高上传速度的情况。
  • 一些人讨论了家庭网络带宽的累积使用,以及对称服务的重要性。
  • 有人提到技术可以实现对称上传下载速度,但需要更新基础设施。
  • 一些人分享了网络提供商提高上传速度的经历,以及对网络性能的影响。
  • 有人讨论了 DOCSIS 标准的不同版本,以及对网络速度的影响。

The Getty makes nearly 88k art images free to use #

https://www.openculture.com/2024/03/the-getty-makes-nearly-88000-art-images-free-to-use-however-you-like.html

根据您提供的链接内容,J. Paul Getty Museum 自 2013 年推出其开放内容计划以来,一直在努力使其庞大的文化艺术品收藏在网上免费获取。他们不仅发布了数字化艺术作品,还发布了许多艺术史文本和艺术书籍。最近,他们宣布扩大了对数字档案的访问,他们在其开放内容数据库下发布了近 88,000 张图像,可以免费下载,采用了创意共享零许可证(CC0)。这意味着“您可以复制、修改、分发和执行作品,甚至可以用于商业目的,而无需征得许可”。

Getty 建议您“在画廊墙上添加您最喜欢的荷兰静物画,或者使用梵高的《鸢尾花》制作淋浴帘。”但是,如果您自己在其档案中搜索开放内容,您肯定可以比这更有创意。

该门户网站的界面允许您按创作日期(时间线图表可追溯到公元前 6000 年)、媒介(从玛瑙和雪花石膏到木刻和锌)、物体类型(包括绘画、摄影和雕塑,当然还有 akroteria、马具和镊子)以及文化进行搜索。这一选择反映了 Getty 收藏的广泛范围,涵盖了世界各个文明以及人类历史时代。

在 Getty 的开放内容档案中,您将找到来自希腊、罗马和世界其他地区的古代雕塑;来自公元前三世纪托勒密埃及的一只残缺的酒壶;华丽的中世纪小时书(之前在 Open Culture 上展示过);法国画家埃杜瓦·马奈和埃德加·德加等创新画家的作品;十九世纪末和二十世纪初拍摄丹麦、巴勒斯坦、日本和韩国等地方的立体摄影作品;以及艺术家汉内斯·玛利亚·弗拉赫、雅罗米尔·富克和弗朗西斯·布鲁吉埃等人的大胆抽象作品。但您对它们的使用完全取决于您自己。您可以在这里查看收藏。

相关内容:

Getty 数字档案扩展至 135,000 张免费图像:下载高分辨率的绘画、雕塑、摄影等扫描图像 一个用于查找世界一流博物馆免费公共领域图像的搜索引擎 由于 Getty 研究门户网站,现在有 100,000 本免费艺术史文本可在线获取 从 40 多家全球博物馆下载伟大艺术作品:探索新的艺术搜索引擎 Artvee 史密森尼将 450 万高分辨率图像上线并进入公共领域,使其免费使用 从 Getty 博物馆下载超过 325 本免费艺术书籍

作者 Colin Marshall 总部设在首尔,他撰写和广播有关城市、语言和文化的内容。他的项目包括 Substack 新闻简报《Books on Cities》、书籍《The Stateless City: a Walk through 21st-Century Los Angeles》以及视频系列《The City in Cinema》。您可以在 Twitter 上关注他 @colinmarshall 或在 Facebook 上关注他。


HN 评论 123 comments | 作者:coloneltcb | 22 hours ago #

https://news.ycombinator.com/item?id=39710454

根据您提供的链接,这篇帖子中的评论观点可以归纳为以下几点:

    1. 一些机构已经在公共领域中提供类似服务,但缺乏像 Getty 这样的营销预算;
    1. 一些数字化作品分辨率较低,水印过多,希望能提供更高分辨率、清晰的图片;
    1. 一些评论者对提供的图片质量和水印表示担忧,认为应该更加注重质量控制;
    1. 一些人认为即使是公共领域的作品照片也需要获得许可使用;
    1. 对 AI 图像生成数据集的讨论,提倡使用开放许可的图片,以推动更多人授权其图片用于开放数据集。

https://abovethelaw.com/2024/03/new-york-disbars-infamous-copyright-troll/

这篇文章讲述了多年来,Richard Liebowitz 经营了一个非常成功的业务,主要是向公司发送威胁信函,声称它们侵犯了他的摄影师客户拥有的版权。在最好的情况下,这是一个有点不太光明正大的利基领域。但是,Liebowitz 在一些引起联邦法官愤怒的案件中犯了一些高调的错误,因此获得了一定程度的臭名。现在,纽约终于取消了他的律师执照。

Liebowitz 并不是唯一从事版权滥用的律师。许多实体在互联网上搜寻可以声称“未经许可”的照片,并要求支付数千美元以解决此事,他们知道在版权侵权的法定赔偿和诉讼费用之间,大多数公司只会选择支付。很多时候,问题照片实际上是通过像 Getty Images 这样的机构合法授权的,但原告摄影师出于某种原因在授权后撤回了该图片。

这种做法存在风险,因为一些原告可能故意这样做,希望抓住一些合法持有许可证的人不留神,然后指望目标方为避免牵涉律师而选择和解。这就是为什么,例如,在一起被取消执照的案件中,法官要求 Liebowitz“向被告提供足以显示有关所涉图片最近三次被许可时支付的版税以及过去五年内图片被许可的次数的记录;如果图片从未被许可,原告应在原告提交的文件中证明这一事实。”在这个案件中,根据取消执照的意见,“Liebowitz 未能及时向被告提供所需的版税信息”。

尽管大部分意见描述了更基本的案件管理问题。从 2017 年提起的一起案件中:

被告在违反宣誓的情况下表示,他在这件事情中从未提出过和解要求。事实上,被告的律师曾向被告的律师发送过一封电子邮件,其中被告提议以 25,000 美元的金额解决此事。

另一起 2017 年提起的案件:

2018 年 1 月 13 日,被告向地方法院提交了一封信(以下简称 2018 年 1 月 13 日信函),请求推迟原定于 2018 年 1 月 19 日的庭前会议,并表示被告“尚未回应诉状”,原告打算提出默认判决动议。Cote 法官批准了这一请求,并要求在 2018 年 1 月 26 日前提交默认判决动议。

被告在 2018 年 1 月 13 日信函中表示被告“尚未回应诉状”是虚假和误导性的,被告在发表该言论时知道这是虚假和误导性的。2018 年 1 月 13 日的信函未告知法院双方自 2017 年 7 月开始的几个月的沟通历史。

从另一起案件中:

原告在证词和其他文件中承认,这张照片曾多次发表。为防止被告得知原告没有有效注册,被告拒绝了被告的文件和信息请求。被告还未能遵守法官 Debra Freeman 的命令,即获取并提交版权办公室文件以证明有效注册。在曝光照片未注册后,尽管记录显示相反,被告辩称,没有注册只是一个错误。

从这些以及意见中包含的许多其他例子中可以得出一个教训,即版权滥用机构在面对对他们的要求进行反击时通常毫无准备。发出要求信函,记录标准授权协议,收取现金是一个整洁的商业模式,直到一家公司不得不应对听证会、发现请求、专家和“不犯伪证罪”为止。

但也许最离奇的故事涉及到 Liebowitz 缺席了 2019 年 4 月 12 日的听证会,解释说他的祖父去世了。当 Seibel 法官要求 Liebowitz 在藐视法庭的情况下提供有关他祖父去世日期的证据或文件时,Liebowitz 回应说,这一命令“很可能构成对司法权的篡夺或违反司法礼仪”。

2019 年 11 月 7 日,被告聘请律师代表他参加藐视诉讼,并于 2019 年 11 月 11 日向 Seibel 法官发函承认他未能履行对地方法院和对手的责任。被告还承认他的祖父于 2019 年 4 月 9 日去世,并于当天被埋葬。

最终,根据法规 22 NYCRR 1240.13 的规定,被告 Richard P. Liebowitz,一名被暂停执业的律师,被取消执业,立即生效,并将其姓名从律师和法律顾问名单中删除。


HN 评论 95 comments | 作者:Turing_Machine | 22 hours ago #

https://news.ycombinator.com/item?id=39710455

评论中的观点归纳如下:

  • 有人认为 Richard Liebowitz 的诉讼行为过于大胆,甚至开始产生先例,但这有助于法律体系的强化。
  • 有人觉得他起诉 NBC 是愚蠢的行为。
  • 评论中指出,版权滥用和非法勒索多年来一直存在,但却没有触发取消律师执照,暗示在版权问题上,非道德、勒索和非法的行为通常能够顺利进行。
  • 有人认为取消执照的制度不公平,认为执照应该证明持有人具有必要的知识,而不应该用来惩罚某人的观点或因为某人过于聪明而从不公平的法律中获利。
  • 评论中提到,律师的行为对整个司法系统有影响,即使是“好”律师也不愿意规范违法律师的起诉。
  • 有人认为应该更快地取消执照,而不是起诉,证据上看,有些人可能因为无法被定罪而被取消执照。
  • 评论中提到了 Richard Liebowitz 的一些不诚实行为,有人认为这是否构成欺诈是一个不同的问题,对于定罪,需要超过合理怀疑的证据,而取消执照似乎只需要证据的优势。
  • 有人认为律师统治整个司法系统,即使“好”律师也不愿意规范律师在执业过程中犯罪的行为。
  • 评论中提到了 Richard Liebowitz 因爷爷去世为借口缺席听证会的情况,引发了一系列讨论。
  • 有人认为版权滥用对小企业造成了严重影响。
  • 评论中提到了 Sony 在法庭上两次败诉,但却摧毁了至少两个商业 PlayStation 模拟器。
  • 有人指出,大多数美国州没有永久取消律师执照的程序。
  • 评论中提到了版权和专利之间的不同。
  • 有人认为版权滥用和勒索是犯罪行为,应该受到监禁惩罚。
  • 评论中出现了关于惩罚版权滥用的不同观点,包括监禁、罚款和社区服务等。
  • 有人认为专利流氓摧毁了人们的生计和生活,应该受到惩罚。
  • 评论中还有一些幽默的对话和讨论。

Vision Pro: What we got wrong at Oculus that Apple got right #

https://hugo.blog/2024/03/11/vision-pro/

这篇文章是由前 Oculus 在 Meta 公司担任负责人 Hugo Barra 撰写的。文章主要探讨了苹果的 Vision Pro 产品。以下是文章中涉及的一些主题:

  • Hugo Barra 是 VR 爱好者,曾在 Oculus 工作,并分享了他对苹果 Vision Pro 产品的看法。
  • Vision Pro 可能是一个过度设计的“开发套件”。
  • 苹果在硬件决策方面展现了天才和大胆。
  • 视线和捏合是令人难以置信的 UI 超能力。
  • Vision Pro 软件/内容故事乏味且缺乏想象力。
  • 大多数人不会用 Vision Pro 观看电视/电影。
  • 苹果在沉浸式视频方面的赌注是体育直播的彻底改变者。
  • Hugo Barra 退还了他的 Vision Pro,并提出了重新考虑的十大愿望清单。
  • 苹果的 VR 首秀是 Oculus/Meta 最好的事情。
  • Hugo Barra 对 Meta 的 Quest Pro 2 及未来产品提出了建议。
  • 苹果的 Vision Pro 是 VR 行业所需的北极星。
  • Vision Pro 是一个精心设计的“开发套件”,过重而无法完全适应市场需求,但足以引起世界的好奇心。
  • Vision Pro 是第一个提供足够高分辨率和视觉清晰度的 VR 头显。
  • Vision Pro 的显示屏故意模糊,以隐藏像素化效果并使图形看起来更平滑。
  • Vision Pro 的显示屏存在显著的运动模糊和图像质量问题,使透视模式无法长时间使用。
  • Vision Pro 搭载了比大多数人意识到的更多的计算能力,M2 + R1 的组合使其达到了 MacBook Pro 的水平。
  • 苹果决定使用连接式电池包,未来的 Vision 头显可以通过 iPhone、iPad 或 MacBook 来卸载计算。

HN 评论 452 comments | 作者:wolverine876 | 19 hours ago #

https://news.ycombinator.com/item?id=39711725

这篇帖子中的评论观点归纳如下:

    1. Apple 的 Vision Pro 被认为是开发套件,是一个测试产品,未来硬件将不断改进,可能会激发行业更多竞争和实验;
    1. 有人认为 Vision Pro 的视野宽度不错,通过调整垫片可以改善视野,提高舒适度;
    1. 有人表示在 Vision Pro 中进行编码工作比 5k 显示器更好;
    1. 有人担心更宽的视野可能会降低像素密度;
    1. 有人对 VR/AR 头显的发展持怀疑态度,认为行业进展缓慢;
    1. 有人认为 Apple 之所以成功是因为他们注重产品体验,愿意为标准而不是价格而努力。

Ollama now supports AMD graphics cards #

https://ollama.com/blog/amd-preview

这篇博文介绍了 Ollama 现在在 Windows 和 Linux 上预览支持 AMD 显卡。

现在,Ollama 的所有功能都可以通过 AMD 显卡在 Linux 和 Windows 上加速。支持的显卡包括 AMD Radeon RX 系列(如 7900 XTX、7900 XT、Vega 64 等)、AMD Radeon PRO 系列(如 W7900、W7800、Vega II 等)以及 AMD Instinct 系列(如 MI300X、MI250、MI100 等)。

未来将支持更多的 AMD 显卡。想要开始使用支持 AMD 显卡的 Ollama,请下载适用于 Linux 或 Windows 的 Ollama。


HN 评论 106 comments | 作者:tosh | 4 hours ago #

https://news.ycombinator.com/item?id=39718558

  • 有评论认为 Ollama 没有直接给 llama.cpp 更多的功劳和感谢,认为应该更好地表达对其基础技术的感激。
  • 另一方认为 Ollama 有自己的贡献,不一定需要在广告中给予 llama.cpp 更多的功劳,因为每个人都可以查看源代码、研究论文等,做出自己的判断。
  • 有人质疑 Ollama 为何备受关注,认为其价值有限,只适用于模型实验,不适合生产部署,但也有人认为 Ollama 简化了实验过程,值得支持。
  • 还有评论指出 Ollama 使得本地模型运行变得更简单,吸引了用户的关注,尤其是对于那些想要尝试本地模型的人来说。

https://huyenchip.com/2024/03/14/ai-oss.html

这篇文章是 Chip Huyen 撰写的,标题为《What I learned from looking at 900 most popular open source AI tools》。文章主要内容如下:

Chip Huyen 在四年前对开源机器学习生态系统进行了分析,现在她重新审视了这个话题。这次,她专注于围绕基础模型的技术栈。 Chip Huyen 列出了她发现的 896 个开源 AI 存储库,其中 51 个是教程和聚合列表,而她更感兴趣的是软件存储库,最终分析是基于 845 个软件存储库。 她将 AI 技术栈分为基础设施、模型开发、应用开发和应用四个层次,并对每个层次进行了详细的介绍。 文章还讨论了 AI 技术栈随时间的变化,以及 2023 年各层次的增长情况。 Chip Huyen 还提到了开源 AI 开发者的分布情况,以及中国不断增长的开源生态系统。 最后,文章总结了 Chip Huyen 在研究这些开源 AI 工具时发现的一些有趣想法。

总的来说,这篇文章详细介绍了 Chip Huyen 对 900 多个最受欢迎的开源 AI 工具进行分析的过程和结果,涵盖了各个方面的内容,对于了解当前开源 AI 技术生态系统具有很高的参考价值。


HN 评论 37 comments | 作者:swyx | 23 hours ago #

https://news.ycombinator.com/item?id=39709912

  • 社区正在开发许多创新点子,包括批量推理优化、更快的解码技术、模型合并和受限采样。
  • 工程师很难在家中进行训练框架或构建具有新知识或新功能的模型,因为这需要深入的建模和优化知识,而硬件成本对这些工程师来说是禁锢的。
  • 大多数工程学科都存在类似的情况,例如核工程师无法在家中建造核电站,化学工程师无法在工作之外获得工业级基础设施,计算机硬件架构师无法设计硬件并在 TSMC 以 3nm 或更高的工艺制造。
  • 软件工程师可以尝试编译器、操作系统和计算机图形学等领域,最近几年,数据库、分布式系统和机器学习算法也可以由任何人在家中尝试,只有大型模型和相关优化才真正超出了大多数人的能力范围。

More powerful Go execution traces #

https://go.dev/blog/execution-traces-2024

这篇文章介绍了关于 Go 语言执行追踪的更强大功能。通过 runtime/trace 包,可以生成每个 goroutine 在一段时间内的执行追踪。使用 go tool trace 命令(或优秀的开源工具 gotraceui),可以可视化和探索这些追踪数据。追踪的魔力在于它可以轻松揭示程序中难以通过其他方式看到的问题。例如,大量 goroutine 在同一通道上阻塞可能很难在 CPU 分析中看到,但在执行追踪中,缺乏执行将清晰显示出来,并且被阻塞的 goroutine 的堆栈跟踪将迅速指出问题所在。Go 开发人员甚至可以为他们的程序添加任务、区域和日志,以便将高级关注点与低级执行细节相关联。

文章还提到了执行追踪中的一些问题,如高开销、不良扩展性、不清楚何时开始追踪以捕获特定问题行为以及缺乏公共包用于解析和解释执行追踪。但在过去的两个 Go 版本中,这些问题都取得了重大进展。

其中包括低开销追踪、可扩展追踪、飞行记录技术以及追踪读取器 API。通过优化追踪效率,执行追踪的运行时 CPU 开销大幅降低,使得追踪可以更广泛地应用。此外,追踪格式和事件的设计使得追踪更具可扩展性,同时保持低开销。飞行记录技术允许连续追踪,并始终保留最新的追踪数据,以便在需要时进行记录。此外,还介绍了追踪读取器 API,可以使追踪更易于访问和分析。

最后,文章感谢了参与诊断工作组的社区成员,他们的讨论、反馈和工作对于取得今天的成果至关重要。文章还提到了一些示例代码和实验性功能,鼓励读者尝试并提供反馈。


HN 评论 111 comments | 作者:nalgeon | 1 day ago #

https://news.ycombinator.com/item?id=39708591

  • 评论认为 Go 的标准库是其他标准库应该追求的典范,提到一些语言开发者拒绝在标准库中包含基本的 http API;
  • 有人认为大的 stdlib 或良好的依赖管理二者选其一是必要的,Go 的 stdlib 丰富,但依赖管理曾是问题;
  • 讨论 Go 和 Rust 的 stdlib 区别,Go 专注于 Web 服务,Rust 作为系统语言,但构建简单服务器时 Rust 需要更多依赖;
  • Rust 的依赖管理被描述为 Go 和 NPM 的优缺点结合;
  • 讨论不同语言的标准库特点,Go 的标准库更常用,Python 的标准库更容易被第三方包替代;
  • 讨论 Go 提供的丰富标准库功能,希望其他语言也能提供类似功能;
  • 讨论 Go 与 C、C++、Rust 等语言的抽象级别相似,Go 在较低级别语言中提供丰富的标准库功能;
  • 讨论 Go 的 AOT 编译模型,与其他语言的差异和优劣;
  • 评论认为 Go 是对 C 思维的极端模仿,提到 C#在低级别原语方面的优势;
  • 讨论 Go 的 AOT 编译模型,对开发者理解不同平台的方式提出疑问;
  • 讨论 Go 与 Rust、C#的比较,各自的优势和适用场景;
  • 评论 Go 的标准库,提到 crypto 等功能值得称赞。