2024 01 07 HackerNews

FAA orders grounding of more than 170 Boeing 737 Max 9s #

https://www.cnbc.com/2024/01/06/boeing-737-max-9-grounding-after-alaska-airlines-door-blows-midflight.html

根据 CNBC 的文章,美国联邦航空管理局(FAA)在一架阿拉斯加航空公司的飞机在飞行途中发生爆炸性减压事故后,下令对数十架波音 737 Max 9 飞机进行检查,并暂时停飞。这架飞机在起飞不久后返回波特兰,社交媒体上分享的照片和视频显示飞机侧面有一个巨大的洞口,乘客戴着氧气面罩。FAA 的紧急适航指令将影响全球约 171 架飞机,适用于美国航空公司和在美国领土上运营的航空公司。事故中没有报告严重伤亡。FAA 自从五年前两起致命坠机事故导致波音 737 Max 停飞以来,一直对该机型进行严格审查。这次事故是一个提醒,乘客在坐下时应系好安全带。

根据 FAA 的指令,阿拉斯加航空公司先前已经宣布停飞其所有的波音 737 Max 9 飞机。阿拉斯加航空公司表示,其机队中有 18 架飞机在最近的大修期间进行了彻底的门插销检查,并于周六重新投入使用。然而,此次停飞导致阿拉斯加航空公司约 14% 的航班被取消。

国家运输安全委员会(NTSB)已经派遣一支调查小组前往波特兰调查此次事故。美国最大的波音 737 Max 9 飞机运营商联合航空公司已准备停飞数十架飞机进行检查。联合航空公司表示,其机队中有 30 多架飞机已经接受了 FAA 要求的必要检查。这些检查预计将导致周六约 60 个航班取消。

波音 737 Max 9 是波音最畅销的 737 Max 8 飞机的大型版本。2019 年,由于两起致命坠机事故,波音 737 Max 飞机全球停飞。美国在 2020 年底进行了软件和培训更新后解除了对这些飞机的停飞禁令。

根据航空数据公司 Cirium 的数据,全球运营的波音 737 Max 9 飞机有 215 架,除了联合航空和阿拉斯加航空外,还有墨西哥航空、土耳其航空、冰岛航空和巴拿马的科帕航空等运营商。而美国西南航空和美国航空则运营较小型号的 737 Max 8 飞机。

这次事故是一个严重的结构故障,对于航空安全来说是非常罕见的。FAA 的紧急适航指令要求对波音 737 Max 9 飞机进行检查,以确保飞机的安全性。波音公司表示支持 NTSB 的调查,并将继续与 FAA 合作确保飞机的安全。

资料来源:


HN 评论 546 comments | 作者:ephesee | 6 hours ago #

https://news.ycombinator.com/item?id=38893909

这篇帖子的评论主要涉及到以下几个观点:

波音公司没有按照 FAA 的要求修复 737 Max 的 MCAS 系统问题,而是通过游说国会获得了豁免。这引发了对波音公司和美国民主制度的质疑。

有人认为应该追究波音公司高管的责任,包括追回他们的奖金并将他们送进监狱。

有人认为高管个人应该对生命损失负责,无论法律如何,企业不能成为他们逃避责任的遮挡物。

有人质疑 FAA 的责任,认为他们应该对民航安全负责。

有人指出国会对波音公司的豁免权力,因为国会有权力修改和覆盖行政机构的规定。

有人认为国会应该制定法律时不应提及特定公司的名字,除非是为了限制其行为。

有人提到了波音公司的历史问题,包括之前的安全事故和维护问题。

有人对美国政府与大型企业的紧密联系表示担忧,认为这削弱了政府对企业的监管能力。

请注意,这些观点来自于匿名用户的评论,可能代表个人观点,并不一定代表广泛共识或事实准确性。


IRS to begin trial of its own free tax-filing system #

https://www.nytimes.com/2024/01/05/your-money/irs-tax-filing-free-online.html

美国国内税务局(IRS)计划在 12 个州试行其自己的免费报税系统。根据一些标准,符合条件的居民可以参与试行。然而,这项计划已经遭到了一些商业报税公司的反对。

该免费报税系统是一个试点项目,旨在测试居民直接向国内税务局在线提交联邦税务申报表的可行性。如果符合特定条件,12 个州的居民有资格参与。国内税务局局长丹尼・韦弗尔(Danny Werfel)在最近的一份声明中表示:“这是这项创新工作的一个重要步骤,将测试为纳税人提供一种新的免费直接报税选项的可行性。”

然而,这项直接报税计划已经受到了一些抵制,特别是来自商业报税公司的抵制。Intuit 公司的发言人塔尼亚・梅尔卡多(Tania Mercado)批评直接报税计划是一个 “拍脑袋出的解决方案”,浪费纳税人的钱。Intuit 公司是 TurboTax 报税软件的开发商。

国会中的民主党人普遍支持免费直接报税的想法,而共和党人认为这个想法是总统拜登重塑国内税务局计划的一部分,将使该机构对普通纳税人的权力更加强大。

免费直接报税试点项目将向低收入和中等收入纳税人开放,前提是他们申报的情况相对简单。例如,符合条件的纳税人必须选择标准扣除,并且收入必须限于在 W-2 表、社会保障或失业金以及利息收入(不超过 1,500 美元)上报的工资。非全职雇佣者不符合条件。国内税务局在去年 11 月表示,预计将有 “至少几十万纳税人” 参与这个被称为 “有限” 试点的项目。

许多纳税人已经有了根据自己的收入准备和提交免费电子申报的选择,可以通过国内税务局的 “免费报税” 计划或某些商业提供商的直接报税服务实现。国内税务局还提供在线表格,任何纳税人都可以免费使用这些表格提交申报表。

国内税务局表示,所有这些免费选择仍然可用,它的测试版本只是另一个选择。但是,通过新的直接报税服务,国内税务局的目标是进一步简化申报过程。根据国内税务局向国会提交的报告中的一个可能的情景,国内税务局可以利用其已有的信息,如 W-2 工资报表的数据,填写纳税申报表。然而,在试点阶段,参与者将需要输入自己的财务信息,国内税务局表示。

2022 年的通货膨胀减少法案要求国内税务局研究直接报税。今年 5 月,该机构向国会提交了一份报告,报告发现大多数纳税人对使用直接报税工具感兴趣,并开始准备进行试点测试。在报告中,国内税务局估计直接报税系统的年度成本可能在 6400 万美元至 2.49 亿美元之间,具体取决于服务的范围。(然而,财政部税务管理部门的独立监察长办公室的另一份报告表示,早期报告中所进行的调查设计可能 “夸大” 了纳税人的兴趣,并且该部门无法确定机构成本估计的 “合理性”)。根据国内税务局的说法,试点系统是由一组税务专家、产品经理、软件工程师、设计师和数据科学家在国内税务局内部构建的。国内税务局表示,它正在与政府内部的特殊团队合作,帮助机构开发数字服务。

国内税务局表示,直接报税系统将像商业软件一样引导用户完成申报步骤。该服务将是 “适用于移动设备的”,并且提供英语和西班牙语版本。用户可以通过在线实时聊天功能获取机构的帮助,如果需要,还可以选择与客服代表通过电话交流。

国内税务局在在线摘要中表示,为了确保试点顺利进行,它将在 2024 年的申报季节最初向 “一小部分纳税人” 开放该服务。随着季节的推进,“越来越多” 符合条件的纳税人将能够使用该服务。“我们从小规模开始,以确保做得正确。” 该机构在最新的更新中表示。

国内税务局表示,它计划通过其草根和社区伙伴网络来推广这种申报选择,例如为低收入和中等收入纳税人以及残疾人提供免费税务帮助的志愿收入税务援助计划。

该机构表示,它计划在决定是否将直接报税系统开放给更多纳税人之前发布一份公开报告。

在这里有一些关于即将到来的纳税季节的问题和答案:

  1. 哪些州参与了试点项目?

亚利桑那州、加利福尼亚州、佛罗里达州、马萨诸塞州、内华达州、新罕布什尔州、纽约州、南达科他州、田纳西州、德克萨斯州、华盛顿州和怀俄明州参与了试点项目。其中大部分州不对个人所得征税,但四个征税州(亚利桑那州、加利福尼亚州、马萨诸塞州和纽约州)将引导参与者使用由州政府支持的工具提交他们的州税申报。“这真是令人兴奋的事情,”Code for America 组织的税收福利副政策总监加布里埃尔・祖克尔(Gabriel Zucker)表示。该组织正在为亚利桑那州和纽约州建立州电子申报软件,试点项目的参与者可以使用该软件提交他们的州税申报。“我们期待它能让纳税申报变得简单,” 祖克尔说。

  1. 今年我什么时候可以提交我的所得税申报?

国内税务局还没有宣布 2023 年纳税申报开始日期,但通常在一月下旬(去年的申报季节在 1 月 23 日开始)。

  1. 今年的纳税申报截止日期是什么时候?

对于大多数纳税人来说,2023 年纳税申报的联邦截止日期是 4 月 15 日。州的申报截止日期可能有所不同。


HN 评论 179 comments | 作者:thelastgallon | 9 hours ago #

https://news.ycombinator.com/item?id=38892044

根据对该帖子的摘要,以下是评论观点的总结:

有人推荐了一篇关于纳税历史的博客文章,解释了为什么现行的纳税系统看起来如此复杂。

有人认为该博客作者有明显的偏见,试图将所有的低效归咎于政府而不是私营部门。

有人提到日本的纳税系统非常高效,并且与其他国家进行了比较,得出了不同的结论。

有人表示在日本填写纳税申报表的过程非常复杂和繁琐,与他的家乡国家(西班牙)相比,日本的银行系统也显得过时和低效。

有人解释了美国纳税系统的复杂性,指出美国有多个纳税机构,每个州、县和城市都有自己的纳税机构,需要向所有适用的机构提交申报表和缴纳税款。

有人对 Norquist 的观点表示不满,认为他过于荒谬。

有人解释了 Norquist 和 ATR 的观点,认为他们希望人们意识到纳税的重要性,并且认为简化纳税申报会导致“通过隐蔽方式增加税收”的问题。

有人质疑简化纳税申报是否会导致“通过隐蔽方式增加税收”,并指出自动纳税申报仍然需要审批和核对。

有人提到了心理学机制,解释了为什么简化纳税申报可能会导致“隐蔽方式增加税收”的问题。

有人表示美国纳税申报系统的改进是进步的,但也提出了一些改进建议。

有人讨论了其他国家的纳税系统,包括墨西哥和英国。

请注意,这些摘要仅代表帖子中的观点,可能不一定代表事实或广泛共识。


Alaska Airlines grounds Boeing 737 Max 9 planes after mid-air window blowout #

https://www.theguardian.com/us-news/2024/jan/06/alaska-airlines-grounds-boeing-737-max-9-planes-after-mid-air-window-blowout

根据《卫报》的报道,美国监管机构已下令临时停飞 171 架波音 737 Max 9 飞机,此前一架由阿拉斯加航空公司运营的全新飞机在上周五晚间发生了机舱面板爆炸事件,迫使该飞机进行紧急降落。

根据美国联邦航空管理局(FAA)的一位管理员 Mike Whitaker 在周六的讲话中表示:“FAA 要求在这些特定的波音 737 Max 9 飞机重新飞行之前进行立即检查,安全将继续驱动我们的决策,同时我们将协助国家运输安全委员会(NTSB)对阿拉斯加航空 1282 航班进行调查。”美国交通部长彼得·布蒂吉格在社交媒体上也发表了同样的观点:“安全始终是我们部门和 FAA 的首要任务。”

阿拉斯加航空公司在周六早上首次停飞了所有的波音 737 Max 9 飞机,此前一架飞机在起飞后不久发生了窗户和机身部分爆炸的事故。这架飞机安全降落,机上共有 174 名乘客和 6 名机组人员。事故发生后,阿拉斯加航空公司向媒体发布了一份声明,称他们已经采取了“预防性措施,临时停飞了我们的 65 架波音 Max-9 飞机”。

这起事件中的波音 737 Max 9 飞机是两个月前下线并获得认证的,根据联邦航空管理局的在线记录。波音公司表示,他们正在努力收集更多信息,并准备支持调查。波音 737 Max 是波音公司备受推崇的 737 系列的最新版本,是一种双引擎、单通道飞机,经常用于美国国内航班。2018 年和 2019 年,两架波音 737 Max 8 飞机发生坠机事故,造成 346 人死亡,并导致全球范围内近两年的停飞。只有在波音公司对涉及事故的自动飞行控制系统进行改进后,这些飞机才重新投入使用。

需要注意的是,这是一篇新闻报道,相关调查和进一步信息可能会在以后的报道中公布。


HN 评论 324 comments | 作者:robin_reala | 15 hours ago #

https://news.ycombinator.com/item?id=38889774

这篇帖子是关于阿拉斯加航空公司(Alaska Airlines)停飞波音 737 Max 9 飞机的新闻。以下是评论观点的摘要:

有评论者表示,他们不再信任这种飞机,因为波音公司一直试图将飞机设计缺陷归咎于飞行员,这显示出他们没有吸取教训。

有人认为波音公司应该为这些飞机负责,并且不应该在任何情况下给予豁免。他们认为这些飞机已经证明是危险的,而波音公司没有采取任何措施修复它们,因为这将损害他们的利润。

有人主张美国联邦航空局(FAA)应该无限期停飞所有波音 737 Max 飞机,直到波音公司自费修复并且 FAA 对每一架飞机的修复措施进行认证。他们认为政府应该对这种企业渎职行为采取行动。

还有人认为波音公司的高层管理人员应该对他们将利润置于安全之上的行为承担刑事责任。

这些评论观点主要集中在对波音公司的不信任、对飞机安全的担忧以及对波音公司管理层的批评上。


Csvlens: Command line CSV file viewer. Like less but made for CSV #

https://github.com/YS-L/csvlens

摘要:

CSVLens 是一个命令行的 CSV 文件查看器,类似于 less 命令,但专为 CSV 文件设计。它提供了一些键绑定和可选参数,可以方便地浏览和操作 CSV 文件。

详细分析:

CSVLens 是一个开源项目,可以在 GitHub 上找到它的代码仓库。它提供了一个命令行界面,用于查看和操作 CSV 文件。以下是一些关键特性和用法:

用法:通过提供 CSV 文件名来运行 CSVLens:csvlens 。也可以通过管道将 CSV 数据直接传递给 CSVLens: | csvlens。

键绑定:CSVLens 提供了一些键绑定,用于在给定方向上滚动一行或一列、向上或向下滚动一个窗口、向上或向下滚动半个窗口、向左或向右滚动一个窗口、滚动到第一列或最后一列、跳转到顶部或底部等操作。

查找和过滤:CSVLens 支持使用正则表达式进行内容查找和过滤。可以使用 / 进入查找模式,输入正则表达式进行匹配,并高亮显示匹配结果。还可以使用 & 进行行过滤,只显示匹配的行;使用 * 进行列过滤,只显示匹配的列。

选择模式:CSVLens 支持在行、列或单元格之间切换选择模式。可以使用 TAB 键在不同的选择模式之间切换。

可选参数:CSVLens 还提供了一些可选参数,例如指定分隔符、忽略大小写、打印选定行的某一列值等。

安装:可以使用 cargo install csvlens 命令从 crates.io 安装 CSVLens。也可以从源代码构建和安装。

以上是对 CSVLens 的摘要和概述。如果您需要更详细的信息,可以访问 CSVLens 的 GitHub 仓库 查看完整的文档和代码。

请注意,本回答基于访问的 GitHub 仓库和相关信息,可能会有更新或变化。建议查看最新的文档和代码以获取准确的信息。


HN 评论 71 comments | 作者:ingve | 15 hours ago #

https://news.ycombinator.com/item?id=38889820

Csvlens 是一个命令行 CSV 文件查看器,类似于 less,但专为 CSV 文件设计。

帖子中的评论主要是关于使用 Csvlens 以及其他一些 CSV 处理工具的经验和建议。

有人提到他通常使用 vi 或 R 来查看 CSV 文件,而 Csvlens 将成为他的默认 CSV 文件查看工具。

还有人提到了其他一些 CSV 处理工具,如 duckdb、Visidata、SQLite 和 clickhouse-local。

这些工具可以用于查询和快速检查 CSV 文件。

此外,还有一些关于使用标准化的 TSV(制表符分隔值)而不是 CSV 的讨论。总的来说,帖子中的评论主要是分享关于 CSV 文件处理工具的使用经验和建议。


Chromium bug bounty money tree browser #

https://lyra.horse/misc/chromium_vrp_tree.html

这篇文章是关于"Chromium Money Tree Browser"的。它将 Chrome VRP(漏洞赏金计划)的奖励映射到特定文件的更改(修复)上。

该网站的数据截至 2023 年 11 月初。文章提到,奖金将根据修复的文件数量进行分配,例如,如果修复一个价值 1000 美元的漏洞涉及 5 个文件,那么每个文件将获得 200 美元的奖励。

根据文章中提到的数据,根目录下的奖励总额为 9,873,277 美元。


HN 评论 63 comments | 作者:admp | 15 hours ago #

https://news.ycombinator.com/item?id=38889833

有人提到了构建一个可以根据文件或文件区域中历史上的破坏性变更来计算变更可能导致问题的概率的工具。这个工具可以为每个变更分配一个风险分数,以帮助评审人员决定哪些代码需要额外关注,并在部署时突出显示风险变更。

有人提到了他们在静态分析每个变更后进行符号级别的风险评估,并在每天对整个代码库进行分析。他们通过运行更多的客户端测试来应对高风险变更,并且发现在同一变更中,与非问题相关的符号的连接性非常相似。他们还发现变更后的调用图通常很大,深度达到 50,很难从中获得有用的信号。

有人提到了一个有趣的观察,即在同一变更中,有一个或两个罪魁祸首符号,但其与同一变更中的非罪魁祸首符号的连接性非常相似。另一个观察是,变更后的传递修改的调用图通常很大,深度达到 50,在变更和测试之间受影响的符号之间的重叠程度很难获得有用的信号。

一些评论提到了编写错误的开发人员,以及编写错误可能对 QA 部门的工作安全性产生的影响。

还有一些评论提到了代码质量和漏洞赏金计划的金额。


Alaska Airlines 737 Max makes emergency landing due to depressurization #

https://www.reddit.com/r/aviation/comments/18znz5p/as_1282_kpdx_to_kont_diverted_for_rapid/

根据 Reddit 上的帖子,航班 AS 1282 从 KPDX 飞往 KONT 时发生了快速减压事件,导致飞机被迫返回 KPDX。根据乘客提供的照片,一个座位位置的整个侧壁爆炸开裂,有一个座位被撕裂出来。幸运的是,该座位没有人坐,听起来是一次相当惊险的经历。目前还没有更多的信息,但大家都安全无恙。乘客还提供了更多照片和视频,可能会上传到网上。这次事件可能会引起进一步的调查。

根据照片,推测是一个未使用的紧急出口出现了故障,导致快速减压。这种情况非常严重,幸运的是没有人员伤亡。乘客拍摄的照片和视频可能对随后的调查非常有用,可以将它们与国家运输安全委员会(NTSB)分享。

这次事件引发了许多评论和讨论,有人提到在 12 月 31 日,这架飞机在 FLL-SEA 航班上发生了一些问题,需要被迫从 FLL(劳德代尔堡)飞往 SEA(西雅图)并且还有一个备用航班计划到 OKC(俄克拉荷马城),这是一个重要的维修基地城市。虽然没有看到日志记录,但这可能是调查的第一件事情。

总之,这次事件是一次严重的快速减压事件,导致飞机被迫返回起飞机场。幸运的是,没有人员伤亡。这次事件将引发进一步的调查,以确定具体的原因和责任。

来源:Reddit 帖子


HN 评论 330 comments | 作者:g1a55er | 22 hours ago #

https://news.ycombinator.com/item?id=38887840

根据提供的链接,这篇帖子是关于阿拉斯加航空公司的一架波音 737 Max 飞机因失压而进行紧急降落的事件。以下是评论的观点摘要:

有人指出,波音公司试图豁免 737 Max 的安全规定,这与该事件有关。

另一位评论者认为这种豁免已经存在于 737 Max 8 和 9 型号上,只是尚未明确授予 737 Max 7 型号。他认为目前还不清楚是否存在任何问题。

一位评论者认为在之前的评论中,没有人真正了解 737 Max 8 和 9 型号与 737 Max 7 和 10 型号之间的差异和减轻措施。鉴于波音公司在 Max 飞机上的安全记录极差,他不太相信有关监管机构愚蠢的猜测。

还有人认为,即使对于 8 和 9 型号来说,豁免也不应该在第一次授予。

有人提到,这可能与两架 Max-8 飞机坠毁事故有关,因为在给予该型号同样的豁免后发生了这些事故。他认为美国联邦航空局(FAA)可能会更加谨慎。

还有人提到,根据 FAA 的记录,这架波音 737-9 Max 是在两个月前下线的,于 2023 年 11 月获得了认证。

这些是评论者对该事件的观点摘要。请注意,这些观点来自于 Hacker News 上的评论,可能代表个人观点,并不一定代表事实或专业意见。


Carta doing unsolicited tender offer outreach to their customers' investors #

https://twitter.com/karrisaarinen/status/1743398553500971331

这是一条推文,发表于 2024 年 1 月 5 日,作者是 Karri Saarinen。推文内容是关于 Carta(一家创业公司的股权管理平台)的,作者表示对于 Carta 向他们的天使投资者进行冷调,以出售 Linear 股份给买家感到失望,并认为这可能是 Carta 作为创业公司信任的平台的终结。

由于推文内容较短,没有提供更多详细信息,因此无法提供更具体的摘要。


HN 评论 66 comments | 作者:shoenseiwaso | 24 hours ago #

https://news.ycombinator.com/item?id=38886915

根据对该帖子的评论观点进行摘要,以下是一些主要观点:

有人认为 Carta 向其客户的投资者发送了未经请求的要约,这被认为是不道德的行为。

有人指出,购买价格可以在多个平台上找到,公司可以选择退出。

有人批评 Carta 的商业模式,认为他们的行为是为了牟取利润,而不是为了创业公司的利益。

有人认为创业公司应该严格控制自己的股权表,如果使用 Carta,应该要求他们不要在未经明确许可的情况下进行市场营销或交易。

有人认为员工出售股票是有利于员工的,因为他们可能没有机会参与真正的流动性事件。

有人指出,流动性会降低 409A 折扣,从而使其他股权授予变得不那么有价值。

有人认为 409A 折扣是问题所在,应该游说政府改变法律,以便员工能够获得与创始人相同的流动性。

有人认为 Carta 滥用了他们所掌握的机密信息,试图在二级市场上建立订单簿。

有人认为 Carta 的行为可能违反了公司之间的合同和机密性。

有人认为 Carta 的行为可能对创业公司产生负面影响,因为它可能导致股权分散和管理困难。

有人认为 Carta 的行为可能违反了证券交易法规。

这些是从评论中摘录的一些观点,涉及了 Carta 向其客户的投资者发送未经请求的要约的行为以及与此相关的道德和法律问题。请注意,这些观点来自于评论者,可能代表他们个人的意见。


Microsoft Phi-2 model changes licence to MIT #

https://huggingface.co/microsoft/phi-2/commit/7e10f3ea09c0ebd373aebc73bc6e6ca58204628d


HN 评论 80 comments | 作者:regularfry | 16 hours ago #

https://news.ycombinator.com/item?id=38889539

这篇帖子是关于 Microsoft Phi-2 模型更改许可证为 MIT 许可证的讨论。以下是评论的观点摘要:

之前该模型采用非商业许可证,这在一定程度上减少了人们的兴趣。

由于其性能和规模,采用商业友好的许可证实际上是一件大事。

该模型在推理能力方面表现出色,但故意没有在大型“网络爬取”数据集上进行训练,以避免学习如何制造炸弹等不良行为。因此,它是当前权重类别中最聪明的思考模型,甚至可以与更高参数的模型相媲美,但在世界和琐事方面的知识不如其他模型丰富。这可能会在未来发生变化,但目前是这样的。

对于 RAG 应用程序来说,这仍然使它成为一个很好的选择,因为我希望答案基于我的数据,而不是基于它从网络中学到的任何内容。

有人尝试过或对 RAG 进行了基准测试吗?

在使用之前,您可能需要对其进行微调。人们对“被审查的模型”进行了大量的自我贬低,并且对这个主题的了解比了解的人要多得多,导致信噪比失调。

对于许多任务来说,一般知识并不是必需的,特别是对于 RAG 来说,小型语言模型在自然语言方面表现出色。

这与人类学习的边界基本相同。如果有人读了一套字典,然后与实际人交谈…你会得到大致相同的结果。例如,对俚语的完全无知等。

有人认为 Microsoft 通过不训练大型“网络爬取”数据集来减少明显的盗窃财产和个人数据以获取利润。

它是通过“教科书质量”的合成数据和一些高质量的网络数据进行训练的。问题是,如果我们使用 GPT-4 生成的合成数据来训练模型,这个模型的状态是什么?微软是否也必须删除它以及使用 GPT-4 数据训练的所有模型?

如果我们只使用合成数据训练 GPT-5,那将大大简化版权问题,并提高 5 倍的效率。

有人更感兴趣的是数据集而不是模型本身。

这可能是 phi-1/1.5“只需要教科书”的训练方法的演变。

合成数据集的成本非常高,没有人共享。人们可能低估了 OpenAI/Microsoft 用于构建大量合成数据的硬件数量。他们不仅仅是一遍又一遍地训练模型,而是使用常见的爬取等方式。