Horizon Summary: 2026-04-28 (ZH)

From 53 items, 32 important content pieces were selected

微软与 OpenAI 终止独家收入分成协议 ⭐️ 9.0/10
FDA 批准首个基因疗法治疗遗传性听力损失 ⭐️ 9.0/10
pgBackRest 归档：维护者退出 ⭐️ 9.0/10
Luce DFlash：在 RTX 3090 上实现 Qwen3.6-27B 两倍吞吐量 ⭐️ 9.0/10
ChatGPT 5.2 在东大京大入学考试中超越人类最高分 ⭐️ 9.0/10
量子放大镜在实验室创造出迄今最强光 ⭐️ 9.0/10
vLLM v0.20.0 发布，支持 DeepSeek V4 和 CUDA 13.0 ⭐️ 8.0/10
Mercor 数据泄露 4TB 语音样本和身份证件 ⭐️ 8.0/10
中国阻止 Meta 收购 AI 初创公司 Manus ⭐️ 8.0/10
Super ZSNES：GPU 加速的 SNES 模拟器重生 ⭐️ 8.0/10
GitHub Copilot 转向按用量计费 ⭐️ 8.0/10
开源 CLI 智能体在 TerminalBench 上超越谷歌官方结果 ⭐️ 8.0/10
最高法院权衡地理围栏搜查令合宪性 ⭐️ 8.0/10
微软开源带说话人分离的 VibeVoice ⭐️ 8.0/10
微软与 OpenAI 移除 AGI 条款 ⭐️ 8.0/10
Zig 0.16.0 通过 Io 接口引入结构化并发 ⭐️ 8.0/10
MiMo-V2.5-Pro：开源 AI 模型挑战 Claude Opus ⭐️ 8.0/10
Asahi Linux 对苹果 M3 芯片的适配接近 Alpha 水平 ⭐️ 8.0/10
小米玄戒 O1 芯片出货量突破 100 万颗 ⭐️ 8.0/10
Easyduino：面向 KiCad 的开源 PCB 开发板设计 ⭐️ 7.0/10
macOS 27 将强制 TLS 1.2，弃用 AFP 用于 Time Machine ⭐️ 7.0/10
凝视墙壁的失落艺术 ⭐️ 7.0/10
SVG 消毒的困境 ⭐️ 7.0/10
为什么不用 Lean？一个批判性比较 ⭐️ 7.0/10
pip 26.1 发布，新增依赖冷却和 pylock 支持 ⭐️ 7.0/10
Linux 7.1 合并窗口关闭，包含近 1.3 万个变更集 ⭐️ 7.0/10
微软开源 TRELLIS.2：40 亿参数图像转 3D 模型 ⭐️ 7.0/10
4B 参数 LLM 基准测试：Nemotron 3 Nano 在金融、推理和代码任务中夺冠 ⭐️ 7.0/10
通过添加旧 GPU 增加 LLM 的 VRAM ⭐️ 7.0/10
Skymizer 发布 384GB PCIe 卡，支持 700B 参数大模型推理 ⭐️ 7.0/10
微软 Windows K2 计划旨在重塑 Windows 11 ⭐️ 7.0/10
中国科技巨头因 AI 内容遭用户抵制 ⭐️ 7.0/10

微软与 OpenAI 终止独家收入分成协议 ⭐️ 9.0/10

微软与 OpenAI 重组了合作关系，终止了要求 OpenAI 独家使用 Azure 的独家收入分成协议。根据新条款，微软将不再向 OpenAI 支付收入分成，而 OpenAI 向微软的支付将持续到 2030 年，保持 20%的相同比例但设有总上限。这一转变使 OpenAI 能够使用其他云服务商（如 AWS）以及潜在的 Google TPU，打破了微软对 OpenAI 基础设施的独家控制。这可能重塑 AI 云市场，加剧云服务商之间的竞争，并加速 OpenAI 获取 Google 最新 TPU 等专用硬件。 OpenAI 向微软支付的收入分成仍为 20%，但设有上限，微软继续作为主要股东，持股比例从 49%降至 27%。OpenAI 现在可以自由地在 AWS 和其他云上运行工作负载，并可能考虑使用 Google 新推出的 Gen 8 TPU。

hackernews · helsinkiandrew · Apr 27, 13:22

背景: 微软与 OpenAI 于 2019 年建立了紧密的合作关系，微软投资数十亿美元并通过 Azure 提供独家云基础设施。该协议包括一项收入分成安排，微软获得 OpenAI 收入的 20%。这一独家安排限制了 OpenAI 使用竞争性云服务或 Google TPU 等专用硬件的能力，而其他前沿 AI 实验室广泛使用这些硬件。

参考链接

社区讨论: 评论者认为 Google 可能是赢家，因为 OpenAI 现在可能采用 Google TPU。有人质疑微软为何同意看似对 OpenAI 有利的条款，推测微软担心之前的协议损害了 OpenAI 对抗 Anthropic 等竞争对手的能力。其他人指出，此举允许 OpenAI 使用 AWS，凸显了 Azure 地位的削弱。

标签: #AI, #Microsoft, #OpenAI, #Cloud Computing, #Partnership

FDA 批准首个基因疗法治疗遗传性听力损失 ⭐️ 9.0/10

美国食品药品监督管理局（FDA）批准了首个针对 OTOF 基因突变导致的遗传性听力损失的基因疗法，这标志着治疗先天性耳聋的历史性里程碑。这一批准为遗传性耳聋的新型治疗打开了大门，有望恢复那些原本需要依赖人工耳蜗或助听器的儿童的听力，并为针对其他致聋基因的疗法铺平了道路。该疗法名为 DB-OTO，使用双腺相关病毒（AAV）载体将功能性 OTOF 基因拷贝递送至内耳毛细胞，并通过内耳注射给药。它专门针对由 OTOF 基因突变引起的常染色体隐性耳聋 9 型（DFNB9），这是一种罕见的先天性耳聋。

hackernews · JeanKage · Apr 27, 10:15

背景: 基因突变占出生时听力损失原因的 60%。OTOF 基因负责编码一种对听力至关重要的蛋白质——otoferlin。OTOF 基因突变会破坏声音信号从毛细胞到听觉神经的传递，导致重度至极重度耳聋。此前，遗传性听力损失的治疗仅限于助听器或人工耳蜗，这些方法并未解决根本的遗传原因。

参考链接

社区讨论: 社区评论对这一批准表达了广泛的热情，许多人分享了个人听力损失的经历和对未来治疗的希望。一些用户指出，虽然该疗法针对的人群较小，但这是向前迈出的关键一步；其他人则强调需要针对其他遗传原因（如 GJB2 突变）的疗法。少数人表示失望，因为他们特定的耳聋类型（例如由腮腺炎引起）尚无法通过此类方法治疗。

标签: #gene therapy, #FDA approval, #hearing loss, #medical breakthrough, #biotechnology

pgBackRest 归档：维护者退出 ⭐️ 9.0/10

pgBackRest 的创建者和唯一维护者 David Steele 已将项目在 GitHub 上归档，并宣布经过 13 年的开发后不再维护。这一广泛使用的 PostgreSQL 备份工具的停用凸显了开源可持续性的关键问题，包括维护者倦怠以及 Crunchy Data 被收购后企业赞助的流失。 pgBackRest 在 GitHub 上拥有 3800 颗星，并在 Crunchy Data 被出售前由其赞助；Steele 寻找新赞助或职位以继续维护的努力未能成功。

rss · LWN.net · Apr 27, 14:06

背景: pgBackRest 是一个针对 PostgreSQL 的开源备份和恢复工具，支持全量、差异和增量备份、WAL 归档以及时间点恢复。它由 David Steele 在 13 年间开发，最初由 PostgreSQL 服务公司 Crunchy Data 提供企业赞助。Crunchy Data 被出售后，赞助终止，Steele 失去了继续项目的资金。

参考链接

pgBackRest - Reliable PostgreSQL Backup & Restore

社区讨论: 社区成员对 Steele 的工作表示遗憾和感谢，一些人指出源代码仍然可用，可以分支或付费维护。其他人则指出 Crunchy Data 的收购是一个警示，说明关键开源基础设施依赖单一公司赞助的风险。

标签: #PostgreSQL, #open source, #backup, #maintainer burnout, #pgBackRest

Luce DFlash：在 RTX 3090 上实现 Qwen3.6-27B 两倍吞吐量 ⭐️ 9.0/10

Luce DFlash 是 DFlash 推测解码的 GGUF 移植版，在单张 RTX 3090 上无需重新训练即可将 Qwen3.6-27B 的吞吐量提升至 2 倍。这一突破显著加速了消费级硬件上的本地 LLM 推理，使个人和小团队更容易获得高性能 AI。该实现基于 ggml 使用独立的 C++/CUDA 栈，需要 CUDA 12+和 24 GB 显存的 NVIDIA GPU，在 HumanEval 和 GSM8K 等基准测试上实现约 1.98 倍的平均加速。

reddit · r/LocalLLaMA · sandropuppo · Apr 27, 16:31

背景: 推测解码通过使用小型草稿模型提出令牌，再由大型目标模型并行验证，从而加速 LLM 推理。GGUF 是一种量化模型文件格式，可在消费级硬件上实现高效推理。DFlash 是一种专为推测解码设计的块扩散模型，支持并行草稿生成。

参考链接

社区讨论: 社区反响非常积极，称赞这一创新和速度提升。部分用户担心量化导致的质量下降以及缺乏多 GPU 支持，另一些用户则询问使用场景和基准测试情况。

标签: #speculative decoding, #local LLM inference, #GGUF, #CUDA, #Qwen

ChatGPT 5.2 在东大京大入学考试中超越人类最高分 ⭐️ 9.0/10

AI 创业公司 LifePrompt 测试显示，ChatGPT 5.2 Thinking 模型在东京大学和京都大学本科入学考试中得分超过人类最高分，其中在东大竞争最激烈的理科三类考试中数学获得满分。这标志着 AI 在日本最顶尖大学入学考试中超越人类最高水平的重要里程碑，挑战了当前侧重记忆和计算的考试制度，并引发对教育改革的讨论。测试将试卷转为图像输入，作文由日本大型补习学校河合塾的老师评分。2024 年 ChatGPT-4 未能及格，而 2025 年的 o1 模型首次过线。

telegram · zaihuapd · Apr 27, 09:15

背景: 东京大学和京都大学的入学考试是日本竞争最激烈的考试之一，考查深度知识和解题能力。ChatGPT 5.2 是 OpenAI 于 2025 年 12 月发布的模型系列，其中 Thinking 版本针对推理任务进行了优化。

参考链接

GPT - 5 . 2 - Wikipedia

标签: #AI, #benchmark, #education, #ChatGPT, #Japan

量子放大镜在实验室创造出迄今最强光 ⭐️ 9.0/10

物理学家利用 Gemini 激光系统和双等离子体镜的“量子放大镜”技术，在实验室产生了迄今最强光，在第 12 至 47 阶谐波中获得超过 9 mJ 能量，逼近施温格极限。这一突破使实验室光强接近 10²⁹ W/cm²，为直接研究量子真空和强场量子电动力学开辟了道路，此前这些仅停留在理论层面。实验使用双等离子体镜将激光上升时间缩短至约 351 飞秒，大幅提升了相对论表面高次谐波转换效率，实测效率与理论高度吻合。

telegram · zaihuapd · Apr 27, 16:00

背景: 施温格极限是量子电动力学中的临界电场强度，超过该强度真空会变得不稳定并自发产生电子-正电子对。达到该极限需要约 10²⁹ W/cm²的光强，这一直是高能物理学的长期目标。相对论表面高次谐波产生利用强激光脉冲与等离子体镜相互作用来产生相干的高阶谐波。

参考链接

标签: #high-energy physics, #quantum electrodynamics, #laser physics, #plasma optics, #Schwinger limit

vLLM v0.20.0 发布，支持 DeepSeek V4 和 CUDA 13.0 ⭐️ 8.0/10

vLLM v0.20.0 引入了对 DeepSeek V4 的初步支持，将默认 CUDA 轮子切换为 CUDA 13.0，升级至 PyTorch 2.11，并增加了对 Python 3.14 的支持。此版本显著增强了 vLLM 服务前沿大语言模型的能力，尤其是 DeepSeek V4，并与最新的 CUDA 和 PyTorch 生态系统保持一致，使 AI 推理社区受益。该版本包含来自 320 位贡献者的 752 次提交，显著特性包括 FlashAttention 4 作为默认 MLA 预填充、TurboQuant 2 位 KV 缓存以及新的在线量化前端。

github · khluu · Apr 27, 21:20

背景: vLLM 是一个开源的高吞吐量 LLM 推理引擎，广泛应用于生产环境。DeepSeek V4 是 DeepSeek 的最新模型，以强大的编码能力著称。CUDA 13.0 和 PyTorch 2.11 分别是 NVIDIA 并行计算平台和流行深度学习框架的最新版本。

参考链接

社区讨论: 社区报告了 DeepSeek V4 中的 DSML 令牌泄漏错误，v0.20.0 已修复。此外，还有关于 CUDA 版本策略跟随 PyTorch 的讨论，建议 CUDA 12.9 用户使用 --torch-backend=cu129。

标签: #vLLM, #LLM inference, #DeepSeek, #CUDA, #PyTorch

Mercor 数据泄露 4TB 语音样本和身份证件 ⭐️ 8.0/10

AI 人员平台 Mercor 发生数据泄露，通过 LiteLLM 库中被入侵的 API 密钥，超过 4 万名承包商的 4TB 语音录音和身份证件被窃取。此次泄露独特地将语音样本与身份证扫描件结合，为欺诈提供了现成的深度伪造工具包，可用于绕过银行声纹验证或在视频通话中冒充高管。泄露通过管理 AI 模型 API 密钥的 Python 库 LiteLLM 发生，数据被发布在 Lapsus$泄露网站上。Mercor 于 2026 年 3 月 31 日确认该事件，并面临多起诉讼。

hackernews · Oravys · Apr 27, 09:57

背景: 音频深度伪造技术利用 AI 生成模仿特定个体的语音，通常仅需几秒钟的样本音频。语音克隆是深度伪造的一个子集，专注于音频操作。声纹等生物识别数据越来越多地用于身份验证，但与密码不同，一旦泄露就无法更改。

参考链接

社区讨论: 评论者指出，受害者被要求将语音发送给另一家 AI 公司进行分析具有讽刺意味，并指出生物识别数据实际上是无法更改的“永久密码”。作者强调了实际攻击途径，如绕过银行声纹验证和 Arup 式视频通话欺诈。

标签: #data breach, #AI safety, #deepfake, #privacy, #cybersecurity

中国阻止 Meta 收购 AI 初创公司 Manus ⭐️ 8.0/10

中国以出口管制和国家安全法为由，阻止了 Meta 对 AI 初创公司 Manus 的 20 亿美元收购，尽管 Manus 总部设在新加坡。这标志着中国在 AI 技术领域运用域外法律管辖权的重大升级，可能重塑全球科技并购和 AI 治理格局。 Manus 在中国创立，后在 2025 年 5 月由 Benchmark 领投 7500 万美元融资后迁至新加坡。中国正寻求撤销已完成交易，援引出口管制法中的兜底条款和境外关联规则。

hackernews · yakkomajuri · Apr 27, 11:43

背景: 中国 2020 年更新的出口管制法允许政府限制敏感技术（包括 AI 算法）的转让。该法包含兜底条款（第 12 条），可适用于威胁国家安全的境外活动。此案与 TikTok 争端类似，中国对海外使用的中国起源算法主张控制权。

参考链接

社区讨论: 评论者争论中国是否在实施其版本的美国出口管制，有人指出考虑到 Meta 和 Google 的开放 AI 贡献，这具有讽刺意味。其他人质疑阻止一家新加坡公司的法律依据，以及这对新加坡作为科技中心角色的影响。

标签: #AI, #geopolitics, #regulation, #M&A, #China

Super ZSNES：GPU 加速的 SNES 模拟器重生 ⭐️ 8.0/10

ZSNES 的原开发者 zsKnight 和_Demo_发布了 Super ZSNES，这是一个完全重写的 SNES 模拟器，利用 GPU 加速实现增强性能，并支持高分辨率 Mode 7 和无损音频替换等功能。这标志着 SNES 模拟技术的重大飞跃，可能提供更高的准确性和视觉增强，惠及复古游戏爱好者和游戏保存工作。 Super ZSNES 从头重写，利用 GPU 进行渲染，支持每款游戏的增强功能和现代化界面。它还支持无损音频替换，可提升音质。

hackernews · haunter · Apr 27, 17:50

背景: ZSNES 是最早且最流行的 SNES 模拟器之一，但多年前已停止开发。传统模拟器依赖 CPU 进行软件渲染，可能限制性能和准确性。GPU 加速模拟将图形处理卸载到显卡，从而实现更高分辨率和特效。

参考链接

社区讨论: 社区成员对原版 ZSNES 表达了怀旧之情，并对 GPU 重写版感到兴奋。一些人讨论了技术实现细节，如逐像素渲染与逐图块渲染的对比，并指出该项目可从社区贡献（如无损音频样本）中受益。

标签: #emulation, #retro gaming, #GPU computing, #SNES

GitHub Copilot 转向按用量计费 ⭐️ 8.0/10

GitHub 宣布 Copilot 将从固定月费订阅转为按用量计费模式，用户每月获得一定数量的 AI 积分，可充值或累积。此变更影响 Copilot Pro（每月 10 美元，含 10 美元积分）和 Pro+（每月 39 美元，含 39 美元积分）套餐。此次定价转变结束了 Copilot 用户的补贴推理时代，可能增加重度用户的成本，并促使许多人评估 OpenRouter 或 DeepSeek 等替代方案。这反映了 AI 工具提供商转向按用量定价的行业趋势，以使成本与实际使用量相匹配。新模型倍率从基础模型的 1 倍到 GPT-4 和 Sonnet 的 6 倍，最高达 Opus 的 27 倍，这意味着单个请求可能消耗大量积分。此前用户每月支付 10 美元即可获得价值数百美元的 Opus 使用量，但现在这种使用成本将大幅增加。

hackernews · frizlab · Apr 27, 16:03

背景: GitHub Copilot 是一款 AI 驱动的代码补全工具，可实时建议代码片段和函数。它于 2021 年推出，迅速受到开发者欢迎。原定价为固定月费，实际上补贴了 GPT-4 和 Claude Opus 等昂贵 AI 模型的重度使用。

社区讨论: 社区情绪普遍负面，用户称这一变化对重度 Opus 用户是“50 倍涨价”，并质疑其价值主张。许多人考虑转向 OpenRouter 等按需付费提供商或 DeepSeek 等免费替代品，认为补贴推理时代已经结束。

标签: #GitHub Copilot, #pricing, #AI tools, #developer tools, #billing

开源 CLI 智能体在 TerminalBench 上超越谷歌官方结果 ⭐️ 8.0/10

一个名为 Dirac 的开源 CLI 智能体使用 Gemini-3-flash-preview 在 TerminalBench 上取得了 65.2%的分数，超过了谷歌官方智能体（47.8%）和此前排名第一的闭源模型 Junie CLI（64.3%）。这一结果表明，精心设计的执行框架（harness）能显著提升 AI 智能体的性能，甚至超越官方实现和闭源竞争对手，凸显了开源创新在 AI 智能体开发中的重要性。作者明确声明未使用任何作弊机制，智能体以符合排行榜要求的方式运行，且使用了完全开源版本。该智能体采用了哈希锚定编辑、基于 AST 的上下文获取以及批量操作等技术。

hackernews · GodelNumbering · Apr 27, 12:35

背景: TerminalBench 是一个评估 AI 智能体在命令行界面任务中表现的基准测试，测试其导航和操作真实环境的能力。Gemini-3-flash-preview 是谷歌于 2025 年 12 月发布的一款快速且成本效益高的模型。执行框架（harness）指的是控制智能体如何与环境交互并执行动作的软件框架。

参考链接

社区讨论: 评论者赞扬了执行框架的改进，并指出缺乏跨模型泛化测试。有人对遥测数据发送到作者端点表示担忧，而其他人则建议与不同模型家族进行比较，以排除过拟合的可能性。

标签: #AI agents, #benchmarking, #open source, #CLI, #LLM

最高法院权衡地理围栏搜查令合宪性 ⭐️ 8.0/10

美国最高法院于 2026 年 4 月 27 日听取了口头辩论，讨论警方要求科技公司提供手机位置数据的地理围栏搜查令是否违反第四修正案对不合理搜查的保护。此案可能为数字隐私设立重要先例，影响执法机构从谷歌、苹果和优步等公司获取位置数据的方式，并可能重塑监控与隐私权之间的平衡。谷歌于 2025 年停止响应地理围栏搜查令，将位置数据存储转移到用户设备上，但苹果、Lyft 和 Snapchat 等其他公司仍收到此类请求。法院的裁决将决定第三方数据共享是否消除了合理的隐私期望。

hackernews · unethical_ban · Apr 27, 15:29

背景: 地理围栏搜查令是一种要求公司识别特定时间段内特定地理区域内所有移动设备的搜查令。自 2018 年以来，此类搜查令的使用激增，谷歌的 Sensorvault 数据库是主要目标。第四修正案通常要求基于可能原因签发搜查令，但法院在将其适用于与第三方共享的数字数据时面临困难。

参考链接

社区讨论: 评论者注意到谷歌转向设备端存储是积极的隐私举措，但就第三方数据是否应失去隐私保护展开辩论。一些人将地理围栏搜查令比作警方查看监控录像，而另一些人则对监控范围和大法官明显的偏见表示担忧。

标签: #privacy, #surveillance, #supreme court, #geofencing, #tech policy

微软开源带说话人分离的 VibeVoice ⭐️ 8.0/10

微软于 2026 年 1 月 21 日发布了 VibeVoice，这是一个采用 MIT 许可证的语音转文本模型，内置说话人分离功能。Simon Willison 展示了如何在 Mac 上使用 mlx-audio 运行该模型，在不到 9 分钟内转录了一段 99 分钟的播客。这一开源发布使开发者能够使用先进的说话人感知转录功能，有望加速会议转录、播客分析和无障碍工具等应用。MIT 许可证鼓励广泛采用和社区贡献。该模型需要大量内存，在 128GB M5 Max MacBook Pro 上预填充阶段峰值达 61.5GB。每次运行最多处理一小时音频；更长的录音需要分割并重叠以避免错误。

rss · Simon Willison · Apr 27, 23:46

背景: 说话人分离用于识别音频流中“谁在何时说话”，将语音按说话人身份分割成片段。传统系统将转录和分离分为不同的流水线，而 VibeVoice 将两者集成到单个模型中，简化了部署。MLX 是苹果针对 Apple Silicon 优化的机器学习框架，mlx-audio 提供了基于它的音频处理工具。

参考链接

GitHub - Blaizzy/ mlx - audio : A text-to-speech (TTS), speech-to-text...

标签: #speech-to-text, #open-source, #machine learning, #Microsoft, #audio processing

微软与 OpenAI 移除 AGI 条款 ⭐️ 8.0/10

2026 年 4 月 27 日，OpenAI 和微软宣布从合作协议中移除 AGI 条款，该条款原本规定一旦实现 AGI，微软的知识产权将失效。这一变化移除了将 AGI 定义与商业利润挂钩的关键治理机制，可能加速 OpenAI 技术的商业化，并重塑两家公司之间的权力平衡。该条款最初将 AGI 定义为能够产生 1000 亿美元利润的系统，后来改为由独立专家小组验证；移除意味着微软无限期保留知识产权。

rss · Simon Willison · Apr 27, 18:38

背景: AGI 条款是微软与 OpenAI 合作中的独特设计，旨在确保如果 OpenAI 实现 AGI，微软不会拥有独家商业权利。随着时间的推移，AGI 的定义从模糊概念演变为基于利润的指标，再到专家验证。移除该条款反映了 OpenAI 寻求更多独立性和云合作灵活性的努力。

参考链接

标签: #OpenAI, #Microsoft, #AGI, #AI governance, #intellectual property

Zig 0.16.0 通过 Io 接口引入结构化并发 ⭐️ 8.0/10

Zig 0.16.0 扩展了新的 Io 接口，提供了 async() 和 concurrent() 函数，返回带有 await() 和 cancel() 方法的 Future 对象，实现了结构化并发。该设计为其他语言的隐式异步模型提供了一种显式且冗长的替代方案，可能减少取消操作带来的错误，并在系统编程中改善资源清理控制。 async() 函数可以在另一个线程中同时运行回调，而 concurrent() 必须在另一个线程中运行。Future 方法是幂等的，允许安全地多次调用 await() 或 cancel()。

rss · LWN.net · Apr 27, 13:52

背景: 结构化并发确保并发任务限定在父作用域内，防止线程泄露并改进错误传播。Zig 的方法显式传递 Io 接口，类似于其分配器 API，与 Rust 的隐式异步模型形成对比，后者在取消操作方面曾遇到问题。

参考链接

标签: #Zig, #structured concurrency, #systems programming, #asynchronous

MiMo-V2.5-Pro：开源 AI 模型挑战 Claude Opus ⭐️ 8.0/10

小米发布了 MiMo-V2.5-Pro，这是一个采用 MIT 许可证的开源 AI 模型，据报道其性能可与 Claude Opus 相媲美，尤其在编码和长上下文任务方面表现出色。此次发布通过提供高质量的开源模型，显著推动了开源 AI 的发展，该模型可在本地运行且不受企业限制，有望使尖端 AI 能力更加普及。 MiMo-V2.5-Pro 拥有超过 1 万亿总参数，支持 100 万 token 的上下文长度，在 GDPval-AA 基准测试中 Elo 得分为 1426，超越了众多同类模型。

reddit · r/LocalLLaMA · Namra_7 · Apr 27, 17:57

背景: 像 Claude Opus 这样的大型语言模型通常是专有的，需要云端访问。采用 MIT 等宽松许可证的开源模型允许任何人下载、修改并在本地运行，从而减少对商业 API 的依赖，并支持私密、可定制的 AI 应用。

参考链接

社区讨论: 社区反应热烈，许多人称赞该模型的质量和 MIT 许可证。一些用户指出它在推理和长上下文方面表现出色，但在编码代理方面较弱。硬件需求是一个问题，因为运行完整模型需要多块高端 GPU。

标签: #AI, #open-source, #LLM, #machine learning, #model release

Asahi Linux 对苹果 M3 芯片的适配接近 Alpha 水平 ⭐️ 8.0/10

Asahi Linux 已实现对苹果 M3、M3 Pro 和 M3 Max 芯片的接近 Alpha 级别的支持，启用了内部 SSD、屏幕、键盘、触控板、PCIe 和蓝牙音频等基本硬件功能，但 GPU 加速仍未实现。这标志着将 Linux 移植到 Apple Silicon 的重要里程碑，扩展了 ARM Linux 生态系统，并为用户在最新的 Mac 硬件上提供了替代操作系统。 GPU 硬件加速仍然缺失，图形渲染目前由 CPU 软件处理；此外，项目正在将 m1n1 引导加载程序迁移到 Rust 语言以提高安全性和可维护性，并已在 M4 和 M5 芯片上完成了基础引导测试。

telegram · zaihuapd · Apr 27, 02:08

背景: Asahi Linux 是一个社区驱动的项目，通过逆向工程未公开的硬件将 Linux 移植到 Apple Silicon Mac。该项目于 2022 年 3 月发布了针对 M1 设备的首个 Alpha 安装程序，此后逐步扩展了对新芯片的支持。Fedora Asahi Remix 是旗舰发行版，在 Apple 硬件上提供完整的 Linux 体验。

参考链接

标签: #Asahi Linux, #Apple M3, #Linux on ARM, #open source, #hardware support

小米玄戒 O1 芯片出货量突破 100 万颗 ⭐️ 8.0/10

小米在投资者日上宣布，自研的 3nm 玄戒 O1 芯片出货量已超过 100 万颗，后续自研芯片将应用于小米汽车，并计划每年推出升级版本。这一里程碑标志着小米在自研芯片领域取得重大进展，挑战了既有厂商，并可能重塑半导体格局，尤其是在汽车应用方面。小米自研大芯片项目自 2021 年重启，计划 10 年投入至少 500 亿元，截至 2025 年 4 月底，玄戒研发投入已超 135 亿元。

telegram · zaihuapd · Apr 27, 05:50

背景: 3nm 制程是领先的半导体制造节点，相比前代节点可提供更高的晶体管密度、更好的性能和更低的功耗。小米玄戒 O1 是采用这一先进制程的自研芯片，表明公司减少对外部供应商依赖、在高端芯片设计领域竞争的雄心。

参考链接

3纳米制程 - 维基百科，自由的百科全书

标签: #semiconductor, #Xiaomi, #chip design, #3nm, #automotive

Easyduino：面向 KiCad 的开源 PCB 开发板设计 ⭐️ 7.0/10

Easyduino 是一个新的开源 GitHub 仓库，为 Arduino UNO、ESP32 和 Raspberry Pi Pico 等流行的微控制器开发板提供 KiCad PCB 设计，方便爱好者和教育者学习 PCB 设计。该项目通过提供经过验证的开源模板，降低了学习 PCB 设计的门槛，这些模板可以修改和重用，从而促进硬件开发的实践教育和创新。该仓库包含 Arduino UNO、Arduino Nano、ESP32、ESP32-S3、Raspberry Pi Pico (RP2040)和 STM32 Bluepill 的设计，全部统一在 KiCad 中，支持 USB-C，并采用针对 JLCPCB 制造优化的 4 层铜堆叠。

hackernews · Hanqaqa · Apr 27, 17:45

背景: KiCad 是一个免费的开源电子设计自动化（EDA）套件，用于原理图绘制和 PCB 布局。从头开始设计定制 PCB 对初学者来说可能令人生畏，因为它需要了解元件放置、布线以及制造约束。Easyduino 提供了现成的参考设计，展示了最佳实践，使学习者能够从一块可工作的板子开始，并根据自己的项目进行修改。

参考链接

社区讨论: 社区反响非常积极，用户称赞该项目是填补开源开发板设计空白的绝佳资源。一些用户分享了自己设计类似板子的经验，而另一些用户则询问如何向儿童介绍 PCB 设计，显示出浓厚的教育兴趣。

标签: #PCB design, #KiCad, #Arduino, #open source hardware, #education

macOS 27 将强制 TLS 1.2，弃用 AFP 用于 Time Machine ⭐️ 7.0/10

macOS 27 将要求某些网络连接使用 TLS 1.2，并弃用 Apple Filing Protocol (AFP) 用于 Time Machine 备份，推动用户改用 SMB。这一变化通过强制使用现代加密标准增强了安全性，并简化了网络文件共享，但可能会影响依赖旧版 AFP 的 Time Machine 用户，特别是使用 Time Capsule 等旧硬件的用户。 TLS 1.2 要求适用于与某些服务器的连接，AFP 弃用意味着不再支持通过 AFP 进行 Time Machine 备份，需要迁移到 SMB。使用 Time Capsule 的用户可能需要运行自定义的 Samba 构建才能继续使用。

hackernews · pvtmert · Apr 27, 15:36

背景: AFP 是苹果专有的文件共享协议，而 SMB 是广泛使用的跨平台协议。TLS 1.2 是一种确保通信安全的加密协议；旧版本如 TLS 1.1 被认为不安全。苹果多年来一直在逐步弃用 AFP。

参考链接

社区讨论: 评论者反应不一：有人指出 TLS 1.2 早就该强制了，也有人回忆起苹果重写 mDNSResponder 时引发的网络问题。少数用户分享了变通方法，比如为 Time Capsule 构建 Samba 4，还有人对 Time Machine 动画的不完善表示遗憾。

标签: #macOS, #networking, #TLS, #Time Machine, #SMB

凝视墙壁的失落艺术 ⭐️ 7.0/10

一篇个人随笔指出，智能手机已经消除了过去用于走神的空闲时刻，这种状态被称为“非注意”。这篇反思突显了智能手机时代一种微妙而深刻的损失：让思绪自由游荡的能力，而这种能力对创造力和心理健康至关重要。文章用“凝视墙壁的人”来形容陷入沉思的人，与如今不断查看手机的行为形成对比。社区评论将这种状态与冥想进行比较，并讨论了其益处。

hackernews · aselimov3 · Apr 27, 11:08

背景: “非注意”概念指的是无结构的空闲时间，此时大脑无需外部刺激即可自由游荡。在智能手机时代之前，这种时刻在等待、通勤或休息时很常见。持续使用智能手机填补了这些空白，可能减少了创造性思维和自我反思的机会。

社区讨论: 评论者大多赞同文章的观点，分享了凝视墙壁的个人经历以及走神的好处。一些人争论这种状态是否是一种冥想形式，而另一些人则提醒说它与冥想不同，并非注意力缺陷的解决方法。

标签: #attention, #smartphones, #meditation, #mental health, #technology

SVG 消毒的困境 ⭐️ 7.0/10

一篇详细文章解释了由于 SVG 的复杂特性（如脚本、事件处理程序和 CSS），对其进行消毒极其困难，并建议使用内容安全策略 (CSP) 作为解决 HTTP 泄漏问题的唯一可靠方法。这很重要，因为许多 Web 应用程序允许 SVG 上传或渲染，不完整的消毒可能导致 XSS 和数据泄露。文章提供了实用的 CSP 建议，可帮助开发者保护其应用程序。文章指出 SVG 支持内联脚本、事件处理程序、CSS 和外来对象，使消毒成为一个打地鼠式的问题。它建议使用 CSP 标头或标签作为抵御 HTTP 泄漏的唯一可靠防御。

hackernews · varun_ch · Apr 27, 15:31

背景: SVG（可缩放矢量图形）是一种基于 XML 的矢量图像格式，可以包含脚本和 CSS 等交互元素。消毒是从用户提交的 SVG 中移除危险内容以防止跨站脚本 (XSS) 等安全漏洞的过程。内容安全策略 (CSP) 是一种浏览器安全机制，限制页面可以加载和执行的资源。

参考链接

社区讨论: 评论者一致认为 CSP 是唯一可靠的修复方法，有人建议为内联 SVG 添加沙箱属性。另有人提议仅支持 SVG 功能的安全子集，还有一位提到了 HTML Sanitizer API 对 SVG 的有限支持。

标签: #web security, #SVG, #CSP, #sanitization, #frontend

为什么不用 Lean？一个批判性比较 ⭐️ 7.0/10

Lawrence Paulson 发表了一篇博客文章，批判性地审视了为什么 Lean 可能不是所有证明助手任务的最佳选择，并将其与 Coq、Agda 和 Isabelle/HOL 进行了比较。这一分析有助于从业者根据需求选择合适的证明助手，突出了在自动化、依赖类型和社区支持方面的权衡。文章认为 Lean 保留证明对象可能导致项过大，但社区评论指出这是一种误解。Lean 因各方面表现均衡且拥有庞大社区而受到称赞。

hackernews · ibobev · Apr 27, 14:24

背景: Lean、Coq、Agda 和 Isabelle/HOL 等证明助手是用于编写和验证数学证明的软件工具。它们基于不同的类型理论，提供不同级别的自动化和表达能力。Lean 基于带归纳类型的构造演算，并拥有庞大的数学库（mathlib）。

参考链接

社区讨论: 评论者就 Lean 的优势展开了讨论：一些人认为它在函数式编程方面比 Agda 笨重，而另一些人则称赞其平衡性。一个关键纠正是，Lean 并不保留完整的证明对象，这与文章的说法相反。

标签: #proof assistants, #Lean, #functional programming, #formal verification

pip 26.1 发布，新增依赖冷却和 pylock 支持 ⭐️ 7.0/10

pip 26.1 已发布，引入了依赖冷却功能、对 pylock.toml 文件的实验性支持、解析器改进、安全修复，并终止了对 Python 3.9 的支持。此版本对 Python 开发者意义重大，因为它提高了依赖解析的可靠性，通过 pylock 支持增强了可重现性，并修复了安全漏洞，同时终止对 Python 3.9 的支持鼓励用户迁移到更新版本。依赖冷却功能允许 pip 暂时避免重新解析最近已解析的依赖项，减少不必要的工作。实验性的 pylock 支持实现了 PEP 751，用于可重现安装，解析器改进解除了 2020 解析器的若干限制，进一步接近移除旧版解析器。

rss · LWN.net · Apr 27, 18:45

背景: pip 是 Python 的标准包安装工具。2020 解析器引入了更严格的依赖冲突检测，但存在一些限制，pip 26.1 解决了这些问题。依赖冷却功能受 uv（一个快速的 Python 包管理器）启发。pylock.toml 是 PEP 751 定义的新锁定文件格式，用于确保跨环境的可重现安装。

参考链接

标签: #pip, #Python, #package management, #release

Linux 7.1 合并窗口关闭，包含近 1.3 万个变更集 ⭐️ 7.0/10

Linux 7.1 合并窗口关闭，共包含来自 2011 名开发者的 12996 个非合并变更集，其中 342 名是首次贡献者。值得注意的新增内容包括 Alpha 架构的 seccomp() 支持、Loongarch 的高内存支持，以及 sched_ext 中子调度器支持的初步实现。此次合并窗口显示了 Linux 内核开发者社区的持续增长，首次贡献者数量不断增加。新特性如子调度器和改进的交换子系统将提升广大用户的性能和灵活性。合并窗口在后半段收到了超过 9000 个变更集，主要集中在驱动更新。关键技术变化包括因缺乏维护者而移除 RISC-V 的就地执行支持，以及为虚拟机跟踪添加远程环形缓冲区。

rss · LWN.net · Apr 27, 16:39

背景: Linux 内核开发周期以两周的合并窗口开始，在此期间新特性被接纳入主线。合并窗口关闭后，进入稳定期，最终发布正式版本。7.1 合并窗口是 Linux 内核持续开发的一部分，由 Linus Torvalds 和全球开发者社区维护。

标签: #Linux kernel, #merge window, #open source, #development

微软开源 TRELLIS.2：40 亿参数图像转 3D 模型 ⭐️ 7.0/10

微软发布了 TRELLIS.2，这是一个开源的 40 亿参数图像转 3D 生成模型，能够生成高达 1536³分辨率、带有完整 PBR 材质的高保真 3D 资产，采用了新颖的 O-Voxel 结构和具有 16 倍空间压缩的原生 3D VAE。此次开源发布使最先进的 3D 生成技术得以普及，开发者和艺术家可以高效地从单张图像创建高质量 3D 资产，有望加速游戏、VR/AR 和数字内容创作等领域的工作流程。该模型采用名为 O-Voxel 的无场稀疏体素结构来处理复杂拓扑和锐利特征，并使用具有 16 倍空间压缩的原生 3D VAE 实现高效的潜在表示。代码和在线演示已在 GitHub 和 Hugging Face 上提供。

reddit · r/LocalLLaMA · 44th–Hokage · Apr 27, 20:07

背景: 图像转 3D 生成旨在从单张 2D 图像创建 3D 模型，由于需要推断深度、几何和材质，这一任务颇具挑战。传统方法常依赖神经辐射场或符号距离函数，而 TRELLIS.2 通过 O-Voxel 和 3D VAE 引入紧凑的潜在空间，提高了效率和保真度。PBR（基于物理的渲染）材质模拟真实的光照交互，增强了视觉质量。

参考链接

社区讨论: 社区评论指出该模型实际上在四个月前就已发布，降低了新闻的紧迫性。一些用户反映难以复现演示中的高质量结果，并且有用户请求 ROCm 支持，虽然已有合并请求被批准，但在 AMD GPU 上仍存在兼容性问题。

标签: #3D generation, #image-to-3D, #open-source, #generative AI, #computer vision

4B 参数 LLM 基准测试：Nemotron 3 Nano 在金融、推理和代码任务中夺冠 ⭐️ 7.0/10

一项社区基准测试比较了五款 4B 参数的大语言模型（Gemma 4、Qwen 3.5、Granite 4、Nemotron Nano、Phi-4 Mini），涵盖金融、推理和代码共 39 项任务，其中 Nemotron 3 Nano 以 85%的总分位居第一。该基准测试及时提供了最新小型 LLM 的直接对比，突显了 Nemotron 3 Nano 在金融任务上的强劲表现，并引发了关于基准测试方法和 token 预算公平性的讨论。该基准测试使用最大输出 1024 个 token、温度设为 0、随机种子 42，并对每个任务进行 3 次试验取中位数。Nemotron 3 Nano 在金融任务上获得 100%，推理 80%，代码 67%；而 Qwen 3.5 总分仅 15%，很可能是因为思考 token 预算不足。

reddit · r/LocalLLaMA · FederalAnalysis420 · Apr 27, 18:36

背景: 4B 参数的 LLM 足够小，可以在笔记本电脑等消费级硬件上运行，因此适合本地部署。该基准测试了来自 Google、阿里巴巴、IBM、NVIDIA 和 Microsoft 的模型，发布时间从 2024 年底到 2026 年初。Token 预算对于使用内部推理 token 后再输出答案的思考模型至关重要。

参考链接

社区讨论: 评论者质疑 1024 个 token 的预算设置，认为这对 Qwen 3.5 等思考模型不公平。有人建议禁用思考功能或使用外部预算控制。还有人指出，较旧的 Phi-4 Mini 在代码任务上得分高，可能表明基准测试存在缺陷。

标签: #LLM, #benchmark, #local LLM, #model comparison, #AI

通过添加旧 GPU 增加 LLM 的 VRAM ⭐️ 7.0/10

一位 Reddit 用户发现，通过 llama.cpp 中的 Vulkan 将 16GB RTX 5070 Ti 与旧的 6GB RTX 2060 组合使用，可以运行原本无法装入 16GB VRAM 的更大 LLM（例如 Qwen3.6-27B），总 VRAM 达到 22GB。这一实用技巧使 VRAM 有限（例如 16GB）的用户无需购买昂贵的 24GB 显卡即可运行更大的密集模型，让爱好者和研究人员更容易获得高端 LLM。该设置使用 llama-server 的dev=Vulkan1,Vulkan2将模型分配到多个 GPU，并需要no-mmap和mlock=false以避免模型占用 RAM。性能可能受较慢显卡的限制（例如，在单个 3090 Ti 上为 30 t/s，而双卡时降至 20 t/s）。

reddit · r/LocalLLaMA · akira3weet · Apr 27, 10:20

背景: 大型语言模型（LLM）需要大量 VRAM 才能完全在 GPU 上运行，这比 CPU+RAM 快得多。许多用户只有 16GB VRAM，不足以运行 30B+参数模型。llama.cpp 支持使用 Vulkan 或 CUDA 将模型分配到多个 GPU，但传统观点认为使用相同 GPU 才能获得最佳性能。

参考链接

社区讨论: 社区成员普遍赞同这一技巧，一些人分享了自己的多 GPU 设置（例如，在 3x3090 基础上增加 3060）。然而，多位用户指出性能瓶颈：Mysterious_Role_8852 报告在 3090 Ti 上添加 2070 后，速度从 30 t/s 降至 20 t/s。其他人则提出了功耗、空间和插槽带宽等实际顾虑。

标签: #LLM, #VRAM, #GPU, #hardware, #llama.cpp

Skymizer 发布 384GB PCIe 卡，支持 700B 参数大模型推理 ⭐️ 7.0/10

台湾 Skymizer 公司发布了一款突破性 PCIe 卡，搭载六颗 HTX301 芯片和 384GB 内存，可在约 240W 功耗下本地运行 700B 参数大语言模型推理，其核心创新是将解码阶段从 GPU 卸载到 HTX301 卡上。这种架构使企业无需昂贵的多 GPU 配置，即可在单卡上运行超大规模模型，有望以更低功耗和成本普及大模型推理能力。该卡将大模型推理分为两个阶段：GPU 处理计算密集的预填充阶段，HTX301 卡处理内存带宽密集的解码阶段。内存并非 HBM，而是采用类似 GDDR6/6X/7 的封装，带宽细节尚未公布。

reddit · r/LocalLLaMA · lurenjia_3x · Apr 27, 12:56

背景: 大语言模型推理包含两个阶段：预填充（处理输入提示）和解码（逐个生成 token）。解码受内存带宽限制，而预填充受计算能力限制。传统 GPU 同时处理两者，而 Skymizer 的方法为每个阶段分配专用硬件以提高效率。

参考链接

社区讨论: 社区对未公开的带宽、潜在的高成本（数万美元）以及过去的“雾件”承诺表示怀疑。有人质疑在卡之间传输权重是否会导致延迟，也有人指出缺乏具体的性能数据。

标签: #LLM inference, #hardware architecture, #AI hardware, #edge AI

微软 Windows K2 计划旨在重塑 Windows 11 ⭐️ 7.0/10

微软内部正在推进一项名为“Windows K2”的长期计划，旨在通过性能、可靠性和社区驱动的改进来重塑 Windows 11，包括基于 WinUI 3 的开始菜单（响应速度提升 60% 且无广告）、将更新频率降低至每月一次，以及在一到两年内使游戏性能对标 SteamOS。该计划标志着从快速功能发布向质量优先开发的战略转变，通过解决长期存在的性能、臃肿软件和侵入性更新等投诉，有望恢复用户对 Windows 11 的信任。如果成功，它可能使 Windows 11 在游戏领域与 SteamOS 等平台更具竞争力，并改善数百万 PC 用户的整体体验。 K2 计划基于四大支柱：性能、工艺、可靠性和社区反馈。关键技术细节包括：使用 WinUI 3 重建开始菜单以实现 60% 的速度提升并移除广告；将系统更新重启频率降至每月一次；优化系统体积以降低空闲内存占用。

telegram · zaihuapd · Apr 27, 10:31

背景: Windows 11 因性能问题、带有广告的杂乱开始菜单以及需要重启的频繁更新而受到批评。WinUI 3 是微软用于 Windows 桌面应用的现代原生 UI 框架，与操作系统解耦以实现更快的更新。SteamOS 是 Valve 基于 Linux 的游戏操作系统，针对 Steam Deck 等掌机进行了优化，以其游戏性能和易用性著称。

参考链接

标签: #Windows 11, #Microsoft, #Operating Systems, #WinUI 3, #Gaming

中国科技巨头因 AI 内容遭用户抵制 ⭐️ 7.0/10

网易游戏《第五人格》因疑似 AI 生成的海报出现肢体错误，玩家于 4 月 23 日发起“停氪”抵制；爱奇艺开放“艺人库”供 AIGC 创作者遴选，引发肖像权争议；字节跳动旗下番茄小说在经历 AI 训练协议风波后，开始整治低质 AI 批量生成内容。这些事件凸显了中国科技行业在 AI 驱动效率与用户/创作者权益之间日益紧张的关系，可能迫使平台重新思考 AI 部署策略，以避免疏远用户群体。网易自 2025 年起在美术和编程环节部署了 AI 原生管线，部分环节效能提升高达 300%，但此次抵制表明 AI 生成内容的质量和伦理问题仍未解决。

telegram · zaihuapd · Apr 27, 12:22

背景: AI 原生管线指将 AI 深度集成到内容创作中的开发流程，例如通过文本提示生成图形、音效和脚本。“停氪”是中国玩家通过停止游戏内购进行抗议的术语。AIGC（AI 生成内容）指利用 AI 创作作品，引发了版权和肖像权问题。

参考链接

社区讨论: Telegram 频道的讨论可能包含关于 AI 伦理和行业影响的不同观点，一些用户批评平台优先考虑效率而非质量和权益，而另一些用户则承认 AI 的潜力但呼吁更好的监管。

标签: #AI Ethics, #Content Moderation, #Gaming, #Copyright, #China Tech