📅 05-1905-1705-1605-15

📋 今日速览

5
📅 6天前 · Hugging Face Daily Papers
CiteVQA 是一个针对文档视觉语言模型的基准测试,它不仅评估答案的准确性,还要求模型正确引用支持证据。研究发现,当前模型普遍存在“归因幻觉”——答案正确但引用的证据区域错误。该基准包含 1897 个问题,覆盖 711 份 PDF 文档(…
📅 05-04 · Hugging Face Daily Papers
CoRD是一种协作式多教师解码框架,通过预测困惑度评分和束搜索合成推理轨迹,能够高效蒸馏大型推理模型,生成高质量输出并具备泛化性能。该方法解决了现有基于筛选的方法中教师协作缺失和动态探索不足的问题,在减少冗余采样的同时保留了互补推理路径。实…
📅 4天前 · Hugging Face Daily Papers
NudgeRL框架通过结构化探索和策略轻推,增强基于可验证奖励的强化学习(RLVR),提升大语言模型的推理能力。该方法引入策略轻推,利用轻量级策略级上下文引导多样化推理轨迹,无需昂贵的神谕监督。同时提出统一目标,将奖励信号分解为上下文间和上…
📅 昨日 · Hacker News
本文介绍了一种通过结合LP(低精度)、FUSE(融合)、C/R(检查点/恢复)和CUDA-checkpoint技术,将推理冷启动时间降低40倍的方法。该方法优化了模型加载和初始化过程,显著提升了推理效率。
📅 5天前 · Hugging Face Daily Papers
本文提出因果强制++(Causal Forcing++),一种用于实时交互视频生成的可扩展少步自回归扩散蒸馏方法。该方法通过因果一致性蒸馏(causal CD)实现帧级自回归,仅需1-2步采样,解决了现有方法粗粒度响应和高延迟问题。在帧级2…

🤖 AI·模型

15
📅 4天前 · Hugging Face Daily Papers · ★★★★☆
DexJoCo提出了一个灵巧操作基准与工具包,包含11个功能性任务,评估工具使用、双手协调、长时执行和推理能力。它提供了一个低成本数据采集系统,收集了1.1K条轨迹,并支持域随机化以评估鲁棒性。通过视觉和动力学随机化、多任务训练和动作头适应等设置,对现代模型进行了基准测试,揭示了当前策略的常见局限和…
📅 4天前 · Hugging Face Daily Papers · ★★★★☆
FashionChameleon是一个实时交互框架,用于自回归视频生成中的人体服装定制。它通过教师-学生蒸馏和上下文学习技术,仅使用单服装视频数据,实现了多服装的交互式切换,同时保持运动连贯性。该框架在单GPU上达到23.8 FPS的实时生成速度,比现有基线快30-180倍。
📅 4天前 · Hugging Face Daily Papers · ★★★★☆
Flash-GRPO 是一种单步训练框架,旨在解决视频扩散模型对齐中 GRPO 方法的计算瓶颈。它通过等时分组消除时间步混淆方差,并通过时间梯度修正平衡不同时间步的梯度幅度,从而在低计算预算下实现优于全轨迹训练的对齐质量,同时大幅提升训练效率。实验在 1.3B 到 14B 参数模型上验证了其有效性。
📅 7天前 · Hugging Face Daily Papers · ★★★★☆
HölderPO是一种通用策略优化框架,通过Hölder均值统一token级概率聚合,解决了GRPO中固定聚合机制导致的训练崩溃与性能不佳的权衡问题。通过调节参数p,框架可连续控制梯度集中度与方差边界,并采用动态退火算法在训练过程中逐步调度p。实验表明,该方法在多个数学基准上达到54.9%的平均准确…
📅 5天前 · Hugging Face Daily Papers · ★★★★☆
InsightTok 是一种改进的离散视觉标记化框架,通过引入内容感知的感知损失,显著提升了文本和面部的重建质量。在保持通用重建性能的同时,使用16k码本和16倍下采样率,InsightTok 在文本和面部重建上优于先前方法,并有效迁移至自回归图像生成任务,生成更清晰的文本和更逼真的面部细节。
📅 7天前 · Hugging Face Daily Papers · ★★★★☆
本文提出了一种名为LC-MAPF的预训练模型,通过引入可学习的局部通信模块,使相邻智能体之间进行多轮特征共享,从而提升多智能体路径规划中的协调能力。实验表明,该方法在多种未见过的测试场景中,在多个指标上均优于现有的基于强化学习和模仿学习的求解器,且不牺牲可扩展性。
📅 6天前 · Hugging Face Daily Papers · ★★★★☆
在线策略蒸馏(OPD)作为大语言模型的高效后训练范式,其效率源于早期建立稳定的更新轨迹。本文从参数动态角度揭示其机制:在模块分配层面,OPD识别低边际效用区域,集中更新关键推理模块;在更新方向层面,OPD表现出更强的低秩集中性,主导子空间与最终更新子空间早期对齐。基于此,提出EffOPD方法,通过自…
📅 05-07 · Hugging Face Daily Papers · ★★★★☆
本文提出灯塔注意力(Lighthouse Attention),一种训练专用的对称分层选择注意力算法,通过降低计算复杂度实现因果Transformer在超长序列上的高效训练。该方法包含自适应压缩/解压缩、对称池化保持因果性、两阶段训练(预训练+恢复)等创新,在小型LLM预训练实验中达到更快的总训练时…
📅 5天前 · Hugging Face Daily Papers · ★★★★☆
MMSkills 提出了一种多模态程序性知识框架,使视觉智能体能够通过结合文本、状态卡片和视觉关键帧的结构化表示,利用外部可复用技能,从而在复杂环境中改进决策。该框架包括技能包表示、生成和使用三个部分,并在 GUI 和游戏基准测试中持续提升了前沿和较小规模的多模态智能体性能。
📅 5天前 · Hugging Face Daily Papers · ★★★★☆
PhysBrain 1.0 利用人类自我中心视频生成物理常识监督信号,用于视觉-语言-动作模型。通过数据引擎提取场景元素、空间动态、动作执行和深度感知关系,转化为问答监督训练 VLM,再通过能力保持和语言敏感适配迁移到 VLA 策略。在 ERQA、PhysBench、SimplerEnv-Widow…
📅 5天前 · Hugging Face Daily Papers · ★★★★☆
ReactiveGWM是一种反应式游戏世界模型,通过扩散模型和交叉注意力模块,将玩家控制与NPC行为解耦,实现游戏无关的策略表示和零样本策略迁移。在《街头霸王》游戏中验证,该模型在保持玩家精细控制的同时,实现了稳健的、与提示对齐的NPC策略遵循,为可扩展的策略丰富NPC交互铺平了道路。
📅 5天前 · Hugging Face Daily Papers · ★★★★☆
SDAR 通过将在线策略自蒸馏(OPSD)作为门控辅助目标,同时保持强化学习(RL)作为主要优化框架,增强了多轮智能体训练的强化学习。它使用 sigmoid 门控选择性地强化教师认可的正差距令牌的蒸馏,同时减弱负面的教师拒绝。在 Qwen2.5 和 Qwen3 系列上,SDAR 在 ALFWorld…
📅 5天前 · Hugging Face Daily Papers · ★★★★☆
Solvita 是一个智能体进化框架,通过强化学习更新图结构知识网络,实现代码生成的持续学习,无需更新底层 LLM 权重。它由 Planner、Solver、Oracle 和 Hacker 四个专用智能体组成,形成策略选择、程序合成、认证监督和定向攻击的闭环系统。在 CodeContests、APP…
📅 昨日 · Hacker News · ★★★☆☆
本文介绍了Agora-1,一种多智能体世界模型,旨在通过多个智能体协同构建和更新对环境的共同理解。该模型强调分布式感知、推理与行动,适用于复杂动态场景。
📅 昨日 · TechCrunch · ★★★☆☆
SandboxAQ 将其药物发现模型集成到 Claude 中,旨在降低使用门槛,让非计算专家也能利用 AI 加速新药研发。与 Chai Discovery 和 Isomorphic Labs 等公司专注于构建更优模型不同,SandboxAQ 认为更大的障碍在于访问便利性,而 Claude 解决了这一…

🚀 创业·产品

4
📅 昨日 · TechCrunch · ★★★☆☆
Anthropic 收购了纽约初创公司 Stainless,该公司成立于 2022 年,专注于自动化创建和维护软件开发工具包(SDK),帮助开发者与 API 交互。Stainless 在 AI 行业迅速崛起,其客户包括 OpenAI、Google 和 Cloudflare。
📅 昨日 · TechCrunch · ★★★☆☆
亚马逊升级其语音助手Alexa+,新增按需生成定制AI播客的功能,标志着其从传统助手向个性化AI内容平台的转型。用户可通过语音指令,让Alexa+基于特定主题或数据源自动生成播客节目,实现内容消费的个性化与即时化。
📅 昨日 · TechCrunch · ★★★☆☆
Kin Health 完成 900 万美元融资,开发一款类似会议记录工具的 AI 应用,用于记录患者就诊过程。该应用能自动生成就诊摘要和后续步骤,并支持与家人朋友分享。
📅 昨日 · The Verge · ★★★☆☆
亚马逊升级版AI助手Alexa Plus新增功能,可根据用户指定主题生成AI播客。用户可先预览AI主持人的讨论大纲,调整对话方向和时长,然后生成完整节目。示例包括罗马帝国历史、新音乐和世界杯预期等主题。

⚡ 行业·基础设施

11
📅 昨日 · Hacker News · ★★★☆☆
埃隆·马斯克针对山姆·奥特曼和OpenAI提起的诉讼已被法院驳回。该诉讼指控OpenAI背离了其非营利初衷,但法官认为缺乏足够证据支持。此案结果对AI行业治理和开源理念产生一定影响。
📅 4天前 · Hacker News · ★★★☆☆
Stratum是一种系统-硬件协同设计方案,利用3D堆叠DRAM优化混合专家模型(MoE)的效率。通过将MoE的稀疏激活特性与3D DRAM的高带宽、低延迟相结合,Stratum显著减少了数据移动开销,提升了推理和训练性能。实验表明,相比传统方案,Stratum在能效和吞吐量上分别提升2.3倍和1.…
📅 昨日 · OpenAI Blog · ★★★☆☆
OpenAI与戴尔宣布合作,将AI编码助手Codex部署到混合云和本地企业环境中,帮助企业安全地在数据和流程中应用AI编码代理。
📅 昨日 · TechCrunch · ★★★☆☆
韩国初创公司LetinAR开发了一款拇指甲大小的透镜,有望成为AI眼镜时代的光学支柱。该技术通过创新的光学设计,解决了传统AR眼镜体积大、视场角窄、功耗高等痛点,为轻量化、高性能AI眼镜提供了关键组件。
📅 昨日 · The Verge · ★★★☆☆
马斯克诉奥特曼案揭示了AI领域领导层的信任危机。马斯克指控奥特曼不应主导AI未来,但陪审团因诉讼时效驳回其诉求。庭审表明,科技界最有权势的人物在气质上似乎不适合领导AI发展,引发对AI治理的广泛担忧。
📅 昨日 · Hacker News · ★★★☆☆
本文报道了YC(Y Combinator)首席执行官Garry Tan公开指责作者进行不道德报道的事件。文章可能涉及作者与Garry Tan之间的争议,但原文内容仅包含标题和评论部分,未提供具体细节。
📅 3天前 · Hacker News · ★★★☆☆
本文介绍了一种在2025年实现两台电脑共享一个显示器且无需手动切换的解决方案。通过使用支持KVM功能的显示器或专用KVM切换器,结合USB-C或HDMI等接口,用户可以实现鼠标、键盘和显示器的无缝共享。文章详细讨论了硬件选择、连接方法和配置步骤,旨在减少桌面杂乱和操作繁琐。
📅 2天前 · TechCrunch · ★★★☆☆
十年前,Lior Susan投资实体世界(如芯片、硬件)显得孤独,如今其公司Eclipse因Cerebras的2.5亿美元投资而处于科技界中心。这标志着Eclipse专注于物理世界技术(如AI芯片、制造、能源)的 thesis 正获得验证,未来将有更多类似投资。
📅 2天前 · TechCrunch · ★★★☆☆
本文指出,汽车行业正面临一场围绕人工智能(AI)技能的军备竞赛。随着自动驾驶、智能座舱等技术的快速发展,传统汽车工程师的技能已无法满足需求,企业急需大量具备AI、机器学习、数据科学等背景的人才。文章分析了这一趋势对行业招聘、培训及竞争格局的深远影响。
📅 昨日 · Hacker News · ★★★☆☆
本文详细介绍了如何从零开始设计一个基于FPGA的计算器,涵盖硬件架构、模块划分、状态机设计、算术逻辑单元(ALU)实现以及输入输出处理等关键步骤。通过逐步构建,读者可以掌握FPGA数字系统设计的基本方法。
📅 2天前 · TechCrunch · ★★☆☆☆
本文指出,在2026年的毕业典礼演讲中,提及人工智能可能难以激发毕业生的热情。AI对未来的影响虽大,但毕业生对此感到疲惫或焦虑,演讲者应避免过度强调AI,转而关注更人性化、鼓舞人心的主题。

🛠 工具·资源 📎

16
📅 昨日 · Hacker News · ★★★☆☆
本文探讨了使用人工智能技术完全自主运营广播电台的实践。通过AI生成内容、自动播放、实时调整节目单,实现了24/7不间断广播。实验表明,AI能有效管理音乐、新闻、广告等模块,并可根据听众反馈动态优化。关键发现包括:AI可降低运营成本、提升内容多样性,但需人工监督以避免伦理问题。
📅 昨日 · Hacker News · ★★★☆☆
本文对比了四种主流Lisp方言:Common Lisp、Racket、Clojure和Emacs Lisp,涵盖语法、特性、应用场景及社区生态。重点分析了它们在宏系统、并发模型、类型系统和平台依赖上的差异,帮助开发者根据项目需求选择最合适的Lisp方言。
📅 昨日 · Hacker News · ★★★☆☆
本文介绍了 Project Glasswing 项目,重点分析了 Mythos 系统在其中的作用与表现。通过实际案例,展示了 Mythos 如何提升数据处理效率、优化资源分配,并揭示了其在复杂系统集成中的关键价值。文章总结了关键发现与未来应用方向。
📅 3天前 · Hacker News · ★★★☆☆
本文介绍了 Fil-C 优化调用约定,旨在提升函数调用的效率与安全性。该约定通过寄存器分配、栈帧优化等机制减少开销,并兼容现有 ABI。关键点包括:使用特定寄存器传递参数、减少内存访问、支持尾调用优化,以及提供可选的检查点以增强安全性。
📅 昨日 · GitHub Trending · ★★★☆☆
Waylandcraft 是一个在《我的世界》中实现的 Wayland 合成器项目,允许玩家在游戏内运行图形界面应用。该项目将 Wayland 协议与 Minecraft 的方块世界结合,提供独特的交互体验。
📅 昨日 · Hacker News · ★★★☆☆
loopmaster 是一款专为现场编程音乐设计的集成开发环境(IDE),支持实时循环、音频合成与算法作曲,帮助音乐人通过代码即兴创作。
📅 昨日 · Hacker News · ★★★☆☆
FBI 计划购买全国范围的车牌读取器数据访问权限,以加强车辆追踪和犯罪调查能力。该技术可实时捕捉车牌信息,但引发隐私担忧。
📅 2天前 · TechCrunch · ★★☆☆☆
苹果在推出新版Siri时,隐私将成为核心主题。新功能可能包括自动删除聊天记录,以增强用户数据保护。
📅 昨日 · TechCrunch · ★★★☆☆
纽约市公立医疗系统(NYC Health + Hospitals)遭遇黑客攻击,导致至少180万人的个人、医疗数据及指纹等生物识别信息被窃取。这是2026年记录在案的最大规模数据泄露事件之一。
📅 昨日 · The Verge · ★★★☆☆
据彭博社报道,索尼已通知员工,将不再将主要单人PlayStation游戏移植到PC平台。此前,索尼曾计划推出《对马岛之鬼》等游戏的PC版,但现已取消。在线游戏仍将支持多平台。
📅 昨日 · The Verge · ★★★☆☆
索尼宣布自5月20日起,在“特定区域”提高PlayStation Plus一个月和三个月订阅的起始价格,理由是“持续的市场状况”。美国地区,Essential档位一个月订阅涨价1美元至10.99美元,三个月订阅涨价3美元至27.99美元。其他档位是否涨价尚不明确,索尼未立即回应评论请求。
📅 昨日 · The Verge · ★★★☆☆
沃尔沃紧凑型电动车EX30因关税和电池召回问题停产,但公司并未放弃平价电动车市场。在EX60美国发布媒体圆桌会上,沃尔沃美国总裁透露正在开发面向美国市场的新平价车型,以替代EX30。
📅 昨日 · The Verge · ★★★☆☆
沃尔玛旗下Onn品牌推出六款平价安卓平板电脑,总价低于一台iPad Pro。其中Onn Core 7起价仅97美元,配备7英寸IPS LCD屏幕、4GB内存、64GB可扩展存储和10小时续航。所有平板均搭载Android 16系统,除一款外售价均低于200美元。
📅 昨日 · The Verge · ★★☆☆☆
谷歌Workspace应用图标正在广泛更新,采用渐变色调设计,部分图标从彩虹色改为单色,以增强区分度或识别难度。
📅 昨日 · The Verge · ★★☆☆☆
戴森新推出的PencilWash无线清洁器专为瓷砖等硬地板设计,可处理污渍和泼洒物。目前售价249.99美元(优惠100美元),在亚马逊、Target和戴森官网有售。其1.5英寸直径手柄和近乎平躺的设计能轻松清洁家具下方,采用加压水系统和微纤维湿滚筒,每次清洁都使用清水,并配有Max模式处理顽固污渍…
📅 昨日 · Simon Willison's Weblog · ★☆☆☆☆
本文记录了作者在PyCon US结束后,于洛杉矶河附近晨间散步时观察到的四种鸟类:灰翅鸥、褐鹈鹕、雪鹭和加拿大雁。作者成功看到一只褐鹈鹕,但未拍到理想照片,却在天鹅船湖附近发现了加拿大雁的幼鸟。

📌 其他

10
📅 昨日 · Hacker News · ★★★☆☆
Files.md 是一款开源的笔记应用,旨在替代 Obsidian。它支持 Markdown 编辑、双向链接、图谱视图等核心功能,并强调本地优先、隐私保护和可扩展性。项目在 GitHub 上开源,社区活跃。
📅 昨日 · Hacker News · ★★★☆☆
本文指出语音AI系统存在安全漏洞,攻击者可通过嵌入人耳无法察觉的隐藏音频指令来操控系统,导致隐私泄露或误操作。文章分析了攻击原理、潜在风险及防御建议。
📅 昨日 · Hacker News · ★★★☆☆
本文介绍了如何利用 Git 的 --author 标志来识别并阻止 AI 机器人向 GitHub 仓库提交的垃圾内容。通过检查提交作者信息,可以过滤掉非人类或自动生成的提交,从而维护仓库的整洁和安全。
📅 2天前 · Simon Willison's Weblog · ★★★☆☆
英国政府数字服务(GDS)就NHS因安全漏洞关闭开源仓库的决定发表评论,强调默认开放原则,认为全面封闭会增加成本并减少复用与审查。Terence Eden将此视为内部争议升级的信号。
📅 昨日 · GitHub Trending · ★★★☆☆
这是一个精选的CUDA编程最佳书籍列表,由alternbits维护,旨在帮助开发者系统学习CUDA编程。
📅 昨日 · GitHub Trending · ★★★☆☆
codiff 是一个快速的本地差异查看器,用于高效比较文件或代码差异。
📅 3天前 · Hacker News · ★★★☆☆
本文探讨了Bitwarden密码管理器近期进行的一系列低调但重要的改进,包括性能优化、用户体验提升以及安全增强。这些更新旨在巩固其作为开源密码管理解决方案的领先地位,同时保持对用户隐私的承诺。
📅 3天前 · Hacker News · ★★★☆☆
Singleflight 是 Go 语言中用于防止重复函数调用的同步原语,它确保同一时间只有一个 goroutine 执行某个操作,其他并发请求会等待并共享结果。本文介绍其工作原理、使用场景及注意事项。
📅 昨日 · TechCrunch · ★★★☆☆
开源项目 Grafana Labs 表示黑客窃取了其代码库,并威胁若不支付赎金将公开源代码。公司拒绝支付,并强调用户数据未受影响。
📅 昨日 · Hacker News · ★★☆☆☆
本文介绍了线束工程的基本概念、设计原则和制造流程,涵盖从需求分析到生产验证的关键步骤,强调标准化和可靠性。 *简报结束 — 2026-05-19 05:58*