-
1
微软发 7 款自研 MAI 模型
Build 2026 上推出 MAI-Thinking-1(35B 推理)与 MAI-Code-1-Flash(5B,供 Copilot/VS Code),共 7 款,称训练未用蒸馏。
Microsoft's first advanced reasoning AI is here ↗4.8 -
2
特朗普签 AI 行政令,发布前须报备
在业界反对后收窄为「自愿框架」,要求 AI 公司在发布前沿模型前自愿与联邦政府共享、接受审查。
Trump signs narrower executive order on AI oversight after industry objections ↗4.5 -
3
微软推 OpenClaw 系办公助手 Scout
基于 OpenClaw 的常驻 AI 助手,集成进 Outlook、Teams、OneDrive,可像同事一样被指派处理办公任务。
Microsoft Scout is a new AI personal assistant built on OpenClaw ↗4.4 -
4
MiniMax 新架构原生撑百万 token
MiniMax 公布稀疏注意力 MSA,通过重构内存访问绕开二次方复杂度,原生扩展到 100 万 token 上下文。
MiniMax dropped a new attention architecture ↗4.2 -
5
OpenAI 给 Codex 加白领办公能力
OpenAI 为 Codex 推出面向企业的新能力,扩展到分析、营销、设计等白领岗位,并放出 Codex sites 等工具。
OpenAI launches new Codex tools for white-collar work ↗4.2 -
6
Claude Code 上线 Workflows 编排
Anthropic 推出 Workflows,可用脚本确定性地编排多个子代理;官方称是继 skills、subagents 之后最大升级。
Claude Code Workflows: dynamic multi-agent orchestration ↗4.1 -
7
斯坦福研究:Gemini 答疑胜法学教授
法学教授盲评下,Gemini 2.5 对学生答疑的胜率达 75%,答案被评为危害性低于人类,更新的模型表现更好。
AI outperforms law professors in Stanford Law study ↗4.0 -
8
微软发 AI 代理设备 OS Solara
微软在 Build 推出 Project Solara,一个基于 Android、专为运行 AI 代理的硬件设备打造的操作系统。
Microsoft's Project Solara is an OS for AI agent gadgets ↗4.0 -
9
微软发 Majorana 2 量子芯片
微软发布新一代量子芯片 Majorana 2,称在去年 Majorana 1 突破基础上进一步缩短迈向实用量子计算的时间表。
Microsoft's next-gen quantum chip cuts timeline to useful quantum computing ↗3.8 -
10
微软 Surface 开发机本地跑万亿参数
微软推出搭载英伟达 Arm 架构 RTX Spark 芯片的迷你 Surface 开发机,128GB 统一内存,可本地运行万亿参数模型。
Microsoft created the mini Surface dev box that Qualcomm couldn't ↗3.8 -
11
Google 上线反 AI 拟声诈骗来电检测
Google 为 Phone 应用推出反诈功能,当来电号码冒充已存联系人时发出提示,应对 AI deepfake 拟声冒充诈骗。
Google rolls out fake call detection to protect against AI deepfake impersonation scams ↗3.8 -
12
VSCode 漏洞可一键窃取 GitHub Token
安全研究者披露 VSCode 的一个漏洞,诱导用户单击即可窃取其 GitHub 访问令牌,HN 首页热议。
1-Click GitHub Token Stealing via a VSCode Bug ↗3.5 -
13
GitHub 推出独立 Copilot 应用
GitHub 上线独立 Copilot App 预览;同期 Latent Space 播客与 Kyle Daigle 详谈 GitHub 的 Agents 路线图。
GitHub Copilot App ↗3.5 -
14
微软推开发者优化版 Windows
微软在 Build 宣布面向开发者优化的 Windows 体验,进一步整合 Linux,主打开发场景下的性能与可靠性。
Microsoft's new developer-optimized Windows embraces Linux even more ↗3.5 -
15
Uber 给员工 AI 开支设上限
在曾鼓励员工尽量使用 AI 后,Uber 因四个月内开支超预算,转而对员工的 AI 花费设置上限。
Uber caps employee AI spending after blowing through budget in four months ↗3.4 -
16
微软开源 AI 行为测试框架
微软开源评测框架,开发者用文字描述即可生成 AI 评测,覆盖行为评分与回归测试。
New Microsoft tool lets devs spin up AI behavior tests using text descriptions ↗3.3 -
17
Holo 3.1 刷新计算机操作智能体 SOTA
H Company 的 Holo 3.1 在计算机使用智能体基准 AndroidWorld 上达到新 SOTA,主打从云端转向本地运行的操作代理。
Holo 3.1 reaches a new SOTA on AndroidWorld ↗3.2 -
18
开源 OCR 模型 Surya 登趋势榜
Datalab 的 Surya 是 650M 参数 OCR 模型,支持 90+ 语言的版面分析、阅读顺序与表格识别,olmOCR-bench 得 83.3%。
datalab-to/surya ↗3.2 -
19
DeepSeek-V4-Flash 跑通 AMD MI300X
一篇技术博客记录将 DeepSeek-V4-Flash 移植到 AMD MI300X 的过程,侧面披露 DeepSeek 新一代模型已现身。
Bringing Up DeepSeek-V4-Flash on AMD MI300X ↗3.2 -
20
Perplexity 提出搜索即代码生成
Perplexity 研究团队发文,主张把搜索过程建模为代码生成,以提升复杂查询的可组合性与准确度。
Rethinking Search as Code Generation ↗3.2 -
21
安全公司 Cyera 冲 120 亿美元估值
网络安全公司 Cyera 接近完成由 Evolution Equity 领投的约 3 亿美元融资,估值达 120 亿、对应 80 倍 ARR。
Cyera eyes $12B valuation at 80x ARR multiple despite operating losses ↗3.0 -
22
英国议员警告过度依赖 Palantir
英国一政府委员会称该国对数据分析公司 Palantir 日益加深的依赖是严重隐患,构成「不可接受的脆弱点」。
Palantir Contracts Have Become 'An Unacceptable Point of Weakness,' UK Politicians Warn ↗3.0 -
23
AXA:超 6 成人向 AI 寻心理支持
安盛(AXA)2026 心理健康报告显示,超过六成受访者会借助 AI 获取心理与情绪支持。
More than 6 out of 10 people turn to AI for psychological support ↗3.0 -
24
微软开源 Windows 版 Coreutils
微软在 GitHub 开源面向 Windows 的 coreutils 实现,HN 首页 88 分讨论。
Coreutils for Windows ↗3.0 -
25
Claude Code 发布 v2.1.161
新版可将 OTEL_RESOURCE_ATTRIBUTES 作为指标标签,按 team/repo 等维度切分用量,并优化 agents 行的展示。
Claude Code v2.1.161 ↗2.9 -
26
博文称 LLM 并非真正黑箱
一篇 HN 热门博文论证大模型内部机制比通常宣称的更可解释,引发对可解释性的讨论。
LLMs are not the black box you were promised ↗2.9 -
27
Papers With Code 重新上线
社区宣布 Papers With Code 复活(paperswithcode.co),可按领域浏览 SOTA 与论文配套代码。
PapersWithCode is back ↗2.8 -
28
亚马逊 Ring 人脸识别遭集体诉讼
一名弗吉尼亚居民在西雅图提起集体诉讼,指控 Ring 的 Familiar Faces 功能未经同意存储路人面部图像。
Amazon faces class action lawsuit over Ring facial-recognition feature ↗2.7 -
29
75M 小模型击败近两倍大模型
开发者从零训练 75M 参数的 KeyLM(18B token),含基座、指令微调与 GGUF,IFEval 上略胜近两倍大的模型。
I trained a 75M parameter LLM from scratch on 18B tokens and it beats a model almost double its size ↗2.7 -
30
埃里森:全程记录让公民守规矩
甲骨文联合创始人 Larry Ellison 称 AI 持续记录与上报会让公民「保持最佳行为」,言论引发隐私侵蚀担忧。
Larry Ellison: "Citizens will be on their best behavior because we're recording" ↗2.6