AI 资讯
每日 AI 精选与日报
大模型、AI 产品、行业动态、论文与实用技巧,内容由 AIHOT 实时聚合,点击直达原文。
Meta AI iOS 应用新增隐身聊天与眼镜页面更新
Meta AI app for iOS 新增了隐身聊天功能,并为 Glasses 页面提供了新外观。 更新后的页面包含所有主要开关的快捷键,包括实时翻译和对话焦点。
BrowserBC开源:人类浏览器轨迹转可复用技能
ViDA 团队开源的 BrowserBC 项目,探索更高效的 web agent 运行方式:先用强模型录制一次人类浏览器操作流程,将其蒸馏为可复用技能,再交给更小更便宜的模型执行。一次录制即可泛化技能。在 WebArena-Hard 上,tool calls 降低 27%,成功率从 60% 升至 81%。
Codex自动审查模式误发.env文件给同事
Codex Auto review mode,当我让它给同事发送我的.env文件时。
LLM讲解通俗易懂引热议
一位老师以通俗易懂的方式讲解大语言模型(LLM),引发网友共鸣,并邀请大家分享看法。原文信息有限,未提及具体模型名称或课程细节。
Claude Code 桌面版新增原生多会话拖拽分屏
Claude Code 桌面版更新,支持原生多会话拖拽分屏,将并行 Agent 工作流可视化。用户可在桌面 App 中开多个会话,左侧侧边栏统一管理,拖拽即可排列并排窗格,支持单独弹出窗口。内置终端、文件编辑器、预览面板均可分屏排布,底部同时显示多个会话的输入区。相比此前依赖 tmux 和终端窗口切换,效率大幅提升。
Codex 质量更新改善长线程滚动
🆕 Codex 质量提升更新本周发布。 从长线程开始:滚动现在更流畅,并且在浏览对话时你的位置保持不变。
Vercel 发布开源框架 Eve(Apache 2.0,beta),用于构建持久化 AI 智能体
Vercel 开源了框架 Eve,将智能体视为一个目录:`agent/instructions.md` 定义系统提示,`agent/agent.ts` 配置模型等运行时参数;工具(`agent/tools/` 下的类型化文件)、技能(`agent/skills/` 下的 Markdown 文件,按需加载)、子智能体(内置 agent 工具实现委托)和人工审批(`needsApproval` 标记)均以文件形式存放,无需注册步骤。Eve 内置持久会话、沙箱、追踪和评估等生产级基础设施。
hf-claude 为 Claude Code 引入超百款开源模型
hf-claude 让你在 Claude Code 中使用超过 100 个开源模型,包括 GLM 5.2、MiniMax-M3、DeepSeek V4 Pro。
Runway API 推出广告本地化 Recipe
广告本地化现在可通过 Runway API 以 Recipe 形式使用。 现在您可以通过单次 API 调用翻译静态广告和图形资产。
Google NotebookLM 将支持集合功能
Google 正在为 NotebookLM 开发 Collections(集合)支持。 > 用户可以将多个笔记本分组到一个集合中。 > 集合将出现在 NotebookLM 主菜单的一个单独标签页中。 由于笔记本现在在 Gemini 中也作为"项目"运行,这可能有助于用户更有效地组织它们。
DeepSeek V4 推出 DSpark,推理速度提升 80%
DeepSeek V4 进行了一次更新。 新推出了投机解码(Speculative Decoding)框架 DSpark,推理速度提升 80%。 DSpark 已被部署在 DeepSeek-V4(Flash 和 Pro)的真实线上流量中。 报告:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
Meta 开源 Astryx(Beta):基于 React 和 StyleX 的 AI 就绪设计系统
Meta 本周发布 Astryx(Beta),一个基于 React 和 StyleX 的开源设计系统。项目包含 90 多个 React 组件、模板和主题,内置十个可定制主题(default、neutral、chocolate 等),通过 CSS 变量级联实现全局统一样式。Astryx 提供 CLI(astryx/xds)和 MCP 服务器,可输出自描述 JSON 清单,AI 智能体无需解析 --help 即可直接调用命令搭建和文档化 UI。组件具有上下文感知间距补偿功能,消除双重内边距问题。许可证为 MIT。
安装知识记忆MCP,体验AI对话与个人知识库
装上了 @wey_gu 的knowledge mem,配置了MCP AI对话记忆,还有个人知识库还是挺关键的,等我试试体验下。 下载地址见评论区
DeepSeek 联合北大发布 DSpark 推理加速框架,速度提升 60% 至 85%
DeepSeek 联合北京大学发布 DSpark 推理加速框架,已部署于 DeepSeek-V4-Flash 与 DeepSeek-V4-Pro 预览版。DSpark 采用半自回归架构与置信度调度验证机制,在同等吞吐量下将单用户生成速度提升 60% 至 85%。在 Qwen3 系列和 Gemma4-12B 的离线测试中,DSpark 平均每轮接受长度优于 Eagle3 和 DFlash。生产环境下,V4-Flash 引擎在 80 token/s SLA 下吞吐量提升 51%,120 token/s 时提升 661%。相关论文、训练代码已在 GitHub 开源。
美满升级 Structera CXL 控制器:内联压缩最高 3.64x,缓解 AI 场景内存压力
美满电子(Marvell)6月24日发布Structera X和Structera A两款CXL控制器,集成CDB压缩-解压硬件模块,实现内联LZ4无损压缩。压缩比最高3.64x(Database nci数据),全零页面达64:1。Structera X定位CXL内存扩展,支持DDR5/DDR4,最大6TB/4TB容量,200 GB/s带宽,配备4个ARM Cortex-M7核心;Structera A面向近内存加速,集成16个Arm Neoverse V2核心、64MB末级缓存及4个DDR5-6400通道。两者均支持内联XTS-AES 256位加密,为首批将硬件内联内存压缩写入OCP规格的产品。
阿里千问输入法上线 macOS 版:最快 300 字/分,AI 自动润色
阿里千问输入法 macOS 版今日上线官网,支持最快 300 字/分的 AI 语音输入,可自动润色、将口语转为工整文字,并支持 9 种方言,纯净无广告。官方预告 iOS、Android、Windows 版将于近日发布。此前千问团队已于今年 5 月推出千问语音输入法(千问 App 内的组件),具备去语气词、纠错、格式化整理及基于上下文的智能回复等能力,而本次上线的输入法则定位为独立 App,填补千问在移动端 AI 输入法赛道的空白。
谷歌 Gemini 助手新功能:直接帮用户安装 Play 商店内的应用
谷歌今年 5 月宣布将 Play 商店集成至 Gemini 助手,现已逐步推送。用户可在 Gemini 聊天窗口中直接搜索、安装应用或进行内购,无需离开 Gemini。例如,询问"帮我找一款可以规划每周吃什么的 App",Gemini 会搜索并跳转至 Play 商店详情页。该功能需年满 18 周岁,仅支持个人账号,且 Android 设备需安装 Play 商店。
苹果 iPhone 18 Pro 芯片 A20 Pro 爆料:更强散热和 NPU,支持 96-bit 位宽 LPDDR6 内存
6 月 26 日爆料显示,苹果 iPhone 18 Pro 搭载的 A20 Pro 芯片将采用 WMCM 封装替代 A19 Pro 的 PoP 方案。DRAM 从芯片顶部移至侧面,以改善高负载下的散热。A20 Pro 支持 96-bit 位宽 LPDDR6 内存,Neural Engine 面积变大,整体封装尺寸与 A19 Pro 接近。
这哥们真是个天才, 直接把大模型 API 的商业模式干穿了,OpenAI 大概率不喜欢这个项目🤣
这哥们真是个天才, 直接把大模型 API 的商业模式干穿了,OpenAI 大概率不喜欢这个项目🤣
AI实时换脸:拖入照片即换直播摄像头人物
开发者 @miyumiyuna5 制作了一款实时换脸AI工具,支持直接拖拽任意人物照片到界面,瞬间将直播摄像头中的人物替换为目标形象。该工具无需重新加载模型即可流畅运行,实现低延迟的实时换脸效果,甚至能让大叔秒变美少女。
Anthropic 测试手机端 Claude Cowork,支持远程管理 AI 长任务
IT之家 6 月 27 日报道,Anthropic 正测试移动端 Claude Cowork,用户可直接在手机上发起并调整任务。Cowork 是桌面导向的智能体工作模式,可创建文档、生成表格、撰写报告。手机端被定位为远程控制器,用于发起任务、调整方向和查看进度,可能无法获得与桌面端完全一致的能力。Cowork 于 2026 年 1 月发布,代码由 Claude 完成,初期仅向 Mac 端 Claude Max 订阅用户开放。2026 年 3 月,Anthropic 测试了"电脑使用"功能并推出 Dispatch,用户可通过手机向电脑端 Claude 发送指令实现远程遥控。
Browser_use 云智能体明日上线可做海报
browser_use 明日上线新云智能体,可制作样式化海报页面,比纯文本更直观,还能做更多。MiniMax 表示期待开发者尝试,好奇其背后模型。
微软 Teams 下月引入 Recap:集中索引 30 天内会议相关转录、AI 摘要等
微软计划在 2026 年 7 月为 Windows、macOS 及网页版 Microsoft Teams 推出 Recap 功能。该功能集中展示用户最近 30 天内的会议录制、文字转写、AI 生成摘要、聊天记录、任务、共享文件及发言人标记等,支持搜索、筛选、缩略图/列表视图。基础功能遵循现有访问控制;高级 AI 功能(如智能摘要、音频/视频回顾)需 Microsoft 365 Copilot 许可证。
Google AI Studio 推出设计变体功能
向 @GoogleAIStudio 中的设计变体说声你好,制作一个应用,迭代它,然后探索变体,将你的想法引向新方向 : )
OpenMontage开源:视频制作工作流,单日获3000 Star
OpenMontage开源,将视频生产拆为12条pipeline,内置52工具、500+ agent skills。用户自然语言驱动agent完成调研、脚本、素材、剪辑全流程,支持AI与真实素材混合,含预合成验证、后渲染自检等质量控制,渲染引擎为Remotion+HyperFrames。发布单日获3000 Star。
Google AI Studio 发布设计变体功能
Google 为 AI Studio 发布了设计变体功能! 选中后,该功能会生成多个设计提案,用户可将其应用于自己的 Build 应用。 主题支持也在计划中👀
Claude Code v2.1.195 发布
新增 `CLAUDE_CODE_DISABLE_MOUSE_CLICKS` 环境变量,可在全屏模式下禁用鼠标点击/拖拽/悬停,保留滚轮。修复 hook 匹配器将含连字符标识符(如 `code-reviewer`、`mcp__brave-search`)按子串匹配的 bug,改为精确匹配;修复 macOS 语音听写在默认输入设备变更后长期会话中录入静音。改进 Linux 语音模式区分"无麦克风"与"未安装 SoX",优化 agent 完成列表垂直空间利用及远程会话启动资源清单显示。
OpenAI发布首款自研AI芯片Jalapeño
团队完成了工作,带点辣味。 OpenAI 设计并制造了首款 AI 芯片:Jalapeño。该芯片由 OpenAI 从零开始设计,并与 Broadcom 合作量产,专为支持 ChatGPT、Codex、API 及未来智能体产品的 LLM 工作负载而打造。芯片是 AI 经济的基础。自研芯片扩展了从产品到模型再到基础设施的全栈平台,将助力扩展智能、服务更多用户并扩大 AI 的普及。
GPT 5.6 Sol 在 Cerebras 达 750 tok/s
对于 GPT 5.6 Sol,高达 750 tokens/sec。 当前 GPT-5.5 优先和规模层级服务宣称 99% >50 tokens/sec,因此 Cerebras 上的 Sol 声称达到该速率的 15 倍。 这个巨大数字来自专门的推理硬件:Sol 运行在 Cerebras 上,其晶圆级芯片旨在以远少于普通多 GPU 设置的存储和网络延迟来移动模型数据。
Show HN:在 Claude、Codex 和 Cursor 中直接进行智能模型路由
一个 GitHub 项目实现了在 Claude、Codex 和 Cursor 中直接进行智能模型路由。
Perplexity 发布 Computer for Counsel:面向法律工作流的多模型智能体层
Perplexity 于 2026 年 6 月 24 日面向 Enterprise 和 Max 订阅用户推出 Computer for Counsel。该系统将法律任务自动拆解为子任务,并路由 20+ 个前沿 AI 模型分别处理研究、推理、合同等工作。数据层通过 MCP 协议连接 Midpage(美国案例法 + 引用)、Deel、LegalZoom 等专业法律源,以及 Docusign、NetDocuments、Box、Microsoft 365、Google Workspace 和 400+ 其他工具。每个输出均链接至原始来源,律师可一键核验。Computer for Counsel 并非替代 Westlaw 等数据库,而是叠加其上的研究、起草与工作流层。
Model Sets 功能上线,支持保存自定义模型组
应大家要求,Model Sets 现已上线!你可以保存自定义的模型选择,并立即将其应用于所有图表。
Artificial Analysis Model Sets 上线
应大众需求,Model Sets 现已上线!你现在可以保存自定义的模型选择,并立即将其应用于所有图表。
PixVerse Seedance 2.0 简化电影级VFX制作
从绿幕和单个盒子到完整的电影级场景。 Seedance 2.0 保留原始运动和构图,同时无缝生成场景其余部分。 电影级视觉特效,如今大大简化。
Moxt 更新多Agent编排工作流
Moxt 更新了多agent编排的工作流。 支持自动一群 Agent 帮你协作完成任务,而且还能重复驱动完成更长的任务
脑部超声成像
一支研究团队通过完整颅骨对活人脑部进行超分辨率超声成像,获得了迄今最详细的脑血管三维图像。该技术利用FDA批准的微泡造影剂实现超衍射极限定位,体积分辨率比CT高100倍。团队已开源完整处理流程和数据集。下一步目标是无需造影剂的神经血管成像,依靠硬件小型化和端到端机器学习从每小时TB级原始数据中提取更多信号。
Weave 推出智能模型路由工具,可直接接入 Claude Code、Codex 和 Cursor
Weave 发布智能模型路由工具,通过 `npx @workweave/router` 安装,作为本地代理运行在 localhost:8080。它采用基于 Avengers-Pro 1 的集群评分器,每个请求自动选择最佳模型。支持 Anthropic、OpenAI、Gemini 原生 API,并通过 OpenRouter 接入 DeepSeek、Kimi、GLM、Qwen、Llama、Mistral 等开源模型。用户自行保管提供商密钥,数据本地加密存储。工具兼容 Claude Code、Codex、Cursor 等客户端,并提供 OTLP 追踪,支持自托管部署。
Gemini Drops 本月新功能一览
从用语音实时创建图像,到支持小企业的新方式,以下是本月 Gemini Drops 的内容 🧵
Replit 450+集成,现更易查找
450+集成,现更易查找 https://x.com/i/broadcasts/1yxBeeQApqyJN
SuperNori 打造主动式家庭 AI 代理
在许多家庭中,让人疲惫的往往不是某件大事。 而是每天有人要记在心里的所有小事:几点出门避开拥堵、家里什么东西快用完了、客厅需不需要打扫、孩子吃得好不好、纪念日是否和别的安排冲突了。 SuperNori 正在构建一款主动式家庭 AI 代理,在这些小事变成需要有人记挂的负担之前,就注意到它们。
可灵AI:你的可爱来了
你的可爱来了!🐾
OpenAI扩展Codex计算机使用至PPT和Excel
OpenAI正在通过插件增强Codex在PowerPoint和Excel上的计算机使用能力。
xAI ZDR 上线 OpenRouter 覆盖 Grok 多模型
xAI + 零数据保留,现已上线 OpenRouter。🔒 适用于 Grok 4.3、4.20 和 Build 0.1。开启 ZDR 即可无忧。 浏览 Grok ZDR 模型:https://openrouter.ai/models?zdr=true&q=grok
Memanto:为AI coding agent提供无限记忆的开源工具
开源工具Memanto为Claude Code、Cursor、Codex、LangGraph、CrewAI等主流AI coding agent提供"无限记忆"能力。它自动保存每次完整工作会话,通过AI压缩和组织,在下一次会话时90ms内检索到相关上下文,解决agent每次新开会话失忆、需重新解释项目背景的问题。实现无需传统向量数据库,安装仅需`pip install memanto`。该项目已在GitHub获1k+ stars,免费开源。
Meta 为旗下智能眼镜推出不锈钢充电底座:支持快充,60 美元
Meta 于 6 月 26 日推出不锈钢充电底座,兼容雷朋联名眼镜和 Oakley Meta HSTN,但不支持带屏的雷朋 Display 眼镜。定价 60 美元(约 408.5 元)。充电底座采用不锈钢主体与硅胶防滑垫,重 108 克,支持快充:20 分钟充至 50%,1 小时充满。底座配有 USB-C 接口,包装内不含充电线和电源适配器。
openEuler 24.03 LTS SP4 发布:弹性内存、64K 内核、AI 图编译器全面升级
openEuler 24.03 LTS SP4 于6月25至26日发布,基于6.6内核LTS,面向服务器、云计算、灵衢超节点和AI场景,升级弹性内存、64K内核、AI图编译器、虚拟化优化、低时延通信、Agent沙箱、推理软件适配和智能调优。哈萨克斯坦自由云加入社区成为首家境外实体生态伙伴。麒麟软件、麒麟信安、软通天鹤AIOS、超聚变FusionOS 26、天翼云CTyunOS、联通数科CUOS等伙伴展示了在智能运维、高可靠场景、AI原生OS等方向的落地应用。
SAP 推出 Advanced Success Plan,整合碎片化数据实现 AI 个性化
SAP 面向 SAP Customer Experience 解决方案推出 Advanced Success Plan,解决企业数据碎片化问题。该计划覆盖三层:数据层统一实时客户画像并遵守用户授权;决策层由 AI 算法确定展示商品、促销时机;交付层通过数字店铺、邮件、推送通知等渠道执行。SAP Commerce Cloud 具备 AI 辅助商品推荐系统,基于实时行为提升转化;SAP Engagement Cloud(由 SAP Emarsys 驱动)支持 AI 发送时间优化,根据联系人行为模式决定发送时机,替代固定计划。
优必选在 OPPO 供应链技术展发布轮式工业人形机器人 Cruzr Y1
优必选 Cruzr Y1 轮式工业人形机器人在 OPPO 技术发布会首秀,演示料箱拆垛、码垛流程。机器人搭载地瓜 S100P 和 S600 系列国产算力芯片,配备 360° 全向轮与垂直升降模组,可在狭窄车间穿梭;手臂采用一体化谐波关节模组,集成抱闸制动与力矩传感器。配备高容量锂电池,满载续航 4 小时以上,支持自动充电和快速换电,实现 24 小时轮班作业。官方称开放全套 SDK、视觉识别、手臂运动控制开发接口与多机调度平台,可对接工厂系统进行二次开发。
阿里云HappyHorse 1.1成Creative Fabrica Studio默认视频模型
阿里云宣布HappyHorse 1.1即日起成为Creative Fabrica Studio的默认AI视频生成模型。为纪念此次升级,平台提供为期一周的视频生成50%折扣,适用于设计师、营销人员和内容创作者。附试用链接及模型详情页。
微博发布开源CLI工具weibo-cli:面向开发者与AI Agent,封装70余API
微博开放平台6月22日上线官方命令行工具weibo-cli,专为开发者和AI Agent设计。基于Node.js 18+,封装70余个API,命令采用<group> <action>结构,输出支持JSON、YAML、表格和原始格式,原生支持MCP协议。功能涵盖内容发布、互动管理、检索、热搜趋势、粉丝画像等。采用订阅制计费:Free(7天试用,每小时5次)、Basic 29元/月(3000 Credits)、Plus 69元/月(7500)、Pro 299元/月(32000)、Ultra 899元/月(100000)。以MIT协议在npm发布,每周下载约300次。