AI 日报 · 2026年07月04日
15 小时前
1 阅读
公众号:生数科技(Vidu·视频)
模型发布/更新
生数科技发布 Vidu S1,推动视频生成迈向“实时交互”新时代
7月3日,生数科技在2026全球数字经济大会上发布Vidu S1实时交互模型,支持实时视频通话和语音控制视频走向,实现无限时长连续互动。模型采用自回归扩散路线,基于已生成画面和语音指令持续预测后续内容;无需传统建模,一张图片即可创建角色并自定义音色。Vidu S1在540P分辨率下实现25FPS(最高42FPS)实时生成,通过TurboDiffusion等技术降低计算成本,已开启内测。
X:阿里云 / Alibaba Cloud (@alibaba_cloud)
产品发布/更新
Wan Video 推出“音乐伴舞”新功能
Wan Video 新功能:音乐伴舞 💃 上传一个角色,添加一首歌曲,让 Wan Video 生成与节奏同步的舞蹈视频。 可用舞种: • 街舞 • 踢踏舞 • 拉丁舞 • K-Pop • 中国古典舞 从节拍至动作,你的角色随音乐起舞。 前往 wan.video 体验音乐伴舞 👉 https://int.alibabacloud.com/m/1000412428/
Hacker News 热门(buzzing.cc 中文翻译)
产品发布/更新
面向 Web 开发者的 Safari MCP 服务器
Safari Technology Preview 247 推出 Safari MCP 服务器,基于 Model Context Protocol,允许任何 MCP 兼容客户端连接 Safari 浏览器窗口。智能体可获取 DOM、网络请求、截图、控制台输出等信息,自主完成调试、性能分析、可访问性检查等任务。内置 `browser_console_messages`、`screenshot`、`evaluate_javascript`、`list_network_requests` 等工具。开发者安装后启用“远程自动化与外部智能体”选项,即可通过命令接入,减少窗口切换。
公众号:京东JoyAI
产品发布/更新
JoyAI App 上线 UGC 数字人功能,用户可“捏”出专属虚拟玩伴
JoyAI App 近日上线 UGC 数字人功能,用户只需上传一张照片即可生成专属虚拟数字分身,支持一键复刻写实形象或通过模板重塑为卡通风格,搭配用户自己的语音即可解锁专属陪伴。该功能复用“万能博士”技术底座,集成 JoyAI 语言、语音、数字人大模型,实现行业领先的全双工对话,支持随时打断、自然接话。数字人兼具情绪陪伴与全能助手属性,可提供点外卖、金融咨询、学英语、规划行程等生活服务。
公众号:面壁智能(MiniCPM)
产品发布/更新
面壁智能发布AI全自动预训练框架ForgeTrain,8小时追平Megatron-LM
面壁智能发布全球首个完全由AI编写、无人类干预的生产级大模型预训练框架ForgeTrain。该框架针对特定模型和硬件从零自动“锻造”专用训练代码。基准测试显示,ForgeTrain在8小时内追平Megatron-LM,1.5至2天内实现稳定反超,模型FLOPS利用率提升约8%~10%,且可迁移至不同模型(MiniCPM4-0.5B/8B)和硬件(H100及昇腾NPU)。其采用四阶段Harness优化流程,全程自动判定。面壁智能将其工程思想概括为Forge Engineering。
Claude Code:GitHub Releases(RSS)
产品发布/更新
Claude Code v2.1.200 发布
Claude Code v2.1.200 将 AskUserQuestion 对话框默认改为不自动继续,可通过 /config 设置空闲超时;默认权限模式改为“Manual”。修复了启动时因 .claude.json 中 disabledMcpServers 或 enabledMcpServers 为非数组值导致的崩溃、后台会话在休眠/唤醒或重新打开卡顿会话时无声停止、后台代理因陈旧 daemon.lock 无法重启、子代理因速率限制截断后未返回空结果等问题。改进了屏幕阅读器输出,隐藏装饰性字符,并优化转录符号与嵌套表格朗读。安装脚本在因系统内存不足被终止时会给出说明。
IT之家(RSS)
行业动态
国家网信办就《互联网信息服务管理办法》再次征求意见,首设“智能信息服务”专章规范AI服务
7月3日,国家互联网信息办公室就《互联网信息服务管理办法(修订草案征求意见稿)》再次公开征求意见。草案新增“智能信息服务”专章,要求AI服务提供者公示技术基本原理、训练数据来源,对生成合成内容进行标识,禁止强制用户使用智能服务或利用算法扰乱网络舆论。草案还强化用户账号管理,明确对超过6个月不登录账号可依约注销;要求平台建立网络暴力信息特征库,提供屏蔽、禁止转载等防护选项。意见反馈截止8月2日。
IT之家(RSS)
行业动态
全球首例 AI Agent 勒索攻击曝光,从漏洞利用到数据库加密全程自主完成
安全厂商 Sysdig 首次记录到 AI Agent“JADEPUFFER”自动完成的勒索攻击。攻击利用暴露的 Langflow 服务漏洞 CVE-2025-3248 远程执行 Python 代码,随后自主收集 OpenAI、Anthropic、DeepSeek、Gemini 等 API 密钥及阿里云、腾讯云、华为云、AWS、Google Cloud、Azure 等云平台凭证,通过 MinIO 默认密码访问对象存储并创建每 30 分钟连接的计划任务。横向移动到 MySQL 和 Nacos 服务器,利用数据库 Root 账号及 Nacos 漏洞 CVE-2021-29441 获取管理权限,加密全部 1342 条配置数据,留下包含比特币…
Google DeepMind:Blog(RSS)
行业动态
Google DeepMind 与 A24 宣布首次研究合作伙伴关系
Google DeepMind 与电影制作工作室 A24 达成一项首次研究合作,旨在帮助艺术家开发新工作流程和技术。合作将 DeepMind 的 AI 创新直接嵌入创作过程,由 A24 及其电影人塑造新技术以服务其愿景并扩展叙事可能性,同时为 DeepMind 提供来自顶尖艺术家的反馈与指导。此外,Google 已对 A24 进行投资。双方研究人员将共同测试、迭代和构建,以拓展未来娱乐的可能性。
IT之家(RSS)
论文研究
阿里达摩院发布超导材料发现AI智能体Elements Claw
7月3日,阿里达摩院联合中国人民大学、中国科学院大学发布首个超导材料发现AI智能体Elements Claw。该智能体采用“专通融合”架构,基于1.25亿分子/晶体结构预训练的1B参数原子基础模型Elements,判断超导性AUC达0.996,预测临界温度平均误差小于1K。AI仅用28个GPU小时筛选240万晶体结构,预测出6.8万个候选材料,其中4种(Hf₂₁Re₂₅、Zr₄VRe₇、HfZrRe₄、Zr₃ScRe₈)已合成并验证超导性,临界温度最高6.5K。全部240万稳定晶体数据库已开放。
Hacker News 热门(buzzing.cc 中文翻译)
技巧与观点
pxpipe:通过图像化压缩输入token降低Claude Code成本
pxpipe是一个本地代理,将系统提示、工具文档和历史记录等密集文本渲染为PNG图像,利用图像token成本取决于像素尺寸的特性压缩输入token。在Fable 5模型上,约25k文本token压缩为约2.7k图像token,端到端账单降低59–70%。SWE-bench Lite 10个实例全部通过,成本从$54降至$27;SWE-bench Pro 19对测试中18对判定一致,单次请求成本降低约60%。该方法有损(精确ID等需保持文本),默认仅处理`claude-fable-5`请求,可通过`PXPIPE_MODELS`变量控制。
Hacker News 热门(buzzing.cc 中文翻译)
技巧与观点
claude-real-video ─ 让任何大语言模型(LLM)都能观看视频
claude-real-video 是一个开源工具,让大语言模型基于视频画面而非字幕进行理解。它通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供模型读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,通过 pip 安装。全部处理在本地完成,不上传云端。
X:歸藏 (@op7418)
技巧与观点
藏师傅PPT与Pencil结合使用技巧
用户将藏师傅的AI生成PPT导入Pencil设计软件,可在Pencil中一次性浏览所有页面并手动调整AI常见的排版问题,如元素重叠、对齐不准、字体错误。Pencil提供比PPT更强的编辑能力(对齐、嵌套、打组),支持导出网页和编辑文件,也可导出PNG后直接放入PPT演示。这种工作流昨天经朋友分享验证,大幅提升AI生成内容的可编辑性。
Simon Willison 博客
技巧与观点
Fable 的判断力:Simon Willison 从 Claude Code 团队获得的效率技巧
Simon Willison 在 AIE 上与 Claude Code 团队交流后建议,让 Fable(以及 Opus)用自己的判断力工作,而非硬性规定行为。例如,直接让 Fable 自行决定何时编写测试,比给出具体规则更好。为应对价格即将上涨、节省 Fable token,Jesse Vincent 的另一个技巧是告诉 Fable 将较小任务委托给较低功耗模型(Sonnet 用于实质性实现、Haiku 用于机械修改),主循环保留判断、审计和数据合成等任务。Willison 已将提示词存入 Claude Code 记忆文件,实际效果良好,Fable token 消耗速度明显下降。
公众号:数字生命卡兹克
技巧与观点
Claude Fable 5 自主优化 AIHOT 网站 SEO/GEO 全记录
作者用 Claude Fable 5 优化 AIHOT 网站的 SEO 与 GEO。模型自主启动 22 个 Agent 调研 40 分钟,发现豆包 App 每天六千多次访问未被统计等异常。规划境外加速时,否定 Claude Opus 4.8 的 Cloudflare 方案(无法国内直连/国外分流,且 2025 年起默认拦截 AI 爬虫),改用火山引擎 CDN。因需白名单,模型自行找到工单入口提交专业工单,22 分钟开通;发现工程师漏答回源 IP 网段问题,礼貌追问并补充备选方案;发现官方方案有安全漏洞,自行加暗号验证。23:30 切换域名解析,10 分钟后 616 个海外请求走新线路。最终生成运维文档,提醒边缘证书 10 月 2 日…
该分类下暂无条目
资讯详情
内容整理自 AI HOT, 版权归原作者/来源网站所有。