头条头版
频道主
AI早报 2025年05月14日
1. 火山引擎豆包1.5视觉深度思考模型,新增GUI Agent能力实现自动化交互任务执行,支持视频理解与动态帧率采样。
2. 谷歌测试搜索首页新设计,将“I’m Feeling Lucky”按钮替换为“AI模式”功能,预计将在I/O大会发布更多AI更新。
3. 火山引擎推出视频生成模型Seedance 1.0 lite,支持5-10秒影视级视频生成,通过动态控制技术提升画面细节与互动性。
4. 苹果开源FastVLM视觉语言模型,为Apple Silicon优化,计划应用于智能眼镜与AirPods摄像头,实现端侧实时视觉交互。
5. 石头科技推出P20 Pro自清洁扫拖机器人,搭载RRmind GPT智能交互系统,支持自然语言指令控制。
6. 英伟达与MIT合作发布音频扩散模型Audio-SDS,优化FM合成器校准与音源分离。
7. 苹果与复旦大学联合推出StreamBridge框架,增强AI对直播流的实时理解,提升流媒体分析效率。
1. 火山引擎豆包1.5视觉深度思考模型,新增GUI Agent能力实现自动化交互任务执行,支持视频理解与动态帧率采样。
2. 谷歌测试搜索首页新设计,将“I’m Feeling Lucky”按钮替换为“AI模式”功能,预计将在I/O大会发布更多AI更新。
3. 火山引擎推出视频生成模型Seedance 1.0 lite,支持5-10秒影视级视频生成,通过动态控制技术提升画面细节与互动性。
4. 苹果开源FastVLM视觉语言模型,为Apple Silicon优化,计划应用于智能眼镜与AirPods摄像头,实现端侧实时视觉交互。
5. 石头科技推出P20 Pro自清洁扫拖机器人,搭载RRmind GPT智能交互系统,支持自然语言指令控制。
6. 英伟达与MIT合作发布音频扩散模型Audio-SDS,优化FM合成器校准与音源分离。
7. 苹果与复旦大学联合推出StreamBridge框架,增强AI对直播流的实时理解,提升流媒体分析效率。
2025-05-14
浏览61
AI早报
登录后评论
2
评论
分享