【AIGC日报】2025.6.19
今日要闻速览:
1. Midjourney发布首款AI视频生成模型V1,支持21秒视频创作
2. 中科院团队利用AI技术完成青藏高原高精度植被测绘
3. MiniMax推出新一代视频生成工具Hailuo 02,效率提升显著
 
文章配图:Midjourney生成,测试版本:V7; 风格--sref 8301693441,我推荐在漫画风格中使用。
1.Midjourney 推出首个 AI 视频生成模型 V1,支持 21 秒视频生成
 
Midjourney 发布首个 AI 视频生成模型 V1,可将用户上传图像或使用其他模型生成的图像转换为最长 21 秒的视频。
该模型支持四种自定义设置,包括自动随机动画和文本控制特定动作。
同时,Midjourney 计划开发 3D 渲染和实时 AI 模型,但近期因模型生成迪士尼、环球版权角色陷入诉讼纠纷。
来源:IT之家
 
2.我国科学家绘制青藏高原高精度草地植被图,利用 AI 攻克识别难题
 
中国科学院大学王艳芬团队发布1:50万比例尺青藏高原草地植被群系图,精度达国内最高。
该图利用AI技术融合数万野外样点和上百遥感图层数据,攻克复杂环境下精准识别难题,精细呈现65种植物群系分布格局,其中高山嵩草草甸等5个群系分布最广。
该成果不仅揭示植物碳输入对土壤碳库稳定性影响,更为青藏高原生态系统研究和生态保护提供关键科学依据。
来源:IT之家
 
3.MiniMax 发布 Hailuo 02 视频生成工具,效率与成本双突破
 
MiniMax 推出新一代视频生成工具 Hailuo 02,采用核心架构 Noise-aware Compute Redistribution(NCR),实现训练和推理效率提升 2.5 倍。该模型参数规模扩大至上一代的 3 倍,训练数据量增加 4 倍,支持 768p-6s、768p-10s 及原生 1080p-6s 视频生成。
Hailuo 02 可响应复杂指令生成体操等高度拟真场景,在 Artificial Analysis Video Arena 评测中位列全球第二。
来源:IT之家
4.谷歌 Gemini 新增视频上传与分析功能,支持安卓和网页端
 
谷歌宣布 Gemini 2.5 Pro 和 Flash 推出稳定版并向所有用户开放,同时推出预览版 Gemini 2.5 Flash-Lite 模型,专用于高吞吐量任务。
此次升级新增视频上传与分析功能,安卓用户可通过图库上传视频片段并要求 Gemini 进行内容概述、物品定位等操作,回复内容会同步显示对应视频片段。该功能还拓展至网页端,成为对标 ChatGPT 的差异化优势(后者仅支持实时摄像头画面分析)。
目前 Gemini 暂不支持应用内视频录制功能,摄像头界面仍仅限拍照使用。
来源:IT之家
 
5.字节跳动与比亚迪深化 AI 锂电池研发合作
 
字节跳动 Seed 团队及火山引擎与比亚迪锂电池宣布深化合作,双方将共建“AI + 高通量联合实验室”,通过结合 AI 技术与高通量实验加速锂电池研发。合作重点聚焦动力电池的快充、寿命和安全等关键技术,其中比亚迪此前推出的“兆瓦闪充电池”(充电5分钟续航400公里)已率先应用字节跳动的电解液 AI 模型框架 BAMBOO。
该框架能准确预测电解液的密度、粘度和离子电导率等性能指标,相比传统试错方法显著缩小实验配方筛选范围,加速了研发进程。
来源:IT之家
 
6.腾讯元宝上线 AI 编程模式:边修改边实时预览
 
腾讯元宝近日推出 AI 编程模式,用户在电脑版选择 DeepSeek V3 模型后,通过“@AI 编程”指令即可进入双栏界面:左侧对话生成代码,右侧实时展示预览效果。支持 HTML、Python、C++、Java 等开发语言在线运行,无需配置环境即可查看运行结果。
结合腾讯云代码助手 CodeBuddy 技术,该模式适用于教育场景,可快速生成互动动画、小游戏等代码,用户可实时修改指令调整运行效果。
来源:IT之家
7.OpenAI 发现 AI 模型隐藏特征,可调控“毒性”行为
 
OpenAI 最新研究显示,人工智能模型中存在与“毒性”行为相关的隐藏特征,例如对用户撒谎或提供不负责任建议等异常行为。
研究人员通过调整这些特征,能控制模型输出的有害程度,并发现仅用几百个安全示例微调即可修复突发性恶意行为(如诱骗用户分享密码)。这一发现有助于开发更安全、可控的 AI 系统,并与 Anthropic 等公司关于模型可解释性的研究形成互补。
OpenAI 可解释性研究员指出,此类研究对理解模型泛化能力至关重要。
来源:IT之家
2025-06-19
浏览2585
🚀前沿资讯
登录后评论
评论
1