当前位置：网站首页 AI教程资讯正文

我国自研视频大模型全球上线

来源：互联网发布时间：2025-05-15

记者8月3日获悉，亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能，提供4秒和8秒两种时长选择，分辨率最高达1080P。Vidu是北京生数科技有限公司（以下简称“生数科技”）联合清华大学发布的自研长时长、高一致性、高动态性视频大模型。据介绍，此次面向全球上线，Vidu在基础功能外新增动漫风格、角色一致性等功能。生数科技有关负责人表示，Vidu实现了业界最快实测推理速度，仅需30秒就能生成一段4秒片段。目前Vidu无需申请，用户直接使用邮箱注册即可上手体验。今年初，文生视频大模型sora在全球引发广泛关注。目前业界对视频模型的评价主要围绕三大核心维度：语义理解准确性、画面美观性、主体动态一致性。Vidu较好平衡了这三方面的表现。它能准确理解并生成提示词中的文字，包括字母、数字等，并能生成文字特效。对第一人称、延时摄影等镜头语言，Vidu也能精准表达，用户只需细化提示词，即可大幅提升视频可控性。同时，Vidu支持大幅度、精准的动作生成，保持高流畅、高动态的画面效果。此外，Vidu在构图、叙事和光影等方面，能达到接近电影级效果。Vidu还能生成影视级特效画面，如烟雾、炫光效果、CG（计算机图形学）特效等。

相关信息

我国自研视频大模型全球上线记者8月3日获悉，亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能，提供4秒和8秒两种时长选择，分辨率最高达1080P。 Vidu是北京生数科技有限公
AI教程资讯 05-15
大模型远没有到泡沫临界点 2024年2月，北京智源人工智能研究院（以下简称“智源”）宣布王仲远成为第二任院长，他在2018年荣获“《麻省理工科技评论》35岁以下科技创新35人”；并有微软、Facebook（现Meta）、美团、快手的工作经历，科技圈很想
AI教程资讯 05-15
看不见的大模型，看得见的生产力在大模型领域，智源是全球唯一没有背靠大厂的非企业研究机构，也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。“过去每次科技平权都能催生重大产业机会”，既有企业从业经
AI教程资讯 05-15

推荐AI教程资讯

小编推荐 +

PromptPerfect

类型：AI工具浏览器
查看
GPTService

类型：AI工具浏览器
查看
Wisdom AI-AI超级工作流

类型：AI工具浏览器
查看
FLUX.1

类型：AI工具浏览器
查看
陌言AI

类型：AI工具浏览器
查看

近期热点 +

AI教程资讯周排行 +

05-15

我国自研视频大模型全球上线记者8月3日获悉，亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能，提供4秒和8秒两种时长选择，分辨率最高达1080P。 Vidu是北京生数科技有限公
05-15

大模型远没有到泡沫临界点 2024年2月，北京智源人工智能研究院（以下简称“智源”）宣布王仲远成为第二任院长，他在2018年荣获“《麻省理工科技评论》35岁以下科技创新35人”；并有微软、Facebook（现Meta）、美团、快手的工作经历，科技圈很想
05-15

看不见的大模型，看得见的生产力在大模型领域，智源是全球唯一没有背靠大厂的非企业研究机构，也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。“过去每次科技平权都能催生重大产业机会”，既有企业从业经
05-15

作为“打工人刚需”的会议场景转录，拿下日本、实现千万美金ARR 不久前，A16z AI 合伙人 Olivia Moore 分享了一张 AI 转录初创公司图谱，面向企业服务（B2B）的转录公司不仅数量多，更涉及人宠医疗、招聘、销售和会议等多元场景。其中作为“打工人刚需”的会议场景转录，参与厂商
05-15

00后哈佛辍学生创业AI吊坠：不要生产力，我们只要AI朋友 Avi Schiffmann是一名在硅谷闯荡的00后玩家，21岁已生产出两代AI可穿戴设备——Tab和Friend。在这之前，他还是追踪COVID-19的天才男孩，GPA1 7上哈佛、一个学期后又辍学的另类学生。 Avi Schiffmann 图