当前位置: 网站首页 AI教程资讯 正文

我国自研视频大模型全球上线

来源:互联网 发布时间:2025-05-15
记者8月3日获悉,亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。Vidu是北京生数科技有限公司(以下简称“生数科技”)联合清华大学发布的自研长时长、高一致性、高动态性视频大模型。据介绍,此次面向全球上线,Vidu在基础功能外新增动漫风格、角色一致性等功能。生数科技有关负责人表示,Vidu实现了业界最快实测推理速度,仅需30秒就能生成一段4秒片段。目前Vidu无需申请,用户直接使用邮箱注册即可上手体验。今年初,文生视频大模型sora在全球引发广泛关注。目前业界对视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态一致性。Vidu较好平衡了这三方面的表现。它能准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可大幅提升视频可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。此外,Vidu在构图、叙事和光影等方面,能达到接近电影级效果。Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG(计算机图形学)特效等。
相关信息
  • 我国自研视频大模型全球上线 记者8月3日获悉,亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。 Vidu是北京生数科技有限公

    AI教程资讯 05-15

  • 大模型远没有到泡沫临界点 2024年2月,北京智源人工智能研究院(以下简称“智源”)宣布王仲远成为第二任院长,他在2018年荣获“《麻省理工科技评论》35岁以下科技创新35人”;并有微软、Facebook(现Meta)、美团、快手的工作经历,科技圈很想

    AI教程资讯 05-15

  • 看不见的大模型,看得见的生产力 在大模型领域,智源是全球唯一没有背靠大厂的非企业研究机构,也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。“过去每次科技平权都能催生重大产业机会”,既有企业从业经

    AI教程资讯 05-15