迄今最大视频开源模型!腾讯混元文生视频上线
发布时间:2024-12-09 17:12
快科技12月3日新闻,本日,腾讯混元年夜模子发布文生视频功效上线,一句话就能天生视频。此次开源的视频天生年夜模子,参数目130亿,是以后最年夜的视频开源模子。现在,该模子已在Hugging Face平台及Github上宣布,包括模子权重、推理代码、模子算法等完全模子,可供企业与团体开辟者无偿使用跟开辟生态插件。各人可在腾讯元宝APP-AI利用-AI视频中提交请求试用,企业客户可经由过程腾讯云供给效劳接入,API同步开放内测请求。据懂得,现在天生视频支撑中英文双语输入、多种视频尺寸以及多种视频清楚度。腾讯混元视频天生年夜模子能够天生超写实的高品质视频,比方,像冲浪、舞蹈这种年夜举措场景,天生的画面天然公道,不轻易变形。在镜面或镜子场景中,能够做到镜面反射举措跟表面完整同步,光影反射基础合乎物理法则。据腾讯先容,腾讯混元视频天生年夜模子采取DiT架构,并在架构计划长进行多处进级。适配了新一代文本编码器晋升语义遵守,其具有强盛的语义追随才能,更好地应答多个主体刻画,实现愈加过细的指令跟画面浮现。经由过程进步的图像视频混杂VAE(3D变分编码器),让模子在细节表示有显明晋升,特殊是君子脸、高速镜优等场景。【本文停止】如需转载请务必注明出处:快科技义务编纂:拾柒文章内容告发]article_adlist-->   申明:新浪网独家稿件,未经受权制止转载。 -->