拼多多发布2024四季度及全年财报 陈磊:坚持高质量发展战略不动摇引领显示、智能终端创新,TCL多款新品荣获AWE 2025艾普兰奖破局2025!第二届推客大会暨首届推客大赛颁奖盛典5月27日长沙定档全球首款RGB-Mini LED电视售价27999元起联想摩托罗拉razr 60 Ultra小折叠手机“木纹后盖”版本曝光 引入Edge 50 Ultra设计3月24日打开京东搜「1」 3C数码“疯狂星期一”低价来袭传三星取消SF1.4制程,韩国半导体技术瓶颈与市场困境下艰难求生两部门:人脸信息应当存储于人脸识别设备内,不得通过互联网对外传输雷丁汽车“卷土重来” 预告 A50 短途代步微型车下半年上市海信首发1000nits全屏亮度激光电视探索X1亮相AWE 2025闻泰科技拟出售子公司股权 专注半导体业务发展中国平安2024年报:营收净利双增 核心人员持股计划深化利益绑定苹果折叠iPhone将采用液态金属轴承 宜安科技成主要受益者理想汽车发布新一代自动驾驶技术MindVLA,预计7月与理想i8同步首发得一微即将推出PCIe 5.0固态硬盘主控YS9503不再用Windows/Linux!华为首款鸿蒙PC来了 余承东:鸿蒙要成全球第三大电脑OSReka开源Reka Flash3,能力超Gemma327BSider AI推出Deep Research功能:能自动模拟人类研究行为,还能生成可视化交互式报告MiC 建筑:城市可持续发展的模块化解决方案DomoAI推出语音图像生成数字人功能:数字内容创作迎来新突破
  • 首页 > 云计算频道 > 大模型

    阶跃星辰 Step-Video-TI2V 图生视频模型开源

    2025年03月20日 14:44:09   来源:Citnews中文科技资讯

      上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成,能够生成102帧、5秒、540P分辨率的视频,具有运动幅度可控和镜头运动可控两大核心特点,尤其在动漫效果方面表现出色。与现有的开源图生视频模型相比,Step-Video-TI2V不仅在参数规模上提供了更高的上限,其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性,为创作者提供了更灵活的选择。

      Step-Video-TI2V的开发过程中,团队进行了两大关键优化。首先,引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同,该模型采用了更直接的方式,将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接,从而确保生成的视频与输入图片高度一致。其次,通过AdaLN模块引入视频动态性打分信息,使用户在生成视频时可以指定不同的运动级别,精准控制视频的动态幅度,从而平衡动态性、稳定性和一致性。此外,团队还对主体动作和镜头运动进行了专项精准标注,进一步提升了模型在主体动态性和运镜效果上的表现。

      Step-Video-TI2V的核心特点包括运动幅度可控、多种运镜控制、动漫效果优异以及支持多尺寸生成。用户可以根据创作需求自由切换动态与稳定画面,生成从基本的推拉摇移、升降到复杂电影级运镜效果的视频。该模型在动漫类任务上的表现尤为突出,非常适合动画创作和短视频制作等应用场景。同时,它支持多种尺寸的图生视频,无论是横屏、竖屏还是方屏,都能满足不同平台的需求。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    新闻

    明火炊具市场:三季度健康属性贯穿全类目

    奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    华硕ProArt创艺27 Pro PA279CRV显示器,高能实力,创

    华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。