• 首页 > 云计算频道 > 大模型

    OpenAI推出文本转视频AI模型Sora:可创建一分钟逼真视频

    2024年02月16日 10:48:57   来源:DoNews

      2月16日消息,据鞭牛士援引外电报道,OpenAI推出一种名为 Sora 的新的视频生成模型。

      这家人工智能公司表示,Sora 可以根据文本指令创建现实且富有想象力的场景。文本到视频模型允许用户创建长达一分钟的逼真视频——所有这些都基于他们编写的提示。

      根据 OpenAI 的介绍性博客文章,Sora 能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景。该公司还指出,该模型可以理解物体在物理世界中如何存在,以及准确地解释道具并生成引人注目的角色来表达充满活力的情感。

      该模型还可以基于静止图像生成视频,以及填充现有视频上缺失的帧或扩展它。

      OpenAI 博客文章中包含的 Sora 生成的演示包括淘金热期间加利福尼亚州的空中场景、一段看起来像是从东京火车内部拍摄的视频等等。许多模型都有一些明显的人工智能迹象——比如博物馆视频中可疑移动的地板。

      OpenAI 表示,该模型可能难以准确模拟复杂场景的物理原理,但总体结果令人印象深刻。

      几年前,像 Midjourney 这样的文本到图像生成器处于模型将文字转换为图像的能力的最前沿。但最近,视频开始以惊人的速度进步:Runway和 Pika 等公司展示了自己令人印象深刻的文本到视频模型,而谷歌的 Lumiere 也被认为是 OpenAI 在这一领域的主要竞争对手之一。

      与 Sora 类似,Lumiere 为用户提供文本转视频工具,还允许他们从静态图像创建视频。

      OpenAI 还允许一些视觉艺术家、设计师和电影制作人获取反馈。它指出,现有模型可能无法准确模拟复杂场景的物理原理,并且可能无法正确解释某些因果实例。

      本月早些时候,OpenAI 宣布将在其文本转图像工具 DALL-E 3 中添加水印,但指出它们可以轻松删除。与其他人工智能产品一样,OpenAI 将不得不应对虚假的人工智能真实视频被误认为真实的后果。

      OpenAI 表示,它还在开发可以辨别视频是否由 Sora 生成的工具。

      文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    即时

    TCL实业荣获IFA2024多项大奖,展示全球科技创新力量

    近日,德国柏林国际电子消费品展览会(IFA2024)隆重举办。凭借在核心技术、产品设计及应用方面的创新变革,全球领先的智能终端企业TCL实业成功斩获两项“IFA全球产品设计创新大奖”金奖,有力证明了其在全球市场的强大影响力。

    新闻

    敢闯技术无人区 TCL实业斩获多项AWE 2024艾普兰奖

    近日,中国家电及消费电子博览会(AWE 2024)隆重开幕。全球领先的智能终端企业TCL实业携多款创新技术和新品亮相,以敢为精神勇闯技术无人区,斩获四项AWE 2024艾普兰大奖。

    企业IT

    重庆创新公积金应用,“区块链+政务服务”显成效

    “以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。

    3C消费

    “纯臻4K 视界焕新”——爱普生4K 3LCD 激光工程投影

    2024年3月12日,由爱普生举办的主题为“纯臻4K 视界焕新”新品发布会在上海盛大举行。

    研究

    2024全球开发者先锋大会即将开幕

    由世界人工智能大会组委会、上海市经信委、徐汇区政府、临港新片区管委会共同指导,由上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会主办的“2024全球开发者先锋大会”,将于2024年3月23日至24日举办。