12月14日 消息:谷歌Deepmind宣布了他们最先进的图像生成模型Imagen2。该模型通过参考图片和文本生成新图片和局部编辑的效果比较强大。
这一最新模型的主要特点包括改进的图像描述理解。为了帮助创建更高质量和更准确的图像,Imagen2的训练数据集中添加了更多描述,帮助该模型学习不同的标题风格,并更好地理解广泛的用户提示。
此外,Imagen2的数据集和模型在许多领域取得了改进,这些领域通常是文本到图像工具所困扰的,包括渲染逼真的手部和人脸,以及保持图像不受干扰的视觉伪影,从而实现更加真实的图像生成。
Imagen2的扩散技术提供了高度的灵活性,使得更容易控制和调整图像的风格。通过提供参考风格图像并结合文本提示,可以训练Imagen2生成遵循相同风格的新图像。
该模型还支持图像编辑功能,如“修补”和“扩展”。通过提供参考图像和图像蒙版,用户可以使用一种称为修补的技术直接在原始图像中生成新内容,或者使用扩展技术将原始图像延伸到其边界之外。
为了应对潜在的风险和挑战,Google DeepMind在设计和开发过程中设置了严格的防护措施。Imagen2集成了SynthID,这是一种先进的数字水印工具,使Google Cloud客户能够在图像的像素中添加不可察觉的数字水印,而不会影响图像质量。这种数字水印可以在应用修改,如滤镜、裁剪或使用有损压缩方案保存后仍然可检测到。在发布功能给用户之前,Google DeepMind进行了严格的安全测试,以最小化潜在的危害风险。安全检查涵盖了训练数据、输入提示和系统生成的输出,以避免生成潜在有问题的内容。
现在,开发人员和云客户可以通过Google Cloud Vertex AI中的Imagen API使用这一先进的图像生成模型。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。