加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

一个模型通吃八大视觉任务,一句话生成图像视频

发布时间:2021-12-03 06:16:51 所属栏目:传媒 来源:互联网
导读:女娲女娲,神通广大,正如其名,一句话生成视频只是这个模型的技能之一。 除此之外,一句话生成图片,草图生成图像、视频,图像补全,视频预测,图像编辑、视频编辑 一共八种视觉任务,它其实全部都能搞定。 完全是一位不折不扣的全能型选手。 它,就是由微软
“女娲女娲,神通广大”,正如其名,一句话生成视频只是这个模型的技能之一。
 
除此之外,一句话生成图片,草图生成图像、视频,图像补全,视频预测,图像编辑、视频编辑——
 
一共八种视觉任务,它其实全部都能搞定。
 
完全是一位不折不扣的“全能型选手”。
 
它,就是由微软亚研院和北大联合打造的一个多模态预训练模型,在首届微软峰会上亮相。
 
目前,在推特上已“小有热度”。

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读