植物百科网
当前位置: 首页 农业百科

有多少个字教学(几个字生成)

时间:2023-05-13 作者: 小编 阅读量: 4 栏目名: 农业百科

近来,AI技术开始在图文视频行业大放异彩,给图文视频生成技术带来了革新。Make-A-Video开创了T2V新一代的最新技术。而同时开发人员也正在致力于将这项技术提供给公众,目前正对Make-A-Video继续分析、测试和试用,以确保发布的每一步都是安全的。向我们周围的世界学习是人类智力的最大优势之一,能够通过观察快速学习和认识他人、地点、事物和行为;AI如果能够模仿人类的学习方式,生成系统将更具创造性和实用性。

近来,AI技术开始在图文视频行业大放异彩,给图文视频生成技术带来了革新。

在2021年百度的大脑图文转视频技术(VidPress)问世,该技术能够由AI自动剪辑生成视频,只需要一键输入上传Word稿件、新闻网址即可在短时间生成视频。

该技术是业界首个支撑通用型、大规模的全自动视频生成技术。

AI绘画也开始出现并快速发展,从最早的AI上色网站Paintschainer、到谷歌的Disco Diffusion、还有中国的Tiamat,AI在绘画领域也“开卷”。

近期Novel AI也在二次元图片生成领域有了飞跃式进展,人物绘画技术取得了很大的进展,最近大火的番剧《电锯人》也运用了AI技术Midjourney来制作,还掀起了AI绘画即将取代新人画师的舆论风潮。

而如今,AI技术生成视频也有了新的成果:Meta AI推出了Make-A-Video,一种通过时空分解扩散模型将基于扩散的T2I模型扩展到T2V的有效方法,是最先进的人工智能系统,可以利用给定的几个词或几行文字生成一个几秒钟的短视频

Make-A-Video释放你的想象力

Meta首席执行官Mark Zuckerberg详细介绍一个短视频的制作,“我们给出的描述是这样的,‘画自画像的泰迪熊’、‘戴着针织帽的树懒宝宝在探索笔记本电脑’、‘在火星上着陆的宇宙飞船’以及‘在海中冲浪的机器人’。生成视频比生成照片难得多,因为除了正确生成每个像素,Make-A-Video系统还必须预测像素如何随时间变化。”

据了解,Make-A-Video由三个主要部分组成:

1. 基于文本图像对训练的基本T2I模型

2. 时空卷积和注意层,将网络的构建块扩展到时间维度

3. 时空网络,由这两个维度组成时空层,以及T2V生成所需的另一个关键元素:用于高帧速率生成的帧内插网络

相对于百度它对文本生成视频技术做出了一些升级,百度的大脑图文转视频技术是通过互联网素材构成的,视频生成服务依靠丰富大量的素材库才能完成素材的聚合和视频的生成;而它能够完全用AI取代内容生成,它不需要互联网素材库也能生成视频。

Make-A-Video研究建立在文本到图像生成技术最新进展的基础上,该技术旨在实现文本到视频的生成。

该系统使用带有描述的图像来了解世界的样貌以及图像是如何被描述的,它还能使用未标记的视频来了解世界是如何运动的。

因此它能给你发挥想象力的空间,不需要互联网上的素材,只需要几句话或者几行文字就可以生成奇思妙想且独一无二的视频。

Make-A-Video开创了T2V新一代的最新技术。

使用函数保持变换,在模型初始化阶段扩展了空间层来包含时间信息;扩展的时空网络包括新的注意力模块,可以从视频集合中学习时间世界动态。

除了用文本生成视频的功能,它还能将运动添加到单个图像或者两个图像之间填充运动;还可以根据原始视频创建变体,为视频添加额外的创意。

Make-A-video相较于以往产品的优势

Make-A-Video主要有三个优点:

1. 它加快了T2V(文本到视频)模型的训练,不需要从头开始学习视觉和多模式表示。

2. 它不需要成对文本的视频数据。

3. 生成的视频继承了当今图像生成模型的广泛性、审美多样性、幻想性描绘等。

Make-A-Video相较于以前的作品有一个显著的优势,其架构打破了T2V生成对文本视频的依赖,而以前的AI图文转视频技术必须限制在狭窄的领域或需要大规模成对文本视频数据。

该程序还通过将先前训练的的T2I网络中的知识瞬间转移到新的T2V网络中,大大加快了T2V培训过程。

同时为了提高视觉质量,训练了空间超分辨率模型以及帧插值模型;这将提高生成视频的分辨率,并启用更高更可控的帧速率。

Make-A-VideoMake a new future

而为了负责任地推进人工智能,减少有害的、有偏见或误导性的内容,确保这种最先进的视频技术的安全使用,开发人员采取了一些有效措施。

在源数据方面,由于这项技术通过分析数以万计的数据来了解世界,为了降低有害内容产生的风险,对过滤器进行了检查、应用并迭代过滤器,以减少有害内容在视频中出现的可能性。

在内容方面,由于Make-A-Video可以创建看起来逼真的内容,因此开发人员在生成的所有视频中添加了水印;这有助于确保观众能知道视频是用人工智能生成的,而不是捕获的视频。

而同时开发人员也正在致力于将这项技术提供给公众,目前正对Make-A-Video继续分析、测试和试用,以确保发布的每一步都是安全的。

向我们周围的世界学习是人类智力的最大优势之一,能够通过观察快速学习和认识他人、地点、事物和行为;AI如果能够模仿人类的学习方式,生成系统将更具创造性和实用性。

而未来的工作,开发人员还将致力于解决技术限制,如今的方法还无法学习文本和只能在视频之中推断出的现象之间的关联。

如何整合这些内容,以及生成更长的包含多个场景和事件的视频,描述更详细的故事,让我们期待其未来的发展吧。

作者:谭颖 排版:孔瀚越

图片源于Q仔互联网冲浪所得,若有侵权,后台联系,Q仔滑跪删除~

    推荐阅读
  • 吃鸡中怎么才能继续打巅峰赛(无法进入巅峰赛)

    另外,还有部分粉丝,想让刺激哥带着他们一起上分,等到达成超级王牌段位以后,再去获得巡查员资格。一般情况下,距离航线左右两侧2000米左右的距离,是相对比较安全的区域。另外,我们还可以把烟雾弹丢到相反的方向,分散对手的注意力,为自己创造进圈的机会。作为《和平精英》的老玩家,相信很多玩家都发现一个道理,我们采用的打法越激进,越容易提前被淘汰出局。

  • 九章算术作者(谁是九章算术的作者)

    以下内容大家不妨参考一二希望能帮到您!《九章算术》是中国古代张苍、耿寿昌所撰写的一部数学专著。是《算经十书》中最重要的一部,成于公元一世纪左右。其作者已不可考。一般认为它是经历代各家的增补修订,而逐渐成为现今定本的,西汉的张苍、耿寿昌曾经做过增补和整理,其时大体已成定本。最后成书最迟在东汉前期,现今流传的大多是在三国时期魏元帝景元四年,刘徽为《九章》所作的注本。

  • 逢人说项是什么意思(为人说项是什么意思)

    2、出自唐·杨敬之《赠项斯》:“处处见诗诗总好,及观标格过于诗。平生不解藏人善,到处逢人说项斯。”

  • 炒干豆角的方法(炒干豆角的方法窍门)

    肉切条跟豆角同粗,用酱油、糖、酒、姜丝,腌过。水份烧干,加入青辣椒丝、胡萝卜丝,翻炒稍至软,淋点麻油和耗油,拌匀就出锅。

  • 五万五千与五万五的区别(既然有了一二三四五)

    古文字中的“一”字,乃是一根手指伸出,即右手食指伸出的象形描写。现今楷书的“一”字,来自对古文字的一脉相承。“一”来源于右手食指伸出,这是说,“一”乃所有数字的元始,同时是单纯的唯一,因而又有同一、原道、第一之义。

  • 高人一等名词解释 高人一等名词解释汇总

    出自《礼记·檀弓上》。

  • 邢台市广宗县什么时候领教师资格证 邢台市广宗县什么时候领教师资格证啊

    2021年上半年教师资格认定工作已经全部结束,请已经通过审核认定的申请人,携带本人有效证件原件,到广宗县行政审批局一楼服务大厅领取教师资格证,具体要求如下:1、领取时间2021年7月26日至2021年7月30日,上午8:30-12:00,下午2:30-5:30。办公地址:广宗县经济开发区一楼审批服务大厅联系电话:0319—7361169

  • 布加迪0-400公里加速实拍(2799万的布加迪雪藏7年)

    这辆车在雪藏了7年之后,已经重出江湖。在当年,Veyron可是身份的象征。这辆2008款布加迪Veyron目前行驶了1000公里,上牌的时间是2013年,报价2799万。而目前2008款的Veyron在国际二级市场的拍卖价格在110万美金,700万人民币不到。尽管如此,当Veyron达到极速状态行驶后,轮胎最多也只能承受15分钟。

  • 王者荣耀可爱头像q版西施曜情头(王者荣耀Q版头像合集)

    王者荣耀Q版头像合集,这么可爱的话,赶紧用起来啊!貂蝉这个英雄应该是很多法师玩家的本命,不管男女都有受众吧。这q版的头像来源应该是妲己最近新出的皮肤时之彼端。接下来就是作为辅助界扛把子的奶妈蔡文姬了,蔡文姬确实是一个非常可爱的英雄,蔡文姬作为王者荣耀的辅助,深受众多女玩家的欢迎,而且出了法装的话,会拥有强大的回血能力。

  • 江苏省教育厅省教育厅关于进一步做好深化高考综合改革相关工作的通知(苏教考〔2020〕8号文件)

    全省建立和完善统一的综合素质评价电子化管理平台。要进一步加大高等职业教育资源统筹,扩大高职分类招考规模,使分类考试录取逐步成为学校招生主渠道。当化学科目实考人数的比例低于25%时,启动化学科目保障机制。各级教育行政部门和普通高中学校要认真做好相关政策的解读工作,及时回应社会关切,努力营造有利于高考综合改革的良好环境。