谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

谷歌VideoPoet项目Research Lead,CMU兼职教授蒋路的Google Scholar资料显示已加入TikTok。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

最近,有传闻TikTok招募了某篇论文的作者作为北美技术部门负责人,研发能和Sora对抗的视频生成AI。

而蒋路3周前在Linkedin上发布了离职谷歌的消息,也向外界揭开了谜底。

他作为谷歌VideoPoet项目的负责人,将离开Google Research,不过会留在湾区,继续视频生成领域的工作。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

「人才第一,数据第二,算力第三」,谢赛宁的AI突破「3要素」,已经为大厂在未来构建自己的AI护城河指明了方向。

而蒋路带领谷歌团队在去年年底推出了在技术路线上与Sora相似的视频生成技术:VideoPoet,让他成为了世界上为数不多的有能力构建最前沿AI视频生成技术的科学家。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

VideoPoet在Sora发布之前就已经将AI视频的前沿推进到了生成10秒长,一致性非常强,动作幅度大且连贯的视频。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

而与此同时,他还是CMU的兼职教授,有非常丰富的科研经历和成果。

蒋路这样既有深厚的理论功底,又有最前沿大型项目的工程和管理经验的复合型专家,自然成为了大厂必争的AI基石型人才。

个人介绍

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

蒋路在Google担任研究科学家和管理岗位,同时也是卡内基梅隆大学计算机科学学院语言技术研究所的兼职教授。

在CMU,他不仅指导研究生的科研项目,还亲自讲授课程。

他的研究成果在自然语言处理(ACL)和计算机视觉(CVPR)等领域的顶级会议上屡获佳绩,还在ACM ICMR、IEEE SLT 和 NIST TRECVID等重要会议上获奖。

他的研究对多款谷歌产品的开发和完善起到了至关重要的作用:包括YouTube、Cloud、Cloud AutoML、Ads、Waymo和Translate 等。

这些产品每天服务全球数十亿用户。

除了上述这些内容以外,还有另一个侧面能很好地说明蒋路学术水平的高度:他与众多计算机视觉和自然语言处理领域的顶尖研究者都有过合作。

2017至2018年期间,他是Google Cloud AI首批研究团队的创始成员,由李佳博士和李飞飞博士亲自挑选。

随后,他加入了Google Research,与Weilong Yang博士(2019-2020)、Ce Liu博士(2020-2021)、Madison Le(2021-2022)和Irfan Essa博士(2023)等人都有过合作。

此外,在卡内基梅隆大学读博期间,他的论文由Tat-Seng Chua博士和 Louis-Philippe Morency博士共同指导。2017他在Alexander Hauptmann博士和Teruko Mitamura博士的帮助下成功毕业。

他在雅虎、谷歌和微软研究院的实习时,得到了Liangliang Cao博士、Yannis Kalantidis博士、Sachin Farfade、Paul Natsev博士、Balakrishnan Varadarajan博士、Qiang Wang博士和Dongmei Zhang博士等人的指导。

从他在领英上的履历可以看出,很多科技大厂都留有过他的足迹。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

在CMU和NSF都有过实习经历。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

而在毕业之前,他在雅虎,谷歌,微软都实习过。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

他本科毕业于西安交通大学,研究生毕业于布鲁塞尔自由大学,博士毕业于CMU。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

VideoPoet

他在谷歌带领的团队在去年底推出的VideoPoet,已经用Transformer代替了传统的UNet,成为AI视频生成当时的SOTA.

这项成就,也成为了TikTok相中他最主要的原因。

相比起只能生成小幅动作的Gen-2,VideoPoet一次能够生成10秒超长,且连贯大动作视频,可以说是实现了完全碾压!

另外,VideoPoet也并非基于扩散模型,而是多模态大模型,便可拥有T2V、V2A等能力,或将成为未来视频生成的主流。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

相比起其他模型,谷歌的方法是将多种视频生成功能无缝集成到单一的大语言模型中,而不依赖针对各个任务分别训练的专用组件。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

具体来说,VideoPoet主要包含以下几个组件:

– 预训练的MAGVIT V2视频tokenizer和SoundStream音频tokenizer,能将不同长度的图像、视频和音频剪辑转换成统一词汇表中的离散代码序列。这些代码与文本型语言模型兼容,便于与文本等其他模态进行结合。

– 自回归语言模型可在视频、图像、音频和文本之间进行跨模态学习,并以自回归方式预测序列中下一个视频或音频token。

– 在大语言模型训练框架中引入了多种多模态生成学习目标,包括文本到视频、文本到图像、图像到视频、视频帧延续、视频修复/扩展、视频风格化和视频到音频等。此外,这些任务可以相互结合,实现额外的零样本功能(例如,文本到音频)。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

VideoPoet能够在各种以视频为中心的输入和输出上进行多任务处理。其中,LLM可选择将文本作为输入,来指导文本到视频、图像到视频、视频到音频、风格化和扩图任务的生成

使用LLM进行训练的一个关键优势是,可以重用现有LLM训练基础设施中引入的许多可扩展的效率改进。

不过,LLM是在离散token上运行的,这可能会给视频生成带来挑战。

幸运的是,视频和音频tokenizer,可以将视频和音频剪辑编码为离散token序列(即整数索引),并可以将其转换回原始表示。

VideoPoet训练一个自回归语言模型,通过使用多个tokenizer(用于视频和图像的MAGVIT V2,用于音频的SoundStream)来跨视频、图像、音频和文本模态进行学习。

一旦模型根据上下文生成了token,就可以使用tokenizer解码器将这些token转换回可查看的表示形式。

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

VideoPoet任务设计:不同模态通过tokenizer编码器和解码器与token相互转换。每个模态周围都有边界token,任务token表示要执行的任务类型

相比于之前的视频生成模型,VideoPoet有这么三个比较大的优势。

一个是能生成更长的视频,一个是用户能对生成的视频有更好的控制能力,最后一个则是VideoPoet还可以根据文本提示,生成不同的运镜手法。

而在测试中,VideoPoet也是拔得头筹,碾压了不少其它视频生成模型。

文本保真度

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

文本保真度的用户偏好评级,即在准确遵循提示方面首选视频的百分比

动作趣味性:

谷歌VideoPoet负责人蒋路跳槽TikTok!对标Sora,AI视频模型大战在即

用户对动作趣味性的偏好评级,即在产生有趣的动作方面,首选视频的百分比

综上可见,平均有24-35%的人认为VideoPoet生成的示例比其他模型更加遵循提示,而其他模型的这一比例仅为8-11%。

此外,41%-54%的评估者认为VideoPoet中的示例动作更有趣,而其他模型只有11%-21%。

而有关未来的研究方向,谷歌研究人员表示,VideoPoet框架将会实现「any-to-any」的生成,比如扩展文本到音频、音频到视频,以及视频字幕等等。

内容链接:https://www.hpaper.cn/16679.html

(0)
上一篇 2024-02-22 上午9:01
下一篇 2024-02-22 上午9:06

相关推荐

  • 小鹏回应MONA M03自动泊车撞上奥迪:不排除光线等因素致弱势场景

    IT之家 9 月 18 日消息,近期一起“小鹏 MONA M03 自动泊车撞上奥迪汽车”的事故,引起了IT之家网友的关注。据每日经济新闻今天下午报道,小鹏汽车相关负责人就此事回应称,“公司售后同学已经联系上客户,在积极处理解决中。” 关于自动泊车状态下发生剐蹭的原因,该负责人表示,目前不排除因光线及其他因素导致的弱势场景,具体原因还要结合具体的数据进行分析。…

    16小时前
    5
  • 华为三折叠,炸出570万「黄牛」

    「核心提示」人人争当黄牛背后,是三折叠手机备受追捧。沉积的手机市场,太需要这样的“王炸”来唤醒了。 作者 | 陈法善 编辑 | 刘杨 备货量100万台,发布四天就有近570万人预约,华为三折叠手机Mate XT注定是今年最难抢的手机。 要知道,根据IDC的统计,2023年中国折叠屏手机总出货量约700.7万台。也就是说,华为这一个单品,就…

    4天前
    1.1K
  • 比亚迪员工总数突破 90 万,技术研发人员近 11 万全球车企第一

    IT之家 9 月 13 日消息,比亚迪集团品牌及公关处总经理李云飞今日在微博上透露,今天,比亚迪员工总数突破 90 万,是 5300 多家 A 股上市公司里员工人数最多的,比第二名还要多 40 多万人。 李云飞还表示:“比亚迪 90 万员工中,技术研发人员近 11 万,是全球研发人员最多的车企。过去两年还招聘了近 5 万名优秀应届大学生,持续助力大学生就业。…

    5天前
    503
  • 从Vertu到8848,奢侈品手机为何全军覆没

    华为三折叠终于发布了,19999元起售。 主要噱头是比折叠还多一折,但也引起了互联网的广泛争论。 在争论之中,黄牛早已率先抢购。 据网上消息,黄牛把三折叠已经炒到了一台65万。 一台38万,有人为了提升销量,黄牛给出的利好是全国可飞。 大家都知道这个溢价不可持续。可大家的疑惑点在于,华为三折叠的受众是谁? 为何有种魔幻的吸引力? 如果堆科技参数。 我可以告诉…

    6天前
    758
  • 苹果谷歌的合作关系正在升级?苹果新推视觉搜索功能

    财联社9月11日讯(编辑 周子意)苹果在9月9日的发布会上推出了视觉搜索功能——“视觉智能(Visual Intelligence)”,这一功能提供了一种与软件和服务交互的新范式,也为其搜索引入了新的模式。 苹果将“视觉智能”描述为一种即时了解你所看到的一切的方式。发布会上,苹果解释称,“视觉智能”功能可以被用来做更多的事情,它不仅仅是一种帮助用户了解相机视…

    2024-09-11
    2.4K
  • 外媒评苹果新品发布会:AI或助苹果在中国保持竞争力

    9月10日消息,美国时间周一,苹果在2024秋季新品发布会上推出了最新款iPhone、Watch和AirPods等硬件产品。iPhone 16系列毫无疑问再次成为焦点。苹果押注,人工智能支持的iPhone将有助于提振销量,保持在中国市场的竞争力。以下是主流媒体对苹果发布会的点评: 路透社:AI助力苹果在中国市场保持竞争力 苹果最新发布的iPhone 16系列…

    2024-09-10
    2.2K
  • 华为Mate XT震撼发布:余承东宣布全球首款三折叠手机引领行业新潮流

    9月10日,华为在“见非凡品牌盛典及鸿蒙智行新品发布会”上正式推出了其备受瞩目的全球首款三折叠手机——华为Mate XT。华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东在发布会上发表演讲,详细介绍了这款集前沿科技与创新设计于一体的旗舰产品,并展望了其对行业未来的深远影响。 余承东激动地表示:“华为团队历经五年奋斗,终于将科幻变成现实,今天发布…

    2024-09-10
    492
  • 苹果与华为发布会“正面交锋”:iPhone 16 AI功能在中国大陆受限,华为Mate XT引领三折叠手机新风潮

    2024年9月10日,全球科技界迎来了一场前所未有的盛宴。苹果与华为两大科技巨头在这一天几乎同时举行了年度新品发布会,吸引了全球消费者的目光。然而,在这场科技盛宴中,iPhone 16系列与华为Mate XT三折叠手机的发布,不仅展示了各自品牌的最新技术创新,也揭示了科技行业竞争的新格局。 iPhone 16 AI功能在中国大陆受限 当地时间9月9日上午(北…

    2024-09-10
    175
  • 华为Mate XT 非凡大师发布在即,三折叠设计或引领柔性屏产业新风向

    随着华为Mate XT 非凡大师发布日期的临近——定于9月10日下午14:30,市场对该款手机的关注度持续攀升,预约情况呈现出火爆态势。这一创新的三折叠手机设计,不仅预示着智能手机形态的新变革,还可能对柔性屏产业及相关企业,如京东方、TCL等,产生深远的潜在影响。 据观察,华为Mate XT 非凡大师自曝光以来,便吸引了大量消费者的目光。在华为官方商城及各大…

    2024-09-10
    498
  • 苹果华为新机同日上市,靠谱剧透都在这里了

    iPhone 16发布在即,各种剧透释出,苹果发力AI的意味更浓厚了。 最瞩目的便是在芯片上,库克一改此前精准刀法,直接给iPhone 16全系用上全新A18芯片,大家都有8GB内存。 这不就是为了Apple Intelligence而来? 发布会海报更是Siri味道十足。 明天凌晨1点,苹果“It’s Glowtime”发布会带着iPhone 16全系、最…

    2024-09-09
    4.0K
  • 中国车企避免掉入“利润下滑”舆论陷阱

    (文/张家栋 编辑/高莘) 近期,海外评级机构穆迪副总裁兼高级信贷官Gerwin Ho表示,“尽管需求强劲,但激烈的国内竞争正在侵蚀中国电动汽车制造商的盈利能力。” 该机构还在一份中国电动汽车行业报告中指出,中国车企之所以大力推动海外市场建设,是因为国内盈利前景黯淡。 在全球化的背景下,影响力日益强大的中国汽车品牌走出国门,面向全球市场已经成为必然趋势,但在…

    2024-09-06
    590
  • 全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

    新智元报道 编辑:编辑部 【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天? 马斯克的xAI一路狂飙突进,把Sam Altman都整怕了! 就在9月3日…

    2024-09-05
    525
  • 两家AI巨头正讨论建超级AI数据中心 每个耗资1250亿美元

    9月4日消息,全球顶尖的人工智能开发商对其最先进的技术一向保密,而对于开发这些技术所需的专业数据中心,他们则更加讳莫如深。 据美国科技媒体《The Information》披露,美国七个州有17个已建成或规划中的人工智能数据中心,这些数据中心有时被称为超级计算机或人工智能芯片集群。目前,这些超级计算数据中心或已投入运营,或正由微软、OpenAI、Meta及埃…

    2024-09-04
    2.8K
  • 特斯拉中国回应明年生产六座版 Model Y:不实消息

    IT之家 9 月 3 日消息,路透社今日报道称,特斯拉计划于 2025 年底开始在国内生产六座版 Model Y。特斯拉中国向界面新闻回应表示:“不实消息”。 有知情人士对路透社表示,特斯拉已要求供应商为其上海工厂 Model Y 产量实现两位数增长做好相应准备。 参考IT之家此前报道称,特斯拉于 2020 年发布了 Model Y,并一直在开发一项名为“J…

    2024-09-03
    5.3K
  • 零跑首次交付超3万辆,蔚来销量连续4个月超2万辆,8月新势力“成绩单”出炉

    9月1日,多家新能源车企公布了8月的交付数据。从已公布的数据来看,多家企业实现了销量或交付量的同比增长,延续了“淡季不淡”的销售趋势。 造车新势力方面,理想汽车依旧位列当月新车交付榜第一位。理想汽车公布的8月交付数据显示,其交付新车4.81万辆,同比增长37.8%;2024年1月~8月,理想汽车共交付28.81万辆汽车。截至2024年8月31日,理想汽车已累…

    2024-09-02
    602
  • BBA车主的面子,被假货三件套背刺

    有网友吐槽BBA的赠品:以前买奔驰全是原厂的。后来买奥迪一半是原厂的,现在买宝马全是淘宝货。 作者|钱多多 编辑|原 野 曾经,有人买BBA就是买个标。 现在,印着BBA车标的赠品正在痛击BBA车主的面子。 有BBA车主发现,自己在购车时与销售多轮拉扯要来的赠品小熊,疑似为网购的20元假货。廉价假货重灾区集中在小熊、雨伞、行李箱,并称:假货三件套。相比蔚来、…

    2024-08-30
    5.0K
  • 李想解读理想汽车财报:鸿蒙智行是强劲对手,我们持续学习华为

    雷递网 乐天 8月28日 理想汽车(Nasdaq: LI; HKEX: 2015)今日公布2024年第二季度财报。理想汽车董事长兼CEO李想、总裁、总工程师马东辉、CFO李铁、销售与服务高级副总裁邹良军出席电话会议。 李想在电话会议上表示,鸿蒙智行是理想汽车在市场上最强劲的对手,双方会长期健康地共存下去。从另一个角度看,理想汽车的核心态度是要长期地、持续地向…

    2024-08-29
    2.2K
  • 是谁接住了《黑神话:悟空》撒出的“泼天富贵”?

    《黑神话:悟空》正在改写中国游戏的历史,同时扮演着极具“钞能力”的带货王。 据游戏科学官方消息,发售3天之后,截至2024年8月23日21点整,中国首款3A大作《黑神话:悟空》全平台销量已超过1000万套,全平台最高同时在线人数达300万人。 这一数据不仅大幅打破国产游戏的销售纪录,也使《黑神话:悟空》成为有史以来销量达到1000万最快的主机游戏之一。即使是…

    2024-08-28
    1.1K
  • 第十三届中国创新创业大赛(海南赛区)暨海南省第十届“科创杯”创新创业大赛决赛在海口圆满落幕

    8月27日,第十三届中国创新创业大赛(海南赛区)暨海南省第十届“科创杯”创新创业大赛决赛在海口圆满落幕。在颁奖典礼活动环节,海南省政府张华伟副秘书长出席活动并为初创组一等奖和成长组一等奖的获奖企业颁奖,海南省科技厅党组书记李劲松在活动现场致辞并宣读大赛获奖决定,并同时授予2家一等奖的获奖企业省重点研发项目的立项支持,海南省科技厅副厅长蒙巍向13位决赛评委颁发…

    2024-08-28
    697
  • 枢密院十号:放着现成的“龙”飞船不坐,NASA为何非要两名美国宇航员再“漂”半年?

    美国国家航空航天局纠结了许久之后,终于还是给波音公司沉重一击:两名在国际空间站滞留的美国宇航员将由美国太空探索技术公司(SpaceX)的载人“龙”飞船在明年2月送回地球,而波音公司出现故障的“星际客机”飞船则将在今年9月以无人驾驶模式自行返航。 应该说,对于这个结局,其实外界早有预感,毕竟NASA给了波音公司足够长的时间,但依然没有能够彻底解决“星际客机”飞…

    2024-08-27
    1.0K