色淫

telegram 文爱 实测 Sora!比拼可灵、Runway,谁最莫得 AI 味

发布日期:2024-12-16 05:51    点击次数:119

telegram 文爱 实测 Sora!比拼可灵、Runway,谁最莫得 AI 味

telegram 文爱

鸽了一年,Sora 千呼万唤始出来,但 OpenAI 是让网友来历劫的。

说好的追究绽开使用,蹲点直播且手速够快的运气儿,武艺抢先过问体验。等了一天,反复刷新,一次次面临「请稍后记忆查看」的提醒,终于注册见效。

但是telegram 文爱,让我和 ChatGPT 从诗词歌赋聊到东谈主生玄学的 20 好意思元,只够让 Sora 在一个月内生成 40 个 5 秒的 480p 视频。每一次点击生成,皆毛骨竦然。

好退却易用上了,咱们天然要把每一个 Sora 的视频用在刀刃上,拿它和 Runway、可灵比一比。论断是,能用,好玩,但很难硬夸。

Sora、Runway、可灵,失败得各有各的笑点

让 Sora 和 Runway、可灵比赛,天然是有根由的,一个是出谈早、国外最有代表性的 AI 视频家具,一个是异军突起、以实力礼服全全国网友的国内顶尖选手。

法例尽头简单,用交流的英文教唆词(为了便捷阅读,底下皆翻译为中语),生成的时长皆是 5 秒。惟一的区别是,Sora 的分裂率皆开发成了 480p。没方针,积分得省着用。

先用文生视频,比比画面的写实和质感,望望 AI 视频们生成的猫怎样样。

Sora 固然唯独 480p,但画面看起来是高清的,调色也很漂亮。

▲ Sora 生成,教唆词:200mm 长焦镜头捕捉阳台上的英短猫,其毛发细节澄清。出路的大盆栽幽微虚化,布景中树叶随风摇曳。画面具有电影胶片的颗粒感和色调饱和度,高清画质

Runway 和可灵的进展差未几,可灵的出路、布景生成得最准确。三只猫,三种花色。

▲ Runway 生成

▲可灵生成

接下来,让 AI 视频们「写字」,望望能不行写出「APPSO」。

Sora 的手部动作还算天然,但写出来的线条像吃了菌子,有我方的思法。

▲ Sora 生成,教唆词:鸟瞰角度拍摄手在白色素描纸上书写「APPSO」,玄色笔画,流通的书写动作,天然的手部挪动,柔和打光,特写镜头

Runway 对得最多,但也没完全对,况兼,除了终末那一笔,字母轨迹和手部动作莫得领略诱骗,各管各的。

至于可灵,写出一串乱码,但很贫苦,字母轨迹是跟入辖下手部动作走的。

然后再来考考通顺的流通过程,吞并场自行车比赛,Sora 的镜头和通顺轨迹完全盲从了教唆词,影子看起来也很真实。

▲ Sora 生成,教唆词:平地自行车手快速冲过相接滚动的土壤赛谈,从终末一个跳台腾空而起,侧面镜头捕捉他在最高点的一会儿

Runway 的教唆词只对了一半,自行车手没在起头出场,终末给了一个高光镜头。

可灵和 Runway 正值反过来,前半段进展得可以,但收尾出现象了,怎样多出来一个东谈主?

该上难度了,拿出相对复杂的、自带镜头切换的教唆词。

Sora 的画面色调饱和,像调了色,但是男性好像是臆造出现的,AI 也莫得按照条目,把镜头转向男性。

▲ Sora 生成,教唆词:阳光明媚的下昼,星巴克立场的咖啡馆内,镜头领先瞄准一位面带浅笑的年青中国女性,随后转向一位语言时轻轻点头的年青中国男性。他们相对而坐,木桌上放着两杯咖啡。天然光充满空间,营造仁爱氛围

Runway 径直就从侧面拍,规复了两个东谈主的心思,但莫得体现镜头的通顺,男性的手部也出了问题。

可灵和 Runway 差未几,但后来居上,因为更像中国东谈主,但是,这两个东谈主同坐一桌,却谁也没看谁。

除了文生视频,图生视频亦然视频生成的重头戏,况兼比拟文生视频,图生视频更实用,好多交易化请托的 AI 片子,基本皆是图生视频,先在图片阶段尽量作念到一致性。

但是,要是仅仅 20 好意思元的 Plus 用户,是不行在 Sora 上传包含东谈主物的相片或者视频的。退而求其次,咱们上传一张巫师猫的颜色包,让猫猫挥舞手中的魔法棒,变出玫瑰花。

不知谈为什么,Sora 的图生视频不起作用,猫根本没动,从右下角的 logo 才看出,这短长静止画面。

▲ Sora 生成,教唆词:猫猫挥入手中的魔法棒,变出了一朵红玫瑰

Runway 让猫猫右爪挥舞魔法棒,左爪变出玫瑰花,也算稳健教唆词的条目,但这个花不在一个图层啊。

可灵的进展尽头完满,后果最天然,作念成 gif 即是又一张颜色包。

试了动物,再试试空镜,我将之前用 AI 生成的一张工业废土立场图片,作为图生视频的材料。

Sora 生成的放浪很难评价,视角是够低的,但镜头不是从侧面追踪,画面切换也突兀。这就叫,我不该在车里,而是在车底。

▲ Sora 生成,教唆词:坦克车开过,轮胎扬起尘土碎片,侧面追踪镜头,低角度视角,慢动作,电影级质感

女同gh

Runway 生成的最有内味,以致车窗也随着动起来了。

可灵径直把镜头拉远了,和教唆词基本没什么干系。

就那么几谈题,三个 AI 莫得一个是可以打满分的。天然,以上通通皆是个例,不具有大皆的代表性,充其量只可提供一个测评的角度。

单论 Sora 的话,它在文生视频的写实立场上进展得可以,具有电影质感,物体通顺关于教唆词的盲从也还行,偶然以致比可灵和 Runway 进展得好。

但图生视频容易握瞎,可能静止不动,可能不听镜头通顺,举座性价比不算高。

▲ Sora 生成,教唆词:90 年代在上海拍摄的 35 毫米胶片短片,电影质感

「丐版」的模子,立异的家具

Sora 进展一般,可能因为,它是个「丐版」——和受 OpenAI 邀请的艺术家们不同,当今咱们能用的是 turbo 版块,需要的算力更少,后果也就打了扣头。

模子不够,家具来凑,Sora 有少许让东谈主深信—— 2 月官宣,12 月才发布,中间冒出好多竞品,但 Sora 仍然具备它们莫得的功能。

不像 ChatGPT 一个对话框走天地,Sora 在交互界面和家具功能的野心上别出机杼。

其中,Sora 的故事板功能,肖似首尾帧,但更活泼,咱们可以在工夫轴上添增多张卡片,卡片里可以是教唆词,也可以是图片和视频,Sora 在卡片之间生成完整的视频。

于是,我写了两段教唆词,1. 日剧立场镜头,女高中生靠在天台雕栏旁,侧脸构图,柔和的午后后光打在脸上;2. 她转头面向镜头显现浅笑,仁爱的打光隆起颜色。

生成的后果,很稳健我的思象,发丝的飘零让东谈主活该的心动。

▲   Sora 生成

AI 还作念不到让东谈主东谈主皆能当导演,但 Sora 让你体验一把野心分镜的嗅觉。不外,已经那句话,模子就这样,后果的横暴,尽头随即,但 Sora 的积分,经不起抽卡。

我本思让 AI 效法游戏 CG 的后果,主角速即回身并拔枪,但最终,获取了一个颜色呆滞的机器东谈主。

▲ Sora 生成

只在故事板放上一张图也可以,这样 Sora 会自动生成教唆词,提出你这张图片怎样动。

于是,巫师猫终于可以动起来了。原本,图生视频的短板,是要在这里弥补啊。但是,后果也很难绷,有工夫会生成一些弥漫的东西。

另外,Sora 的 Remix(重绘)功能也很好玩,咱们可以用天然语言剪辑视频,改造视频中的元素,进行「二创」。

既可以用我方的视频,也可以在 Sora 的社区里借用他东谈主的视频。

▲ 图片来自:Sora 社区 @bpyser1

比如,咱们可以把舞蹈的真 · 纸片东谈主换成男团,同期,把场景换成锻练室。

纸东谈主的动作和衣饰皆莽撞保留了,但东谈主物的看成已经不行细看。

更好玩的来了,咱们可以接着用 Blend(混杂)功能,将两个视频合并成一个,Sora 会自动惩处视频之间的过渡后果。

原本觉得,可以出来一个丝滑的 MV 片断,毕竟这两个视频皆这样不异了,但 AI 已经给了我惊喜,起头和遣散皆很平素,中间的阵势一度很杂沓,你们到底几个东谈主啊?

总之,不追求出片率的话,Sora 很好玩,家具形态也很有道理,提供了一个全新的责任流,立异是有的,功能亦然比较完整的。

但是,仅从刻下来看,生成后果的栽培空间较大,但给用户的探索次数又不及,20 好意思元只可浅尝辄止。有工夫画面很漂亮,但通顺惩处得不好,亦然徒劳,「试验不存在了」已经一个远方的梦思。

请观赏,猫猫穿墙而过,原本在 AI 眼里,猫真的是液体。

▲ Sora 生成,教唆词:电影感实足的黑猫特写镜头,猫咪在故宫红色宫墙前优雅地跃起,画面以慢动作呈现,猫咪全身明晰可见,布景欺诈浅景深虚化惩处,在朝上最高点时金色的眼睛直视镜头。接收柔和的天然后光,传统的录取建筑墙面细节酿成朦胧的布景

Sora 的问题,其实亦然好多 AI 视频家具的通病,莫得确凿靠谱的一刀流。模拟真实的全国?终了丝滑的通顺?保持东谈主物的一致?可以是可以,但有概率,抽卡和后期必不可少。

当今咱们看的是肉眼可见的生成后果,而 AI 视频们集体改造的,是创作的步地。以前固然可期,但是,Sora 请先把模子升级了吧。