極楽せきゅあブログ

ときどきセキュリティ

sora2および動画生成

sora2で10秒動画制作を続けている。30本制限になったけど、テイク数を少なくしつつ量産する感じに持ってきたので、毎日それなりの数を生産できている。
動画としての完成度を上げることはかなりできるようになってきたけど、問題はセリフかなぁ。
元のスクリプトを標準語の会話文として書いて、AIに関西弁をお任せするとイマイチ想定通りいかないことがある。細かく指定すると棒読みになる可能性が結構高い。どちらかと言えば前者の方が自然になる確率が高い。
その一方で、人物の動作とか背景とかは情報を適切に与えるとそれに答えてくれる。ただし漢字は別(笑)。セリフのときもそうだけど、日本語の読みが不自然になることがたまにある。例えば「特定班」のことを「とくていばん」と言うので「特定はん」と書いても「とくていばん」と言ってしまうとか。「怖いよね」というのを「ふいよね」と読んだりもする。ひらがなで指定してても間違えることもある。
そんな試行錯誤の中で、最も情報量が多く、かつ自然になるのは、関西弁の若い女性、というのが見えて来たので(笑)、最近の動画はもっぱらそのパターン。しかし、若い女性、とだけ指定していると服装がパターン化してきてしまうのと、若干の不自然さも出てきてしまうので、正直全く関心が無かった(笑)ファッションをいろいろ勉強しつつ、そのあたりも指定し始めている。使い方を見極めながらやっているので、どうしても同じような装いが続いてしまう(笑)。
本数たまってきたらどっかで連続的に公開していこうかなぁ。なおテーマは情報セキュリティの啓蒙啓発。なので情報量が命なんだよね(笑)。
さすがに長尺ものも欲しいので、他のプラットフォームも試してみようと思うものの、日本語対応がどうなの?というところがあるので、まだ試行中、というところ。