Stable Diffusionを使っていくつか画像を作成していくと、このような欲求が湧くはずです。
「ああ、このモデルをアバターのように喋らせてみたい・・・。でも難しいことはできない・・・」
そんな時、D-ID社の「Creative Reality Studio」というサービスを使えば、その欲求はすぐに満たす事ができます。
例えばこのように、画像を喋らせる事ができます。(↓再生してみてください)
まあ少し違和感はあると思いますが、自分の作ったモデルが、難しい操作なく、このようなクオリティで喋るのは単純に嬉しいです。
![わたし](https://moriblo.com/wp-content/uploads/2022/03/97D446E7-15EA-43F3-AC38-50A2EE077883-e1646447054777.jpeg)
トライアルでいくつか無料で作成できるので、ぜひ作成した画像を喋らせてみましょう!
AIで作成した画像をアバターとして喋らせる方法
サイトへアクセスしアカウント作成
「Creative Reality Studio」はWeb上で使えるサービスです。
ますは公式サイトへアクセスします。
右上の「FREE TRIAL」を選択します。
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4218-500x187.jpeg)
一覧から「Create Video」を選択。
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4219-336x500.jpeg)
「Choose a presenter」の「+ADD」を選択します。
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4221-500x420.jpeg)
サインインを求められるので、アカウントを作成します。
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4222-500x243.jpeg)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/97D446E7-15EA-43F3-AC38-50A2EE077883-e1646447054777.jpeg)
アカウントを作成したら、いよいよ画像を喋らせていきましょう。
アバターの作成
「Choose a presenter」の「+ADD」から画像を追加していきます。
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4221-500x420.jpeg)
保存してある画像を選んでいきましょう。
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4224-500x391.jpeg)
![](https://moriblo.com/wp-content/uploads/2023/05/IMG_4225-500x349.jpg)
画像を加えたら、喋らせるテキストを入力します。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-15.44.12-1-248x500.png)
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-16.30.59-426x500.png)
次に「Language」で言語を選択。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-15.44.37-241x500.png)
お次は「Voices」で声を選択。女性と男性があります。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-15.44.55-359x500.png)
「Styles」は声の表現方法(おしゃべり、怒った感じ、元気いっぱいの感じ、などなど)を選択できます。※対応している声に限ります
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-16.11.18-253x500.png)
テキスト、言語、声などの設定が終わったら、「音声」アイコンを選択して試聴することができます。
![わたし](https://moriblo.com/wp-content/uploads/2022/03/97D446E7-15EA-43F3-AC38-50A2EE077883-e1646447054777.jpeg)
ここで選択した声はどんな感じなのか、テキストに違和感がないか、などを確認しましょう。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-15.52.22-251x500.png)
ちなみにこのまま動画を作成すると、開始時間の顔が口を開けた状態になってしまいます。
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-31-0.38.59-462x500.jpg)
気になる方は、テキストの初めに「時計」アイコンで0.5秒の休止時間を作ると、開始時間でも口を開けないでいてくれます。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-31-0.37.41-433x500.png)
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-31-0.39.54-467x500.jpg)
良い感じに調整が終わったら、画面右上の「GENERATE VIDEO」→「GENERATE」と選択していきます。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-31-10.47.37-500x120.png)
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-30-15.53.18-467x500.jpg)
動画の作成が始まり、完了したらモデルのおしゃべりを確認する事ができるようになります。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-30-15.53.58-1-500x483.png)
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-30-15.55.14-402x500.jpg)
ちなみに作成した動画は「Video Library」という場所に保存されます。
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-31-10.46.34-500x221.jpg)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/97D446E7-15EA-43F3-AC38-50A2EE077883-e1646447054777.jpeg)
以上、お疲れ様でした!
いくつかアバターとして喋らせた結果
ここで作成したアバターを少し紹介します。(↓再生できます)
こちらは日本語のイントネーション等に若干違和感があるものの、許容範囲と言えるでしょう。
英語の方がよりナチュラルです。
失敗例
とはいえ、実はこのサービスは癖があり、うまくいかないことも多々あります。
ということで失敗例をいくつか。(失敗例は画面キャプキャでお送りします)
![](https://moriblo.com/wp-content/uploads/2023/05/55A9CE95-5AD2-4D20-8E06-910B4C5FD739-1-500x500.jpg)
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-30-22.47.18-500x480.jpg)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/D32FB20C-391D-49C6-BB27-9C523A8ACAF1-e1646446908613.jpeg)
悪くないですが、左目が大きく違和感があります。
髪が目にかかっている画像だとこのような形になるようです。
![](https://moriblo.com/wp-content/uploads/2023/05/D1CE06B9-E737-41CF-BBF5-FB64335ADC84-500x500.jpg)
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-30-22.48.10-500x483.jpg)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/D32FB20C-391D-49C6-BB27-9C523A8ACAF1-e1646446908613.jpeg)
いや、口まわりの癖!
![](https://moriblo.com/wp-content/uploads/2023/05/85528ABF-B7CF-4AB9-8534-824DF868B75B-333x500.jpg)
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-30-22.46.55-500x486.jpg)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/001BC442-E03C-47FA-A703-D16CA5007F4B-e1646446979591.jpeg)
おおい!どうしてこうなった・・・
とにかく全般的に口周りのクセが強いのが特徴で、日本人などアジア系のおとなしい顔には、大袈裟すぎて違和感があります。
こちらのモデルのように、ハーフのような顔であれば、違和感はだいぶ減ります。
![](https://moriblo.com/wp-content/uploads/2023/05/2023-05-30-23.09.52-500x497.jpg)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/97D446E7-15EA-43F3-AC38-50A2EE077883-e1646447054777.jpeg)
この辺は試行錯誤と、動画を再生してみるまでわからないガチャ要素(運要素)があります。
まとめ
ということで、AIで作成した画像を喋らせる方法をお伝えしました。
アカウントを作成すれば、無料で簡単に試せます。
少し癖がありますが、自分が作成したモデルを喋らせるのなかなか楽しいので、ぜひトライしてみてください。
![](https://moriblo.com/wp-content/uploads/2023/05/スクリーンショット-2023-05-31-11.08.09-500x226.png)
![わたし](https://moriblo.com/wp-content/uploads/2022/03/97D446E7-15EA-43F3-AC38-50A2EE077883-e1646447054777.jpeg)
トライアルは14日間、トータル5分の動画が作れるので、きっと良い感じのものは作れると思います!
コメント