プレスリリース要約
合同会社JoyPixは、オンラインクリエイティブツール「JoyPix.ai」において、静止画から自然なAIアバター動画を生成する新モデル「Motion-2.5」および「Motion-2.5-Dialog」の提供を開始しました。動画制作のコスト削減と表現力向上を両立する新技術として、ビジネスでの活用が注目されます。
合同会社JoyPixは2026年6月15日、AIリップシンク動画生成モデルの最新版「Motion-2.5」と、2人のキャラクターによる対話に対応した「Motion-2.5-Dialog」をリリースしました。本モデルは、1枚の静止画とテキストまたは音声素材を組み合わせることで、人物やキャラクターが自然に話す・歌う動画を生成するものです。今回はWeb上での利用に加え、企業の既存システムやワークフローに組み込めるAPI経由での提供も同時に開始しており、開発者向けのドキュメントも公開されています。これにより、動画制作の自動化やシステム連携が容易になりました。
従来のモデル「Motion-2」から進化した本バージョンでは、音声と口元の同期精度が大幅に向上しました。さらに、口元だけでなく頭の動きや表情、身体の姿勢まで自然に連動させ、不自然な硬さを排除しています。1人のアバターが話す動画だけでなく、2人のキャラクターが掛け合う対話型動画の生成にも対応したため、対談風のコンテンツや説明動画、デジタルヒューマン同士の会話といった複雑な演出が可能です。企業のマーケティング担当者やSNS運用者、コンテンツクリエイターを対象に、撮影不要の動画制作環境を提供します。
Journalポイント
実はこれ、1枚の静止画と音声データさえあれば、まるで本当に話しているかのような動画が作れてしまうんです。
え、そうなんですか?動画を作るのって、普通はスタジオで撮影したり、複雑な編集ソフトを使ったりしますよね。
そうなんです。従来の動画制作には莫大な時間と費用がかかるという課題があり、特にSNS向けに大量の動画を毎日投稿したい企業にとっては、制作リソースの確保が大きな壁になっていました。
でも、それってもともとAIで作った動画だと、動きが不自然でチープな印象になってしまうんじゃないですか?
AIというのは人工知能のことで、コンピュータが人間のように学習して判断する技術を指します。今回のMotion-2.5では、口元だけでなく、頭の揺れや表情、身体の姿勢まで自然に連動させることで、その不自然さをクリアしているんです。
なるほど!じゃあ、自社のキャラクターや社長の顔写真を使って、オリジナルの説明動画が簡単に作れるってことですか?
その通りです。たとえば、自社製品の紹介動画を各言語の音声データと組み合わせるだけで、多言語のプレゼン動画を瞬時に量産できます。さらに今回は2人の対話シーンにも対応したため、対談風のコンテンツも作れます。
それは便利ですね。開発者向けにAPIも提供されているようですが、システム連携もできるんですか?
APIというのは外部のプログラムとシステムを繋ぐ窓口のことで、これを使うとJoyPix.aiの機能を自社のシステムやアプリに直接組み込めます。現在、業界全体が動画制作の自動化やパーソナライズ化へシフトしているんです。
顧客ごとに最適化した動画を自動生成して配信する、といった新しいビジネスの形が見えてきました。勉強になりました!


