統合型マルチモーダル言語モデルプロジェクト「The Language of Motion」を紹介します。このモデルは以下の特徴を持っています:
- 言語(音声・テキスト)と非言語(ジェスチャー・表情・身体動作)の相互作用を同時に理解・処理できます。
- 異なるモーダル間の変換をサポートし、以下のようなタスクを実行可能です:
- 音声から動作
- テキストから動作
- 動作から感情解析
- 音声と動作の同期性が高く、自然で多様な動作を生成可能です。
- 自然なコミュニケーションを行うバーチャルキャラクターの作成に活用できます。
プロジェクトページ: https://languageofmotion.github.io