名古屋大学大学院情報学研究科の東中竜一郎教授の研究グループは、人間同士の自然な会話のように相手の話を聞きながら話すことのできる、日本語で利用可能なFull-duplex(全二重)音声対話モデル「J-Moshi」を公開した。
英語の音声対話モデル「Moshi」をベースに、日本語の音声対話データでの追加学習によって構築。人間同士の対話における発話の重複(オーバーラップ)や相づちなど同時双方向的な対話を実現した。雑談や接客など、さまざまな場面での利用が期待される。
教育家庭新聞 教育マルチメディア号 2025年3月3日号掲載