LTS戦略事業本部・Data & Technology Consulting事業部の曽根原奎斗は、第43回日本ロボット学会学術講演会(RSJ2025)で論文「Vision-Language-Action(VLA)モデルによるタスク実行中の異常検知・自律復帰:VLA単体と階層アーキテクチャの比較」の研究発表を予定しております。
■学会名:第43回日本ロボット学会学術講演会
■開催日時:2025年9月2日(火)~9月5日(金)
■開催場所:東京科学大学 大岡山キャンパス(東京都目黒区)
■発表演題:『Vision-Language-Action(VLA)モデルによるタスク実行中の異常検知・自律復帰:VLA単体と階層アーキテクチャの比較』
■発表内容の概要:
✓ Vision-Language-Model(VLM)モデルによる状態検知と、ROS2による正常/異常状態の管理を通じ、意味的異常を含む抽象タスクを具体タスクへ分解してVision-Language-Action(VLA)モデルへ指示する階層アーキテクチャを開発した。
✓ この階層アーキテクチャとVLA単体との性能を比較することにより、VLAにおける異常状態からの自律復帰タスクにおける困難とその解決の方向性を検討した。
✓ VLA単体、階層アーキテクチャともに学習分布外条件に対しては性能が大きく低下することがわかり、意味的異常からの自律回復には、データ合成等を通じた大規模なファインチューニングデータセットの構築やオンライン適応を備えた学習分布外データへのロバストネスの向上が必要であると考察した。
当社は今後も、研究開発活動を通じて技術革新に取り組み、産業と技術への貢献を目指してまいります。
<参考>
学会URL
https://ac.rsj-web.org/2025/index.html