目次
ニュース
- 2025-05-22: 言語条件付きUAV模倣学習のための初の実世界ベンチマークであるUAV-Flowをリリースしました。(プロジェクトページ:https://prince687028.github.io/UAV-Flow)
- 2025-01-25: 論文、プロジェクトページ、コード、データ、環境およびモデルがすべて公開されました。
はじめに
本研究は、_現実的なUAVビジョン・言語ナビゲーションに向けて:プラットフォーム、ベンチマーク、および方法論_を提案します。UAVシミュレーションプラットフォーム、アシスタントガイドによる現実的なUAV VLNベンチマーク、ならびに現実的なUAVビジョン・言語ナビゲーションの課題に対処するMLLMベースの手法を紹介します。
依存関係
llamauav環境の作成
conda create -n llamauav python=3.10 -y
conda activate llamauav
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118LLaMA-UAVモデルのインストール
こちらのLLaMA-UAVを参照してllmの依存関係をインストールできます。
requirementsファイルに記載されているその他の依存関係をインストールする
pip install -r requirement.txt
さらに、AirSimのPython APIとの互換性を確保するために、AirSim issueで言及されている修正を適用してください。準備
データ
データセットを準備するには、Dataset セクションに記載された指示に従ってデータセットを構築してください。
モデル
GroundingDINO
GroundingDINOモデルは、groundingdino_swint_ogc.pthからダウンロードし、ファイルを src/model_wrapper/utils/GroundingDINO/ ディレクトリに配置してください。
LLaMA-UAV
モデルのセットアップについては、詳細なModel Setupを参照してください。
シミュレータ環境
様々なマップ用のシミュレータ環境はこちらからダウンロードしてください。
環境のファイルディレクトリは以下の通りです:
├── carla_town_envs
│ ├── Town01
│ ├── Town02
│ ├── Town03
│ ├── ...
├── closeloop_envs
│ ├── Engine
│ ├── ModularEuropean
│ ├── ModularEuropean.sh
│ ├── ModularPark
│ ├── ModularPark.sh
│ ├── ...
├── extra_envs
│ ├── BrushifyUrban
│ ├── BrushifyCountryRoads
│ ├── ...使用方法
- シミュレータ環境サーバーの設定
AirVLNSimulatorServerTool.py内のroot_pathに対して相対的なenv実行ファイルのパスenv_exec_path_dictを更新してください。
cd airsim_plugin
python AirVLNSimulatorServerTool.py --port 30000 --root_path /path/to/your/envs- クローズドループシミュレーションを実行する
# Dagger NYC
bash scripts/dagger_NYC.sh
Eval
bash scripts/eval.sh
bash scripts/metrics.sh論文
このプロジェクトが役立つと感じたら、次の論文を引用してください: 論文:
@misc{wang2024realisticuavvisionlanguagenavigation,
title={Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology},
author={Xiangyu Wang and Donglin Yang and Ziqin Wang and Hohin Kwan and Jinyu Chen and Wenjun Wu and Hongsheng Li and Yue Liao and Si Liu},
year={2024},
eprint={2410.07087},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2410.07087},
}謝辞
このリポジトリは一部、AirVLNおよびLLama-VIDのリポジトリを基にしています。
--- Tranlated By Open Ai Tx | Last indexed: 2026-03-21 ---