Web Analytics

TravelUAV

⭐ 214 stars Japanese by prince687028

現実的なUAVビジョン・言語ナビゲーションに向けて:プラットフォーム、ベンチマーク、および方法論

Paper PDF Project Page

目次

ニュース

はじめに

本研究は、_現実的なUAVビジョン・言語ナビゲーションに向けて:プラットフォーム、ベンチマーク、および方法論_を提案します。UAVシミュレーションプラットフォーム、アシスタントガイドによる現実的なUAV VLNベンチマーク、ならびに現実的なUAVビジョン・言語ナビゲーションの課題に対処するMLLMベースの手法を紹介します。

依存関係

llamauav環境の作成

conda create -n llamauav python=3.10 -y
conda activate llamauav
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118

LLaMA-UAVモデルのインストール

こちらのLLaMA-UAVを参照してllmの依存関係をインストールできます。

requirementsファイルに記載されているその他の依存関係をインストールする

pip install -r requirement.txt
さらに、AirSimのPython APIとの互換性を確保するために、AirSim issueで言及されている修正を適用してください。

準備

データ

データセットを準備するには、Dataset セクションに記載された指示に従ってデータセットを構築してください。

モデル

GroundingDINO

GroundingDINOモデルは、groundingdino_swint_ogc.pthからダウンロードし、ファイルを src/model_wrapper/utils/GroundingDINO/ ディレクトリに配置してください。

LLaMA-UAV

モデルのセットアップについては、詳細なModel Setupを参照してください。

シミュレータ環境

様々なマップ用のシミュレータ環境はこちらからダウンロードしてください。

環境のファイルディレクトリは以下の通りです:

├── carla_town_envs
│   ├── Town01
│   ├── Town02
│   ├── Town03
│   ├── ...
├── closeloop_envs
│   ├── Engine
│   ├── ModularEuropean
│   ├── ModularEuropean.sh
│   ├── ModularPark
│   ├── ModularPark.sh
│   ├── ...
├── extra_envs
│   ├── BrushifyUrban
│   ├── BrushifyCountryRoads
│   ├── ...

使用方法

シミュレーションを実行する前に、AirSim環境サーバーが適切に設定されていることを確認してください。

AirVLNSimulatorServerTool.py内のroot_pathに対して相対的なenv実行ファイルのパスenv_exec_path_dictを更新してください。

cd airsim_plugin
python AirVLNSimulatorServerTool.py --port 30000 --root_path /path/to/your/envs

シミュレータサーバーが起動している場合、daggerまたは評価スクリプトを実行できます。

# Dagger NYC
bash scripts/dagger_NYC.sh

Eval

bash scripts/eval.sh bash scripts/metrics.sh

論文

このプロジェクトが役立つと感じたら、次の論文を引用してください: 論文:

@misc{wang2024realisticuavvisionlanguagenavigation,
      title={Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology},
      author={Xiangyu Wang and Donglin Yang and Ziqin Wang and Hohin Kwan and Jinyu Chen and Wenjun Wu and Hongsheng Li and Yue Liao and Si Liu},
      year={2024},
      eprint={2410.07087},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2410.07087},
}

謝辞

このリポジトリは一部、AirVLNおよびLLama-VIDのリポジトリを基にしています。

--- Tranlated By Open Ai Tx | Last indexed: 2026-03-21 ---