Web Analytics

TravelUAV

⭐ 214 stars French by prince687028

Vers une navigation vision-langage réaliste pour UAV : Plateforme, Benchmark et Méthodologie

Paper PDF Project Page

Contenu

Actualités

Introduction

Ce travail présente _VERS UNE NAVIGATION VISION-LANGAGE RÉALISTE POUR UAV : PLATEFORME, BENCHMARK ET MÉTHODOLOGIE_. Nous introduisons une plateforme de simulation UAV, un benchmark VLN UAV réaliste guidé par un assistant, et une méthode basée sur MLLM pour relever les défis de la navigation vision-langage réaliste pour UAV.

Dépendances

Créer l'environnement llamauav

conda create -n llamauav python=3.10 -y
conda activate llamauav
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118

Installer le modèle LLaMA-UAV

Vous pouvez suivre LLaMA-UAV pour installer les dépendances llm.

Installer les autres dépendances listées dans le fichier requirements

pip install -r requirement.txt

De plus, pour garantir la compatibilité avec l'API Python AirSim, appliquez la correction mentionnée dans le problème AirSim

Préparation

Données

Pour préparer le jeu de données, veuillez suivre les instructions fournies dans la Section Jeu de Données afin de construire le jeu de données.

Modèle

GroundingDINO

Téléchargez le modèle GroundingDINO depuis le lien groundingdino_swint_ogc.pth, et placez le fichier dans le répertoire src/model_wrapper/utils/GroundingDINO/.

LLaMA-UAV

Pour configurer le modèle, référez-vous à la Configuration du Modèle détaillée.

Environnements du simulateur

Téléchargez les environnements du simulateur pour diverses cartes depuis ici.

La structure des fichiers des environnements est la suivante :

├── carla_town_envs
│   ├── Town01
│   ├── Town02
│   ├── Town03
│   ├── ...
├── closeloop_envs
│   ├── Engine
│   ├── ModularEuropean
│   ├── ModularEuropean.sh
│   ├── ModularPark
│   ├── ModularPark.sh
│   ├── ...
├── extra_envs
│   ├── BrushifyUrban
│   ├── BrushifyCountryRoads
│   ├── ...

Utilisation

Avant d'exécuter les simulations, assurez-vous que le serveur d'environnement AirSim est correctement configuré.

Mettez à jour les chemins des exécutables d'environnement env_exec_path_dict relatifs à root_path dans AirVLNSimulatorServerTool.py.

cd airsim_plugin
python AirVLNSimulatorServerTool.py --port 30000 --root_path /path/to/your/envs
Une fois que le serveur du simulateur est en fonctionnement, vous pouvez exécuter le script dagger ou d’évaluation.

# Dagger NYC
bash scripts/dagger_NYC.sh

Eval

bash scripts/eval.sh bash scripts/metrics.sh

Article

Si vous trouvez ce projet utile, veuillez envisager de citer : article :

@misc{wang2024realisticuavvisionlanguagenavigation,
      title={Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology},
      author={Xiangyu Wang and Donglin Yang and Ziqin Wang and Hohin Kwan and Jinyu Chen and Wenjun Wu and Hongsheng Li and Yue Liao and Si Liu},
      year={2024},
      eprint={2410.07087},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2410.07087},
}

Remerciements

Ce dépôt est en partie basé sur les dépôts AirVLN et LLaMA-VID.

--- Tranlated By Open Ai Tx | Last indexed: 2026-03-21 ---