Contenu
Actualités
- 2025-05-22 : Nous publions UAV-Flow, le premier benchmark réel pour l'apprentissage par imitation UAV conditionné par le langage. (page du projet : https://prince687028.github.io/UAV-Flow)
- 2025-01-25 : Article, page du projet, code, données, environnements et modèles sont tous publiés.
Introduction
Ce travail présente _VERS UNE NAVIGATION VISION-LANGAGE RÉALISTE POUR UAV : PLATEFORME, BENCHMARK ET MÉTHODOLOGIE_. Nous introduisons une plateforme de simulation UAV, un benchmark VLN UAV réaliste guidé par un assistant, et une méthode basée sur MLLM pour relever les défis de la navigation vision-langage réaliste pour UAV.
Dépendances
Créer l'environnement llamauav
conda create -n llamauav python=3.10 -y
conda activate llamauav
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118Installer le modèle LLaMA-UAV
Vous pouvez suivre LLaMA-UAV pour installer les dépendances llm.
Installer les autres dépendances listées dans le fichier requirements
pip install -r requirement.txtDe plus, pour garantir la compatibilité avec l'API Python AirSim, appliquez la correction mentionnée dans le problème AirSim
Préparation
Données
Pour préparer le jeu de données, veuillez suivre les instructions fournies dans la Section Jeu de Données afin de construire le jeu de données.
Modèle
GroundingDINO
Téléchargez le modèle GroundingDINO depuis le lien groundingdino_swint_ogc.pth, et placez le fichier dans le répertoire src/model_wrapper/utils/GroundingDINO/.
LLaMA-UAV
Pour configurer le modèle, référez-vous à la Configuration du Modèle détaillée.
Environnements du simulateur
Téléchargez les environnements du simulateur pour diverses cartes depuis ici.
La structure des fichiers des environnements est la suivante :
├── carla_town_envs
│ ├── Town01
│ ├── Town02
│ ├── Town03
│ ├── ...
├── closeloop_envs
│ ├── Engine
│ ├── ModularEuropean
│ ├── ModularEuropean.sh
│ ├── ModularPark
│ ├── ModularPark.sh
│ ├── ...
├── extra_envs
│ ├── BrushifyUrban
│ ├── BrushifyCountryRoads
│ ├── ...Utilisation
- configurer le serveur d'environnement du simulateur
Mettez à jour les chemins des exécutables d'environnementenv_exec_path_dictrelatifs àroot_pathdansAirVLNSimulatorServerTool.py.
cd airsim_plugin
python AirVLNSimulatorServerTool.py --port 30000 --root_path /path/to/your/envs
- exécuter une simulation en boucle fermée
# Dagger NYC
bash scripts/dagger_NYC.sh
Eval
bash scripts/eval.sh
bash scripts/metrics.shArticle
Si vous trouvez ce projet utile, veuillez envisager de citer : article :
@misc{wang2024realisticuavvisionlanguagenavigation,
title={Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology},
author={Xiangyu Wang and Donglin Yang and Ziqin Wang and Hohin Kwan and Jinyu Chen and Wenjun Wu and Hongsheng Li and Yue Liao and Si Liu},
year={2024},
eprint={2410.07087},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2410.07087},
}Remerciements
Ce dépôt est en partie basé sur les dépôts AirVLN et LLaMA-VID.
--- Tranlated By Open Ai Tx | Last indexed: 2026-03-21 ---