목차
소식
- 2025-05-22: 언어 조건 기반 UAV 모방 학습을 위한 최초의 실제 벤치마크 UAV-Flow를 공개합니다. (프로젝트 페이지: https://prince687028.github.io/UAV-Flow)
- 2025-01-25: 논문, 프로젝트 페이지, 코드, 데이터, 환경 및 모델 모두 공개되었습니다.
소개
본 연구는 _현실적인 UAV 비전-언어 내비게이션을 향하여: 플랫폼, 벤치마크 및 방법론_을 제시합니다. UAV 시뮬레이션 플랫폼, 보조자 안내 현실적 UAV VLN 벤치마크, 그리고 현실적인 UAV 비전-언어 내비게이션의 도전을 해결하기 위한 MLLM 기반 방법을 소개합니다.
종속성
llamauav 환경 생성하기
conda create -n llamauav python=3.10 -y
conda activate llamauav
pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118
LLaMA-UAV 모델 설치
다음 링크 LLaMA-UAV를 따라 llm 종속성을 설치할 수 있습니다.
요구 사항 파일에 나열된 기타 종속성 설치
pip install -r requirement.txt
또한 AirSim Python API와의 호환성을 보장하기 위해 AirSim 이슈에서 언급된 수정 사항을 적용하십시오.준비
데이터
데이터셋을 준비하려면 데이터셋 섹션에 제공된 지침을 따라 데이터셋을 구축하십시오.
모델
GroundingDINO
GroundingDINO 모델을 groundingdino_swint_ogc.pth 링크에서 다운로드하고, 파일을 src/model_wrapper/utils/GroundingDINO/ 디렉터리에 배치하십시오.
LLaMA-UAV
모델 설정에 대해서는 자세한 모델 설정을 참조하십시오.
시뮬레이터 환경
다양한 맵에 대한 시뮬레이터 환경은 여기에서 다운로드하십시오.
환경 파일 디렉터리는 다음과 같습니다:
├── carla_town_envs
│ ├── Town01
│ ├── Town02
│ ├── Town03
│ ├── ...
├── closeloop_envs
│ ├── Engine
│ ├── ModularEuropean
│ ├── ModularEuropean.sh
│ ├── ModularPark
│ ├── ModularPark.sh
│ ├── ...
├── extra_envs
│ ├── BrushifyUrban
│ ├── BrushifyCountryRoads
│ ├── ...사용법
- 시뮬레이터 환경 서버 설정
AirVLNSimulatorServerTool.py에서root_path에 상대적인 env 실행 파일 경로env_exec_path_dict를 업데이트하십시오.
cd airsim_plugin
python AirVLNSimulatorServerTool.py --port 30000 --root_path /path/to/your/envs
- 클로즈 루프 시뮬레이션 실행
# Dagger NYC
bash scripts/dagger_NYC.sh
Eval
bash scripts/eval.sh
bash scripts/metrics.sh논문
이 프로젝트가 유용하다면, 다음 논문을 인용해 주시기 바랍니다: paper:
@misc{wang2024realisticuavvisionlanguagenavigation,
title={Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology},
author={Xiangyu Wang and Donglin Yang and Ziqin Wang and Hohin Kwan and Jinyu Chen and Wenjun Wu and Hongsheng Li and Yue Liao and Si Liu},
year={2024},
eprint={2410.07087},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2410.07087},
}감사의 글
이 저장소는 부분적으로 AirVLN 및 LLaMA-VID 저장소를 기반으로 합니다.
--- Tranlated By Open Ai Tx | Last indexed: 2026-03-21 ---