Web Analytics

TAPIP3D

⭐ 369 stars Simplified Chinese by zbw001

TAPIP3D:在持久三维几何中跟踪任意点

arXiv Project Page

Bowei Zhang1,2, Lei Ke1\, Adam W. Harley3, Katerina Fragkiadaki1

1卡内基梅隆大学   2北京大学   3斯坦福大学

NeurIPS 2025

\* 贡献相同

TAPIP3D overview


🚀 新闻

概述

TAPIP3D 是一种用于单目 RGB 和 RGB-D 视频序列的长期前馈三维点跟踪方法。它引入了一种三维特征云表示,将图像特征提升到持久的世界坐标空间,抵消相机运动,实现跨帧的精确轨迹估计。

我们提供了 TAPIP3D 的详细视频演示

安装

安装依赖

conda create -n tapip3d python=3.10
conda activate tapip3d

pip install torch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 "xformers>=0.0.27" --index-url https://download.pytorch.org/whl/cu124 pip install torch-scatter -f https://data.pyg.org/whl/torch-2.4.1+cu124.html pip install -r requirements.txt

cd third_party/pointops2
LIBRARY_PATH=$CONDA_PREFIX/lib:$LIBRARY_PATH python setup.py install
cd ../..

cd third_party/megasam/base
LIBRARY_PATH=$CONDA_PREFIX/lib:$LIBRARY_PATH python setup.py install
cd ../../..

下载检查点

下载我们的 TAPIP3D 模型检查点这里checkpoints/tapip3d_final.pth

如果你想在单目视频上运行 TAPIP3D,你需要手动准备以下检查点以运行 MegaSAM:

此外,MoGeUniDepth 的检查点将在运行演示时自动下载。请确保你的网络连接正常。

演示用法

我们提供了一个简单的演示脚本 inference.py,以及位于 demo_inputs/ 目录中的示例输入数据。

该脚本接受 .mp4 视频文件或 .npz 文件作为输入。如果提供 .npz 文件,格式应如下:

为了演示,脚本在第一帧使用了一个 32x32 的点网格作为查询点。

使用单目视频推理

通过提供视频作为 --input_path,脚本首先运行带有 MoGeMegaSAM 来估计深度图和相机参数。随后,模型将在全局框架内处理这些输入。

演示 1

Demo 1

运行推理:

python inference.py --input_path demo_inputs/sheep.mp4 --checkpoint checkpoints/tapip3d_final.pth --resolution_factor 2

一个 npz 文件将被保存到 outputs/inference/。要可视化结果:

python visualize.py 

Demo 2

Demo 2

python inference.py --input_path demo_inputs/pstudio.mp4 --checkpoint checkpoints/tapip3d_final.pth --resolution_factor 2

已知深度和相机参数的推理

如果提供包含所有四个键(rgbdepthsintrinsicsextrinsics)的 .npz 文件,模型将在对齐的全局坐标系中运行,生成世界坐标下的点轨迹。 我们在这里提供了一个示例 .npz 文件,请将其放置于 demo_inputs/ 目录下。

演示 3

Demo 3

python inference.py --input_path demo_inputs/dexycb.npz --checkpoint checkpoints/tapip3d_final.pth --resolution_factor 2

训练与评估

1. 数据集准备

请参考 DATASET.md 了解训练和评估数据集的准备说明。

2. 训练

开始训练,请运行:
bash scripts/train.sh

3. 评估

要评估一个检查点,请运行:
bash scripts/eval.sh
您可以通过修改 scripts/eval.sh 中的 checkpoint 变量来指定要评估的模型。

引用

如果您觉得本项目有用,请考虑引用:

@article{tapip3d,
  title={TAPIP3D: Tracking Any Point in Persistent 3D Geometry},
  author={Zhang, Bowei and Ke, Lei and Harley, Adam W and Fragkiadaki, Katerina},
  journal={arXiv preprint arXiv:2504.14717},
  year={2025}
}

--- Tranlated By Open Ai Tx | Last indexed: 2026-02-12 ---