Web Analytics

ChinaTravel

⭐ 0 stars Arabic by Adopos

ChinaTravel: معيار واقعي لوكلاء اللغة في تخطيط السفر الصيني

المستودع الرسمي للشفرة الخاصة بورقة "ChinaTravel: معيار واقعي لوكلاء اللغة في تخطيط السفر الصيني".

الصفحة الرسمية الورقة العلمية مجموعة البيانات (Huggingface) المسابقة (TPC@IJCAI2025) المسابقة (TPC@AIC2025)

🏆 تحدي تخطيط السفر IJCAI 2025 (TPC@IJCAI)

يسعدنا أن نعلن أن ChinaTravel تم اختياره كمعيار رسمي لتحدي تخطيط السفر (TPC) @ IJCAI 2025!

الموقع الرسمي للمسابقة: https://chinatravel-competition.github.io/IJCAI2025/

ندعو المشاركين لتطوير وكلاء مبتكرين يمكنهم التعامل مع سيناريوهات تخطيط السفر الواقعية تحت قيود معقدة. ستستعرض هذه المسابقة أحدث الأساليب في أبحاث وكلاء اللغة.

📝 سجل التغييرات

2025.09

2025.06

2025.05

2025.04

تنفيذ خط أنابيب LLM-modulo مع محقق رمزي موثوق. استناداً إلى المنهجية من: ورقة: Robust Planning with Compound LLM Architectures: An LLM-Modulo Approach قاعدة الكود: https://github.com/Atharva-Gundawar/LLM-Modulo-prompts

🚀 بدء سريع

⚙️ الإعداد

conda create -n chinatravel python=3.9  
conda activate chinatravel  
pip install -r requirements.txt  

روابط التنزيل: Google Drive، NJU Drive

bash download_llm.sh

wget https://cdn.deepseek.com/api-docs/deepseek_v3_tokenizer.zip -P chinatravel/local_llm/
unzip chinatravel/local_llm/deepseek_v3_tokenizer.zip -d chinatravel/local_llm/

▶️ التشغيل

ندعم deepseek (واجهة برمجة التطبيقات الرسمية من deepseek)، gpt-4o (chatgpt-4o-latest)، glm4-plus، والاستدلالات المحلية باستخدام Qwen (Qwen3-8B)، llama، mistral (Mistral-7B-Instruct-v0.3)، وغيرها.

export OPENAI_API_KEY=""

python run_exp.py --splits easy --agent LLMNeSy --llm deepseek --oracle_translation python run_exp.py --splits medium --agent LLMNeSy --llm deepseek --oracle_translation python run_exp.py --splits human --agent LLMNeSy --llm deepseek --oracle_translation

python run_exp.py --splits human --agent LLMNeSy --llm Qwen3-8B --oracle_translation

python run_exp.py --splits human --agent LLMNeSy --llm deepseek python run_exp.py --splits human --agent LLMNeSy --llm Qwen3-8B

python run_exp.py --splits human --agent LLM-modulo --llm deepseek --refine_steps 10 --oracle_translation python run_exp.py --splits human --agent LLM-modulo --llm Qwen3-8B --refine_steps 10 --oracle_translation

ملاحظة:

  {
    "hard_logic_py": [
      "
      total_cost=0 
      for activity in allactivities(plan):
          total_cost+=activity_cost(activity)
              total_cost += innercity_transport_cost(activity_transports(activity))
      result=(total_cost<=1000)
      ", 
      "
      innercity_transport_set=set()
      for activity in allactivities(plan):
          if activity_transports(activity)!=[]:              
              innercity_transport_set.add(innercity_transport_type(activity_transports(activity)))
      result=(innercity_transport_set<={'taxi'})
      "
    ], 
    "hard_logic_nl": ["总预算为1800元", "市内交通选择taxi"], 
  }
  ``
  • طريقة LLM-modulo تتطلب وضع oracle_translation لعملية التحسين الرمزي الخاصة بها

📊 التقييم

bash python eval_exp.py --splits human --method LLMNeSy_deepseek_oracletranslation python eval_exp.py --splits human --method LLMNeSy_deepseek python eval_exp.py --splits human --method LLM-modulo_deepseek_10steps_oracletranslation python eval_exp.py --splits human --method LLM-modulo_Qwen3-8B_10steps_oracletranslation

في TPC@IJCAI2025، يتم توفير كود التقييم في ملف eval_tpc.py. يمكنك تشغيل كود التقييم كما يلي:

bash python eval_tpc.py --splits tpc_phase1 --method YOUR_METHOD_NAME

📚 الوثائق

البيئة القيود

🛠️ التطوير المتقدم

1. تطوير خوارزمية الوكيل الخاصة بك

لتطوير خوارزمية الوكيل الخاصة بك، عليك أن ترث فئة BaseAgent من chinatravel/agent/base.py وتضيف منطق الخوارزمية الخاصة بك إلى دالة init_agent في chinatravel/agent/load_model.py. نحن نوفر مثال وكيل فارغ يسمى TPCAgent.

الخطوات:

  • وراثة فئة BaseAgent: أنشئ ملف بايثون جديد في مجلد chinatravel/agent وعرّف فئة الوكيل الخاصة بك، وارثًا من BaseAgent.
python:chinatravel/agent/your_agent.py from .base import BaseAgent

class YourAgent(BaseAgent): def __init__(self, kwargs): super().__init__(kwargs) # Initialization logic

def act(self, observation): # Implement the decision - making logic of the agent pass


  • أضف الكود إلى دالة init_agent: افتح ملف chinatravel/agent/load_model.py وأضف الدعم لوكيلك الجديد في دالة init_agent.
python: def init_agent(kwargs): # ... existing code ... elif kwargs["method"] == "YourMethodName": agent = YourAgent( kwargs ) # ... existing code ... return agent

2. تطوير نموذج اللغة الكبير المحلي الخاص بك

لتطوير نموذج لغة كبير محلي (LLM) خاص بك، تحتاج إلى توريث فئة AbstractLLM من ملف chinatravel/agent/llms.py وإضافة كود الاستدلال الخاص بنموذج LLM المحلي في llms.py. نقدم مثالاً فارغاً لنموذج LLM باسم TPCLLM. الخطوات:

  • وراثة فئة AbstractLLM: قم بتعريف فئة نموذج LLM الخاصة بك في ملف chinatravel/agent/llms.py، وارثًا من AbstractLLM.
python class YourLLM(AbstractLLM): def __init__(self): super().__init__() # Initialization logic self.name = "YourLLMName"

def _get_response(self, messages, one_line, json_mode): # Implement the response logic of the LLM response = "Your LLM response" if json_mode: # Handle JSON mode pass elif one_line: # Handle one - line mode response = response.split("\n")[0] return response


  • أضف الكود إلى دالة init_agent: افتح ملف chinatravel/agent/load_model.py وأضف دعمًا لنموذج llm الجديد الخاص بك في دالة init_llm.
python: def init_llm(kwargs): # ... existing code ... elif llm_name == "glm4-plus": llm = YourLLM() # ... existing code ... return llm

3. تشغيل الكود باستخدام سكريبتات التجارب

بعد الانتهاء من التطوير أعلاه، يمكنك استخدام سكريبتات التجارب لتشغيل الكود الخاص بك.

مثال على التشغيل:

bash python run_tpc.py --splits easy --agent TPCAgent --llm TPCLLM python run_exp.py --splits easy --agent YourMethodName --llm YourLLMName
سيتم حفظ النتائج في دليل results/YourMethodName_YourLLMName_xxx، على سبيل المثال: results/TPCAgent_TPCLLM.

✉️ التواصل

إذا واجهتك أية مشاكل، يرجى التواصل مع جيه-جينغ شاو، بو-وين تشانغ، شياو-وين يانغ.

📌 الاقتباس

إذا كانت ورقتنا البحثية أو الموارد ذات الصلة مفيدة لأبحاثك، نرجو منك ذكرها كمصدر.

@misc{shao2024chinatravelrealworldbenchmarklanguage, title={ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning}, author={Jie-Jing Shao and Xiao-Wen Yang and Bo-Wen Zhang and Baizhi Chen and Wen-Da Wei and Guohao Cai and Zhenhua Dong and Lan-Zhe Guo and Yu-feng Li}, year={2024}, eprint={2412.13682}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2412.13682}, }
`` English | 简体中文 | 繁體中文 | 日本語 | 한국어 | हिन्दी | ไทย | Français | Deutsch | Español | Italiano | Русский | Português | Nederlands | Polski | العربية | فارسی | Türkçe | Tiếng Việt | Bahasa Indonesia | অসমীয়া

--- Tranlated By Open Ai Tx | Last indexed: 2025-10-17 ---