Web Analytics

proxyless-llm-websearch

⭐ 122 stars Hindi by itshyao

🌐 भाषा

🧠 बिना प्रॉक्सी के LLM वेब खोज इंजन

एक बिना प्रॉक्सी के मल्टी-सर्च इंजन LLM वेब रिट्रीवल टूल, जो URL सामग्री विश्लेषण और वेब क्रॉलिंग को सपोर्ट करता है, LangGraph और LangGraph-MCP को जोड़कर मॉड्यूलर एजेंट लिंक बनाता है। यह बड़े भाषा मॉडल के बाहरी ज्ञान कॉलिंग के लिए डिज़ाइन किया गया है, Playwright + Crawl4AI वेब प्राप्ति और विश्लेषण को सपोर्ट करता है, असिंक क्रॉनकरेंसी, कंटेंट स्लाइसिंग और री-रैंकिंग फ़िल्टरिंग को सपोर्ट करता है।

🚀 अद्यतन लॉग

✨ फीचर झलक

workflow

framework

⚡ तेज़ शुरुआत

रिपॉजिटरी क्लोन करें

git clone https://github.com/itshyao/proxyless-llm-websearch.git
cd proxyless-llm-websearch

निर्भरता स्थापित करें

pip install -r requirements.txt
python -m playwright install

पर्यावरण वेरिएबल कॉन्फ़िगरेशन

# 百炼llm
OPENAI_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
OPENAI_API_KEY=sk-xxx
MODEL_NAME=qwen-plus-latest

百炼embedding

EMBEDDING_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1 EMBEDDING_API_KEY=sk-xxx EMBEDDING_MODEL_NAME=text-embedding-v4

百炼reranker

RERANK_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1 RERANK_API_KEY=sk-xxx RERANK_MODEL=gte-rerank-v2

लैंगग्राफ-एजेंट

#### डेमो

python agent/demo.py

#### एपीआई सेवा

python agent/api_serve.py

import requests

url = "http://localhost:8800/search"

data = { "question": "广州今日天气", "engine": "bing", "split": { "chunk_size": 512, "chunk_overlap": 128 }, "rerank": { "top_k": 5 } }

try: response = requests.post( url, json=data )

if response.status_code == 200: print("✅ 请求成功!") print("响应内容:", response.json()) else: print(f"❌ 请求失败,状态码:{response.status_code}") print("错误信息:", response.text)

except requests.exceptions.RequestException as e: print(f"⚠️ 请求异常:{str(e)}")

#### ग्रैडियो

python agent/gradio_demo.py

gradio

gradio

#### docker

docker-compose -f docker-compose-ag.yml up -d --build

Langgrph-MCP

#### MCP सेवा प्रारंभ करें

python mcp/websearch.py

#### डेमो

python mcp/demo.py

#### एपीआई सेवा

python mcp/api_serve.py

import requests

url = "http://localhost:8800/search"

data = { "question": "广州今日天气" }

try: response = requests.post( url, json=data )

if response.status_code == 200: print("✅ 请求成功!") print("响应内容:", response.json()) else: print(f"❌ 请求失败,状态码:{response.status_code}") print("错误信息:", response.text)

except requests.exceptions.RequestException as e: print(f"⚠️ 请求异常:{str(e)}")

#### डॉकर

docker-compose -f docker-compose-mcp.yml up -d --build

कस्टम मॉड्यूल

#### कस्टम ब्लॉकिंग

from typing import Optional, List

class YourSplitter: def __init__(self, text: str, chunk_size: int = 512, chunk_overlap: int = 128): self.text = text self.chunk_size = chunk_size self.chunk_overlap = chunk_overlap

def split_text(self, text: Optional[str] = None) -> List: # TODO: implement splitting logic return ["your chunk"]

#### कस्टम पुनः क्रमबद्धीकरण

from typing import List, Union, Tuple

class YourReranker: async def get_reranked_documents( self, query: Union[str, List[str]], documents: List[str], ) -> Union[ Tuple[List[str]], Tuple[List[int]], ]: return ["your chunk"], ["chunk index"]

🔍 ऑनलाइन नेटवर्क खोज परीक्षण की तुलना

हमने परियोजना की तुलना कुछ प्रमुख ऑनलाइन API से की, और जटिल समस्याओं पर इसके प्रदर्शन का मूल्यांकन किया।

🔥 डेटा सेट

🧑‍🏫 तुलना परिणाम

| खोज इंजन/सिस्टम | ✅ सही | ❌ गलत | ⚠️ आंशिक रूप से सही | | -------------- | --------- | ----------- | ------------------- | | हुओशान फांगझोउ | 5.00% | 72.21% | 22.79% | | बाईलियन | 9.85% | 62.79% | 27.35% | | हमारा | 19.85% | 47.94% | 32.06% |

🙏 आभार

इस परियोजना की कुछ कार्यक्षमताएँ निम्नलिखित ओपन सोर्स परियोजनाओं के समर्थन और प्रेरणा से मिली हैं, इसके लिए विशेष धन्यवाद:

--- Tranlated By Open Ai Tx | Last indexed: 2025-09-08 ---