Web Analytics

proxyless-llm-websearch

⭐ 122 stars Assamese by itshyao

🌐 ভাষা

🧠 প্ৰক্সি নোহোৱা LLM ৱেব অনুসন্ধান ইঞ্জিন

এটা প্ৰক্সি নোহোৱা বহুবিধ অনুসন্ধান ইঞ্জিন LLM ৱেব অনুসন্ধান সঁজুলি, যি URL সমল বিশ্লেষণ আৰু ৱেবপৃষ্ঠা স্ক্ৰলিং সমৰ্থন কৰে, LangGraph আৰু LangGraph-MCP-ৰ সংযোগে মডুলাৰ ইন্টেলিজেন্ট চেইন ব্যৱস্থা প্ৰদান কৰে। বৃহৎ ভাষা মডেলৰ বাহ্যিক জ্ঞান আহৰণৰ ক্ষেত্ৰত ব্যৱহাৰৰ বাবে বিশেষ ৰূপে ডিজাইন কৰা, Playwright + Crawl4AI-ৰ সহায়ত ৱেব সমল আহৰণ আৰু বিশ্লেষণ সমৰ্থন কৰে, একেসময়ত একাধিক অনুৰোধ, সমল টুকুৰা আৰু পুনঃবিন্যাস ফিল্টাৰ সমৰ্থন কৰে।

🚀 আপডেট লগ

✨ বৈশিষ্ট্যৰ সংক্ষিপ্ত তালিকা

workflow

framework

⚡ তৎকাল আৰম্ভণি

ৰিপজিটৰি ক্লোন কৰক

git clone https://github.com/itshyao/proxyless-llm-websearch.git
cd proxyless-llm-websearch

নিৰ্ভৰশীলতা স্থাপন কৰক

pip install -r requirements.txt
python -m playwright install

পৰিৱেশ পৰিৱৰ্তনশীল সংৰূপণ

# 百炼llm
OPENAI_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
OPENAI_API_KEY=sk-xxx
MODEL_NAME=qwen-plus-latest

百炼embedding

EMBEDDING_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1 EMBEDDING_API_KEY=sk-xxx EMBEDDING_MODEL_NAME=text-embedding-v4

百炼reranker

RERANK_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1 RERANK_API_KEY=sk-xxx RERANK_MODEL=gte-rerank-v2

Langgraph-এজেন্ট

#### ডেম’

python agent/demo.py

#### API SERVE

python agent/api_serve.py

import requests

url = "http://localhost:8800/search"

data = { "question": "广州今日天气", "engine": "bing", "split": { "chunk_size": 512, "chunk_overlap": 128 }, "rerank": { "top_k": 5 } }

try: response = requests.post( url, json=data )

if response.status_code == 200: print("✅ 请求成功!") print("响应内容:", response.json()) else: print(f"❌ 请求失败,状态码:{response.status_code}") print("错误信息:", response.text)

except requests.exceptions.RequestException as e: print(f"⚠️ 请求异常:{str(e)}")

#### গ্ৰাডিঅ’

python agent/gradio_demo.py

gradio

gradio

#### docker

docker-compose -f docker-compose-ag.yml up -d --build

Langgrph-MCP

#### MCP সেৱা আৰম্ভ কৰক

python mcp/websearch.py

#### ডেম'

python mcp/demo.py

#### API SERVE

python mcp/api_serve.py

import requests

url = "http://localhost:8800/search"

data = { "question": "广州今日天气" }

try: response = requests.post( url, json=data )

if response.status_code == 200: print("✅ 请求成功!") print("响应内容:", response.json()) else: print(f"❌ 请求失败,状态码:{response.status_code}") print("错误信息:", response.text)

except requests.exceptions.RequestException as e: print(f"⚠️ 请求异常:{str(e)}")

#### ডকৰ

docker-compose -f docker-compose-mcp.yml up -d --build

কাষ্টম মডিউল

#### কাষ্টম ব্লক বিভাজন

from typing import Optional, List

class YourSplitter: def __init__(self, text: str, chunk_size: int = 512, chunk_overlap: int = 128): self.text = text self.chunk_size = chunk_size self.chunk_overlap = chunk_overlap

def split_text(self, text: Optional[str] = None) -> List: # TODO: implement splitting logic return ["your chunk"]

#### কাষ্টম পুনৰ-বিন্যাস

from typing import List, Union, Tuple

class YourReranker: async def get_reranked_documents( self, query: Union[str, List[str]], documents: List[str], ) -> Union[ Tuple[List[str]], Tuple[List[int]], ]: return ["your chunk"], ["chunk index"]

🔍 অনলাইন নেটৱৰ্ক সন্ধান পৰীক্ষাৰ সৈতে তুলনা

আমাৰো প্ৰকল্পক কিছুমান মুখ্য অনলাইন API ৰ সৈতে তুলনা কৰা হৈছে, আৰু ইয়াৰ জটিল সমস্যাৰ ক্ষেত্ৰত কাৰ্যক্ষমতা মূল্যায়ন কৰা হৈছে।

🔥 ডেটাচেট

🧑‍🏫 তুলনাৰ ফলাফল

| সন্ধান ইঞ্জিন/চিস্টেম | ✅ সঠিক | ❌ ভুল | ⚠️ আংশিক সঠিক | | --------------------- | ------- | ------ | -------------- | | ভলকান আর্ক | ৫.০০% | ৭২.২১% | ২২.৭৯% | | বৈলিয়ান | ৯.৮৫% | ৬২.৭৯% | ২৭.৩৫% | | আমাৰ | ১৯.৮৫% | ৪৭.৯৪% | ৩২.০৬% |

🙏 কৃতজ্ঞতা

এই প্ৰকল্পৰ কিছু ফিচাৰ তলত উল্লেখ কৰা কিছুমান মুক্ত উৎস প্ৰকল্পৰ সহায় আৰু অনুপ্ৰেৰণা ৰ পৰা লাভ হৈছে, তাৰ বাবে কৃতজ্ঞতা জ্ঞাপন।

--- Tranlated By Open Ai Tx | Last indexed: 2025-09-08 ---