ÈçºÎÑµÁ·AI¡¾ÐüÉÍ¡¿,AI½ûÇø£¨ÐüÉÍ£©,±à³ÌÓïÑÔ×¨Çø,ÓãCÂÛÌ³

Ð¡Ñ¼²»Ñ§Ï° ·¢±íÓÚ 2025-8-19 20:24:47

ÈçºÎÑµÁ·AI¡¾ÐüÉÍ¡¿

ÓÐ´óÀÐÄÜ½ÌÎÒÈçºÎÑµÁ·×Ô¶¯ÅÀ³æ+DeepSeek»òchatgpt½Ó¿ÚÑ¸ËÙ·ÖÎöµÄAIÂï

Ä¿Ç°µÈ¼¶±È½ÏµÍËùÒÔÃ»·¨¸øÌ«¶àÓý±Ì£¬Ö»ÄÜ10¸ö£¬µ«ÊÇÈç¹û°ÑÎÒ½Ì»áÁË¿Ï¶¨¸øÄã²¹Âú100Óã±Ò£¬ÄÜÕÒ¹ÜÀíÔ±×÷Ö¤
ÒªÎªÏÂ¸öÔÂµÄ´óÈü×ö×¼±¸£¬µ½Ê±ºòÌâÄ¿²»È·¶¨£¬µ«ÊÇ²î²»¶àÀàËÆµÄ£¬Ò²Ã»ÕÒµ½ÄÜ½ÌÃ÷°×ÎÒµÄÈË{:10_266:}

Ö÷ÒªÄ¿±êÊÇÉè¼ÆÒ»¸öÍ¼ÐÎ»¯³ÌÐò£¬ÄÜ¹»´ÓÑÇÂíÑ·£¬shoppeeºÍÌÔ±¦Èý¸öÆ½Ì¨ÉÏ£¬ÅÀ³æ»ñÈ¡ÈÎºÎÆìÏÂµÄÈÎºÎÉÌÆ·µÄ£¬ÔÚÈýÄêÄÚÈÎÒâÔÂ·ÝµÄËùÓÐ¹ººóÆÀÂÛ£¬È»ºó¶ÔÆÀÂÛ½øÐÐ·ÖÀà£¬´ò¸ö±È·½£¬°´ÕÕ¾¼ÃÑ§µÄ»ù±¾±£½¡ÒòËØ£¨²úÆ·ÖÊÁ¿£¬ÎïÁ÷Ê±Ð§£¬°ü×°ÍêºÃÐÔ£¬Æ½Ì¨/Ö§¸¶°²È«¸Ð£©£¬ÆÚÍûÀà¹¦ÄÜÐÔÐèÇó£¨¼Û¸ñÓëÐÔ¼Û±È£¬ÊÛºóÓë¿Í·þÏìÓ¦£¬Ê¹ÓÃ±ãÀû¶È£¬±ÈÈçËµÃ÷ÊéºÃ²»ºÃÀí½âÉ¶µÄ£©

È»ºó¸øÉÌ¼Ò10¸öÒÔÄÚµÄÓÅ»¯½¨Òé£¨¾ÍÊÇ·ÖÎö×ÛºÏÎÊÌâ£©
ÕâÆÚ¼ä¾ÍÃâ²»ÁËÒª´ÓºÜ¶à´¿ÊôÐ¹·ß£¬Íæ¹£ºÍ¾ÍËµÒ»¸öÊ²Ã´Ê²Ã´ºÜ²î£¬µÄÆÀÂÛÀïÌø³öÀ´ÓÐÒâÒåµÄ¶«Î÷£¬ËùÒÔ¾ÍÒªÓÃµ½AI»úÆ÷Ñ§Ï°¡£
¶øÇÒËÑË÷Òª¾«×¼£¬ÑÇÂíÑ·Æ½Ì¨Î¬»¤µÄ±È½ÏºÃ»ù±¾¶¼ÊÇÕý°æ£¬µ«ÊÇÌÔ±¦ÉÏ¾ÍÓÐºÜ¶à¶þÊÖ··×ÓÁË£¬ÄÇ¸ö¾ÍÒª±Ü¿ª£¬Ö»ÒªÆì½¢µêºÍ¹Ù·½µê¡£

ÎÒÄ¿Ç°×¼±¸ÁËÑÇÂíÑ·£¬shoppeeºÍÌÔ±¦Ã¿¸öÆ½Ì¨300ÍòÌõÆÀÂÛ×÷ÎªÑµÁ·¼¯ºÍ²âÊÔ¼¯¡£¶¼ÊÇ´ÓkaggleºÍgithubÉÏÕÒµ½µÄ£¬ÀíÂÛÉÏ½²Ã»Ê²Ã´ÎÊÌâ¡£
¾ÍÊÇ²»ÖªµÀ½ÓÏÂÀ´ÔõÃ´Êµ²Ù£¨ÎÒÑ§ÀíÂÛ¿Î³ÌÒÔÀ´Õâ»ØÊÇµÚÒ»´ÎÊµ²Ù£©¡£

ÊµÏÖ·½·¨Òª±àÐ´Ò»¸öÍ¼ÐÎ»¯³ÌÐò£¬ÓÐ¼¸¸öÑ¯ÎÊ¿ò
µÚÒ»¸öÊÇÎÊÄãËÑÄÇ¸ö¹«Ë¾£¬Æ·ÅÆ»òÕß¼¯ÍÅµÄ£¬±ÈÈç´ó½®ÎÞÈË»ú»òÕßÆ»¹û
µÚ¶þ¸öÊÇÎÊÄãÏëÒªËÑµÄÆ·Àà»òÕßÆ·Ãû£¬±ÈÈçÆ»¹û16promax£¬´ó½®µÚÎå´úÄÜ´ÓË®ÀïÆð·ÉÄÇ¸ö£¨ÎÒÒ²²»ÖªµÀ½ÐÉ¶
µÚÈý¸öÊÇÎÊÄãÏëËÑÄÄ¸öÆ½Ì¨£¬Ö»ÄÜÉÏÃæÄÇÈý¸öÑ¡£¬»òÕß¶¼Ñ¡£¬ÆäËûµÄ¾©¶«É¶µÄÄÇ¾Í²»ÐÐ
µÚËÄ¸öÊÇÎÊÄãÊ±¼ä·¶Î§£¬ÈýÄêÄÚËæ±ãÄãÑ¡£¬±ÈÈç6¸öÔÂÄÚµÄ£¬2¸öÔÂÄÚµÄ£¬»òÕßÒ²¿ÉÒÔÖ¸¶¨Ê±¼ä£¬±ÈÈçÈýÄêÄÚÄ³Ò»ÄêµÄ¼¸ÔÂµ½¼¸ÔÂ£¬±ÈÈç£¨2024.6.7 - 2025.8.9£©¾«È·µ½ÈÕµÄÄÇÖÖ£¨Õâ¸öÓ¦¸Ã²»ÄÑ£¬¾«È·µ½Ð¡Ê±µ½·ÖÖÓÓ¦¸Ã¶¼Ã»É¶ÎÊÌâ

È»ºó¿ªÊ¼ÅÀ³æËÑË÷£¬ËÑÍêÒÔºó°´ÕÕÎÒÃÇÊÂÏÈÑµÁ·ºÃµÄAIÀ´·ÖÎö´¦Àí£¨Õâ¸öÎÒ²»È·¶¨ÊÇ·ñ»¹ÒªÍâ½ÓÒ»¸öchatgpt»òÕßdeepseekÁË£¬»¹ÊÇËµÒª×Ô¼ºÊÖ´êÒ»¸öAI£¬·´ÕýÎÒÒ²ÓÐÑµÁ·¼¯ºÍ²âÊÔ¼¯£©

deepseek×¨Òµ°æ±¾ÍÅ¶Ó°æ±¾ÂúÅäµÄ½Ó¿ÚÎÒÄÃµ½ÁË£¬Õâ¸ö²»ÐèÒªµ£ÐÄ£¬±ÈÈü·þÕËºÅ£¬¿ªÈüÇ°Ò»¸öÔÂµ½¿ªÈüºó3Ìì¶¼¿ÉÒÔÊ¹ÓÃ£¬ÓÃÀ´Á·Ï°Ê²Ã´µÄ

Ïë¿´¿´ÓÐÃ»ÓÐ´óÀÐÄÜ½Ì½ÌÎÒÔõÃ´¾ßÌåÊµÏÖ£¬´ø´øÎÒ×öµÚÒ»´ÎÊµ²Ù£¨ËäÈ»ÌâÄ¿ÊÇÎÒ×Ô¼º±àµÄºÍÊµ¼Ê±ÈÈü¹À¼ÆÓÐ²»Ð¡²î±ð£©
Ê²Ã´Êý¾ÝÇåÏ´Í¶Î¹ÅÀ³æ£¨ÅÀ³æ»¹µÃÐ¡ÐÄµã±ðip¸ø·âÁË

²»¶þÈçÊÇ ·¢±íÓÚ 2025-8-19 20:24:48

Ð¡Ñ¼²»Ñ§Ï° ·¢±íÓÚ 2025-8-20 19:45
°´ÕÕÄãËµµÄ£¬Êý¾ÝÏ´ÍêÁË£¬È»ºó¸Õ¸Õ°Ñ×ÖµäÊ²Ã´µÄÌí¼Ó½øÀ´£¬¾ÍÊÇ×ÖµäÌ«ÉÙÁË£¬Ö»ÓÐ32kbµÄ¹Ø¼ü´Ê¼ìË÷£¬²»ÖªµÀ ...

1) DeepSeek ½Ó¿Ú¡ª¡ª×î¶ÌÂ·¾¶Èý²½×ß

Step A. °²×°ÓëÃÜÔ¿

pip install openai
# mac/linux
export DEEPSEEK_API_KEY="ÄãµÄÃÜÔ¿"
# windows (PowerShell)
setx DEEPSEEK_API_KEY "ÄãµÄÃÜÔ¿"

Step B. »ù±¾µ÷ÓÃ£¨ÓÃOpenAI SDK£¬¸Ä base_url ¼´¿É£©

»ù´¡ÓòÃû£ºhttps://api.deepseek.com

Ä£ÐÍÃû£ºdeepseek-chat£¨V3£©£¬»ò deepseek-reasoner£¨R1£©

Chat Completions Â·¾¶£º/chat/completions

ÈÏÖ¤£ºHTTP Bearer£¨Authorization: Bearer <key>£©

¹Ù·½ÎÄµµÃ÷È·Ö§³ÖÉÏÊö·½Ê½£¬²¢Ìá¹©PythonÊ¾Àý¡£

from openai import OpenAI
import os
client = OpenAI(api_key=os.getenv("DEEPSEEK_API_KEY"),
            base_url="https://api.deepseek.com")
resp = client.chat.completions.create(
model="deepseek-chat",
messages=[
   {"role":"system","content":"You are a helpful assistant."},
   {"role":"user","content":"ping"}
],
stream=False
)
print(resp.choices.message.content)

Step C. ½á¹¹»¯Êä³ö£¨JSONÄ£Ê½£©

°Ñ response_format={"type":"json_object"} ´ò¿ª£¬²¢ÔÚÌáÊ¾ÀïÃ÷È·¡°Ö»Êä³öºÏ·¨JSON¡±£¬DeepSeekÎÄµµ×¨ÃÅÇ¿µ÷ÒªÔÚÌáÊ¾Àï°üº¬¡°json¡±¼°Êä³öÊ¾Àý¡£

2) °Ñ DeepSeek ½Óµ½ÄãÏÖÓÐ Starter£¨Ö±½ÓÕ³Ìù£©

ÔÚÄãµÄÏîÄ¿Àï£¬°Ñcore/classify.pyÀïµÄ llm_classify ÓÃÏÂÃæ°æ±¾Ìæ»»/²¹ÉÏ£¨ÎÞÐè¸Ä¶¯UI£©£º

# core/classify.py ÖÐ¼ÓÈë/Ìæ»»
import os, json, time
from typing import List, Dict
from openai import OpenAI
from .taxonomy import TAXONOMY

def _batched(seq, n):
for i in range(0, len(seq), n):
   yield seq

def llm_classify(rows: List,
            model: str = "deepseek-chat",
            batch_size: int = 40,
            temperature: float = 0.0,
            max_tokens: int = 1500,
            retries: int = 3,
            sleep_s: float = 2.0) -> List:
"""
ÓÃ DeepSeek ¶ÔÆÀÂÛ×ö¶à±êÇ©·ÖÀà + ¸ºÃæÅÐ¶Ï¡£
ÊäÈë rows µÄ×Ö¶ÎÖÁÉÙ°üº¬£ºreview_text, seller, store_type
Êä³ö×Ö¶Î¶ÔÆë classify_batch£ºlabels / is_negative / (¿ÉÑ¡ is_official)
"""
client = OpenAI(api_key=os.getenv("DEEPSEEK_API_KEY"),
               base_url="https://api.deepseek.com")

allowed_labels = list(TAXONOMY.keys())

sys_prompt = f"""
You are a multilingual e-commerce review classifier.
Return STRICT json only.
The final JSON schema:
{{
"results": [{{"idx": int, "labels": , "is_negative": bool, "is_official": bool}}]
}}
Allowed labels (choose zero or more, must be subset of this list):
{allowed_labels}
Label meanings (zh/brief): {TAXONOMY}
Rules:
- Classify each item independently.
- Detect negativity: true if strong complaint/defect/delay/refund/fake, else false.
- is_official: true if seller/store_type implies official/flagship/self-run; else false.
- If pure meme/noise/not about product, use ["other_noise"] only.
Output valid JSON. No extra text.
"""

out = []
for batch in _batched(rows, batch_size):
   items = []
   for i, r in enumerate(batch):
         items.append({
            "idx": i,
            "text": (r.get("review_text") or "")[:2000],# ·ÀÖ¹³¬³¤
            "seller": r.get("seller",""),
            "store_type": r.get("store_type","")
         })

   user_payload = {"items": items}
   messages = [
         {"role":"system","content": sys_prompt},
         {"role":"user","content": "json\n" + json.dumps(user_payload, ensure_ascii=False)}
   ]

   for attempt in range(retries):
         try:
            resp = client.chat.completions.create(
               model=model,
               messages=messages,
               temperature=temperature,
               response_format={"type":"json_object"},
               max_tokens=max_tokens,
            )
            data = json.loads(resp.choices.message.content)
            result_map = {e["idx"]: e for e in data.get("results", [])}
            # ºÏ²¢»ØÔÊ¼ÐÐ
            for i, r in enumerate(batch):
               e = result_map.get(i, {})
               merged = dict(r)
               merged["labels"] = e.get("labels", ["other_noise"])
               merged["is_negative"] = bool(e.get("is_negative", False))
               # Ò²±£Áô¹æÔò°æ is_official£¨ÈôLLMÃ»¸ø£©
               merged["is_official"] = bool(e.get("is_official", r.get("is_official", False)))
               out.append(merged)
            break
         except Exception as ex:
            if attempt == retries - 1:
               # ×îºóÒ»´ÎÈÔÊ§°Ü£º±£µ× fall back
               for r in batch:
                     rr = dict(r)
                     rr.setdefault("labels", ["other_noise"])
                     rr.setdefault("is_negative", False)
                     rr.setdefault("is_official", r.get("is_official", False))
                     out.append(rr)
            time.sleep(sleep_s)
return out

model="deepseek-chat"£¨V3£©×ã¹»×ö·ÖÀà£»ÈôÒª¸üÇ¿ÍÆÀí£¬¿É¸Ädeepseek-reasoner£¨R1£©¡£

response_format={"type":"json_object"}+ÌáÊ¾ÀïÃ÷È·JSON£¬ÄÜ×î´ó»¯±£Ö¤¿É½âÎö½á¹¹Êä³ö¡£

ÈôÓöµ½¼äÐªÐÔ¿ÕÄÚÈÝ/¸ßÑ¹Á÷Á¿£¬ÇëÖØÊÔ/ÍË±Ü£¬»ò»»³ÉÁ÷Ê½£¨stream£©²¢½âÎöSSE¡£¹Ù·½Ò²ÓÐËÙÂÊ/´íÎóÂëËµÃ÷¡£

°ÑUIÇÐµ½LLM·ÖÀà

ÔÚ app/streamlit_app.py Àï°Ñ£º

from core.classify import classify_batch

ÁÙÊ±¸Ä³É£º
from core.classify import classify_batch, llm_classify

²¢ÔÚµã»÷¡°¿ªÊ¼·ÖÎö¡±ºó£¬ÓÃÄãÏëÒªµÄÂ·¾¶£¨ÏÈÅÜ¹æÔò£¬ÔÙÅÜLLM¾À´í£¬»òÖ±½ÓLLM£©£º

# baseline
classified = classify_batch(rows)

# Ö»¶Ô¡°±ß½çÑù±¾/¸ºÃæÑù±¾/¸ß¼ÛÖµSKU¡±ÔÙ×ß LLM£¨Ê¾Àý£ºÈ«Á¿Ö±½ÓLLM£©
# classified = llm_classify(rows, model="deepseek-chat", batch_size=40)

3) 32KB ×Öµä¹»²»¹»£¿ÔõÃ´¡°Ð´³É±êÇ©ÑµÁ·¼¯¡±

½áÂÛ£ºÍêÈ«¿ÉÒÔÏÈ×÷ÎªÈõ¼à¶½µÄ¡°ÖÖ×Ó×Öµä¡±£¬°Ñ 900ÍòÆÀÂÛ×Ô¶¯´òÉÏ¶à±êÇ©£¬×öÒ»¸ö¡°Ò»±é¹ý¡±µÄÑµÁ·¼¯¡£

ÔÙÑµÒ»¸öÐ¡Ä£ÐÍ£¨TF-IDF¡úLinear SVM/LogReg£¬»ò fastText£©¡£

Ö®ºóÓÃ DeepSeek ³é¼ì²¢¾À´í±ß½çÑù±¾£¬»ØÌîÐÞÕý±êÇ©£¬µÃµ½µü´ú¸ü¸É¾»µÄÑµÁ·¼¯¡£

×îÐ¡ÑµÁ·½Å±¾Ê¾Àý£¨¿ÉÐÂ½¨ scripts/train_svm.py£©£º

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MultiLabelBinarizer
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.multiclass import OneVsRestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report

# 1) ÓÃÄãµÄ¡°×Öµä´ò±êÆ÷¡±ÏÈÉú³É labels ÁÐ£¨List£©
df = pd.read_csv("your_clean_reviews.csv")# ÖÁÉÙÓÐ review_text
# ¼ÙÉèÄãÒÑÓÃ¹æÔò°ÑÃ¿ÌõÆÀÂÛ±ä³É¶à±êÇ©ÁÐ±í
# df["labels"] = [["product_quality","price_value"], ...]
df = df.map(len) > 0]

# 2) ÏòÁ¿»¯ + ¶à±êÇ©ÑµÁ·
X_train, X_test, y_train, y_test = train_test_split(
df["review_text"], df["labels"], test_size=0.1, random_state=42, stratify=df["labels"].map(lambda x: x if x else "none")
)
vec = TfidfVectorizer(max_features=200000, ngram_range=(1,2), min_df=3)
Xtr = vec.fit_transform(X_train)
Xte = vec.transform(X_test)

mlb = MultiLabelBinarizer()
Ytr = mlb.fit_transform(y_train)
Yte = mlb.transform(y_test)

clf = OneVsRestClassifier(LogisticRegression(max_iter=200, n_jobs=8))
clf.fit(Xtr, Ytr)
pred = clf.predict(Xte)
print(classification_report(Yte, pred, target_names=mlb.classes_))
# ±£´æ vec / clf / mlb ±¸ÓÃ

×ÖµäÀ©Õ¹½¨Òé£¨ºÜ¿ì¼ûÐ§£©

¶ÔÃ¿¸ö±êÇ©Í³¼Æ¸ßPMI/¿¨·½µÄÐÂ´Ê£¬°ÑTopºòÑ¡¼ÓÈë×Öµä¡£

ÎªÖÐÓ¢/¶«ÄÏÑÇÓïÖÖ×¼±¸Í¬Òå´Ê/³£¼û´íÆ´/¿ÚÓïÐ´·¨/emoji±äÌå¡£

¸ºÑù±¾ÍÚ¾ò£º³éÈ¡Ä£ÐÍÃüÖÐ¸ÅÂÊµÍµ«±»ÈË¹¤ÅÐ¶¨Îª¸ÃÀàµÄÑù±¾£¬·´Ïò²¹´Ê¡£

4) ·â×°Óë·ç¿ØÐ¡ÌùÊ¿£¨ºÜ¶Ì£©

²¢·¢ÓëÍË±Ü£ºÅú´¦Àí 40 Ìõ×óÓÒÒ»ºô½Ð£¬Ê§°ÜÖ¸ÊýÍË±Ü£»×¢Òâ 429/503/500 ´¦Àí¡£¹Ù·½´íÎóÂëÓÐËµÃ÷¡£
DeepSeek API Docs

JSONÄ£Ê½£ºÎñ±ØÔÚÌáÊ¾+response_formatË«ÖØÉùÃ÷£»²¢ÉèÖÃ×ã¹» max_tokens£¬±ÜÃâJSON±»½Ø¶Ï¡£
DeepSeek API Docs

¹Ù·½ºÏ¹æ£ºÆ½Ì¨ÆÀÂÛ¾¡Á¿×ß¹Ù·½API/µ¼³ö»òÄãÒÑÓÐÊý¾Ý£»±ÜÃâÈÆ¹ý·ÃÎÊ¿ØÖÆ¡£

½ö¹Ù·½/Æì½¢¹ýÂË£º±£Áô¡°Apple¹Ù·½Æì½¢µê/×ÔÓª/Official¡±µÈµêÆÌ£»ÒÉËÆ¶þÊÖ/·ÐÂÓÃ±êÇ©µ¥¶ÀÍ³¼Æ£¬±ãÓÚ±¨¸æÀïÌáÊ¾¡£

5) ÏÖÔÚ½¨ÒéÄãÁ¢¿Ì×öµÄ¡°×îÐ¡½»¸¶Çåµ¥¡±

ÓÃÄãÇåÏ´ºÃµÄCSVÅÜÒ»±é»ùÏß·ÖÀà£¨ÒÑÔÚStarterÀï£©¡£

½ÓÉÏÃæµÄ llm_classify£¬¶ÔÒ»¸ö¿ÉÕ¹Ê¾µÄÊý¾ÝÇÐÆ¬ÅÜDeepSeek°æ·ÖÀà£¬µ¼³öCSV/JSON±¨¸æ¡£

¸ù¾ÝTop¸ºÃæ±êÇ©×Ô¶¯Éú³É¡Ü10Ìõ½¨Òé£¨StarterÒÑÄÚÖÃ£©£¬ÈË¹¤ÔÙÈóÉ«2¾ä£¬°ÑÖ¤¾ÝÑùÀý£¨ÔÎÄÆÀÂÛ£©Ìù½ø±¨¸æ¡£

Èô»¹ÏëÉÏÒ»¸ö¡°±¾µØÄ£ÐÍ°æ¡±£¬¾ÍÓÃÈõ¼à¶½±ê×¢¡úÅÜÉÏÃætrain_svm.py£¬°ÑÍÆÀí½á¹ûÓëLLM½á¹û¶ÔÆë×ö¸ö¶ÔÕÕÍ¼±í¡£

Ð¡Ñ¼²»Ñ§Ï° ·¢±íÓÚ 2025-8-19 20:27:22

ºÜÀàËÆÎÒÒÔÇ°ºÍtyhÒ»ÆðÅªµÄchatgpt»Ø´ð

²»¶þÈçÊÇ ·¢±íÓÚ 2025-8-20 19:26:31

Ò»¡¢×ÜÌåË¼Â·£¨ÏÈÅÜÍ¨¡úÔÙ±äÇ¿£©

²É¼¯²ã£¨ºÏ¹æÓÅÏÈ£©

ÓÅÏÈÓÃ¹Ù·½API/ÉÌ¼ÒºóÌ¨µ¼³ö/ÄãÒÑÓÐKaggle&GitHubÆÀÂÛÊý¾Ý¡£

Èý¸öÆ½Ì¨·Ö±ð×ö³ÉAdapter£ºproviders/amazon.py|shopee.py|taobao.py£¬Êä³öÍ³Ò»×Ö¶Î¡£

¹ýÂË¡°¹Ù·½/Æì½¢µê/×ÔÓª¡±£¬±ÜÃâ¶þÊÖ£º»ùÓÚµêÆÌÃûÓëÆ½Ì¨¸øµÄ¡°¹Ù·½/ÈÏÖ¤¡±±ê¼Ç×ö¹æÔò¹ýÂË¡£

ÇåÏ´Óë¹éÒ»

ÓïÑÔÊ¶±ð£¨ÖÐÓ¢¶«ÄÏÑÇ¶àÓï£©¡úÍ³Ò»µ½ÖÐ/Ó¢´¦Àí£¨±ØÒªÊ±×ö·Òë£©¡£

È¥ÖØ¡¢Ê±¼äÉ¸Ñ¡£¨Ö§³Ö¾«È·µ½ÈÕ£©¡¢ÎÞÐ§/Íæ¹£/¹àË®¹ýÂË¡£

·ÖÀàÓëÇé¸Ð

MVP£º¹Ø¼ü´Ê/¹æÔò»ùÏß£¨ÒÑÊµÏÖ£©¡£

Éý¼¶A£º±¾µØÇáÁ¿Ä£ÐÍ£¨TF-IDF+ÏßÐÔ / fastText / ÕôÁóÐ¡Ä£ÐÍ£©¡£

Éý¼¶B£ºDeepSeek/ChatGPT×öÁã/ÉÙÑù±¾·ÖÀà£¨¸ß×¼È·¡¢¿É¿Ø³É±¾£©¡£

»ìºÏ£ºÏÈÓÃÐ¡Ä£ÐÍÅúÁ¿ÅÜ£¬ÔÙÈÃLLMÖ»¾À´í¡°±ß½çÑù±¾¡±¡£

¶´²ìÓë½¨Òé

»ùÓÚ¸ºÃæÑù±¾Top±êÇ©¾ÛºÏÎÊÌâ¡ú²ú³ö¡Ü10Ìõ¿ÉÖ´ÐÐÓÅ»¯½¨Òé£¨ÏÖÒÑÄÚÖÃÄ£°å£©¡£

±¨¸æµ¼³öCSV/JSON£¨MVPÒÑ×ö£©£¬ºóÐø¿É¼ÓPDF/PPT¡£

ÓÃ Streamlit ¿ìËÙ´îºÃËÄ¸öÊäÈë¿ò£¨Æ·ÅÆ/Æ·Àà/Æ½Ì¨/Ê±¼ä£©£¬µã¡°¿ªÊ¼·ÖÎö¡±Ö±½ÓÅÜ£¨ÒÑÊµÏÖ£©¡£

¶þ¡¢ÄãÄÃµ½µÄStarter°üº¬Ê²Ã´

app/streamlit_app.py£ºÒÑÊµÏÖËÄ¸öÊäÈëÏî+½á¹û±í¸ñ+½¨Òé+µ¼³ö°´Å¥¡£

core/taxonomy.py£º»ùÓÚ¡°±£½¡ÒòËØ/ÆÚÍûÒòËØ¡±µÄ±êÇ©¼¯£¬¿ÉËæÊ±¸Ä¡£

core/classify.py£º¹æÔò»ùÏß·ÖÀàÆ÷£¬ÁôºÃLLM½ÓÈëÕ¼Î»¡£

core/suggest.py£º°ÑTopÎÊÌâ×ªÎª¡Ü10ÌõÐÐ¶¯»¯½¨Òé¡£

providers/*.py£ºÈýÆ½Ì¨ÊÊÅäÆ÷Õ¼Î»£¨¿ÕÊµÏÖ£¬Ç¿µ÷ºÏ¹æ£©¡£

data/sample_reviews.csv£ºË«ÓïÊ¾ÀýÊý¾Ý£¬¿ÉÖ±½ÓÅÜÍ¨¡£

requirements.txt£ºÇáÁ¿ÒÀÀµ£¨²»º¬´óÄ£ÐÍ£©¡£

README.md£ºÆô¶¯ÃüÁîÓëºÏ¹æ×¢Òâµã¡£

Æô¶¯£¨±¾µØPython»·¾³£©£º

pip install -r requirements.txt
streamlit run app/streamlit_app.py
ÉÏ´«Äã×Ô¼ºµÄCSV£¨ÁÐÃûÓëÊ¾ÀýÒ»ÖÂ£©¼´¿É¿´µ½ÍêÕûÁ÷³Ì¡£

Èý¡¢·ÖÀà±êÇ©Éè¼Æ£¨¿ÉÖ±½ÓÓÃ/¿É×Ô¶¨Òå£©

±£½¡ÒòËØ£º²úÆ·ÖÊÁ¿/×ö¹¤¡¢ÎïÁ÷Ê±Ð§¡¢°ü×°ÍêºÃ¡¢Æ½Ì¨/Ö§¸¶°²È«

ÆÚÍûÒòËØ£º¼Û¸ñÓëÐÔ¼Û±È¡¢ÊÛºóÓë¿Í·þÏìÓ¦¡¢Ò×ÓÃÐÔ/ËµÃ÷Êé¡¢¹¦ÄÜ/ÐÔÄÜ

·çÏÕ¸¨Öú£ºÊÇ·ñ¹Ù·½/ÕýÆ·¡¢ÒÉËÆ¶þÊÖ/·ÐÂ/¼Ù»õ¡¢ÎÞÐ§/Íæ¹£

ÑµÁ·¼¯´ó¡¢ÓïÑÔ¶àÊ±£º½¨Òé¶Ô²»Í¬ÓïÖÖ¸÷×Ô×ö¹Ø¼ü´Ê±í£¬»òÖ±½Ó×ßLLMÁãÑù±¾¡£

ËÄ¡¢ÈçºÎ°ÑMVPÉýµ½±ÈÈü°æ±¾£¨Á½ÌõÂ·Ïß£©

Â·ÏßA£º±¾µØÇáÁ¿Ä£ÐÍ£¨¾¼ÃÊ¡ÐÄ£©

Ä¿±ê£ºÔÚÄãµÄ900ÍòÑù±¾ÉÏÑµÁ·Ò»¸ö¿ÉÀëÏßÍÆÀíµÄÐ¡Ä£ÐÍ¡£

Èõ¼à¶½Æð²½£ºÓÃclassify.pyÀïµÄ¹Ø¼ü´Ê¹æÔò¸øÈ«Á¿´ò¡°Èõ±êÇ©¡±¡£

³é¼ìÓë¾À´í£º´ÓÃ¿Àà³éÑù£¬ÓÃDeepSeek×öÐ£Õý£¬»ØÌîÐÞÕý±êÇ©¡£

ÑµÁ·£º

·½°¸1£ºTF-IDF + ÏßÐÔSVM/LogReg£¨¶à±êÇ©¡úOne-vs-Rest£©£¬Ê®¼¸·ÖÖÓ¿É³öÒ»¸öºÃ»ùÏß£»

·½°¸2£ºfastText£¨¶àÓï¿ÉÑµÁ·¶à·Ý£©£»

·½°¸3£ºÕôÁóÐ¡Ä£ÐÍ£¨ÈçMiniLM¶àÓï£©Î¢µ÷£¬ÏÔ´æÓÑºÃ¡£

ÉÏÏß£ºÄ£ÐÍÎÄ¼þ¹Ì»¯ÔÚ±¾µØ/·þÎñÆ÷£¬ÍÆÀí¼«¿ì£»LLMÖ»ÔÚµÍÖÃÐÅ¶ÈÊ±¶µµ×¡£

Â·ÏßB£ºLLMÖ÷µ¼£¨ËÙ¶ÈÓëÁé»îÐÔ£©

Ä¿±ê£ºDeepSeek/ChatGPTÖ±½Ó×ö¶à±êÇ©·ÖÀàÓëÕªÒª¡£

·Ö¿éÅú´¦Àí£¬¼ÓÏµÍ³ÌáÊ¾¹Ì¶¨±ê×¼£º

Êä³öJSON£¬×Ö¶Î°üÀ¨labels[]/is_negative/reasons¡£

¸øÃ¿¸ö±êÇ©ÏÂ2~3Ìõ¶¨ÒåÓëÕý·´Àý¡£

³É±¾¿ØÖÆ£º

ÏÈÐ¡Ä£ÐÍÉ¸¡°Ã÷ÏÔÑù±¾¡±£¬LLMÖ»´¦Àí¡°±ß½çÑù±¾¡±£»

ºÏ²¢Í¬ÖÊ¶ÌÆÀÎª¡°´ØÕªÒª¡±¡úLLM¶ÔÕªÒªÅÐÀà£¬¼«Ê¡token¡£

ÎÈ¶¨ÐÔ£ºÓÃº¯Êýµ÷ÓÃ/JSONÄ£Ê½Ç¿Ô¼ÊøÊä³ö½á¹¹¡£

Îå¡¢Æì½¢µê/¹Ù·½µê¹ýÂË£¨·´¡°¶þÊÖ/·ÐÂ¡±£©

¹æÔò£ºµêÆÌÃû/µêÆÌÀàÐÍº¬¹Ù·½/Æì½¢/×ÔÓª/Official£¬Æ½Ì¨²à´æÔÚ¡°¹Ù·½ÈÏÖ¤/Preferred+¡±¼´ÃüÖÐ¡£

ÆÀÂÛÎÄ±¾ÖÐ³öÏÖ¼Ù»õ/¶þÊÖ/·ÐÂ/serial mismatchµÈ¹Ø¼ü´Ê£¬¶îÍâ´òÉÏcounterfeit_or_used±êÇ©±ãÓÚ¸´ºË¡£

Ö»ÔÚÆ½Ì¨ÔÊÐíÓëÊý¾Ý×Ö¶Î¿ÉµÃµÄÇ°ÌáÏÂÊ¹ÓÃ£»±ØÒªÊ±ÈÃÓÃ»§ÔÚUIÖÐÊÖ¶¯¹´Ñ¡¡°½ö¹Ù·½/Æì½¢¡±¡£

Áù¡¢²É¼¯ÓëºÏ¹æ£¨Îñ±Ø×¢Òâ£©

ÓÅÏÈ£º¹Ù·½API/ÉÌ¼ÒºóÌ¨µ¼³ö/ÄãÒÑÓÐµÄ¹«¿ªÊý¾Ý¼¯£»

×ñÊØ¸÷Æ½Ì¨Ìõ¿îºÍµ±µØ·¨ÂÉ£¬²»Òª¹æ±ÜÑéÖ¤Âë/µÇÂ¼/¼ÓÃÜµÈ·ÃÎÊ¿ØÖÆ£»

¿ØËÙ£ººÏÀí²¢·¢¡¢ÖØÊÔ¡¢»º´æÓë¶ÏµãÐø´«£¬±ÜÃâ¶ÔÍøÕ¾Ôì³É¸ºÔØ£»

±£ÁôÖ¤¾ÝÁ´£º¼ÇÂ¼SKU¡¢µêÆÌ¡¢Ê±¼ä´°£¬±¨¸æÀï¸øÑùÀýÔÎÄÓëÍ³¼Æ¿Ú¾¶¡£

ÎÒÔÚproviders/*.pyÖ»¸øÁË½Ó¿ÚÕ¼Î»£¨Î´°üº¬ÈÎºÎÈÆ¹ý·ç¿ØµÄÊµÏÖ£©£¬Äã¿É»ùÓÚºÏ¹æÊý¾ÝÔ´È¥Ìî³ä¡£

Æß¡¢ÆÀ¹ÀÓë½»¸¶

·ÖÀà£º·ÖÆ½Ì¨/·ÖÓïÖÖ¿´P/R/F1£»¶Ô¸ºÃæTopÑù±¾×öÈË¹¤³é¼ì¡£

Ç÷ÊÆ£º°´ÔÂ/ÖÜ¿´Ã¿¸ö±êÇ©µÄÕ¼±È±ä»¯£¬¼ì²â¡°ÐÂ±¬µã¡±¡£

±¨¸æ£º10ÌõÄÚ½¨Òé + Ö¤¾Ý£¨ÑùÀýÆÀÓï/Õ¼±È/Ê±¼ä¶Î£©£¬µ¼³öCSV/JSON£¬ºóÐø¿É¼ÓPDF/PPTÄ£°å¡£

°Ë¡¢ÄãµÄÏÂÒ»²½£¨½¨ÒéÒ»ÖÜ³å´Ì½Ú×à£©

Day 1¨C2£ºÓÃÄãµÄ3¡Á300ÍòÆÀÂÛÎ¹¸øMVP£¨CSV·½Ê½£©£¬ÅÜÍ¨UIÓë·ÖÀà½á¹û¡£
Day 3¨C4£º×ö¡°Èõ¼à¶½¡úÐ¡Ä£ÐÍ¡±ÑµÁ·£¬ÄÃµ½µÚÒ»°æ±¾µØÄ£ÐÍ¡£
Day 5£ºÒýÈëDeepSeek×÷¡°±ß½çÑù±¾¾À´í+½¨ÒéÈóÉ«¡±¡£
Day 6¨C7£ºÍêÉÆÆì½¢µê¹ýÂË¡¢Ê±¼ä´°¡¢±¨¸æÄ£°åÓëÑÝÊ¾Êý¾Ý¡£

Ð¡Ñ¼²»Ñ§Ï° ·¢±íÓÚ 2025-8-20 19:45:15

²»¶þÈçÊÇ ·¢±íÓÚ 2025-8-20 19:26
Ò»¡¢×ÜÌåË¼Â·£¨ÏÈÅÜÍ¨¡úÔÙ±äÇ¿£©

²É¼¯²ã£¨ºÏ¹æÓÅÏÈ£©

°´ÕÕÄãËµµÄ£¬Êý¾ÝÏ´ÍêÁË£¬È»ºó¸Õ¸Õ°Ñ×ÖµäÊ²Ã´µÄÌí¼Ó½øÀ´£¬¾ÍÊÇ×ÖµäÌ«ÉÙÁË£¬Ö»ÓÐ32kbµÄ¹Ø¼ü´Ê¼ìË÷£¬²»ÖªµÀ¹»²»¹»¡£È»ºóÒªÐ´×Öµäµ½»úÆ÷Ñ§Ï°ÑµÁ·µÄ±êÇ©·ÖÀà

µ«ÊÇdeepseek½Ó¿ÚÔõÃ´Åª°¡£¿

»¹ÓÐ¾ÍÊÇ½ñÌìÍíÉÏ¾ÍÈ«²¿ÅªÍêÓÐÏ£ÍûÃ´

Ð¡Ñ¼²»Ñ§Ï° ·¢±íÓÚ 2025-8-20 21:03:47

²»¶þÈçÊÇ ·¢±íÓÚ 2025-8-20 20:22
1) DeepSeek ½Ó¿Ú¡ª¡ª×î¶ÌÂ·¾¶Èý²½×ß

Step A. °²×°ÓëÃÜÔ¿

Ð»À²£¡£¡²»À¢ÊÇ²»¶þ¸ç£¬ÕæµÄÓÐÐ§£¬¸Õ¸ÕÊÔÁËÒ»ÏÂÈ«²¿³É¹¦ÁË{:10_279:}
Ö±½Ó¸øµ½×î¼Ñ£¬È»ºóÎÒÃ¿ÌìÆÀ·Ö°ÑÊ£ÏÂµÄ90Óã±Ò¸øÁË£¬Ã»·¨Ò»´ÎÐÔ¸¶ÇåÎÒÄ¿Ç°µÈ¼¶²»¹»{:10_254:}

Ò³: [1]

ÓãCÂÛÌ³'s Archiver

ÈçºÎÑµÁ·AI¡¾ÐüÉÍ¡¿