mirror of
https://github.com/Usagi-org/ai-goofish-monitor.git
synced 2025-11-25 03:15:07 +08:00
130 lines
6.0 KiB
Python
130 lines
6.0 KiB
Python
import asyncio
|
||
import sys
|
||
import os
|
||
import argparse
|
||
import json
|
||
|
||
from src.config import STATE_FILE
|
||
from src.scraper import scrape_xianyu
|
||
|
||
|
||
async def main():
|
||
parser = argparse.ArgumentParser(
|
||
description="闲鱼商品监控脚本,支持多任务配置和实时AI分析。",
|
||
epilog="""
|
||
使用示例:
|
||
# 运行 config.json 中定义的所有任务
|
||
python spider_v2.py
|
||
|
||
# 只运行名为 "Sony A7M4" 的任务 (通常由调度器调用)
|
||
python spider_v2.py --task-name "Sony A7M4"
|
||
|
||
# 调试模式: 运行所有任务,但每个任务只处理前3个新发现的商品
|
||
python spider_v2.py --debug-limit 3
|
||
""",
|
||
formatter_class=argparse.RawDescriptionHelpFormatter
|
||
)
|
||
parser.add_argument("--debug-limit", type=int, default=0, help="调试模式:每个任务仅处理前 N 个新商品(0 表示无限制)")
|
||
parser.add_argument("--config", type=str, default="config.json", help="指定任务配置文件路径(默认为 config.json)")
|
||
parser.add_argument("--task-name", type=str, help="只运行指定名称的单个任务 (用于定时任务调度)")
|
||
args = parser.parse_args()
|
||
|
||
if not os.path.exists(STATE_FILE):
|
||
sys.exit(f"错误: 登录状态文件 '{STATE_FILE}' 不存在。请先运行 login.py 生成。")
|
||
|
||
if not os.path.exists(args.config):
|
||
sys.exit(f"错误: 配置文件 '{args.config}' 不存在。")
|
||
|
||
try:
|
||
with open(args.config, 'r', encoding='utf-8') as f:
|
||
tasks_config = json.load(f)
|
||
except (json.JSONDecodeError, IOError) as e:
|
||
sys.exit(f"错误: 读取或解析配置文件 '{args.config}' 失败: {e}")
|
||
|
||
# 读取所有prompt文件内容
|
||
for task in tasks_config:
|
||
if task.get("enabled", False) and task.get("ai_prompt_base_file") and task.get("ai_prompt_criteria_file"):
|
||
try:
|
||
with open(task["ai_prompt_base_file"], 'r', encoding='utf-8') as f_base:
|
||
base_prompt = f_base.read()
|
||
with open(task["ai_prompt_criteria_file"], 'r', encoding='utf-8') as f_criteria:
|
||
criteria_text = f_criteria.read()
|
||
|
||
# 动态组合成最终的Prompt
|
||
task['ai_prompt_text'] = base_prompt.replace("{{CRITERIA_SECTION}}", criteria_text)
|
||
|
||
# 验证生成的prompt是否有效
|
||
if len(task['ai_prompt_text']) < 100:
|
||
print(f"警告: 任务 '{task['task_name']}' 生成的prompt过短 ({len(task['ai_prompt_text'])} 字符),可能存在问题。")
|
||
elif "{{CRITERIA_SECTION}}" in task['ai_prompt_text']:
|
||
print(f"警告: 任务 '{task['task_name']}' 的prompt中仍包含占位符,替换可能失败。")
|
||
else:
|
||
print(f"✅ 任务 '{task['task_name']}' 的prompt生成成功,长度: {len(task['ai_prompt_text'])} 字符")
|
||
|
||
except FileNotFoundError as e:
|
||
print(f"警告: 任务 '{task['task_name']}' 的prompt文件缺失: {e},该任务的AI分析将被跳过。")
|
||
task['ai_prompt_text'] = ""
|
||
except Exception as e:
|
||
print(f"错误: 任务 '{task['task_name']}' 处理prompt文件时发生异常: {e},该任务的AI分析将被跳过。")
|
||
task['ai_prompt_text'] = ""
|
||
elif task.get("enabled", False) and task.get("ai_prompt_file"):
|
||
try:
|
||
with open(task["ai_prompt_file"], 'r', encoding='utf-8') as f:
|
||
task['ai_prompt_text'] = f.read()
|
||
print(f"✅ 任务 '{task['task_name']}' 的prompt文件读取成功,长度: {len(task['ai_prompt_text'])} 字符")
|
||
except FileNotFoundError:
|
||
print(f"警告: 任务 '{task['task_name']}' 的prompt文件 '{task['ai_prompt_file']}' 未找到,该任务的AI分析将被跳过。")
|
||
task['ai_prompt_text'] = ""
|
||
except Exception as e:
|
||
print(f"错误: 任务 '{task['task_name']}' 读取prompt文件时发生异常: {e},该任务的AI分析将被跳过。")
|
||
task['ai_prompt_text'] = ""
|
||
|
||
print("\n--- 开始执行监控任务 ---")
|
||
if args.debug_limit > 0:
|
||
print(f"** 调试模式已激活,每个任务最多处理 {args.debug_limit} 个新商品 **")
|
||
|
||
if args.task_name:
|
||
print(f"** 定时任务模式:只执行任务 '{args.task_name}' **")
|
||
|
||
print("--------------------")
|
||
|
||
active_task_configs = []
|
||
if args.task_name:
|
||
# 如果指定了任务名称,只查找该任务
|
||
task_found = next((task for task in tasks_config if task.get('task_name') == args.task_name), None)
|
||
if task_found:
|
||
if task_found.get("enabled", False):
|
||
active_task_configs.append(task_found)
|
||
else:
|
||
print(f"任务 '{args.task_name}' 已被禁用,跳过执行。")
|
||
else:
|
||
print(f"错误:在配置文件中未找到名为 '{args.task_name}' 的任务。")
|
||
return
|
||
else:
|
||
# 否则,按原计划加载所有启用的任务
|
||
active_task_configs = [task for task in tasks_config if task.get("enabled", False)]
|
||
|
||
if not active_task_configs:
|
||
print("没有需要执行的任务,程序退出。")
|
||
return
|
||
|
||
# 为每个启用的任务创建一个异步执行协程
|
||
coroutines = []
|
||
for task_conf in active_task_configs:
|
||
print(f"-> 任务 '{task_conf['task_name']}' 已加入执行队列。")
|
||
coroutines.append(scrape_xianyu(task_config=task_conf, debug_limit=args.debug_limit))
|
||
|
||
# 并发执行所有任务
|
||
results = await asyncio.gather(*coroutines, return_exceptions=True)
|
||
|
||
print("\n--- 所有任务执行完毕 ---")
|
||
for i, result in enumerate(results):
|
||
task_name = active_task_configs[i]['task_name']
|
||
if isinstance(result, Exception):
|
||
print(f"任务 '{task_name}' 因异常而终止: {result}")
|
||
else:
|
||
print(f"任务 '{task_name}' 正常结束,本次运行共处理了 {result} 个新商品。")
|
||
|
||
if __name__ == "__main__":
|
||
asyncio.run(main())
|