xiaji 33c2af5348 fix(爬虫): 更新上证所数据抓取的XPath并添加备用路径
原XPath无法定位元素,更新为更精确的路径并添加多个备用XPath
2026-01-12 10:39:46 +08:00

股吧人气指示器

主要功能

1. 网页评论抓取

  • 支持自定义目标URL和XPath表达式
  • 自动重试机制,确保网页获取成功率
  • 支持多页面抓取和评论解析

2. 上海证券交易所数据爬取

  • 实时获取上证指数等数据
  • 支持非交易时间自动跳过
  • 数据持久化存储

3. 截图功能

  • 使用Playwright自动化截图
  • 支持指定XPath元素截图
  • 自动清理旧截图保留最新10张

4. LLM分析

  • 集成OpenAI API进行评论情感分析
  • 支持自定义提示词和模型参数
  • 分析结果可视化展示

5. 桌面客户端

  • PySide6 GUI界面
  • 系统托盘支持
  • 窗口透明度和置顶设置
  • 实时数据展示

技术栈

  • Python 3.10+
  • PySide6 (GUI)
  • Playwright (自动化截图)
  • Requests (网络请求)
  • LXML (HTML解析)
  • Loguru (日志管理)
  • OpenAI API (LLM分析)

使用说明

配置文件

编辑config.json设置:

  • API Base URL
  • API Key
  • 目标URL和XPath
  • 刷新间隔

运行程序

python main.py

截图功能

截图默认保存到screenshots目录自动清理超过10张的旧截图。

注意事项

  • 确保已安装所有依赖:pip install -r requirements.txt
  • 首次运行Playwright需安装浏览器playwright install chromium
  • 交易时间为工作日9:30-11:30和13:00-15:00
Description
guba.sina.com.cn的指向标,分析内容是看多还是看空。
Readme 812 MiB
Languages
Makefile 66.9%
Rust 17.9%
Python 15%
Java 0.1%