littlebot
Published on 2025-04-03 / 0 Visits
0

【源码】基于 Node.js 的多媒体资源与教育信息爬取工具

项目简介

本项目是基于 Node.js 的多媒体资源与教育信息爬取工具,利用爬虫和脚本技术,帮助用户获取和管理各类多媒体资源,同时从教育网站获取题目与解析等学习资料。项目包含多个模块,能满足不同场景下的特定需求。

项目的主要特性和功能

  1. MQTT 客户端:可依据输入的主机、端口、协议、主题和消息,实现 MQTT 通信。
  2. 百度网盘模块:能获取指定路径下的所有文件信息、查询文件,还可统计文件名中序号不规范的情况。
  3. 问卷星模块:通过在控制台执行代码,获取题目、选项和解析的数据。
  4. 大牛教育模块:包含网页嵌入式脚本实现视频窗口化全屏,能爬取章节演练和历史真题的选择题与应用题。
  5. 粤师教育模块:可爬取科目所有章节练习。
  6. 空格教育模块:能下载对应作业的题目。
  7. 樱花动漫快捷键猴油脚本:实现自动播放、跳过片头,支持快捷键切换上下集和暂停/播放。

安装使用步骤

前提条件

假设用户已下载本项目的源码文件,且系统已安装 Node.js 和 npm。

安装依赖

打开终端,进入项目根目录,执行以下命令安装项目所需依赖: bash npm install

各模块配置与使用

MQTT 客户端

在终端执行以下命令启动: bash node main.js <host> <port> <protocol> <topic> <msg> 示例: bash node main.js localhost 1883 ws UPDATE_NAME "hello world"

百度网盘

  1. 运行程序: bash npx ts-node index.ts
  2. 配置:运行程序后会自动在用户家目录创建 crawler-script/config.json 存储配置文件,按需修改: json { "cookie": "", "customFindPath": "" }

问卷星

./index.ts 的代码复制到控制台执行,即可获取所需字符串。

大牛教育

  1. 网页嵌入式脚本:将 web 目录中的脚本复制粘贴到 console 控制台执行,也可使用油猴之类的插件自动执行。
  2. 爬取题目:配置 config/index.ts 文件中 daniu 里的 token,执行 index.ts 脚本,爬取的数据会保存到 output 目录。

粤师教育

  1. 修改 api/yueShiJiaoYu.ts 中的 Cookie
  2. 修改 index.ts 里的 subcourseId 为对应科目的 id 号。
  3. 执行 index.ts,在 output 中查看结果。

空格教育

  1. 修改 api/kongGeJiaoYu.ts 中的 token 参数。
  2. 修改 getHomeworkDetail() 函数中的 id 参数。
  3. 执行 ts-node src/scripts/kongGeJiaoYu/index.ts
  4. output 中查看结果。

樱花动漫快捷键猴油脚本

在播放地址 https://www.yhpdm.net/ 使用,手动设置片头时间后可实现自动播放并跳过片头,还能使用快捷键操作。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】