开源一个nodejs+react+react-router+webpack+antDesign+mysql的爬虫项目

**wangji817** · June 12, 2019, 1:48am

项目地址：https://github.com/wangji817/nodejs-webpack-react-react-router-antDesign-mysql

要是觉得可以，点一下star。

开场白：

小明：你知道什么是爬虫吗？

小红：知道啊。

小明：是一种在地上爬的虫子吗？

小红：不是，它不是真正意义上的昆虫。是一种网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

小明：哦！原来如此，我懂了，是计算机里的爬虫。

爬虫目标

以掘金和csdn技术文章作为爬取目标，最终实现至本地网页展示、后续还可以不停新增别的爬取目标。

爬虫技术

1）Nodejs作为核心后端爬取媒介

2）Mysql作为数据存储

3）Webpack+react+ant Design作为前端页面数据展示

4）react-router进行组件化页面路由

爬虫框架

superagent基于nodejs服务端请求的模块，是轻量级更为优化的ajax API，对比大量糟糕的现存的API，SuperAgent是灵活的、易读的、并且非常易学，同时SuperAgent可用于Node.js！

启动顺序

1.git clone 当前项目.git地址

2.npm install

3.已安装mysql并已启动，创建jjchapter数据库，导入项目下jjchapter.sql、csdnlist.sql两个数据库表，数据库账号root，密码123456，端口号3306

4.新开cmd窗口 node jjIndex.js

5.新开cmd窗口 npm run online 线上模式 npm run dev 开发模式，开发模式需要新开窗口 npm run build 文件监听；

**Sailor-wu** · June 12, 2019, 6:34am

你好，请问一下改怎么调试吗？

**wangji817** · June 12, 2019, 7:37am

没有明白你的意思，调试可以是浏览器控制台调试，或者ide工具调试。如果需要修改代码建议使用dev开发模式启动