寻找 Github 中的死链接

远子 â€¢  2021å¹´07月14日

今天在 Github 闲逛的时候,发现 Sindre 的 awesome-electron 项目里有个死链接(TimoFM),随手提了个 MR:

image-20210714170323865

awsome 系列的仓库有很多,比如 awesome-nodejs、awesome-react、awesome-flutter 等等,几乎每种框架、语言都有对应的仓库。

awesome 仓库用来搜集使用了某种技术的项目,包括但不限于 UI 库、脚手架、开源项目、教程、视频等。

awesome 仓库有一个明显的特点:只有一个 README.md,提完 MR 后我在想,是否可以做一个自动化的脚本,定期检测这种 awesome 系列的仓库,过滤出无效的链接。

先从上边仓库地址失效的情况开始吧。

我写了几行简单的代码,你可以在 rmlzy/find-dead-link 中找到:

image-20210714162614299

逻辑非常简单,用 cheerio 爬到目标页面后,轮询所有的 a 链接即可。

使用方式很简单:

# 全局安装 find-dead-link 后,你会得到 fdl 命令
# fdl 命令后跟一个 Github 地址即可
fdl https://github.com/sindresorhus/awesome-electron

使用效果和网速有很大关系,大概是这样的:

image-20210714163054853

End.

(完)