js代码写一段web爬虫代码,读取当前页面的链接,json输出

js代码写一段web爬虫代码,读取当前页面的链接,json输出我手头有个项目 其中有个功能是爬取一个指定页面的所有链接地址 返回一个 lists 我现在分享出来 var tag document querySelecto a var myarray for

大家好,欢迎来到IT知识分享网。

我手头有个项目,其中有个功能是爬取一个指定页面的所有链接地址,返回一个lists。我现在分享出来。

var tag = document.querySelectorAll("a"); var myarray = [] for (var i = 0; i < tag.length; i++) { var nametext = tag[i].textContent; var cleantext = nametext.replace(/\s+/g, ' ').trim(); var cleanlink = tag[i].href; myarray.push([cleantext, cleanlink]); }; function generateJson() { var hrefArray = []; for (var i = 0; i < myarray.length; i++) { let t = {} t.n = myarray[i][0]; t.m = myarray[i][1]; hrefArray.push(t); }; var win = window.open("Json"); win.document.write(JSON.stringify(hrefArray)); } generateJson()

测试步骤:

  1. 打开谷歌浏览器,地址栏输入网址的地址,打开要爬取的页面。
  2. 打开控制台。
  3. 复制粘贴上面的代码,json格式的数据将输出到当前页面。

屏幕截图

怎么运行

js代码写一段web爬虫代码,读取当前页面的链接,json输出

输出结果

js代码写一段web爬虫代码,读取当前页面的链接,json输出

大家看完这篇文章有什么想法, 评论区多多交流!

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/162475.html

(0)
上一篇 2024-12-15 20:00
下一篇 2024-12-15 20:15

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信