大家好,欢迎来到IT知识分享网。
我手头有个项目,其中有个功能是爬取一个指定页面的所有链接地址,返回一个lists。我现在分享出来。
var tag = document.querySelectorAll("a"); var myarray = [] for (var i = 0; i < tag.length; i++) { var nametext = tag[i].textContent; var cleantext = nametext.replace(/\s+/g, ' ').trim(); var cleanlink = tag[i].href; myarray.push([cleantext, cleanlink]); }; function generateJson() { var hrefArray = []; for (var i = 0; i < myarray.length; i++) { let t = {} t.n = myarray[i][0]; t.m = myarray[i][1]; hrefArray.push(t); }; var win = window.open("Json"); win.document.write(JSON.stringify(hrefArray)); } generateJson()
测试步骤:
- 打开谷歌浏览器,地址栏输入网址的地址,打开要爬取的页面。
- 打开控制台。
- 复制粘贴上面的代码,json格式的数据将输出到当前页面。
屏幕截图
怎么运行
输出结果
大家看完这篇文章有什么想法, 评论区多多交流!
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/162475.html