在带有JavaScript的Google Chrome扩展程序中对当前未打开的标签执行Web爬取的最佳选择是什么,以及可用的更多技术。其他JavaScript库也被接受。
重要的是掩盖抓取行为,使其表现得像正常的网络请求。没有迹象表明AJAX或XMLHttpRequest,如X-Requested-With: XMLHttpRequest
或Origin
。
必须从JavaScript中访问已抓取的内容,以便在扩展中进行进一步的操作和表示,很可能是字符串。
WebKit / Chrome特定的API中是否有任何钩子可用于进行正常的Web请求并获取处理结果?
var pageContent = getPageContent(url); // TODO: Implement
var items = $(pageContent).find('.item');
// Display items with further selections
奖励点,可以从磁盘上的本地文件进行此项工作,以进行初始调试。但是,如果那只是停止解决方案的唯一要点,则忽略奖金点。