Idatica-带有现成模板的网站的免费解析器,您可以收集价格,特征,联系人,评论等。
idatica-一个免费的网站解析器,以自动模式收集站点的所有数据,并保存到文件。在Idatica的解析器的帮助下,您可以收集竞争对手,与Lyidogenation的联系人,评论有关商品,链接到图片等等。
可能性:
•使用准备好数据收集模板;
•用分页解析目录 - 自动过渡到下一页;
•解析商品卡和单个URL;
•在页面上解析某个区域;
•自定义 - 表列的类型;
•预先检查收集的数据及其数量;
•与XPath和CSS样式合作的能力;
•调整过渡到页面的速度;
•在CSV中设置所需分离器的能力;
•查看该过程的日志。
解析器限制:
解析器不会收集URL地址(带有标签<a> </a>的链接)。
阅读有关解析器功能的更多信息:
模板 - 带有准备的解析设置的文件。您可以下载完成的设置并从所需站点快速启动数据收集,而无需初步调整。您可以将设置保存为模板。
解析具有分页的目录 - 能够独立切换到目录中的下一页,您只需要在第一页上运行解析即可。
解析商品和单个URL卡 - 使用此选项,您可以跟踪所需的商品列表。
表列的可调类型 - 该程序允许您添加所需的列数并删除不必要的列。
收集到的数据及其数量的预审查是一种工具,可让您快速评估解析设置的正确性。单击相应的按钮时,该程序将显示您在所在页面上找到的数据及其编号。
使用XPATH和CSS的功能 - 您可以使用XPATH和CSS查询语言将其附加到页面上的数据。如果您不熟悉XPATH的功能,请在信息部分中查找我们的培训文章,几分钟后,您将学习基础知识,甚至可以在复杂的网站上配置数据收集。
过渡到页面的可调速度 - 此选项使您可以设置解析到新页面后开始的时间,这避免了由于频繁的吸引力而阻止站点的阻止,并给时间加载新页面。
在CSV中设置所需分离器的能力是一个方便的选项,可让您选择所需的符号作为分离器。
查看日志 - 显示每个步骤的信息字段,哪个页面是当前解析的,收集的元素的数量等。
注意力!遵循有关自动数据收集的目标站点的策略。
iDatica – бесплатный парсинг данных插件谷歌浏览器安装教程
第一步:下载iDatica – бесплатный парсинг данных安装扩展
第二步:下载下来的扩展解压到你想放的文件夹里
比如我解压到extend文件夹
打开Chrome的扩展页面(chrome:// extensions /或按Chrome菜单图标>更多工具>扩展程序),右上角开发者模式,点击开启,蓝色为开启,灰色为关闭;
再次将crx文件拖放到扩展程序,页面左下角提示:“扩展功能、应用和主题背景可能会损害您的计算机。您确定要继续吗?”
点击“继续”依然显示“无法从该网站添加应用、扩展程序和用户脚本”。尝试另一种办法方法。
第三步:把crx后缀改为zip,再进行解压
如果有些windows电脑系统查看不到文件扩展名,则可以通过以下设置:
找到文件夹顶部,点击查看
点击查看,找到隐藏已知文件扩展名,去掉前面的勾即可
这样你就能看到解压好的扩展名:.crx
解压的扩展名为.crx
把.crx改为:zip
然后再用解压工具再解压一遍,即可得到扩展的全部文件
然后再谷歌浏览器插件页面选择:加载已解压的扩展程序
这样就安装成功了
友情提醒:
其他浏览器,包括qq浏览器,360浏览器,edge浏览器,猎豹浏览器,搜狗浏览器安装插件的方法都是类似的,以上内容大部分通用!






