baigo CMS


内容采集

内容采集是指 baigo CMS 系统通过技术手段,将管理员指定的网站内容采集到本系统的功能。

完成内容采集需要经过如下的流程:创建采集点 -> 数据采集 -> 采集审核

只有创建采集点以后才能开始真正的数据采集工作。

采集完成后,如网站为纯静态模式,还需要运行生成程序才能最终在网站上发布。


数据采集

点“全部采集”,列表中所有生效的采集点将开始采集数据。您也可单独点某个采集点的“开始采集”菜单,单独采集该点的数据。

系统会对已经采集过的数据做出标记,防止重复采集。系统会采集站点的第一页数据,如果有多页数据,系统将自动忽略后面的数据。

如果您想重复采集某条数据,可以先将该数据删除,然后再次采集,但是如果该数据在原始网站上已经不再出现在第一页的时候,将无法采集。


采集审核

在此,您可以查看采集到的内容并对数据做出编辑、入库等处理。

点“全部入库“,所有采集到的数据将开始导入文章数据表,形成系统的文章。

您也可以点查看,详细检查采集到的内容,如您想将采集到的数据进行编辑可以直接点“编辑并入库”,将进入创建文章的界面,采集到的数据将自动填充入相关的表单。

选中部分数据,然后将界面拉到底部,您可以将选中的数据进行入库、删除等操作。

系统会将已经入库的数据做出标记,防止重复入库,选中部分数据,点强制入库,将已经入库的数据再次强制入库,此时文章列表中可能会出现重复的数据。

v2.1 起支持采集功能。