火车头DEDECMS V5.5 UTF-8采集模块

编程开发 / , , / at

1、若要火车头采集文章中的远程图片发布到本站,并自动提取文章内的缩略图,需要设置:火车头采集器内容标签里的“HTML标签排除”不勾选“图像”,并且勾选文件下载选项里的“将相对地址补全为绝对地址”,这些图没必要下载到本机,所以,文件下载选项其他选项不必勾选;

2、DEDECMS V5.5 UTF-8采集模块发布参数里remote=1下载远程图片和资源(总开关:DEDECMS系统基本参数-其他选项-远程图片本地化),autolitpic=1提取第一个图片为缩略图(总开关:DEDECMS V5.5 UTF-8系统基本参数-其他选项-提取第一张图片作为缩略图),needwatermark=1图片是否加水印(总开关:DEDECMS图片水印设置-上传的图片是否使用图片水印功能,下面个“采集的图片是否使用图片水印功能”指的是DEDE内置的采集系统,你若是使用火车头,此选项可不必理会)

3、有时采集的图片过大,会撑破页面布局,这时你可以在火车头采集时自动替换“<img”为“<img width=”宽度” height=”高度””,但这种可能会造成图片不成比例变形,推荐使用javascript来控制图片自成比例大小,即替换“<img”为“<img onload=”ResizeImage(this,580)””

4、火车头WEB在线发布模块里,同一个标签在文章发表参数的POST数据里不能出现两次,否则出错,比如很多人想让关键词和标签一致,会这样写tags=[标签:标签]&keywords=[标签:标签],这是会出错的,你可以让关键词在采集时自动截取TAGS字符来解决这个问题

5、DEDECMS采集POST数据参数arcrank建议值为-1,是文章发布后并不立刻生成,待审核的意思,这样可以确保在发表之前,能从DEDECMS V5.5 UTF-8后台进行编辑

6、火车头DEDECMS在线发布模块登录,建议使用火车头采集器内置浏览器中登录,获取COOKIE,验证码易出错

7、我的火车头采集器POST数据:title=[标签:标题]&shorttitle=[标签:SY_小标题]&tags=[标签:标签]&keywords=[标签:SY_关键词]&description=[标签:SY_摘要]&body=<p>[标签:内容]</p>&typeid=[分类ID]&typeid2=&source=[标签:来源]&pubdate=[标签:时间]&click=[标签:点击]&picname=&litpic=&ddisremote=&writer=&dede_addonfields=&remote=1&autolitpic=1&needwatermark=1&sptype=hand&spsize=5&notpost=0&sortup=0&color=&arcrank=-1&money=0&ishtml=1&filename=&flags[]=&redirecturl=&channelid=1&dopost=save&templet=

8、采集模块登陆时总是提示刷新列表错误或者读取验证码失败,多半是因为验证码生成文件不在DEDECMS的后台管理路径里,而火车头采集模块地址是CMS路径地址+验证码地址,一般人CMS路径都是填成qqcampus.org/dede这样,验证码地址是/include/vdimgck.php,这样加一块就是qqcampus.org/dede/include/vdimgck.php,这是错误的,实际的是qqcampus.org/include/vdimgck.php,所以火车头采集器读取验证码失败,常用的解决方法是,CMS路径不要加后台目录,找个都加到后面每个实际路径里,或者手动关闭DEDECMS的后台登陆验证码,方法:dede/login.php找到if($validate==” || $validate != $svali)替换为if(false)

9、本次所使用火车头版本:火车采集器2009SP4正式版

10、下载dede-5.5-utf8

8条回应:“火车头DEDECMS V5.5 UTF-8采集模块”

  1. lei说道:

    不过 这个 怎么用呢?
    cwr这个文件要怎么与dede结合起来呢?

    • GlobeTour说道:

      这个文件是火车头的模块文件,是在火车头里使用的,然后做好采集规则,可以直接发布到DEDE里。

      • lei说道:

        不好意思。我用了这个dede模块了。然后web发布显示采集和发布及入库也显示完成。但是网站/数据库里却没有任何采集的数据。只有测试模块成功时入库的一条数据。
        请问这是什么原因呢?

        谢谢

        • GlobeTour说道:

          你在发布时要用火车头抓取登陆COOKIES

          • lei说道:

            不好意思。我发布时,到网站配置中登录后不确认修改配置可以自动登录。但是确认修改配置后,再次编辑该网站配置,则不能自动登录了。必须输入用户名密码。cookies难道是失效了?

            很有问题。求解

  2. lei说道:

    望速回复。。。

  3. lei说道:

    盼望lz回复……
    怎么与dede结合啊。。。

  4. sharesmile说道:

    在采集过程中,采集的PHP文件怎么用?

发表评论

电子邮件地址不会被公开。 必填项已用*标注