采集器根目录
A. 织梦内容管理系统的系统目录—根目录
/dede 管理后台目录
/freelist 自由文档列表生成目录
/html 默认文章生成目录
/include 程序核心文件目录
/member 会员管理目录
/plus 插件及辅助功能目录
/setup 安装目录
/special 专题生成目录
/templets 默认模板存放目录
/upimg 上传下载文件保存目录
base.css 基本样式表
index.php 网站默认首页
robots.txt 搜索控制文件 article_article.htm 普通文章页面模板
article_default.htm 一般文档页面模板
article_flash.htm flash页面模板
article_image.htm 图集页面模板
article_soft.htm 软件页面模板
article_spec.htm 专题页面模板
index.htm 网站首页模板
index_article.htm 文章频道封面模板
index_article_webart1.htm
index_article_webart2.htm
index_article_webart.htm
index_default.htm 一般文档封面模板
index_flash.htm flash频道封面模板
index_image.htm 图集频道封面模板
index_soft.htm 软件频道封面模板
list_article.htm 文章列表模板
list_default.htm 一般文档列表目录模板
list_flash.htm flash文档列表模板
list_free.htm 自由列表模板
list_image.htm 图集列表模板
list_soft.htm 软件列表模板
list_spec.htm 专题列表模板
/img 模板图片目录(含样式表) download_links_templet.htm 下载链接模板
feedback_confirm.htm 评论确认模板
feedback_templet.htm 用户评论模板
feedback_templet_js.htm
flink-add.htm 友情链接添加模板
flink-list.htm 友情链接列表模板
guestbook.htm 留言本模板
heightsearch.htm 高级搜索模板
js.htm
recommend.htm 推荐好友模板
rss.htm RSS的XML模板
rssmap.htm RSS订阅文件
showphoto.htm 图片显示模板
sitemap.htm 网站地图模板
view_msg.htm 会员提示信息模板
vote.htm 投票结果显示模板 channel_list.htm 栏目列表系统模板
list_fulllist.htm 文档列表系统模板
mynews.htm 站内新闻系统模板
part_arclist.htm 文章列表系统模板
part_autochannel.htm 分类栏目系统模板
part_channelartlist.htm 包含文章列表的栏目系统模板
part_imginfolist.htm 使用imginfolist标签调用的模板
part_imglist.htm 使用imglist标签调用的模板
part_type_list.htm 单个栏目的系统模板
spec_arclist.htm 专题列表文章系统模板
spec_list.htm 专题用模板
tag_arclist.htm
tag_fieldlist.htm fieldlist用系统模板
/system/channel 频道特殊底层模板目录
channel_downlinkpage.htm 下载地址列表链接模板
channel_downlinks.htm 下载地址列表模板
channel_spec_note.htm 专题节点列表模板 config_base.php 环境定义文件。用于检测系统环境,定义工作目录,保存数据库链接信息,引入常用函数等,建议不要修改。
config_hand.php 系统配置文件。定义系统常用的配置信息定义,可从后台管理直接生成该文件。
config_passport.php 通行证文件
config_rglobals.php 检测系统外部变量
config_rglobals_magic.php 同上
inc_archives_view.php 用于浏览文档或对文档生成HTML
inc_arclist_view.php 用于浏览频道列表或对内容列表生成HTML
inc_arcmember_view.php 用于浏览会员发布的文档
inc_arcpart_view.php 用于解析和创建全局性质的模板,如频道封面,主页,单个页面等
inc_arcsearch_view.php 用于文档搜索
inc_arcspec_view.php 用于浏览所有专题列表或对专题列表生成HTML
inc_channel_unit.php 用户解析特定频道的附加数据结构信息
inc_channel_unit_functions.php 系统共用函数集合
inc_downclass.php 防采集随机字符串函数
inc_freelist_view.php 用于对特定内容列表生成HTML
inc_functions.php 可供用户使用的函数集合
inc_imgbt.php GetTypeidSelMember
inc_memberlogin.php 用于用户登录及获得会员状态
inc_photograph.php 用于处理系统中的图片,例如水印,缩略图等
inc_photowatermark_config.php 图片处理参数定义
inc_rss_view.php 用于浏览频道RSS或对RSS生成静态文件
inc_separate_functions.php SpGetArcList函数,用于获得文档列表
inc_sitemap.php 用于生成网站地图
inc_type_tree.php 用于选择栏目的目录树
inc_type_tree_member.php 同上,会员使用
inc_typelink.php 用于显示文章的位置和栏目位置等
inc_typeunit_admin.php 用于频道管理时的一些复杂操作,主要用于后台
inc_typeunit_menu.php 同上
inc_userlogin.php 用于管理员登录
inc_vote.php 用于管理投票
jump.php 用于超链接跳转
pub_charset.php 共用字符处理函数,GB/UTF-8/Unicode/BIG5等互换
pub_collection.php 用于采集
pub_collection_functions.php 采集用函数
pub_datalist.php 后台管理用数据列表
pub_datalist_dm.php 同上,不使用模板
pub_db_mysql.php 用于操作数据库
pub_dedehtml2.php 用于采集中的HTML解析
pub_dedehtml.php HTML解析器
pub_dedetag.php 用于dede模板标签解析
pub_httpdown.php 用于下载http中的资源
pub_oxwindow.php 后台程序扩展
pub_splitword_www.php 织梦分词算法
validateimg.php 验证码
vdimgck.php 验证码 inc_fun_funAdmin.php 获取拼音码等函数
inc_fun_funString.php html代码处理等函数
inc_fun_SpGetArcList.php 获取文档列表SpGetArcList
B. 火车头采集器在win7下打不开。
楼主的问题解决了吗?我也碰到这个问题,win7下无法使用,好纠结!
C. 八爪鱼采集器如何将采集到的图片和文字内容发布到网站(discuz!x3.2)
准备工作,在发布前要先将发布接口文件(jiekou.php)拷贝到的网站根目录下,并修改发布密码
数据采完之后,在单机采集任务页面选择发布到网站
设定发布的对应接口地址和密码以及接口参数,点击下一步
必填参数:subject(标题),message(正文),username(用户名),fid(论坛板块id)
这里有个教程可以参考一下http://www.bazhuayu.com/tutorial/dzfb.aspx
D. 八爪鱼采集器发布到DZ3.2论坛视频的详细教程要视频的!!!!
八爪鱼的数据发布到论坛的方法没有视频的教程,
这里是图文发布dz的图文教程,你可以参考下:
http://www.bazhuayu.com/tutorial/dzfb.aspx?t=1
步骤:
先在刚刚的教程网站下载“发布到Discuz! X3.2接口文件”
在发布前要先将发布接口文件(jiekou.php)拷贝到的网站根目录下,并修改发布密码
再数据采集完成后进入导出向导,选择下一步
设定发布的对应接口地址和密码以及接口参数,点击下一步,即可发布
必填参数:subject(标题),message(正文),username(用户名),fid(论坛板块id)
发布完毕,想继续向其他论坛发布可回到上一步更改发布地址。
E. Phpcms设置火车头采集器发布模块时的全局变量设置怎么填
本人钻在火车头web发布配置一整天终于琢磨出怎么用了。看了点教程,没有说道点子上。其中遇到的问题现在记得很清楚相信正在钻研的朋友也是一样。趁热跟大家分享一下。
火车头采集第一、二步不会的自己去找教程,网上多的是。 直接进入 web的发布的配置(bdyxel原创)
进去之后先选择你要发布的web网站类型,我这里以phpcmsV9为例,内容不用编辑了,都是编辑好的,这点真是比以前方便不少
第三步先配置网站,我用的是(在内置浏览器登录)输入登录的网址,和其他浏览器一样。之后点微型浏览器里的确定即可。
注意地址栏里的红色标识。就这个地方让我绕了大半天(bdyxel原创)
我们看到我这里 pc_hash=4PwPGS
每次登录pc_hash这个全局变量值都会改变所以登录操作只能用“使用内置浏览器登录”并获得pc_hash这个变量的值手动填写到“全局变量设置”里。
然后将值 填在第二步 (bdyxel原创)
然后 编码设置
网站根目录一定要填,不知道根目录是什么的自己去网络
获取列表 选择要发布的列表
(bdyxel原创)
测试配置
注意:标题和内容需要自己手写。 直接点修改就OK了。
然后直接点修改,值里面不是空的就点发表文章测试。测试完,在内置浏览器中浏览。可以看到了
最后一步,填上配置名,保存设置就OK了。
F. phpcms网站建设中采集的方法,怎么样做采集
工具/原料
PHPCMS
文章采集器
方法/步骤
1、首先我们需要下载并安装GBK格式的PHPCMS系统。
2、下载PHPCMS和文章采集器的接口文件
3、将jiekou.php文件复制到网站的根目录下,并用记事本打开该文件,修改“密码验证”栏目password处的密码
4、启动文章采集器,先点击【第三步发布内容设置】中的"web发布管理配置"
5、在弹出的【web发布配置管理】窗口中单击右侧的【更多】按钮,导入“phpcms9.wpm”配置模块,并选择该模块
6、设置【web发布配置管理】中的编码设置、登录操作、获取分类栏目等选项
7、单击【测试】按钮,在弹出的【发布配置测试】对话框中设置标签和内容的值,此项为必须设置,否则发布测试文章会失败。至此PHPCMS已经与文章采集器连接成功。
G. 有没有phpcms v9的火车头采集入口
1、首先下载安装好火车头采集器软件(收费免费的本文均适用),这个我相信大家都会,如有不会的找网络或官方论坛。二、下载phpcmsv9火车头接口文件jiekou.php与发布模块,官方下载地址http://bbs.locoy.com/spider-57236-1-1.html,本站下载地址(选本站更好些,不用转换发布模块,站在前辈肩膀上就是好,不用写接口文件也不用写模块)。
2、接口文件修改与上传:用软件或文本打开jiekou.php文件,找到$password='123456'; ”这句把123456修改成你想要的数字串,任意数字吧,我现在把它修改为$password='111111'; ,记下这个数字串,后面设置发布模块要用到。修改后保存,用FTP上传到你网站的根目录下,即www文件夹下。
3、设置发布模块:打开火车头软件,找到界面上的:发布:按钮
4、点击进入发布模块界面,我们用6步来完成模块设置,与界面上面的12345步骤顺序有所不同。1.点击新建,找到配置名处:起个配置名,在这里我把这个配置名命名为lunwen。2.选择编码设置,与自己网站的一样吧,在这里我选择GB2312.3.登录操作:首先填入网站根目录地址,如*********,记得这个一定要填根目录;然后点击“在内置浏览器中登录”按钮,用内置浏览器把网站打开,输全后台登录网址,和平时进后台方法一样,登录后台。登录成功后点下下面的“确定”按钮,点击回到模块设置界面:
5、这步很重要,“选择web在线发布模块”,里面没有模块,我们就点最右边的绿字“更多”,然后选择“导入”选中我们在第二步中下载好的phpcmsv9发布模块phpcms9.wpm(官方下载的叫phpcms9.cwr,需要转为wpm格式,欢迎页界面的扩展上可以转)。导入后,点绿色字“编辑”,进入编辑界面,点击获取栏目列表,看到界面中“刷新列表页面”中的地址:/jiekou.php?pw=123456,后面的123456数字串要改为与jiekou.php里的一样,即/jiekou.php?pw=111111,前面jiekou.php里我们是设置为了111111,所以这里改为与之一样。
phpcms v9火车头采集器接口设置图文教程
6、设置完后再点击“内容发布参数”按钮,设置方法和上面图中的一样,见下图吧
phpcms v9火车头采集器接口设置图文教程
7、上面设置好了,这步就点“获取列表”,如果上面设置都正确,就会自动获取到网站的所有栏目,如果不能获取就说明上面设置不对,重新检查一次看看。6.成功获取列表后就算成功了,点击“保存设置”,模块设置成功。6步走总图见下图
phpcms v9火车头采集器接口设置图文教程
8、下一步就等着写采集规则了,做过采集的写火车头采集器采集规则应该不难,都差不多,只要在有多页时注意一下就行了,不懂可以查下网络或论坛,例子很多也很全。