Wordpress网站火车头采集+发布+图片本地化教程+定时发布+伪原创
在做lead的时候有时候需要做网站 内容需要采集 在加上欧美那边国家对版权比较重视 所以网站的文章要做伪原创发布
并且我们很多网站也不可能一个一个的来发文章 因此做上定时发布就完美
废话不多说开始我们的教程
在采集文章的时候我们可以找无版权的文章
www.articlebiz.com
www.articlecity.com
www.easyarticles.com
www.ezinearticles.com
火车头采集教程
这里使用的是火车头采集器9.8破解版的 可以在这个地址下载 https://dumuzhou.org/372.html
打开后我们新建任务
采集文章列表页
起始地址这里选择你要采集的文章列表页比如我的
https://www.articlecity.com/blog/category/articles/real-estate/page/1/
这里只会采集这一个列表 后面测试没成功 我们在分页采集调用
获取规则这里 我们一般选择手动
查看列表页的源代码 复制带有文章链接的代码
比如这个页面的文章html代码是这样的
<div class="mkdf-post-image">
<a href="https://www.articlecity.com/blog/how-much-does-it-cost-to-build-a-house/" title="How Much Does It Cost to Build a House?">
我们将链接改成 [参数] 最好是选择带有一个链接的 主要是看class属性 其他的标题或者图片 长宽高我们可以改成(*)
比如我改好之后的样子
<div class="mkdf-post-image">
<a href="[参数]" title="(*)">
拼接地址哪里我们选[参数N] 就可以了 会自己填写成 [参数1]
如果你的文章有很多的不要的链接 那就填写一下开头的字符串和结尾的 也就是html代码
然后我们测试地址 这里会让你保存 名字随意保存即可
如果这样文章没问题 我们就开始采集文章
采集文章内容
我们选择内容规则 你想要采集那些内容就新建那些标签 wordpress 默认的话是要有
新建标签字段
文章标题
作者
特色图片(缩略图)
发布时间
文章描述
TAG标签
这些你需要什么就添加什么 一般是根据你自己的网站有那些来的 比如我自己的
设置采集规则
添加好了标签后我们一个一个设置采集规则 比如标题的
查看文章的网页源代码
找到唯一属性的标题
比如我找到的标题是
<title>Finding a Home: 5 Cheap Housing Options That Are Still Nice and Safe - ArticleCity.com</title>
我们就在开头字符串填写<title> 结束字符串填写 - ArticleCity.com</title>
为什么结束要写 - ArticleCity.com</title> 而不是 </title>
是因为我们要把标题里面的ArticleCity.com 也要去掉 所以 把他加上 只要我们想要的部分
写完后测试一下看看标题能不能获取 能的话 多换几篇文章测试下 都可以就没问题了
如果文章有空格的话可以在数据处理哪里添加Htm标签过滤 把没用的过滤掉 后面我们文章内容要用到这些过滤
标题没问题后就开始采集文章 这里文章也是和标题一样的方法
需要注意的是 作者这里我们可以直接写死 因为不需要采集他的 这个看个人需求吧
文章内容这里我们可以过滤或者替换我们不想要要的内容
这个要过滤什么就根据需求来了 一般建议把div过滤掉 否则文章到你网站了可能会错位这些
不想要图片可以过滤掉图像
采集特色图片
火车头要采集特色图片的话 要wordpress网站后台安装一个插件
featured-image-from-url(后台搜索安装)使用方法点击这里
发布模块安装教程
下载下来是有两个文件的 一个是Locoy.php (这个上传到网站的根目录 可以改名字)Wordpress免登陆发布接口.wpm 这个问及爱你是发布模块 放在火车头采集器软件Module 这个目录下
每次操作都要记得保存
然后我们添加模块 (添加之前要把发布模块放在火车头采集Module 这个目录下 以及Locoy.php上传到你的网站根目录)
然保存好了后 选择这个模块
你的自定义标签采集规则都设置好了后 保存下 这里就可以开始采集了
开始采集内容
到这里就是整个的火车头文章采集发布的教程 我们可以查看运行日志 和实时数据 能看到采集的结果
图片本地化教程
细心的朋友会发现 文章是可以发布了 但是发布的文章图片链接地址还是外链 是对方网站上面的
接下来我们本地化
采集图片下载到本地
本地化这里我们在 标签列表里面 在新建一个标签 标签名字可以叫 特色图片下载
特色让图片下载和特色图标签的采集规则是一样的(我们新建这个标签主要是为了下载)
像我这样设置就可以 当然你也可以自定义 记得勾选下载图片按钮 探测文件一般是采集需要下载的内容需要的
文件保存目录填写
uploa\d\s/yyyy/MM/
文件保存格式填写
[原文件名]
然后在设置下载的地址
到了这一步 我们在测试会发现 图片会下载到我们设置的目录里面 但是线上的图片还是外链
接下来的这一步至关重要
线上外链图片替换
现在图片下载到本地了 线上依旧是外链 因此我们需要将 特色图片 进行一个替换
在字符处理哪里添加替换
替换的时候我们先复制我们采集到的图片地址 可以点击测试采集看到
比如我的是
https://www.articlecity.com/wp-content/uploads/2020/06/f66ab28d0281565cc41c50bbc1b373b1.jpg
这个每个人的都不一样 根据网站来的
然后我们将这个图片地址替换下
先来匹配
https://www.articlecity.com/wp-content/uploads/2020/06/f66ab28d0281565cc41c50bbc1b373b1.jpg
改成
https://[参数]/[参数]/[参数]/[参数]/[参数]/[参数]
这个是把网址 以及目录都变成了[参数]记得是有/的
然后在替换为
先写我们自己的网站 https://dumuzhou.org/
我们可以看到上面有6个参数 6层目录结构 我们的这个网址已经算是一层了 因为我们只需要后面的五层所以最后变成了
https://firstinsurancepros.com/[参数2]/[参数3]/[参数4]/[参数5]/[参数6]
因为我们不需要参数1 参数一是采集的网址 一定要记得有/ 最后一个不加/
这么说可能有点抽象给大家录制一个操作动态图
这里我们图片就好了 替换后 我们网站服务器是没有图片的
找到你设置保存的图片 将图片打包到服务器 解压就可以了
嫌麻烦 也可以设置ftp自动上传(这个大家可以自己尝试 也非常的简单 填写你的ftp地址 账号密码 选择被动模式 以及设置好你的上传目录)
到此图片本地化完成
文章定时发布
方法一使用发布模块自带
这个其实是wordpress发布模块自带的功能 打开你根目录下面的 Locoy.php(如果你自己改了名字自己找你改的文件)
搜索 配置参数开始,根据需要修改-
我们主要修改下面的配置就可以
在这里主要介绍3个配置:
- $post_status = "publish"; //"future":预约发布,"publish":立即发布,"pending":待审核
- $time_interval = 60; //发布时间间隔,单位为秒 。可是设置随机数值表达式,如如12345 * rand(0,17)
- $post_next = "next"; //now:发布时间=当前时间+间隔时间值 next: 发布时间=最后一篇时间+间隔时间值
$post_status指的是:wordpress的发布状态。如果是定时发布的话,就设置为"future"
$time_interval指的是:发布时间间隔,它和$post_next配合使用,定义的是时间间隔
$post_next指的是:发布的计时方式,now:发布时间=当前时间+间隔时间值 next: 发布时间=最后一篇时间+间隔时间值
这里的“future”就是“定时发布”的意思。还有一些文章状态,相应地更换“future”就可以实现了:
post_status文章状态:
publish:已发布
inherit:修订版
draft:草稿
auto-draft:自动保存的草稿
pending:待审
trash:回收站
future:定时
private:私有
我们可以大概设置一下
$post_status = "future";
$time_interval = 86400 * rand(0,100);
$post_next = "now";
future 代表定时发布
86400秒 = 1天,然后随机到100天发布,那如果我采集了50个文章时,相当于平均每天发布:50/100 = 0.5篇文章。
也就是说,平均 2 天会发布一篇文章。
实战试一下
假如我想让文章在10天内全部发完,只需要:
$time_interval = 86400 * rand(0,10);
假如我想让文章在2.85年内全部发完,只需要:
$time_interval = 86400 * rand(1,2.85);
然后将修改后的哈默插件上传到服务器,先把之前的采集文章在wordpress后台删除掉。
把任务设为:未发布状态:
再次点击:开始发布,这个时候看看后台的文章。就相当于1天发送2篇文章以上了。
方法二使用插件
WordPress定时发布文章插件Auto Post
后台搜索安装 Auto Post Scheduler
关键是设定好下面这几个地方:
然后点一下那个“enable Auto Post Scheduler”就可以了。
使用了这个插件的话可以把发布的文章都设置草稿 在后台设置好参数即可
可以定时每天发布 和设置那天不发
将wordpress所有已发布文章,设置为草稿,SQL代码如下:
UPDATE `wp_posts` SET `post_status` ='draft' WHERE (`post_status`='publish');
这个sql可以通phpmyadmin在或者用Navicat Premium
到这里自动定时发布就好了
文章伪原创
国内的伪原创太多了 包括火车头采集我们可以对接5118
这里我主要讲下国外的伪原创 我们主要用到的插件
Wordpress Auto Spinner - 文章重写器
这款插件的优点是支持很多语言 并且是内置的 当然他也支持国外主流的api接口
使用教程的话查看这篇文章
版权声明:
本站相关资源均存于来自于互联网,和网友投稿发送如果侵权或资源下载地址失效,如遇此情况可于本文留言或tg:@bayuechangan 联系博主,谢谢!!
下载本站软件注意:网站分享的软件资源并非本人原创,使用之前建议虚拟机运行
链接:https://dumuzhou.org/wordpress%e7%bd%91%e7%ab%99%e7%81%ab%e8%bd%a6%e5%a4%b4%e9%87%87%e9%9b%86%e5%8f%91%e5%b8%83%e5%9b%be%e7%89%87%e6%9c%ac%e5%9c%b0%e5%8c%96%e6%95%99%e7%a8%8b%e5%ae%9a%e6%97%b6%e5%8f%91%e5%b8%83/
文章版权归作者所有
共有 0 条评论