老杂毛博客
  青青子衿,悠悠我心。但为君故,沉吟至今。
博客首页 | 人生历程 | 编程开发 | 机关门  
  文章分类
 
博客首页 > 搜索引擎研究 > 文章正文

将采集来的数据变成原创的几点想法

2010/1/7 13:26:56
 

            做网站自己写原创是一件非常难的事情,我们充其量最多也就是写一写个人博客,想写出几千上万的原创文章来真是难上加难,所以很多懂点程序的人就想去采集数据,怎么样把采集来的数据变成原创或是让搜索引擎收录呢,这是采集数据遇到的最大的问题,今天我就用这篇文章把几点想法和大家说说怎么把采集变成原创

第一:关键词替换法

        做法:将文章中的转折词用其相近的关键词来替换,如:“所以”换成“因此”,“如何”替换成“怎样”,“怎么”等,总结一下大概有几十上百个这样的词语。给大家看一个例子:


这是我之前在百度上提问过的一个问题,因为在百度上搜索不到tv150购物中心,所以就在百度上制作了这样一个问题好让网友找到我的网站,我们在看下面这个图:

这是排在下面的几个结果

我们可以看到百路知道和我爱问答的结果和百度知道上的是一模一样的,而我爱问答的结果是没有经过改变的,百路知道上的结果是经过改变的,只是把怎么给改成了如何。

这明显是机器所为。

第二:文章内容重组法

        这种方法适合篇幅较短或结构清晰的网站采集,比如像问答这种网站,我们可以把问题和答案单独采集,然后打乱顺序重新编排,而且还可以多个网站的问答同时采集,把相同答案合并,因为答案就像贴子一样都是一楼一楼的,而且不分先后顺序,所以我们可以把答案的前后顺序打乱,这样也有助于收录。

        另外笑话网站也可以这样做,把几篇笑话合并到一起,组成一篇笑话集,我的以前做过一个笑话网站就是这样做的,收录也不错。

第三:翻译文章法

        把原有的文章每一段都翻译成英文或繁体附加到每一段的后面,这样生成出来的文章应该也算是原创,我在网上好像看见有人这样做过。

 

第二种方法我认为是最可行的一种办法,如果有哪位有兴趣一试的话,可以写一个这样的程序。

阅读: (2322)  评论(3)  
 
网友评论:
 
 1.2016/7/1 12:59:54 
 2.2016/7/12 12:14:18 
 3.2016/11/9 13:44:31 
 
相关文章:
 谈谈换域名对网站的影响
 搜索引擎的工作原理是怎样的,搜索引擎是如何识
 百度越来越难用了
 b和strong用哪个?i和em哪个对搜索引
 地址(URL)中包含关键词对排名的影响,如何
 我们离框计算还有多远,未来的人工智能
 如何让自己的名字在百度上排名靠前
 网站改版注意事项以及如何不影响seo
 近几天google收录减少了
 asp网站如何做301重定向
 
 
     
联系作者: QQ: 657603425 Email: 657603425@qq.com
Copyright © 2007-2014 www.laozamao.com All Rights Reserved
京ICP备09002242号 北京海淀分局备案号:1101084842