注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

网站运营 网络营销

开心冯

 
 
 

日志

 
 
关于我

石家庄人,电子商务专业。钟爱网络,网站运营,网络营销策划人。喜欢研究新式营销。 喜欢足球。

网易考拉推荐

说一说百度原创星火计划  

2013-05-29 20:55:56|  分类: 热门事件 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

一、搜索引擎为什么要重视原创

1.1 采集泛滥化

1.2 提高搜索用户体验

1.3 鼓励原创作者和文章

二、采集很狡诈,识别原创很艰难

三、百度识别原创之路如何走?

3.1 成立原创项目组,打持久战

面对挑战,为了提高搜索引擎用户体验、为了使优质原创者原创网站得到应有的收益、为了推动中文互联网的前进,我们抽调大量人员组成原创项目组:技术、产品、运营、法务等等,这不是临时组织不是1个月2个月的项目,我们做好了打持久战的准备。

3.2 原创识别“起源”算法

互联网动辄上百亿、上千亿的网页,从中挖掘原创内容,可以说是大海捞针,千头万绪。我们的原创识别系统,在百度大数据的云计算平台上开展,能够快速实现对全部中文互联网网页的重复聚合和链接指向关系分析。首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。

目前,通过我们的实验以及真实线上数据,“起源”算法已经取得了一定的进展,在新闻、资讯等领域解决了绝大部分问题。当然,其他领域还有更多的原创问题等待“起源”去解决,我们坚定的走着。

3.3 原创星火计划

我们一直致力于原创内容的识别和排序算法调整,但在当前互联网环境下,快速识别原创解决原创问题确实面临着很大的挑战,计算数据规模庞大,面对的采集方式层出不穷,不同站点的建站方式和模版差异巨大,内容提取复杂等等问题。这些因素都会影响原创算法识别,甚至导致判断出错。

第一点百度为何要重视“原创”?按照百度说法是由于大量采集、伪原创伤害用户体验,再加上百度鼓励原创。看似很符合逻辑,实则禁不起推敲,我不仅要问采集、伪原创伤害了用户体验,这跟百度竞价被诟病一直存在欺诈钓鱼站,只要花钱就可以推广从而让很多人上当受骗,哪个更伤害用户体验?百度鼓励原创这种说法更不靠谱,既然鼓励原创,早干嘛去了,现在才跑来说要鼓励原创,这么多年都在干吗?

最近看了《中国合伙人》,里边有句台词说的好:听一个人说话,不是听他说了什么,而是听他没说什么。首先我们来看,百度是一家商业公司,既然是商业公司,在天朝这种神奇的国度,从来都是利益才是第一位的。在中国互联网的网站中对百度贡献最大的是企业网站以及企业制作的盈利网站,这类网站最直接的就是通过百度竞价及百度联盟等形式来宣传推广。

而很大一部分中小企业网站根本无法原创,最多也只是伪原创,尤其是医疗行业和电商行业,医疗行业的病种也就来来回回几类,很难源源不断的进行原创更新,而电商行业的产品更是如此,即使上线新产品,但是介绍和信息也都是大致相同。企业也没有时间和精力去一一原创。如果百度针对原创进行打击,从而对这种没有原创网站降权,那么很大一批网站将不会有很好的权重,从而在自然推广得到的利益就很少,在百度关键词排名竞争中也就处于劣势。相反则会更加依赖百度的竞价系统来实现宣传推广。

第二点百度说识别原创很难,而且要走很长时间的路。到底有多难?百度没有表达。要走多久?百度只是说是一个持久战。这种文字表达游戏和语言组织能力,是我天朝特有的形式,为何现在很多民众不再相信官方发言,为何对外那个部门的讲话被称为玩文字游戏,这都是中国几千年来智慧的结晶(有点敏感,大家自行屏蔽)。

其实,我要说的是,百度在说了重视原创之后又说识别原创很难,这到底是个什么意思?这是先给大部分没有原创网站一个警告:我要打击伪原创,你们马上要倒霉了。而拥有原创的大多是个人站长,满心希望以为终于看到了曙光的时候,这时百度又说了,现阶段还无法有效识别原创,你再等等吧!相当于一张空头支票。

所以,广大站长你还在很傻很天真的以为百度真的是为了用户体验,真的是为了要鼓励你原创,真的是要给你的网站提升权重吗?快醒醒吧,那只是百度的一张画饼。

我并非是对百度报以敌意,相反,百度的这种做法在一定程度上促进了互联网的一种健康环境,一系列的算法更是净化了互联网的一种氛围,无论是seo还是网站营销手段都起到一个合理规范引导作用。但是所有的前提是百度是一家商业化公司,别想得太好,也别想得太坏!百度也没有义务担负起中国互联网的道德模范,因为盈利才是最终目的。

  评论这张
 
阅读(341)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017