搜索引擎真能判斷原創(chuàng)?
很多站長和SEO人員都反映百度不支持原創(chuàng)網(wǎng)站,自己原創(chuàng)的內(nèi)容被大站復(fù)制走后,排名都是大站的了,自己的站甚至不被收錄,更別提排名了。不討論現(xiàn)在百度和各大搜索引擎具體是怎么識別原創(chuàng)的,先按照咱們屌絲的思路簡單推測一下,如果搜索引擎要識別原創(chuàng)應(yīng)該會怎么做。
部分人認(rèn)為用文章的發(fā)布時間是最直接的了,誰發(fā)布早誰就是原創(chuàng)。這個道理是正確的,但是對于搜索引擎要判斷某一篇文章原創(chuàng)是比較困難的,因為網(wǎng)站發(fā)布內(nèi)容的時間存在太多不確定因素。
如果以網(wǎng)站上發(fā)布時間為準(zhǔn),那么就會誘使網(wǎng)站去主動改變自己網(wǎng)站上顯示的文章發(fā)布時間。比如內(nèi)容源網(wǎng)站標(biāo)注發(fā)布時間是2012年9月28日17點35分,那么采集網(wǎng)站完全可以改成17點30分,這樣采集網(wǎng)就是原創(chuàng)了。所以根據(jù)時間戳來判斷原創(chuàng)在實踐中是不可能的。
以spider抓取時間為準(zhǔn)的話,小站被大站抓取的情況下,搜索引擎必然認(rèn)為是大站原創(chuàng)小站抄襲。
所以國內(nèi)的搜索引擎對于原創(chuàng)并沒有非常嚴(yán)格的識別機制,基本上還是看哪個網(wǎng)站的影響力大,用戶體驗優(yōu),就給予哪個網(wǎng)站優(yōu)先收錄,提供穩(wěn)定優(yōu)質(zhì)信息比原創(chuàng)更重要。
部分人認(rèn)為用文章的發(fā)布時間是最直接的了,誰發(fā)布早誰就是原創(chuàng)。這個道理是正確的,但是對于搜索引擎要判斷某一篇文章原創(chuàng)是比較困難的,因為網(wǎng)站發(fā)布內(nèi)容的時間存在太多不確定因素。
如果以網(wǎng)站上發(fā)布時間為準(zhǔn),那么就會誘使網(wǎng)站去主動改變自己網(wǎng)站上顯示的文章發(fā)布時間。比如內(nèi)容源網(wǎng)站標(biāo)注發(fā)布時間是2012年9月28日17點35分,那么采集網(wǎng)站完全可以改成17點30分,這樣采集網(wǎng)就是原創(chuàng)了。所以根據(jù)時間戳來判斷原創(chuàng)在實踐中是不可能的。
以spider抓取時間為準(zhǔn)的話,小站被大站抓取的情況下,搜索引擎必然認(rèn)為是大站原創(chuàng)小站抄襲。
所以國內(nèi)的搜索引擎對于原創(chuàng)并沒有非常嚴(yán)格的識別機制,基本上還是看哪個網(wǎng)站的影響力大,用戶體驗優(yōu),就給予哪個網(wǎng)站優(yōu)先收錄,提供穩(wěn)定優(yōu)質(zhì)信息比原創(chuàng)更重要。




