使用Discuz X 系列做論壇的站長很多,并且,其中很多人都在使用Discuz的門戶系統(tǒng),將很多固定的信息資訊都發(fā)布在門戶的各個(gè)頻道,以專題或者欄目的方式保存。這其中一定很多站長遇到過提取的文章或者直接發(fā)布的文章不收錄的問題,今天筆者就跟各位分享下玩改車(http://wangaiche.com)在解決門戶文章收錄問題時(shí)候的一些嘗試,以及最終的發(fā)現(xiàn),并且,成功的將幾乎所有的文章都讓百度收錄!玩改車很多內(nèi)容是搜集整理(也可以說是采集的,不過,都是有針對性的做了調(diào)整和修改)的,也有一些是我們自己的原創(chuàng)文章,從網(wǎng)站上線被收錄內(nèi)頁開始到之后的2個(gè)月,一直有很多文章沒有被收錄,一直不知道是什么原因,開始我們以為是文章內(nèi)容不是原創(chuàng)導(dǎo)致的,就連續(xù)做了很多篇原創(chuàng)的文章,可是,依然有很大一部分百度根本不收錄。非常困惑,按理說,網(wǎng)上找不到的文章,收錄應(yīng)該很快才是啊(網(wǎng)站一直是隔天快照的),沒有辦法,只能接著研究和分析! 接下來,我們把收錄的原創(chuàng)文章、不收錄的原創(chuàng)文章和整理過來的文章拿到一起來對比,發(fā)現(xiàn)了幾處不同的地方:1、文章來源;2、來源地址;3、原作者;4、發(fā)布時(shí)間;5、整理的文章尾部的版權(quán)聲明;我們根據(jù)這幾點(diǎn)不同的地方,分別制作不同的原創(chuàng)文章和整理文章,每篇文章更新的時(shí)候,只帶上面5項(xiàng)中的其中一項(xiàng),即使我們網(wǎng)站是秒收的,我們依然試驗(yàn)了一下午,才發(fā)現(xiàn)最終的測試結(jié)果:原作者!只有提取或者發(fā)布的文章填寫了“原作者”,才能夠讓百度很快的收錄!為了確保測試的準(zhǔn)確性,我們又接著做了很多詳細(xì)的測試,發(fā)現(xiàn)確實(shí)如此,只要有“原作者”,百度就會秒收! 我們接著又比較了很多網(wǎng)站的文章部分,發(fā)現(xiàn)確實(shí)都有同樣的問題,并且,不僅僅是Discuz X系列,其它的CMS系統(tǒng),或者是自制的網(wǎng)頁,只要有類似于:“原作者”,“出處”,“轉(zhuǎn)載自”,“源自”等等的字眼,百度收錄就很快。其實(shí),這也說明了百度還是對文章內(nèi)容以及相關(guān)信息做仔細(xì)校驗(yàn)的,這樣的目的,也確實(shí)能夠很快的保證收錄,節(jié)省很多服務(wù)器資源,提升文章收錄效率,并且,可以確保文章的來源渠道是正常的。 其實(shí),我猜測百度還有很多類似的機(jī)制,來確保文章的真實(shí)性、時(shí)效性和正確性。例如:文章的發(fā)布時(shí)間,即使你是轉(zhuǎn)載的,百度依然能夠很清楚,哪里才是首次被發(fā)現(xiàn),并且,百度有時(shí)候自己也會把這個(gè)時(shí)間“不小心的”顯示在某個(gè)地方:快照! 好了,我們給大家分享這個(gè)方法,其實(shí)也還是有個(gè)問題的,就是我們很擔(dān)心百度將這部分文章認(rèn)定為是采集的,不過,后來一想,百度肯定不僅僅是靠這一個(gè)機(jī)制,所以,還是先提升收錄吧,有了收錄,才能考慮的!本文由 (http://wangaiche.com)站長供稿!
|