firefox کاربر طلایی دلتافوکس وضعيت: آفلاين 28 آذر ماه ، 1387 تعداد ارسالها: 2074 امتياز: 1285 تشکر کرده: 64 تشکر شده 216 بار در 48 پست
ارسال شده در:
جمعه، 6 دي ماه ، 1387 23:26:40
موضوع مطلب: آموزش گرفتن pagerank در گوگل!
كاربرد PageRank
PageRank يكي از روشهائي است كه Google از آن براي تعيين ارتباط يك صفحه با موضوع و اهميت آن استفاده مي كند. PageRank تنها يكي از مقوله هائي است كه مربوط به ليست شدن سايتها در گوگل مي باشند.
PageRank هر صفحه در نوار ابزار ( Toolbar ) گوگل نمايش داده ميشود. اگر بخواهيد ميتوانيد آنرا از آدرس
دريافت نمائيد. PageRank عددي بين 0 و 10 است و به نظر ميرسد كه از يك مقياس لگاريتمي پيروي مي نمايد.
Toolbar PageRank
(log base 10)
Real PageRank
0
0 - 10
1
100 - 1,000
2
1,000 - 10,000
3
10,000 - 100,000
4
and so on...
جزئيات دقيق اين مقياس مشخص نيست ، چرا كه PageRank صفحات هر ماه و در زماني كه گوگل رتبه بندي خود را انجام ميدهد عوض ميشود . اگر فرض كنيم كه مقياس به صورت لگاريتمي است ، پس گوگل مي تواند به بالاترين PageRank عدد 10 را نسبت دهد و بقيه را نسبت به آن رتبه بندي نمايد. همچنين خود نوار ابزار گوگل بعضي مواقع PageRank را حدس ميزند به خاطر اينكه به صفحاتي كه تازه Upload شده اند نيز PageRank تعلق ميگيرد.
اينطور به نظر ميرسد كه نوار ابزار به URL نگاه ميكند و از روي آن صفحه مادر ( اشاره كننده ) را تشخيص ميدهد و اگر صفحه مادر داراي PageRank باشد ، نوار ابزار عدد 1 را از آن كم ميكند و به به صفحه مذكور PageRank نسبت ميدهد. و اگر از اين راه نتواند PageRank را حدس بزند آنگاه عبارت PageRank بروي نوار ابزار خاكستري ميشود و عبارت No PageRank Information available پس از قرار گرفتن موس بروي آن نمايش داده ميشود.
PageRank چيست؟
به طور مختصر ميتوان گفت كه : PageRank يك "راي" به اهميت يك صفحه خاص است كه توسط تمامي صفحات ديگر وب به آن اختصاص داده مي شود. هر link به صفحه يك راي مثبت به PageRank آن مي باشد و اگر لينكي وجود نداشته باشد راي ممتنع ميگردد (دقت كنيد كه راي منفي نمي شود).
خود گوگل PageRank را به شرح زير تعريف مي نمايد.
"فرض كنيم كه صفحه A داراي صفحات T1 تا Tn است كه به آن اشاره مي كنند. d هم يك فاكتور كند كننده ( damping factor ) است كه مقداري بين 0 تا 1 دارد. معمولا براي d مقداري معادل 0.85 انتخاب ميشود. همچنين C(A) تعداد لينكهائي كه اين صفحه به صفحات ديگر داده است. در اين صورت PageRank صفحه A مساوي است با :
PR(A) = (1-d) + d(PR(T1)/C(T1)+...+PR(Tn)/C(Tn))
بايد توجه داشت كه PageRank به صورت يك احتمال پراكندگي ( probability distribution) بوجود مي آيد و از يك الگوريتم تكرار شونده استفاده ميكند."
اجازه دهيد كه نحوه عملكرد اين فرمول را با تقسيم وظايف اجزاي آن توضيح دهيم :
PR(Tn) : هر صفحه PageRank خود را دارد. كه PR(T1) براي صفحه اول سايت است و PR(Tn) براي nامين صفحه اي كه در سايت به آن مي رسيم.
C(Tn) : هر صفحه راي خود را به صورت مساوي بين صفحاتي كه به آنها لينك داده است تقسيم ميكند. تعداد لينكهاي خارج شده از صفحه 1 را با C(1) و براي صفحه nام را با C(n) نشان داده ايم.
PR(Tn)/C(Tn) : اگر صفحه A از صفحه n يك لينك داشته باشد آنگاه سهم راي صفحه A برابر ميشود با PR(Tn)/C(Tn)
d(... : تمامي آراء با هم جمع ميشود و براي اينكه از افزايش بي رويه وزن برخي از صفحات جلوگيري شود اين مجموع در عدد 0.85 ضرب مي شود.
(1-d) : براي اينكه ميانگين PageRank ها همواره يك باشد.
نحوه محاسبه PageRank
فهميديم كه PageRank صفحه به PageRank صفحاتي كه به آن لينك داده اند بستگي دارد. بنابر اين اين طور به نظر مياد كه ما نميتوانيم PageRank يك صفحه را بدست بياوريم مگر آنكه PageRank صفحات اشاره كننده به آن را محاسبه كنيم. و همچنين اگر يك صفحه داراي لينك به خودش باشد و يا اينكه صفحات از يك شكل دايره اي لينك دادن استفاده كرده باشند تكليف چيست؟
اما حقيقت امر به اين بدي نيست . يعني ما ميتوانيم PageRank صفحه را بدون دانستن PageRank صفحات ديگر بدست آوريم. اين عجيب به نظر ميرسد ولي اساسا هر بار كه ما محاسبه را تكرار ميكنيم يك رقم به رقم نهائي نزديك تر ميشويم. پس تنها چيزي كه بايد به خاطر داشت مقدار بدست آمده در هر بار محاسبه فرمول ميباشد و آنرا بايد تكرار كرد تا آنكه ديگر عدد بدست آمده آنچنان تغييري نكند. در اين زمان به عدد PageRank واقعي رسيده ايم.
يك مثال ساده : دوصفحه كه هر كدام به يكديگر اشاره ميكنند.
هر كدام از اين صفحات تنها يك لينك خروجي دارد . پس C(A) = 1 , C(B) = 1
نميدانيم كه براي شروع PageRank اين صفحات چيست . پس حدس مي زنيم.
حدس 1 :
حدس مي زنيم كه PageRank صفحات 1 است و محاسبه را انجام مي دهيم.
خوب، همان طور كه پيداست اعداد به سمت عدد 1 كم مي شوند و زماني كه به عدد يك برسند ديگر تغيير نخواهند كرد.
كد اجرائي و همچنين برنامه مورد نظر اين محاسبات كه با حدس صفر شروع شده : Show the code | Run the program
اصل مهم : بنابر اين مهم نيست كه حدس را چه عددي قرار دهيم ، محاسبه نهائي به عدد يك ختم خواهد شد.
به جواب سريعتر برسيم
براي رسيدن به جواب در شبكه هاي بزرگ به چه تعداد محاسبه نياز است؟ مثلا براي شبكه اي به گستردگي اينترنت احتياج به ميليونها محاسبه خواهد بود. انتخاب ترتيب محاسبه مي تونه مفيد باشه. با اينكه جواب نهائي يكسان است ، اما انتخاب ترتيب مراحل محاسبات ميتونه به سرعت انجام آن كمك كنه.
اصل مهم :
اگر صفحه اي داراي اهميت بالائي مي باشد ، آنرا در بالاي مدل سلسله مراتبي قرار دهيد.
اگر صفحات سايت شما داراي لينكهاي خروجي زيادي هستند ، سعي كنيد لينكهاي داخلي سايت را افزايش دهيد تا PageRank صفحات را ثابت نگه داريد .
اگر صفحاتي از سايت شما داراي لينك خروجي نيست ، افزايش تعداد لينكهاي داخلي هيچ تائيري بر PageRank ندارد. پس دقت كنيد كه سايت خود را از حالت قابل استفاده خارج نكنيد.
اهميت داشتن Site Map
داشتن Site Map به دودليل مهم است
اگر كاربر URL اشتباه وارد كند ، اكثر سايتها يك صفحه غير مفيد به عنوان "404 Page not found" نمايش ميدهند. اين براي كاربر مايوس كننده ميباشد. بهتر است كه صفحه اين خطا به حالتي تغيير كند كه اولا علت خطا را نمايش دهد و ثانيا Site Map را هم نمايش دهد .
لينك دادن به Site Map در هر صفحه تعداد لينكهاي داخلي را افزايش ميدهد و در نتيجه از هدر رفتن آراء بر اي ارتقاء PageRank جلوگيري ميكند.
پس ميتوان گفت كه : بهترين متوسط PageRank صفحات سايت شما عدد 1 است و داشتن تعداد صفحات زياد اصلا اهميت ندارد. ولي در مدل سلسله مراتبي ميتوان راي ها را به سمت صفحه Homeمتمركز كرد و PageRank آنرا بالا برد.
از اين روش برخي از سايتها براي بالا بردن PageRank استفاده مي كنند كه اگر رباتهاي گوگل ( Google's robots) متوجه آن شوند به احتمال زياد از حضور آن سايتها در فهرستهاي گوگل جلوگيري ميكنند.
بنابراين ، پيشنهاد ميكنم كه از دو روش صحيح زير براي بالا بردن PageRank سايت خود در گوگل استفاده كنيد.
داراي دهها و شايد صدها نويسنده و ويراستار خبري ميباشد. هر كدام از صفحات اين سايت داراي مطالب جهاني و مهم هستند و تمامي آنها نيز به صفحه Home سايت لينك داده اند. بنابراين مي بينيم كه PageRank صفحه Home آن 9 از 10 است.
پس هيچ جايگزيني براي محتواي خوب وجود ندارد!
2 - يك چيز مفيد براي ارائه به ديگران داشته باشيد
مي بينيم كه
داراي PageRank معادل 8 از 10 است. با اينكه سرمايه گذاري و بازاريابي قوي پشتيبان آن نبوده است. چه طور اين اتفاق افتاده است؟
علت آن است كه بسياري از افراد كه داراي سايتهاي bulletin board هستند از سيستم مديريت phpbb استفاده كرده اند . در تمام صفحات سايت آنان عبارت زير مشاهده ميشود.
Powered by phpBB
پس ميليونها صفحه راي خود را با قرار دادن اين لينك در خود به سمت سايت
ابزارهاي مفيد رايگان در اختيار ديگران قرار دهيد تا مديران سايتها پس از استفاده از آن با رقبت به سايت شما لينك دهند.
بهتر است كه لينكهاي ورودي از سايتها ي زيادي (حتي سايتهائي با PageRank كم ) به سايت شما وجود داشته باشد تا اينكه تنها چند لينك محدود (ولو از سايتهائي با PageRank بالا ) به سايت خود داشته باشيد.
نتيجه گيري نهائي
PageRank ساده است (به جز يك فرمول ترسناك ) ولي وقتي يك محاسبه ساده ميليونها بار تكرار مي شود نتايج ممكن است پيچيده به نظر آيد.
PageRank تنها قسمتي از مسائل تعيين كننده رتبه در ليستهاي گوگل است. به طور مثال شواهد نشان داده است كه گوگل اين روزها به متن موجود در يك href براي تگ
PageRank جزئي از داستان ليست شدن در فهرست گوگل است ولي ارزش آنرا دارد كه با آن به عنوان يك طرح خوب در اينترنت بيشتر آشنا شويد.
منابع :
The original PageRank paper by Google’s founders Sergey Brin and Lawrence Page -
Phil Craven’s PageRank Calculator (fortunately his figures agree with mine)
A detailed explanation of how Chris incorrectly altered the PageRank equation with his MiniRank model
An excellent discussion on chad-jams (including “pregnant chad”) by Douglas W. Jones -