PageRank, Google tarafından geliştirilen ve web sayfalarının önemini belirlemek için kullanılan bir algoritmadır. İnternet üzerindeki bağlantıların analiz edilmesiyle hesaplanan Pagerank değeri Google Arama sonuçlarında sayfaların sıralanması için kullanılan faktörlerden biridir.
PageRank değeri, bir web sayfasının önemini belirlemek için sayfaya gelen bağlantıların sayısını ve yetkinliğini dikkate alarak, ona bağlanan diğer sayfaların PageRank değerlerine göre hesaplanır. Temel prensibi, bir sayfaya yetkin referanslardan ne kadar çok bağlantı verilirse o sayfanın o denli önemli olduğu varsayımına dayanır.
Google Arama'nın kuruluşundan beri arama motoru sonuçlarında web sayfalarını sıralamak için kullandığı algoritmalardan biri olan PageRank, ilk günlerden bugüne işleyişi çok değişmiş olsa bile, firmanın diğer bağlantı analizi sistemleri ile birlikte web sayfaları arasındaki bağlantıları anlamlandırmaya ve sıralama algoritmalarının temel bir taşı olmaya devam etmektedir.
Eylül 2018 tarihi itibarıyla patent süresi dolmuş olan PageRank'i merak edenler orijinal araştırma makalesini okuyabilir ve teknoloji patentini inceleyebilir.
Tarihçe
PageRank, Larry Page ve Sergey Brin tarafından 1996 yılında Stanford Üniversitesi'nde geliştirilmiş ve ismini Larry Page'in soyadının yanı sıra İngilizce "web page" kelimesinden alarak 1998 yılında patent altına alınmıştır. Proje, "BackRub" adıyla web üzerindeki sayfaların birbirine nasıl bağlantı verdiğini analiz etmesiyle başladı.
"BackRub" karşımıza çıkan ilk referanslardan biridir, Lawrence Page ve Sergey Brin'in yazdığı "The PageRank Citation Ranking: Bringing Order to the Web" adlı makalede geçmektedir. Bu çalışmada, web sayfalarının bağlantıları üzerinden nasıl sıralandığı detaylıca açıklanmıştır.
1994'te kaleme alınan [McBryan 94] araştırma yazısından itibaren, birçok araştırma ve makale, PageRank'in geliştirilmesine ve optimizasyonuna katkıda bulundu. Öne çıkan bazı referanslar arasında [Mauldin 97], [Chakrabarti 98] ve [Kleinberg 98] bulunmaktadır. Bu çalışmalar, arama motorlarının etkinliğini artırmak ve Web üzerindeki bilgi akışını daha verimli hale getirmek için çeşitli yöntemler ve algoritmalar sundu.
Bağlantı sayısı ve kalitesi gibi faktörleri dikkate alarak sayfa önemini belirleyen PageRank, Google'ın arama motoru algoritmasının temelini oluşturdu. 1998'de Google, arama motoru pazarında devrim yaratarak PageRank sayesinde hızla popülerlik kazandı. PageRank'in gelişimi, internetin büyümesi ve bilgiye erişim şeklimizi kökten değiştiren bir süreç olmuştur. Google'ın başarısının arkasındaki temel unsurlardan biri olan PageRank, diğer sıralama sistemi faktörleri ile birlikte modern SEO stratejilerinde hala önemli bir rol oynamaktadır.
Algoritma
PageRank algoritması, web sayfalarının önemini belirlemek için kullanılan ve Çizge teorisini temel alan bir algoritmadır. Bu algoritma, Web üzerindeki bağlantı yapısını dikkate alarak her sayfanın önemini objektif bir şekilde belirler. Bu sayede, kullanıcıların arama sonuçlarında daha alakalı ve önemli sayfalara daha kolay ulaşmaları sağlanır.
Bu gözle bakıldığında PageRank, kullanıcı davranışının bir modeli olarak düşünülebilir. Tanım gereği, rastgele bir sayfadan başlayarak sürekli bağlantılara tıklayan ve sonunda her hangi bir sebeple başka bir rastgele sayfaya geçen bir "rastgele internet gezgini" olduğunu varsayılır.
Matematiksel Temel
PageRank, bağlantılı veri tabanlarında bir matrisin özvektörünü hesaplamak için kullanılan yinelemeli bir algoritmadır. Bu algoritma, internetteki rastgele sayfaların önemini belirlemek için bir dizi matematiksel hesaplama yapar. Örneğin, Sayfa A'nın PageRank değeri şu temel formülle hesaplanır:
Burada,
- PR(A): Sayfa A'nın PageRank değeri,
- d: Sönümleme faktörü (genellikle 0.85 olarak ayarlanır),
- L(n): Sayfa n'nin çıkış bağlantı sayısıdır.
Rastgele gezginin bir sayfayı ziyaret etme olasılığı, o sayfanın PageRank değerine eşittir. Bu gezginin her sayfada sıkılma olasılığı ise Damping faktörü (d) olarak tanımlanır. Böylece algoritma, Web'deki bağlantı yapısını kullanarak her sayfaya bir önem derecesi atar ve web sayfalarının PageRank değerlerinin olasılık dağılımı şeklinde olmasını sağlar; yani tüm sayfa PageRank değerlerinin toplamı 1 (bir) olur.
Basitleştirilmiş Algoritma
Üç web sayfasından oluşan küçük bir bağlantılı veri tabanı üzerinde düşünelim: A, B ve C. Sayfaların kendi kendilerine verdikleri bağlantıları yok sayıp, diğer sayfalara birden fazla bağlantı vermediklerini kabul edelim. Sayfa değeri (PR), tüm sayfalar için aynı başlangıç değerine sahip olarak başlatılır. Tüm sayfaların PR değerlerinin toplamının 1 olması gerektiği için bu örnekteki her sayfa için başlangıç değeri yaklaşık olarak 0,333 olarak belirlenir.
Eğer sistemde B'den A'ya ve C'den A'ya olmak üzere sadece 2 bağlantı olsaydı, her bağlantı bir sonraki yinelemede A'ya 0,333 PageRank aktarır ve A'nın PageRank değeri yaklaşık 0,666 olurdu.
Bunun yerine, A'ya gelen bağlantı sayısı değişmeden, B ve C'nin birbirlerine bağlantı vermiş olduğunu varsayalım. Bu durumda B sayfası, ilk yinelemedeki mevcut değerinin yarısını (0,1665) A sayfasına, diğer yarısını (0,1665) C sayfasına aktaracaktır. Benzer şekilde, C sayfası da mevcut değerinin yarısını (0,1665) A'ya ve B'ye aktarıyor olacaktır. Bu yinelemenin sonunda A sayfasının PR'si yaklaşık 0,333 olacaktır.
Ancak, yukarıdaki örnekte de görüldüğü gibi, PageRank basit bir alıntı sıralama sisteminden daha karmaşık ve inceliklidir. Elbette PageRank de dayandığı matematiksel temeller gereği, geri bağlantı sayısı arttıkça artan bir sayfa sıralaması sağlar. Ancak yüksek değerli bir geri bağlantıyı, düşük değerli bir geri bağlantıdan daha önemli olarak kabul eder.
İşte, Page ve Brin'in dahiyene teorisi da tam olarak burada başlar, çok yüksek değerde yalnızca 1 geri bağlantıya sahip bir sayfanın, çok sayıda düşük değerli geri bağlantıya sahip başka bir sayfadan daha yüksek bir sıralamaya sahip olabilir. Basit alıntı sıralamasına dayanan basitleştirilmiş sayfa sıralama algoritmasında böyle bir durum mümkün değildir.
Sönümleme Faktörü
Bağlantılar arasında rastgele dolaşan bir internet ziyaretçisinin, bir süre sonra gezinmeyi sonlandıracağını öngören PageRank teorisi, her adımda bağlantıları takip etme olasılığını d sönümleme faktörüyle tanımlar. Bu olasılık, rastgele bir sayfaya atlama olasılığı olan 1-d'ye eşittir. Çeşitli araştırmalarda farklı oranlar test edilmiş olsa da, sönümleme faktörü için 0,85 civarında bir değer genel kabul görmüştür.
Bu değer, 1'den çıkartılı ve daha sonra sönümleme faktörü (d) ile toplam PageRank puanının çarpımına eklenir. Adından da anlaşılacağı gibi sönümleme faktörü, elde edilen PageRank puanlarını aşağı çeker.
Bazı algoritma varyasyonlarında, sönümleme faktörünün (d) 1'den çıkarıldığında elde edilen değer, koleksiyondaki sayfa sayısına (N) bölünür.
Bu formül N ile taraf tarafa çarpıldığında iki formül arasındaki fark açığa çıkar: İlk formüldeki PageRank değerlerinin toplamının 1 olması, ikinci formülde ise toplamın N olmasıdır. Page ve Brin'in makalesindeki "tüm PageRank'lerin toplamı 1'dir" ifadesi " ve diğer Google çalışanlarının iddiaları yukarıdaki formülün ilk varyantını desteklemektedir.
Esasen, Page ve Brin, en popüler makaleleri olan "Büyük Ölçekli Hiper Metinsel Web Arama Motorunun Anatomisi"nde iki formülü karıştırken yanlışlıkla ikinci formülün web sayfaları üzerinde bir olasılık dağılımı oluşturduğunu öne sürmüşlerdi.
Teori, birkaç tıklamanın ardından arzu ettiği sayfaya ulaşan ve daha sonra rastgele bir sayfaya geçiş yapan rastgele bir internet ziyaretçisi modelini kullanmaktadır. Bir sayfanın PageRank değeri, rastgele gezinen bir kullanıcının bir bağlantıya tıklayarak o sayfaya gelme şansını yansıtır. Bu model, durumların sayfalar ve geçişlerin de sayfalar arasındaki bağlantılar olduğu bir Markov zinciri olarak yorumlandığında her durumun eşit derecede olası olduğu söylenebilir.
Örneğin, bir sayfanın başka sayfalara bağlantısı yoksa, bu sayfa bir "yutan durum" haline gelir ve rastgele gezinti sürecini sonlandırır. Rastgele gezgin bu durgun noktaya ulaşırsa, rastgele başka bir URL seçerek gezinmeye devam eder.
PageRank hesaplanırken, giden bağlantısı olmayan sayfaların koleksiyondaki tüm diğer sayfalara bağlantı verdiği varsayılır. Bu nedenle PageRank puanları diğer tüm sayfalar arasında eşit olarak bölünür. Başka bir deyişle, geçişlere sahip olan sayfalar için adil olmak gerekirse bu rastgele geçişler Web'deki tüm köşelere eklenir. Bu artık olasılık (d), ortalama bir sörfçünün tarayıcısının yer imi özelliğini kullanma sıklığına göre tahmin edilerek genellikle 0,85 olarak ayarlanır ve denklem aşağıdaki gibi gösterilir.
Burada incelenen sayfaları, , 'ye bağlanan sayfalar kümesini, , sayfasındaki giden bağlantıların sayısı ve toplam sayfa sayısıdır.
PageRank değerleri, her sütunun toplamı bir olacak şekilde yeniden ölçeklendirilmiş, değiştirilmiş baskın sağ özvektörünün girdileridir. İşte bu, Page ve Brin'in meşhur algoritmasının harika bir ölçüm olduğu noktadır:
Burada özvektör denkleminin çözümüdür.
Bitişiklik fonksiyonu , j sayfasından i sayfasına giden bağlantıların sayısının, j sayfasındaki toplam giden bağlantı sayısına oranıdır. sayfası 'ye bağlanmıyorsa bitişiklik işlevi 0'dır ve bu durum her j için standartlaştırılır:
Yani her bir sütunun öğelerinin toplamı 1'e eşit olduğu için PageRank matrisi, Markov zincirinin geçişlerini tanımlamak için kullanılan bir stokastik matristir ve ağ analizinde yaygın olarak kullanılan özvektör merkezilik ölçüsünün bir çeşididir.
Yukarıdaki değiştirilmiş bitişiklik matrisinin büyük özboşluğu nedeniyle, PageRank özvektörünün değerleri yalnızca birkaç yinelemede yüksek derecede doğrulukla tahmin edilebilir.
Google'ın kurucuları, orijinal makalelerinde, 322 milyon bağlantıdan oluşan bir ağ için PageRank algoritmasının 52 yinelemede kabul edilebilir bir sınıra yakınsadığını belirttiler. Bunun yarısı kadar bir ağda ise yakınsamanın yaklaşık 45 yineleme gerektirdiğini söyledir. Bu veriler sayesinde, algoritmanın çok iyi ölçeklenebileceği ve son derece büyük ağlar için ölçeklendirme faktörünün, n'nin ağın boyutu olduğu cinsinden kabaca doğrusal olacağı sonucuna vardılar.
Markov teorisinin bir sonucu olarak de bir sayfanın PageRank'inin, çok sayıda tıklama sonrasında o sayfaya ulaşma olasılığı olduğu söylenebilir. Bu durumda sayfadan kendisine geri dönmek için gereken tıklama (veya rastgele atlama) sayısının beklentisi iken bu olasılık 'e eşit olur.
Teori gereği, PageRank'in en ciddi dezavantajlarından biri eski sayfaları tercih etmesidir. Yeni bir sayfa, çok iyi bir sayfa bile olsa, Wikipedi gibi mevcut bir sitenin parçası olmadığı sürece çok fazla bağlantıya sahip olmayacaktır.
Bu dezavantaj yüzünden, arama sonuçları sıralamasını iyileştirmek ve reklam bağlantılarından para kazanmak için kötü niyetli SEO uzmanları PageRank'i manipüle etmeye yönelik uygulamalar yapmıştır. Bu uygulamalar, hangi sayfaların Web topluluğu tarafından gerçekten çok değerli olduğunu belirlemeyi amaçlayan PageRank kavramının güvenilirliğini ciddi şekilde etkilemiştir.
Ancak Google, Google Search Console üzerinden insanların ücretli ve spam bağlantıları bildirmelerini sağlayan mekanizması dahil olmak üzere, 2007'den bu yana yapay olarak PageRank değerini yükseltmek için yerleştirilen spam bağlantılar ve ücretli metin bağlantıları satan siteleri aktif olarak cezalandırıyor. Günümüzde ise ilk kez 2019 Webspam Raporu'nda adından "webspam" olarak bahsedilen SpamBrain başta olmak üzere, şirketin spam politikaları çerçevesinde tüm spam algılama sistemleri ile sadece bağlantılar değil internet üzerindeki tüm kötü niyetli uygulamalarla mücadele etmeye devam ediyor.
Sayfa değeri
Sayfa değeri, sitenin doğal yapısına ve link içeriğine uygun olarak sitenin değerinin bir göstergesidir. Google, bir linki A sayfasından B sayfasına, B sayfası için A sayfasını kullanarak bağlar. Aynı zamanda sayfanın hakkının yenmemesi için bazı içerik analizleri de yapar. Kendisini "önemli" yapan kriterlerde iyi yerlerde olan bir site önem sıralamasında diğer sitelerin üzerine çıkacaktır. Yani bir sitenin Google Arama sonuçları sıralamadaki yeri onun için önemli olan birçok kriterlerin birleşimi sonucunda belirir.
Google, aynı zamanda spam amaçlı siteleri Google Ban ile cezalandırıp tüm indexlerini silerken, yeni açılan sitelerin de hızlı bir şekilde arama sonuçlarında yükselmesini engelleyen Google Sandbox sistemlerini de kullanmaktadır. Sandbox'a giren bir site 3-6 ay boyunca ne kadar iyi olursa olsun, Google tarafından denenir ve belirli bir sürenin sonunda arama sonuçlarında daha iyi bir yere getirilir.
Ancak site sıralamasını etkileyen tek parametre PageRank değildir. Site sıralamasını esasen "alakalılık" ve "önemlilik" değerlerini kombine etmeye çalışan Google algoritması için de Topic Sensitive Page Rank olarak tartışılan kavramın etkili olduğu düşünülmektedir.
Güncellenmesi
Günümüzde PageRank, Google'ın arama sonuçlarını sıralamak için kullandığı çekirdek algoritmanın bir parçasıdır. Çekirdek algoritmadaki büyük değişiklikler yılda 1 veya 2 kez yapılıyor olsa da yüzlerce sıralama faktörünü içeren Google Arama sıralama sistemlerinde halka açık bilgilendirmeler eşliğinde sürekli güncellemeler yapılmaktadır.
Kaynakça
- ^ a b c d e f g h i "The Anatomy of a Search Engine". infolab.stanford.edu. 25 Nisan 2009 tarihinde kaynağından . Erişim tarihi: 29 Haziran 2024.
- ^ a b "Google Arama sıralama sistemleri kılavuzu". Google. 31 Mayıs 2024 tarihinde kaynağından . Erişim tarihi: 30 Haziran 2024.
- ^ a b US6285999B1, Page, Lawrence, "Method for node ranking in a linked database", 2001-09-04 tarihinde verildi
- ^ . web.archive.org. 15 Temmuz 2001. 15 Temmuz 2001 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Haziran 2024.
- ^ a b "The PageRank Citation Ranking : Bringing Order to the Web". www.semanticscholar.org. Lawrence Page, Sergey Brin, T. Winograd. 29 Mart 2024 tarihinde kaynağından . Erişim tarihi: 29 Haziran 2024.
- ^ "GENVL and WWWW: Tools for Taming the Web*". Oliver A. McBryan. 1997. 6 Temmuz 2024 tarihinde kaynağından . Erişim tarihi: 30 Haziran 2024.
- ^ Mauldin, M.I. (1997). "Lycos: design choices in an Internet search service". IEEE Expert (İngilizce). 12 (1): 8-11. doi:10.1109/64.577466. ISSN 0885-9000. 17 Ekim 2022 tarihinde kaynağından . Erişim tarihi: 30 Haziran 2024.
- ^ "Automatic Resource Compilation by Analyzing Hyperlink Structure and Associated Text". www.semanticscholar.org. Soumen Chakrabarti, B. Dom, P. Raghavan, S. Rajagopalan, David Gibson, J. Kleinberg. Erişim tarihi: 29 Haziran 2024.
- ^ "Authoritative Sources in a Hyperlinked Environment" (PDF). Jon M. Kleinberg. 1998. 26 Haziran 2024 tarihinde kaynağından (PDF). Erişim tarihi: 30 Haziran 2024.
- ^ "PageRank Algoritması: Google Aramanın Metematiğini Anlamak - Bolt SEO". boltseo.com.tr. 30 Haziran 2024 tarihinde kaynağından . Erişim tarihi: 29 Haziran 2024.
- ^ Cutts, Matt (19 Ağustos 2009). "Straight from Google: What You Need to Know". Matt Cutts: Gadgets, Google, and SEO (İngilizce). 20 Şubat 2024 tarihinde kaynağından . Erişim tarihi: 29 Haziran 2024.
- ^ "The Second Eigenvalue of the Google Matrix" (PDF). Taher H. Haveliwala ve Sepandar D. Kamvar. 17 Aralık 2008 tarihinde kaynağından (PDF). Erişim tarihi: 30 Haziran 2024.
- ^ "Information about buying and selling links that pass PageRank | Google Search Central Blog". Google for Developers (İngilizce). 24 Haziran 2024 tarihinde kaynağından . Erişim tarihi: 30 Haziran 2024.
- ^ İngilizce bir kelime olan PageRank birçok Türkçe içerikli sitede "sayfa değeri" olarak çevirilmektedir.
- ^ . 7 Ekim 2014. 22 Mayıs 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Mart 2015. (İngilizce)
- ^ "Arama ve SEO Blogu | Google Arama Merkezi | Google Search Central Blog". Google for Developers. 2 Temmuz 2024 tarihinde kaynağından . Erişim tarihi: 30 Haziran 2024.
Ayrıca bakınız
Dış bağlantılar
- Matematiksel Olarak PageRank
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
PageRank Google tarafindan gelistirilen ve web sayfalarinin onemini belirlemek icin kullanilan bir algoritmadir Internet uzerindeki baglantilarin analiz edilmesiyle hesaplanan Pagerank degeri Google Arama sonuclarinda sayfalarin siralanmasi icin kullanilan faktorlerden biridir Pagerank algoritmasinin basit bir ornegi Yuzdeler algilanan onemi gosterir ve oklar baglantilari temsil eder PageRank degeri bir web sayfasinin onemini belirlemek icin sayfaya gelen baglantilarin sayisini ve yetkinligini dikkate alarak ona baglanan diger sayfalarin PageRank degerlerine gore hesaplanir Temel prensibi bir sayfaya yetkin referanslardan ne kadar cok baglanti verilirse o sayfanin o denli onemli oldugu varsayimina dayanir Google Arama nin kurulusundan beri arama motoru sonuclarinda web sayfalarini siralamak icin kullandigi algoritmalardan biri olan PageRank ilk gunlerden bugune isleyisi cok degismis olsa bile firmanin diger baglanti analizi sistemleri ile birlikte web sayfalari arasindaki baglantilari anlamlandirmaya ve siralama algoritmalarinin temel bir tasi olmaya devam etmektedir Eylul 2018 tarihi itibariyla patent suresi dolmus olan PageRank i merak edenler orijinal arastirma makalesini okuyabilir ve teknoloji patentini inceleyebilir TarihcePageRank Larry Page ve Sergey Brin tarafindan 1996 yilinda Stanford Universitesi nde gelistirilmis ve ismini Larry Page in soyadinin yani sira Ingilizce web page kelimesinden alarak 1998 yilinda patent altina alinmistir Proje BackRub adiyla web uzerindeki sayfalarin birbirine nasil baglanti verdigini analiz etmesiyle basladi BackRub karsimiza cikan ilk referanslardan biridir Lawrence Page ve Sergey Brin in yazdigi The PageRank Citation Ranking Bringing Order to the Web adli makalede gecmektedir Bu calismada web sayfalarinin baglantilari uzerinden nasil siralandigi detaylica aciklanmistir 1994 te kaleme alinan McBryan 94 arastirma yazisindan itibaren bircok arastirma ve makale PageRank in gelistirilmesine ve optimizasyonuna katkida bulundu One cikan bazi referanslar arasinda Mauldin 97 Chakrabarti 98 ve Kleinberg 98 bulunmaktadir Bu calismalar arama motorlarinin etkinligini artirmak ve Web uzerindeki bilgi akisini daha verimli hale getirmek icin cesitli yontemler ve algoritmalar sundu Baglanti sayisi ve kalitesi gibi faktorleri dikkate alarak sayfa onemini belirleyen PageRank Google in arama motoru algoritmasinin temelini olusturdu 1998 de Google arama motoru pazarinda devrim yaratarak PageRank sayesinde hizla populerlik kazandi PageRank in gelisimi internetin buyumesi ve bilgiye erisim seklimizi kokten degistiren bir surec olmustur Google in basarisinin arkasindaki temel unsurlardan biri olan PageRank diger siralama sistemi faktorleri ile birlikte modern SEO stratejilerinde hala onemli bir rol oynamaktadir AlgoritmaPageRank algoritmasi web sayfalarinin onemini belirlemek icin kullanilan ve Cizge teorisini temel alan bir algoritmadir Bu algoritma Web uzerindeki baglanti yapisini dikkate alarak her sayfanin onemini objektif bir sekilde belirler Bu sayede kullanicilarin arama sonuclarinda daha alakali ve onemli sayfalara daha kolay ulasmalari saglanir Bu gozle bakildiginda PageRank kullanici davranisinin bir modeli olarak dusunulebilir Tanim geregi rastgele bir sayfadan baslayarak surekli baglantilara tiklayan ve sonunda her hangi bir sebeple baska bir rastgele sayfaya gecen bir rastgele internet gezgini oldugunu varsayilir Matematiksel Temel PageRank baglantili veri tabanlarinda bir matrisin ozvektorunu hesaplamak icin kullanilan yinelemeli bir algoritmadir Bu algoritma internetteki rastgele sayfalarin onemini belirlemek icin bir dizi matematiksel hesaplama yapar Ornegin Sayfa A nin PageRank degeri su temel formulle hesaplanir PR A 1 d d PR B L B PR C L C PR D L D displaystyle displaystyle PR A 1 d d left frac PR B L B frac PR C L C frac PR D L D cdots right Burada PR A Sayfa A nin PageRank degeri d Sonumleme faktoru genellikle 0 85 olarak ayarlanir L n Sayfa n nin cikis baglanti sayisidir Rastgele gezginin bir sayfayi ziyaret etme olasiligi o sayfanin PageRank degerine esittir Bu gezginin her sayfada sikilma olasiligi ise Damping faktoru d olarak tanimlanir Boylece algoritma Web deki baglanti yapisini kullanarak her sayfaya bir onem derecesi atar ve web sayfalarinin PageRank degerlerinin olasilik dagilimi seklinde olmasini saglar yani tum sayfa PageRank degerlerinin toplami 1 bir olur Basitlestirilmis Algoritma Uc web sayfasindan olusan kucuk bir baglantili veri tabani uzerinde dusunelim A B ve C Sayfalarin kendi kendilerine verdikleri baglantilari yok sayip diger sayfalara birden fazla baglanti vermediklerini kabul edelim Sayfa degeri PR tum sayfalar icin ayni baslangic degerine sahip olarak baslatilir Tum sayfalarin PR degerlerinin toplaminin 1 olmasi gerektigi icin bu ornekteki her sayfa icin baslangic degeri yaklasik olarak 0 333 olarak belirlenir Eger sistemde B den A ya ve C den A ya olmak uzere sadece 2 baglanti olsaydi her baglanti bir sonraki yinelemede A ya 0 333 PageRank aktarir ve A nin PageRank degeri yaklasik 0 666 olurdu PR A PR B PR C displaystyle displaystyle PR A PR B PR C Bunun yerine A ya gelen baglanti sayisi degismeden B ve C nin birbirlerine baglanti vermis oldugunu varsayalim Bu durumda B sayfasi ilk yinelemedeki mevcut degerinin yarisini 0 1665 A sayfasina diger yarisini 0 1665 C sayfasina aktaracaktir Benzer sekilde C sayfasi da mevcut degerinin yarisini 0 1665 A ya ve B ye aktariyor olacaktir Bu yinelemenin sonunda A sayfasinin PR si yaklasik 0 333 olacaktir PR A PR B 2 PR C 2 displaystyle displaystyle PR A frac PR B 2 frac PR C 2 Ancak yukaridaki ornekte de goruldugu gibi PageRank basit bir alinti siralama sisteminden daha karmasik ve inceliklidir Elbette PageRank de dayandigi matematiksel temeller geregi geri baglanti sayisi arttikca artan bir sayfa siralamasi saglar Ancak yuksek degerli bir geri baglantiyi dusuk degerli bir geri baglantidan daha onemli olarak kabul eder Iste Page ve Brin in dahiyene teorisi da tam olarak burada baslar cok yuksek degerde yalnizca 1 geri baglantiya sahip bir sayfanin cok sayida dusuk degerli geri baglantiya sahip baska bir sayfadan daha yuksek bir siralamaya sahip olabilir Basit alinti siralamasina dayanan basitlestirilmis sayfa siralama algoritmasinda boyle bir durum mumkun degildir Sonumleme Faktoru Baglantilar arasinda rastgele dolasan bir internet ziyaretcisinin bir sure sonra gezinmeyi sonlandiracagini ongoren PageRank teorisi her adimda baglantilari takip etme olasiligini d sonumleme faktoruyle tanimlar Bu olasilik rastgele bir sayfaya atlama olasiligi olan 1 d ye esittir Cesitli arastirmalarda farkli oranlar test edilmis olsa da sonumleme faktoru icin 0 85 civarinda bir deger genel kabul gormustur Bu deger 1 den cikartili ve daha sonra sonumleme faktoru d ile toplam PageRank puaninin carpimina eklenir Adindan da anlasilacagi gibi sonumleme faktoru elde edilen PageRank puanlarini asagi ceker PR A 1 d d PR B L B PR C L C PR D L D displaystyle displaystyle PR A 1 d d left frac PR B L B frac PR C L C frac PR D L D cdots right Bazi algoritma varyasyonlarinda sonumleme faktorunun d 1 den cikarildiginda elde edilen deger koleksiyondaki sayfa sayisina N bolunur PR A 1 dN d PR B L B PR C L C PR D L D displaystyle displaystyle PR A 1 d over N d left frac PR B L B frac PR C L C frac PR D L D cdots right Bu formul N ile taraf tarafa carpildiginda iki formul arasindaki fark aciga cikar Ilk formuldeki PageRank degerlerinin toplaminin 1 olmasi ikinci formulde ise toplamin N olmasidir Page ve Brin in makalesindeki tum PageRank lerin toplami 1 dir ifadesi ve diger Google calisanlarinin iddialari yukaridaki formulun ilk varyantini desteklemektedir Esasen Page ve Brin en populer makaleleri olan Buyuk Olcekli Hiper Metinsel Web Arama Motorunun Anatomisi nde iki formulu karistirken yanlislikla ikinci formulun web sayfalari uzerinde bir olasilik dagilimi olusturdugunu one surmuslerdi Teori birkac tiklamanin ardindan arzu ettigi sayfaya ulasan ve daha sonra rastgele bir sayfaya gecis yapan rastgele bir internet ziyaretcisi modelini kullanmaktadir Bir sayfanin PageRank degeri rastgele gezinen bir kullanicinin bir baglantiya tiklayarak o sayfaya gelme sansini yansitir Bu model durumlarin sayfalar ve gecislerin de sayfalar arasindaki baglantilar oldugu bir Markov zinciri olarak yorumlandiginda her durumun esit derecede olasi oldugu soylenebilir Ornegin bir sayfanin baska sayfalara baglantisi yoksa bu sayfa bir yutan durum haline gelir ve rastgele gezinti surecini sonlandirir Rastgele gezgin bu durgun noktaya ulasirsa rastgele baska bir URL secerek gezinmeye devam eder PageRank hesaplanirken giden baglantisi olmayan sayfalarin koleksiyondaki tum diger sayfalara baglanti verdigi varsayilir Bu nedenle PageRank puanlari diger tum sayfalar arasinda esit olarak bolunur Baska bir deyisle gecislere sahip olan sayfalar icin adil olmak gerekirse bu rastgele gecisler Web deki tum koselere eklenir Bu artik olasilik d ortalama bir sorfcunun tarayicisinin yer imi ozelligini kullanma sikligina gore tahmin edilerek genellikle 0 85 olarak ayarlanir ve denklem asagidaki gibi gosterilir PR pi 1 dN d pj M pi PR pj L pj displaystyle displaystyle PR p i frac 1 d N d sum p j in M p i frac PR p j L p j Burada p1 p2 pN displaystyle displaystyle p 1 p 2 p N incelenen sayfalari M pi displaystyle displaystyle M p i pi displaystyle displaystyle p i ye baglanan sayfalar kumesini L pj displaystyle displaystyle L p j pj displaystyle displaystyle p j sayfasindaki giden baglantilarin sayisi ve N displaystyle displaystyle N toplam sayfa sayisidir PageRank degerleri her sutunun toplami bir olacak sekilde yeniden olceklendirilmis degistirilmis baskin sag ozvektorunun girdileridir Iste bu Page ve Brin in meshur algoritmasinin harika bir olcum oldugu noktadir R PR p1 PR p2 PR pN displaystyle displaystyle mathbf R begin bmatrix PR p 1 PR p 2 vdots PR p N end bmatrix Burada ozvektor R displaystyle displaystyle mathbf R denkleminin cozumudur R 1 d N 1 d N 1 d N d ℓ p1 p1 ℓ p1 p2 ℓ p1 pN ℓ p2 p1 ℓ pi pj ℓ pN p1 ℓ pN pN R displaystyle displaystyle mathbf R begin bmatrix 1 d N 1 d N vdots 1 d N end bmatrix d begin bmatrix ell p 1 p 1 amp ell p 1 p 2 amp cdots amp ell p 1 p N ell p 2 p 1 amp ddots amp amp vdots vdots amp amp ell p i p j amp ell p N p 1 amp cdots amp amp ell p N p N end bmatrix mathbf R Bitisiklik fonksiyonu ℓ pi pj displaystyle displaystyle ell p i p j j sayfasindan i sayfasina giden baglantilarin sayisinin j sayfasindaki toplam giden baglanti sayisina oranidir pj displaystyle displaystyle p j sayfasi pi displaystyle displaystyle p i ye baglanmiyorsa bitisiklik islevi 0 dir ve bu durum her j icin standartlastirilir i 1Nℓ pi pj 1 displaystyle displaystyle sum i 1 N ell p i p j 1 Yani her bir sutunun ogelerinin toplami 1 e esit oldugu icin PageRank matrisi Markov zincirinin gecislerini tanimlamak icin kullanilan bir stokastik matristir ve ag analizinde yaygin olarak kullanilan ozvektor merkezilik olcusunun bir cesididir Yukaridaki degistirilmis bitisiklik matrisinin buyuk ozboslugu nedeniyle PageRank ozvektorunun degerleri yalnizca birkac yinelemede yuksek derecede dogrulukla tahmin edilebilir Google in kuruculari orijinal makalelerinde 322 milyon baglantidan olusan bir ag icin PageRank algoritmasinin 52 yinelemede kabul edilebilir bir sinira yakinsadigini belirttiler Bunun yarisi kadar bir agda ise yakinsamanin yaklasik 45 yineleme gerektirdigini soyledir Bu veriler sayesinde algoritmanin cok iyi olceklenebilecegi ve son derece buyuk aglar icin olceklendirme faktorunun n nin agin boyutu oldugu log n displaystyle displaystyle log n cinsinden kabaca dogrusal olacagi sonucuna vardilar Markov teorisinin bir sonucu olarak de bir sayfanin PageRank inin cok sayida tiklama sonrasinda o sayfaya ulasma olasiligi oldugu soylenebilir Bu durumda t displaystyle displaystyle t sayfadan kendisine geri donmek icin gereken tiklama veya rastgele atlama sayisinin beklentisi iken bu olasilik t 1 displaystyle displaystyle t 1 e esit olur Teori geregi PageRank in en ciddi dezavantajlarindan biri eski sayfalari tercih etmesidir Yeni bir sayfa cok iyi bir sayfa bile olsa Wikipedi gibi mevcut bir sitenin parcasi olmadigi surece cok fazla baglantiya sahip olmayacaktir Bu dezavantaj yuzunden arama sonuclari siralamasini iyilestirmek ve reklam baglantilarindan para kazanmak icin kotu niyetli SEO uzmanlari PageRank i manipule etmeye yonelik uygulamalar yapmistir Bu uygulamalar hangi sayfalarin Web toplulugu tarafindan gercekten cok degerli oldugunu belirlemeyi amaclayan PageRank kavraminin guvenilirligini ciddi sekilde etkilemistir Ancak Google Google Search Console uzerinden insanlarin ucretli ve spam baglantilari bildirmelerini saglayan mekanizmasi dahil olmak uzere 2007 den bu yana yapay olarak PageRank degerini yukseltmek icin yerlestirilen spam baglantilar ve ucretli metin baglantilari satan siteleri aktif olarak cezalandiriyor Gunumuzde ise ilk kez 2019 Webspam Raporu nda adindan webspam olarak bahsedilen SpamBrain basta olmak uzere sirketin spam politikalari cercevesinde tum spam algilama sistemleri ile sadece baglantilar degil internet uzerindeki tum kotu niyetli uygulamalarla mucadele etmeye devam ediyor Sayfa degeriSayfa degeri sitenin dogal yapisina ve link icerigine uygun olarak sitenin degerinin bir gostergesidir Google bir linki A sayfasindan B sayfasina B sayfasi icin A sayfasini kullanarak baglar Ayni zamanda sayfanin hakkinin yenmemesi icin bazi icerik analizleri de yapar Kendisini onemli yapan kriterlerde iyi yerlerde olan bir site onem siralamasinda diger sitelerin uzerine cikacaktir Yani bir sitenin Google Arama sonuclari siralamadaki yeri onun icin onemli olan bircok kriterlerin birlesimi sonucunda belirir Google ayni zamanda spam amacli siteleri Google Ban ile cezalandirip tum indexlerini silerken yeni acilan sitelerin de hizli bir sekilde arama sonuclarinda yukselmesini engelleyen Google Sandbox sistemlerini de kullanmaktadir Sandbox a giren bir site 3 6 ay boyunca ne kadar iyi olursa olsun Google tarafindan denenir ve belirli bir surenin sonunda arama sonuclarinda daha iyi bir yere getirilir Ancak site siralamasini etkileyen tek parametre PageRank degildir Site siralamasini esasen alakalilik ve onemlilik degerlerini kombine etmeye calisan Google algoritmasi icin de Topic Sensitive Page Rank olarak tartisilan kavramin etkili oldugu dusunulmektedir GuncellenmesiGunumuzde PageRank Google in arama sonuclarini siralamak icin kullandigi cekirdek algoritmanin bir parcasidir Cekirdek algoritmadaki buyuk degisiklikler yilda 1 veya 2 kez yapiliyor olsa da yuzlerce siralama faktorunu iceren Google Arama siralama sistemlerinde halka acik bilgilendirmeler esliginde surekli guncellemeler yapilmaktadir Kaynakca a b c d e f g h i The Anatomy of a Search Engine infolab stanford edu 25 Nisan 2009 tarihinde kaynagindan Erisim tarihi 29 Haziran 2024 a b Google Arama siralama sistemleri kilavuzu Google 31 Mayis 2024 tarihinde kaynagindan Erisim tarihi 30 Haziran 2024 a b US6285999B1 Page Lawrence Method for node ranking in a linked database 2001 09 04 tarihinde verildi web archive org 15 Temmuz 2001 15 Temmuz 2001 tarihinde kaynagindan arsivlendi Erisim tarihi 29 Haziran 2024 a b The PageRank Citation Ranking Bringing Order to the Web www semanticscholar org Lawrence Page Sergey Brin T Winograd 29 Mart 2024 tarihinde kaynagindan Erisim tarihi 29 Haziran 2024 GENVL and WWWW Tools for Taming the Web Oliver A McBryan 1997 6 Temmuz 2024 tarihinde kaynagindan Erisim tarihi 30 Haziran 2024 Mauldin M I 1997 Lycos design choices in an Internet search service IEEE Expert Ingilizce 12 1 8 11 doi 10 1109 64 577466 ISSN 0885 9000 17 Ekim 2022 tarihinde kaynagindan Erisim tarihi 30 Haziran 2024 Automatic Resource Compilation by Analyzing Hyperlink Structure and Associated Text www semanticscholar org Soumen Chakrabarti B Dom P Raghavan S Rajagopalan David Gibson J Kleinberg Erisim tarihi 29 Haziran 2024 Arsivlenmesi gereken baglantiya sahip kaynak sablonu iceren maddeler link Authoritative Sources in a Hyperlinked Environment PDF Jon M Kleinberg 1998 26 Haziran 2024 tarihinde kaynagindan PDF Erisim tarihi 30 Haziran 2024 PageRank Algoritmasi Google Aramanin Metematigini Anlamak Bolt SEO boltseo com tr 30 Haziran 2024 tarihinde kaynagindan Erisim tarihi 29 Haziran 2024 Cutts Matt 19 Agustos 2009 Straight from Google What You Need to Know Matt Cutts Gadgets Google and SEO Ingilizce 20 Subat 2024 tarihinde kaynagindan Erisim tarihi 29 Haziran 2024 The Second Eigenvalue of the Google Matrix PDF Taher H Haveliwala ve Sepandar D Kamvar 17 Aralik 2008 tarihinde kaynagindan PDF Erisim tarihi 30 Haziran 2024 Information about buying and selling links that pass PageRank Google Search Central Blog Google for Developers Ingilizce 24 Haziran 2024 tarihinde kaynagindan Erisim tarihi 30 Haziran 2024 Ingilizce bir kelime olan PageRank bircok Turkce icerikli sitede sayfa degeri olarak cevirilmektedir 7 Ekim 2014 22 Mayis 2016 tarihinde kaynagindan arsivlendi Erisim tarihi 25 Mart 2015 Ingilizce Arama ve SEO Blogu Google Arama Merkezi Google Search Central Blog Google for Developers 2 Temmuz 2024 tarihinde kaynagindan Erisim tarihi 30 Haziran 2024 Ayrica bakinizArama motoru optimizasyonu TrustRank Google Panda Google SandboxDis baglantilarMatematiksel Olarak PageRank