לפני כמה ימים התרחשה טלטלה בעולם ה-SEO וכל התחומים המקיפים אותו (כולל כתיבת התוכן לאתרים): חלק מהאלגוריתם של גוגל מצא את דרכו לאתר Github (אתר שמיועד לשיתוף קוד), כנראה בשל שליפה מקרית על ידי בוט ולאחר מכן הגיע לעיניים אנושיות.
דבר אפילו יותר מדהים הוא שבשל כל מיני עניינים של קהילת הקוד הפתוח, לא נראה שחשיפת הקוד מהווה עבירה על החוק.
מאז הדליפה, שפורסמה לפני כשלושה ימים (ב-27 במאי), גוגל הספיקה להגיב עליה, כך שאנחנו יודעים שהיא אמיתית.
בדליפה אפשר למצוא בעיקר פונקציות של האלגוריתם, אם כי חשוב להדגיש שלא ניתן לדעת בדיוק מה הקשר ביניהן ומהו המשקל שניתן לכל אחת מהן. זו גם אגב הטענה של גוגל כנגד אתרים שכבר החלו להסיק מסקנות, כולל כמה שכביכול מראות באופן ברור שטענות שגוגל השמיעה בעבר פשוט לא נכונות או נכונות חלקית (לדוגמה, שלמספר הלחיצות על אתר בתוצאות החיפוש אין השפעה על הדירוגים).
ובכל זאת, יש בקוד שדלף כמה עניינים מאוד מעניינים שיכולים ללמד על האופן בו גוגל מנתחת תוכן:
מי כותב את התוכן
מהקוד של גוגל מסתבר שיש פונקציה ספציפית (isAuthor) שמנתחת האם מי שחתום על התוכן באמת כתב אותו (כנראה דרך הצלבה עם מקורות אחרים). סמכותיות היא לא נושא חדש, אבל עכשיו אנחנו יודעים שגוגל מתייחסת אליו ישירות.
כיצד קישורים קשורים להיסטוריה של הדף
אם אתם משנים תוכן באתר שלכם לעיתים קרובות ומסירים או מוסיפים קישורים, כדאי שתדעו שגוגל זוכרת אחורה את כל הגרסאות האלו! מצד שני, היא מתייחסת לקישורים רק ב-20 הגרסאות האחרונות.
זה פחות קריטי אם אתם מתעסקים בעיקר בתוכן, אבל אם אתם מחליפים קישורים עם אתרים אחרים ובעיקר מוכרים להם קישורים (עניין לפוסט אחר…), יכול להיות שתרצו לתעד את כל השינויים האלו.
כמו כן, משתמע מכך שהפניית דף ישן לדף חדש בנושא אחר הוא רעיון גרוע למדי, למרות שלא מעט אנשים עדיין עושים את זה כשהם קונים דומיינים משומשים.
עמוד הבית משפיע על כל האתר
בקוד של גוגל ניתן למצוא פונקציה שממנה אפשר להבין שלאיכות דף הבית יש השפעה על הדירוגים של כלל האתר. בין היתר נמצא שם גם את ה-Pagerank המפורסם. יש כאלו שטוענים שה-Pagerank, האלגוריתם המקורי לדירוג אתרים של גוגל, מת כבר מזמן, ויש כאלו שטוענים שלא ממש (גוגל בעצמה מתייחסת אליו בהנחיות שלה לבעלי אתרים ומבקשת מהם לא לבצע מניפולציות במטרה לשנות אותו).
מה שבטוח הוא שחשוב להשקיע בתוכן בדף הבית.
למשל, אם התוכן שלכם דינאמי (למשל, פוסטים שמתחלפים), תנו לכל אחד מהם תקציר ייחודי, אחרת עמוד הבית שלכם פשוט יכלול "לקט" של טקסטים מעמודים אחרים, וזה לא לעניין…
גודל גופן
אוקי, בנקודה הזו תנו לי בכל זאת להיות ספקן. בקוד ניתן למצוא התייחסות ספציפית לגודל הפונט של קישורים ומושגים בטקסט (Terms). אלו טכניקות SEO שאנשים עם מינימום גאווה מקצועית הפסיקו להשתמש בהם בערך ב-2012…
אני לא מבין גדול בתכנות מודרני, אבל אני לא אתפלא אם מדובר בפונקציה שקטה שפשוט לא הוסרה או שיש לה השפעה מינורית. יכול להיות גם שהיא בכלל אמורה לזהות ספאם (בהפוך על הפוך).
לא כל התוכן שלכם בהחלט נספר
החלק הזה די מפתיע: מסתבר שלכל דף יש מספר מסוים של "אסימונים" (Tokens) שמוקצים לו ולכן גוגל לא בהכרח מתחשב בכל התוכן בדף.
בין אם הבנתי את זה נכון ובין אם לא, מה שבטוח הוא שפסקאות הפתיחה שלכם חייבות להיות סופר רלוונטיות, וכל מה שזה אומר מבחינת מילות מפתח.
תוכן קצר יכול להתברג גבוה אם הוא מקורי
מסתבר שלגוגל יש ציון נפרד עבור תוכן קצר, בתנאי שהוא מקורי. לעניות דעתי זה יכול להסביר למה לפעמיים אתרים שיש בהם כמה פסקאות טקסט עם אפליקציית רשת (לדוגמה מחשבון), עדיין מדורגים גבוה.
תגי מטא ותאריכים
בניגוד למה שאולי סיפרו ולכם ודווקא כן בהתאמה שהאנליסט הראשי בתחום החיפוש בגוגל (גרי אליס) טוען, האורך של כותרת העמוד בעמודי התוצאות (Title) והתיאור (Meta Description) לא משנים מבחינת דירוג.
חשוב מאוד להדגיש שהם כן משנים את אחוזי הלחיצות מכיוון שגוגל מציג רק חלק מהם אם הם ארוכים מדי ולפעמיים הוא מחליט בעצמו מה להציג בהתאם לשאילתה של המשתמש. לדוגמה, בתיאור יכול להיות מוצג חלק פנימי של הדף עם מילת המפתח שהגולש חיפש.
כמו כן, נראה שגוגל מנסה לחפש את התאריך הנוכחי בתגי המטא, בכתובת הדף (URL) וכמובן בתוך התוכן. לכן כנראה רואים כל כך הרבה תוצאות בחיפוש בהן מודגש משהו כמו "לפני 23 שעות" אפילו אם הן לא אייטמים חדשותיים בעצמן.
בקיצור, אם אתם מפרסמים מאמר באתר, רצוי לרשום איפשהו מתי העלתם אותו או מהו תאריך העדכון האחרון (רק אל תיקחו אוטומטית את התאריך של היום, גוגל מן הסתם יעלה על זה בשנייה כי הוא יודע להשוות בין גרסאות שונות של הדף…).
Your Money Your Life
מדובר בתוכן שעוסק בנושאים שקשורים ומשפיעים באופן הדוק על החיים שלנו: החל מהמשכנתא, דרך הרכב הבא שנרכוש ועד לבריאות שלנו. העניין הזה ידוע כבר כמה שנים טובות.
לכן זה אולי לא מפתיע שיש לגוגל ציון נפרד עבור עמודים כאלו, מה שכן עשוי להיות מעט מפתיע הוא שגוגל מנתח כל שאילתה לא מוכרת ומנסה להבין האם היא קשורה ל-YMYL.
מה זה אומר מבחינת תוכן? אם יש לכם תוכן בנושאים כאלו, היצמדו למקורות והפכו אותו לכמה שיותר אמין, אל תמליצו לאנשים למצוץ את הארס של הנחש…
מיקוד נושאי (Site Embeddings)
באופן לא מפתיע, גוגל מעדיף שהאתר שלכם יתרכז בנושא אחד מרכזי ויכול לדרג באופן פחות מיטבי עמודים שחורגים מהנושא הזה (Off topic אם תרצו).
לי אישית זה לא חדש, ותמיד האמנתי שזו הנחיה מוצדקת של גוגל. לצערי יש עדיין המון "חוות תוכן" עם מאמרים ונושאים שלא קשורים אחד לשני.
כמה מילים לסיום
חשוב לציין שמדובר בניתוח חלקי ביותר של המסמך, כך שייתכן שבהחלט צפויות לנו עוד הפתעות. בין אם אתם מאמינים שגוגל מבלפים יותר מאשר אומרים את האמת ובין אם לא, נראה שרוב מה שנחשף בנוגע לתוכן בסופו של דבר נועד להיטיב עם הגולשים ופחות עם מי שמנסה לייצר תוכן בכמויות גדולות במטרה לרמות את המערכת.