יום רביעי, אוגוסט 10, 2005

על המידע , חלק ב'


בפעם הקודמת דיברנו באופן כללי על האפשרויות הנפוצות לארגון מידע ואחזורו. נשים לב כי באופן כללי ישנם שיקולים רבים שנכנסים להחלטה כיצד לארגן מידע. אחזור מידע הוא רק אחד מן השיקולים הללו, למרות היותו מרכזי. בדיון הנוכחי אני מתרכז רק בשיקול הזה.

מנועי החיפוש אכן היוו פריצת דרך בכל מה שנוגע לאחזור מידע. היכולת להקיש מספר מילות חיפוש ולמצוא מספר לא קטן של דפים ברשת שמדבר עליהם היוו התקדמות משמעותית. עם זאת, כמו שהזכרתי קודם, כל מנועי החיפוש הנפוצים מתבססים על ניתוח מבני של המסמכים והקשרים בינהם. דבר שהוביל לאפשרות של "רמאויות" ומניפולציות על תוצאות החיפוש. נוסף על כך, לא מן הנמנע כי מנועי החיפוש בעצמם מטים את תוצאות החיפוש משיקולים שונים, בעיקר מסחריים.

כל זה היווה כר פורה להתפתחות של גישה הגורסת כי ארגון המידע יכול וצריך להתבצע ע"י המשתמשים במידע בעצמם, באופן מבוזר. על פי גישה זו כל אדם שגולש ברשת אוסף לעצמו את אוסף הקישורים הרלוונטי והחשוב לו. תהליך זה דומה לבניית רשימת מועדפים (bookmarks). בנוסף על כך, כל משתמש שאוסף קישורים לדפים, גם מתייג אותם בתוויות על פי ראות עיניו (טקסט חופשי) מתוך שאיפה, כמובן, שהתיוג הנ"ל ייצג את משמעות הדף הנ"ל עבור אותו משתמש.
דרך אגב, נשים לב כי אין כאן חובה של תיוג דווקא של קישורים באינטרנט, אנו יכולים בצורה כזו לתייג כל דבר. דוגמה טובה לכך היא שירות flickr אשר מאפשר לאסוף ולתייג תמונות.

השימוש בתוויות כשלעצמן אינו מסעיר במיוחד - אני פשוט מסווג ישויות שונות (לינקים, תמונות, מסמכים) בצורה שנוחה לי. בצורה שתאפשר לי למצוא אותם בקלות יותר מאוחר. למרות היתרונות הברורים שנובעים מגישה זו, אין בה חידוש דרמטי.
החידוש נובע משיתוף הפעולה ההמוני, ברגע שהרבה אנשים מתייגים ישויות שונות, אנחנו מקבלים המון מידע נוסף - מטה מידע (Meta data) על אותן ישויות; וכל זה במחיר יחסית אפסי מפני שכל בן אדם מתייג בשביל עצמו, אך הוא משתף בכך את כולם ואנחנו מקבלים תמונה יותר רחבה של "מה כל ישות מייצגת עבור קבוצה מאוד גדולה של אנשים". את אותו מידע נוסף, שנוצר ע"י ההמון, ניתן לנצל כעת לצורכי אחזור מידע וארגונו בצורה יעילה יותר.

ניתן כמובן לשכלל את זה, אם אנחנו חושבים על האפשרויות הגלומות בתיוג הזה. אם אני מסתכל על אתר מסוים, ורואה ש2500 איש תייגו אותו במילים "חדשות" ו "ישראל", סביר להניח שהוא מדבר על חדשות מישראל.
לכאורה קיים פה פוטנציאל לא קטן לספאמרים - כל אדם יכול לתייג כל ישות בכל מילה. אתם כבר יכולים לנחש מה יקרה אם מישהו יתייג אתרי פורנו במילים כמו: "ילדים", "כיף", "דיסני" ואלוהים יודע מה עוד.
אומנם הכלים האלה עוד לא נפוצים עד כדי כך כדי לבדוק באופן אמפירי אפשרות כזאת, אך הסברה הרווחת היא שהצפה כזאת היא בלתי אפשרות בדיוק בגלל ההשענות של השיטה הזאת על ההמון. והמפתח כאן הוא ההמון.
כיום מתקיימים כבר דיונים ויש התחלה של נסיונות לנצל את הגישה הזאת לפרסום או לדברים מסחריים באופן כללי.
דוגמה מובהקת לכך היא הדירוג שדלישס נותן ללינקים הפופולרים ביותר.

כמעט כל מי שמתעסק בפרסום באינטרנט, חיפוש, הפצת תוכן, כבר מודע לויכוח שניטש בין המצדדים בחזון לבין המתנגדים או אחרים שמציעים עוד פיתוחים על הנושא הזה. אחד הדוברים היותר נלהבים בעד גישה זו הוא קליי שירקי.

סקירה נוספת למתעניינים ניתן למצוא כאן.
עד כאן בינתיים, אשמח לתגובות, הערות והארות בנושא.
בכל מקרה, אמשיך לסקור את התפתחות התחום של אחזור המידע וארגונו בצורה שיתופית.

סחבק.

0 Comments:

הוסף רשומת תגובה

<< Home