יום ראשון, ספטמבר 02, 2007

מטא-דאטה, מאיפה זה בא?


אם האקונומיסט כותב על הרשת הסמנטית, אז זה כבר בטח רציני.
במאמר קצר יחסית, נסקר הרעיון של הרשת הסמנטית עם 3 דוגמאות מהעולם האמיתי (האמריקאי).

ומענין לענין, באותו ענין:
תו"כ קריאה של המאמר חזרתי לשאלה ישנה נושנה שעומדת בבסיס הרשת הסמנטית - המטא-מידע (metadata ). תיאור של מידע עומד בבסיס של הרשת הסמנטית, ללא נוכחות מטא-דאטה, לא נוכל ללמד את המחשב שום סמנטיקה.
מהבחינה הזאת, משפט מפתח מתוך המאמר גורס כי:
The idea is that eventually such metadata will be incorporated into every web page and electronic document. But that is not the case at the moment, so a further layer of software is needed to infer the metadata from web pages, e-mails and other electronic documents

מה שמחזיר אותנו לויכוח לא חדש ובסיסי בשאלת ההתכנות של הרשת הסמנטית: איך ניצור את כל אותו מטא-דאטה.
למעשה, יש כבר כאלה שטוענים שהרשת הסמנטית מתה בדיוק מהסיבה הזאת - לא נוכל לצפות שמקורות שונים ברשת יכילו את כל אותו מטא-דאטה. הטענה מתבססת על העובדה הפשוטה שלא ניתן לצפות ממשתמש אינטרנט מקרי שיתן מידע משמעותי כמו שחוקר של רשת סמנטית נותן. מידת ההשקעה לא תהיה זהה.

למעשה, כיום, הבעיה העיקרית שעומדת בפני מימוש החזון של הרשת הסמנטית היא יצירת אותה שכבת מטא-דאטה משמעותית כך שמחשבים יוכלו להסיק ממנה משהו.
כמו שכבר הזכרתי בעבר, מתן המשמעות והצמדת המטא-דאטה למידע עצמו היא פעולה אנושית בבסיסה - בני האדם הם אלה שנותנים את המשמעות. המחשבים עוסקים בעיקר בלקשר חתיכות מטא-דאטה ולהסיק מהן חתיכות מידע חדשות ומעניינות. כוחם של המחשבים הוא ביכולת החישוב הגדולה לאין ערוך מזה של בן אדם ממוצע.

כיום מקובלות מספר טכניקות להוספת מטא-דאטה:
1. שימוש בטכניקות של למידה וסיווג אוטומטי. זה נכון בעיקר עבור מסמכי טקסט.
2. שימוש בתיוג חופשי, כמו בפליקר ודלישס, זה נכון עבור כל סוג של ישות שנקשר אליה ברשת, אבל תלוי בתיוג (המוני) ע"י אנשים. כמו שפליקר ודלישס, ועוד הרבה אתרים אחרים, הראו - זה אפשרי, אבל לא חף מבעיות.
3. פרסום של מטא-דאטה רשמי ע"י אתרים. חתיכות RDF ששוכנות באתרים. זה כאמור דורש מומחיות מסוימת, ולכן מוגבל בהיקף שלו.

החזון הגדול יותר של הרשת הסמנטית מדבר לא רק על דפי ווב וחתיכות טקסט אלא גם על ישויות שונות מקושרות ברשת ומסוגלות לתאר את עצמן אחת לשניה (זוכרים את המקרר שמתקשר לסופרמרקט כי חסר חלב?).

אבל עד אז, נמשיך להעביר מידע באופן עצמאי. עט ונייר, זוכרים?

- סחבק





תוויות:

0 Comments:

הוסף רשומת תגובה

<< Home