Presentation is loading. Please wait.

Presentation is loading. Please wait.

Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook By: Lars Backstrom - Facebook Inc, Jon Kleinberg.

Similar presentations


Presentation on theme: "Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook By: Lars Backstrom - Facebook Inc, Jon Kleinberg."— Presentation transcript:

1 Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook By: Lars Backstrom - Facebook Inc, Jon Kleinberg - Cornell University Presented by: Nimrod Harris

2 Introduction Relationships in social networks Find new mutual friends
Find professional opportunities Categorizing friends into social groups מערכות יחסים ברשתות חברתיות נחקרו מאז הקמתם של הרשתות החברתיות. מערכות היחסים נחקרו למשל בשל הנושאים הבאים: מציאת חברים חדשים עבור משתמש מציאת הזדמנויות עסקיות – ע"י שימוש בחברים של בן אדם אפשר להציע לו פרסומות טובות יותר קיטלוג חברים של משתמש לחבורות

3 Definitions individual’s network neighborhood Tie Strength
Embeddedness הרשת השכונתית של הבודד – קבוצת האנשים שהמשתמש מחובר עליהם . הרשת כוללת בתוכה מגוון רחב של סוגי קשרים לדוגמא קרובי משפחה, שותפים לעבודה , חברים מצבא , מכירים , חברי ילדות , קשרים רומנטיים וכו... . בעזרת פיצרים (תכונות) שונים ניתן להבדיל בין סוגי הקשרים . רמת ההדיקות – רמת "הקרבה" של החברות . מרחב של טווחים – קשרים חזקים עם חברים קרובים ועד קשרים חלשים עם מכרים רחוקים. עולה שאלות שקשורות לרמת ההדיקות- האם ניתן לזהות את האנשים החשובים ביותר של אדם לפי הרשת השכונתית שלו . מהי החתימה של מבנה בעל קשר חזק (כלומר האם אפשר לזהות דפוס חוזר בכל הקשרים החזקים של בן אדם) וכיצד מזהים אותה . האמבדדנס היה הסטנדרט למדידת חוזק קשר בין שני אנשים, מוגדר ככמות החברים המשותפים של שני משתמשים. individual’s network neighborhood - the set of people to whom he is linked. Tie Strength – the “closeness” of friendship – a spectrum that ranges Embeddedness – how much two partners’ social circle overlaps האמבדדנס היה הסטנדרט למדידת חוזק קשר בין שני אנשים, מוגדר ככמות החברים המשותפים של שני משתמשים

4 Example הסבר על המושגים : זהו vnetwork neighbrohood של יוזר U .
מי השכן עם האמבדנסס הכי חזק ? למי לדעתכם יש את המערכת היחסים הכי הדוקה עם U ?

5 Data sets The authors used 2 datasets:
1. Consists of the network neighborhoods of approximately 1.3 million Facebook users. Users were selected uniformly at random from among: Users of age at least 20. Users of between 50 to 2000 friends. Users who list a spouse or relationships partner in their profile. 2. sample of approximately 73,000 neighborhoods from the first dataset with at most links. דטה סט השני היה הדטה סט שעליו עשינו את האנליזה . הדטה סט השניי היה הדטה הסט עליו עשו את האבלואציה \הערכה .

6 The Main Goal Identify important individuals of a person given his friends connections. Romantic partner Close family המטרה העיקרית היא להצליח לזהות אנשים חשובים לאדם בהינתן גרף הקשרים שלו (הרשת השכונתית). הכותבים חוקרים את השאלה הנל בנוגע לקשרים רומנטים .

7 Dispersion The main contribution of the article
Use neighbors structure A link between two people has high dispersion when their mutual friends are not well connected to one another. דיספרשן הוא החידוש של המאמר, להבדיל מאמבדדנס, לא מסתכל רק על רשימת החברים המשותפים אלא גם על המבנה שבו הם מסודרים. בדיספרשיין – לינק יקבל דיספרישיין גבוהה כאש החברים המשותפים של אוץם קודקודים לא מחוברים בינהם בצורה גבוהה.

8 Theoretical Basis For Dispersion
Social Foci The links to a person’s relationship partner is usually characterized by: Lower embeddedness. Mutual neighbors from several different foci. Social Foci – המוקד החברתי. החיסרון הביתי ב embededness כמסווג\מזהה הוא התאוריה שעומדת מאחורי המוקד החברתי . למשתמש קיימים הרבה קבוצות חברים שמחוברות בינהם עקב מוקד חברתי משותף , ורבים מהחברים בכל קבוצה כזאת מכירים אחד את השני. הקבוצה מכילה קשרים עם embeddeness גבוהה למרות שלא בכרח קיימים קשרי חברות הדוקים בין המשתתפים בקבוצה. לרוב הקשרים של מערכות יחסים יתוארו בembeddness נמוך ובdispresion גבוהה . לדוגמא : A husband who knows several of his wife’s co-workers, family members, and former classmates. These people belong to different foci and do not know each other. Thus, instead of embeddedness, the link between an individual and his or her partner v should display a ‘dispersed’ structure. The mutual neighbors of u and v are not well-connected to one another. Hence u and v act jointly as the only intermediaries between these different parts of the network.

9 Theoretical Basis For Dispersion
Co-worker family family Husband Wife בצורה הכי פשטנית שיש , זה ההיגיון שעומד מאחורי הרעיון של דיספרישון. בעל ואישה , יכירו את רב המעגלי ם החברתיים אחד של השני . (הסבר בעל פה) university army school

10 Dispersion Definitions

11 Dispersion Definitions – Cont.
High Low

12 Dispersion vs Embeddedness
emb(u,b) =5 emb(u,h) = 4 Dispersion: disp(u,h) = 4 disp(u,b) =1

13 Dispersion improvements
Normalizing Improved normalizing Recursive Dispersion איך נוכל ליצור פונקצית חיזוי בין עם v ו u כאשר נתונים לנו האמבדנסס והדיספרשיון. הנורמליזציה הביאה למקסימום של 48% , הגיעו לביצועיים טובים יותר כאשר השתמשו בשיפור 50.5% How can we create a function that predicts whether or not v is the partner of u in terms of the two variables disp(u,v) and emb(u,v)? Performance is highest for functions that are monotonically increasing in disp(u,v) and monotonically decreasing in emb(u,v). We define: norm(u,v) = disp(u,v)/emb(u,v). Predicting u’s partner to be the individual v maximizing norm(u,v) gives the correct answer in 48.0% of all instances. Improved normalizing leads to maximum performance of 50.5% at a = 0.61, b = 0, and c = 5;

14 Recursive Dispersion Emd זה בשביל הנירמול ,
Xw זה כמה השכנים שלך חזקים ,

15 Recursive Dispersion - Example
1 1 1 1 1

16 Recursive Dispersion - Example
1 1 2 1 1

17 Recursive Dispersion - Example
4 1 2 1 4

18 Recursive Dispersion - Example
4 1 32 1 4

19 Performance of structural and international measures
Find only romantic relationship Photos - דירוג שכנים של משתמש על פי מספר התמונות המשותפות Profile views – דירוג שכנים של משתמש על פי מספר צפיות בפרופיל ב90 הימים האחרונים

20 Performance of structural and international measures
Find romantic relationship or family member Photos - דירוג שכנים של משתמש על פי מספר התמונות המשותפות Profile views – דירוג שכנים של משתמש על פי מספר צפיות בפרופיל ב90 הימים האחרונים

21 A Broader of measures to dv

22 A Broader of measures to dv

23 Performance as a Function of Neighborhood Size and TimeonSite
Further important sources of variation among users: Size of their network neighborhoods The amount of time since they joined Facebook. These two properties are related - after a user joins the site, his or her network neighborhood will generally grow monotonically over time. Time effects: The neighborhood’s complexity The extent to which the network refcts the user's o –line relationships הביצועים כפונקציה של גודל השכונה , וכמות הזמן בא המשתמש חבר ברשת החברתית.

24 Performance as a Function of Neighborhood Size and TimeonSite cont.
Why the interaction features performance increases as a function of neighborhood size? בגרך ניתן לראות כי ככל שכמות החברים גדולה יותר ככה השיטות המבניות משיגות ביצועים חלשים יותר , לעומת זאת השיטות הדינמיות משיגות ביצועים טובים יותר כאשר כמות החברים גודלת , האם אנחנו מסוגלים לשאר למה ?

25 Performance as a Function of Neighborhood Size and TimeonSite cont.
הגרף מתאר את ההצלחה של שיטת הערכה על פי רקורסיב רקרשויין כתלות משך הזמן בו המשתמש חבר ברשת החברתית

26 Combining Features using Machine Learning
Different features may capture different aspects of the user’s neighborhood. How well can we predict partners when combining information from many structural or interaction features via machine learning? פיצרים שונים יכולים להיתייחס או להתקשר בצורה שונות לשכונה של המשתמש. נשאלת השאלה , כמה טוב אנו מסוגלים לחזות שותפות רומנטית כאשר אנו משלבים מידע גם ממבנה השכונה , וגם מפיצרים דינאמים על ידי למידת מכונה.

27 Machine Learning Techniques.
For our machine learning experiments, we compute 48 structural features and 72 interaction features for all of the nodes in the neighborhoods from our primary dataset. Did the machine learning techniques brings better result? 48 המבנים הם סוגי דיספרשיין אבסולוטים ומנורמלים A Broader of measures to dv.המבוססים על 6 סוגי המרחקים משקופית כמו כן השתמשנו בשיטה הרקורסיבית בין 2-7 איטרציות (איך יצא 48??????????) 72 הפיצרים בנויים ממגוון תכונות (תגובתיות \דינמיות) כמו מספר התמונות ש2 תויגו יחדיו, מספר הצפיות בפרופיל ב30\60\90 ימים האחרונים . מספר ההודעות , מספר הלייקים וכדומה . השאלה שנשאלת היא האם למידת המכונה באמת הצליחה להביא לתוצאות יותר טובות . The 48 structural features are the absolute and normalized dispersion based on six distinct distance functions defined for Figure 6, slide of A Broader of measures to dv. as well as the recursive versions using iterations 2 through 7 The 72 interaction features represent a broad range of properties including the number of photos in which u and v are jointly tagged, the number of times u has viewed v’s profile over the last 30, 60, and 90 days, the number of messages sent from u to v, the number of times that u has ‘liked’ v’s content and vice versa, and measures based on a number of forms of interaction closely related to these.

28 Performance of Machine Learning Methods.
Combining all of the 48 structural features, brings increasing in the performance from 50.6% to 53.1%. All interaction features perform slightly better than structural method. Combining of all the fetchers structural and interaction brings the best result. שתי העמודות הראשונות מייצגות את הביצועים הטובים ביותר של ביצוע ניתוח עם שיטה "דינאמית" אחת , ושיטה חישוב מבנה אחד . שתי העמודות הבאות מראות את הביצועים של כל שיטות המבנים ביחד , וכל התוכונת הדינמיות ביחד . העמודה האחרונה מייצגת את השילוב של שיטות המבנים ושיטת התכונות .

29 Machine Learning to Predict Relationship Status.
Until know we focused on the problem of identifying relationship partners for users where we know that they are in a relationship. Now we are going the estimating whether an arbitrary user is in a relationship or not, and this is more challenging question. עד עכשיו התעסקנו בשאלה של זיהוי מערכת היחסים בהינתן הידע שבגרף Gu שקיבלנו קיים שכן v כך ש u ו וv נמצאים במערכת יחסים, עכשיו נתעסק בשאלה שקשורה אליה בצורה ישירה אך היא קצת יותר מאתגרת , האם בהינתן משתמש אקראי ניתן להבין האם הוא נמצא במערכת יחסים או לא. בשאלה זו נצטרך להשתמש בטכניקות שונות .

30 Machine Learning to Predict Relationship Status cont.
Why is this question more challenging ? Consider a user u who has a link of high dispersion to a user v. Dispersion is useful to identify individuals with interesting connections to u, in the sense that they have been introduced into multiple foci that u belongs to. A user generally will have such friends even when u is not in a romantic relationship. (it can be a close friend, family members). למה שאלה זאת היא יותר מאתגרת? נתון משתמש u עם קשר דיספרשיין גבוהה למשתמש v . כאשר ידוע לנו כי u נמצא במערכת יחסים v הוא אכן מועמד טוב להיות במערכת יחסים עם uץ אך דיספרשיין שימושי למצוא משתמשים בודדים עם עיניינים משותפים לu , כאלו שהוצגו (או לוקחים חלק) בהרבה מוקדי עיניין של משתמש u. וידוע שלמשתמש יש מספר חברים כאלה , והם לאוו דווקא תמיד יהיו איתו בקשר רומנטי, כמו בני משפחה חברים קרובים וכו... (לכן קשה מאוד להבדיל בין קשר רומנטי לקשר משפחתי, ראינו גם בגרף ממקודם שאילו לוקחים גם הסתברות שהקשר יצביע לקרבה משפחתית מדרגה ראשונה אחוזי ההצלחה של האלגוריתם עולים משמעותית)

31 Machine Learning to Predict Relationship Status cont.
Data set: approximately 129,000 Facebook users, sampled uniformly over all users of age at least 20 with between 50 and 2000 friends 40% of these users were single, while the remaining were either in a relationship, engaged, or married. 2 different question: First Determining whether a user is in any sort of a relationship Second by looking only at single and married users determine in which category the user belongs to. הדטה סט שלנו מורקב מ משתמשי פייסבוק מעל גיל 20 שנבחרו באופן אחיד ורנדומלי ושיש להם בין חברים. 40 אחוז מהמשתמשים הם רווקים בעוד השאר נמצאים במערכת יחסים (זוגיות , אירוסין , או נשואים). התעסקו ב2 שאלות – לקבוע האם משתמש נמצא בסוג מסויים של מערכת יחסים . על ידי הסתכלות רק על הרווקים והנשואים , נקבע לאיזה קטגוריה המשתמש שייך .

32 Machine Learning to Predict Relationship Status cont.
For this questions they used 3 different sets of features: Demographic features(age, gender, country, etc). Structural features of the network neighborhood The union of these two sets. על מנת לבדוק את השאלות , הסתכלו על 3 פיצרים : פיצרים דמוגרפיים – גיל, מין , ארץ וכדומה .... מבנה של network neighborhood. האיחוד של שניהם .

33 Machine Learning to Predict Relationship Status cont.
אנחנו יכולים לראות ביצועים טובים של הפיצרים הדמוגרפים מכיוון שהגיל היה פיצר מאוד משמעותי. רשת החברים לא היה פיצר ממש חזק כמו שדיסקסנו קודם , גם למשתמשים שלא במערכת יחסים יכול להיות חברים עם דיספרשיין חזק .

34 Temporal Properties How does performance vary based on the time since the relationship was first reported by the user? It was found that the structural measures are more accurate on older relationships than on newer . While profile viewing feature is less accurate. איך שונות הביצועים מושפעת מהזמן בו הוחרז על מערכת היחסים בפעם הראשונה ? מסתבר שככל שהמערכת היחסים ארוכה יותר כך מתחזק הביצועים של הערכה על פי מבנה השכונה . בזמן שעם נסתכל על הפיצר של צפיות בפרופיל נופתע לגלות שהוא הולך וניהיה פחות מדויק ככל שמערכת היחסים ארוכה יותר.

35 Temporal Properties גרף המתאר איך הזמן משפיע על הביצועים של כל אחד מן המדדים השונים כתלות באורך תקופת מערכת היחסים אצל נשואים . השמאלי מתאר פיצר הטוב ביותר יחיד מכל סוג, הימני שילוב של הפיצרים. כמו שנאמר בשקופית הקודמת ניתן לראות כי הדיוק של המציאה על פי מבנה השכונה הלך וגדל עם הזמן , לעומת הירידה באיכות במדד של צפייה בפרופיל . ניתן להבין מהגרף שלחתימת מבנה השכונה לוקח זמן להיצרב בגרף . (לוקח זמן להיווצר) בנוסף ניתן לראות כי לאורך כל הזמן לדיספשיין הרקורסיבי היה את הביצועים הטובים ביותר.

36 Temporal Properties גרף המתאר איך הזמן משפיע על הביצועים של כל אחד מן המדדים השונים כתלות באורך תקופת מערכת היחסים אצל in relationships. השמאלי מתאר פיצר הטוב ביותר יחיד מכל סוג, הימני שילוב של הפיצרים. כאן קורה משהו מעניין , ניתן לראות כי עבור מערכות יחסים קצרות משנה , לצפייה בפרופיל יש את אחוזי ההצלחה הגבוהים ביותר . אך לאחר שנה צפפיה בתמונות והדיספרשיין הרקורסיבי עוקפים את הצפייה בפרופיל/ יש עלייה בביצועים של דיספרישיין לאורך זמן , וירידה בביצועים של צפייה לאורך זמן.

37 Temporal Properties Are partnerships that are more strongly identified by the measures are also more likely to persist over time? בגרף: הם בחנו משתמשים שהכריזו על עצמם בתור "מערכת יחסים" ובתוך 60 יום הפכו "רווקים" והם מצאו ממצאים מפתיעים? משתמשים שהדיספרשיין הרקורסיבי או הנורמליזייד שלהם היה גבוה , הסיכוי שלהם להפוך ל"רווקים" היה נמוך בהרבה .

38 Beyond Immediate Neighborhoods
A question arises: What happens if we search beyond immediate neighborhoods, what happens if we search an extra layer? לא בטוח שצריך , בגדול מדברים על זה שלוקחים יותר משכונה 1, בתאוריה היינו רוצים לקחת מבנה שבו עבור כל v שכן של u נוסיף את כל החברים שלו לגרף , אבל באופן מעשי זה לא הגיוני מכיוון שיכול להיות עבור כל Gu חדש כמו שהגדרנו עכשיו מאות אלפי קודקודים . לכן מבצעים חישוב של dispresion ולוקחים את ה20 חברים הכי קרובים , ועל הגרף הזה מבצעים ניתוחים והצליחו לעלות את האחוזים ב6%.

39 Conclusions Understanding the structural roles of a romantic partner in online social networks is a broad question that requires a combination of different approaches. Dispersion is a measure which provides a powerful method for recognizing such partners from network data alone. Romantic relationships are categorized with people who are connected to a wide range of social foci. These connections may have lower embeddedness, but will indeed involve several mutual foci.


Download ppt "Romantic Partnerships and the Dispersion of Social Ties: A Network Analysis of Relationship Status on Facebook By: Lars Backstrom - Facebook Inc, Jon Kleinberg."

Similar presentations


Ads by Google