Stephen Wolfram n’a pas peur des grands défis.
À l’âge de 21 ans, il a été l’un des premiers lauréats des bourses MacArthur « Genius » pour ses travaux sur la théorie de l’interaction forte en physique des particules avec Geoffrey Fox de l’Université de l’Indiana. Puis il a inventé le domaine de l’étude des systèmes complexes lorsqu’il a fondé le Center For Complex Systems à l’Université de l’Illinois en 1986. Il a créé Mathmatica, un logiciel pour résoudre des problèmes d’algèbre, qui est encore largement utilisé aujourd’hui.
Mais il est probablement mieux connu dans la culture populaire pour avoir construit Wolfram ! Alpha, le moteur de recherche de traitement du langage naturel (NLP) qu’il a lancé en 2007. Depuis lors, Wolfram! Alpha a été intégré au produit Siri d’Apple et au moteur de recherche Bing de Microsoft.
Il n’est donc pas surprenant qu’il soit obligé de plonger dans l’océan de données que Facebook produit. L’année dernière, il a annoncé Personal Analytics For Facebook, qui permet aux utilisateurs de Facebook de parcourir des dizaines de graphiques et de statistiques fascinants sur leurs comptes individuels.
Ceux-ci incluent les âges, les lieux et les activités Facebook de tous les amis. En échange de la fourniture de ces rapports personnels, Wolfram demande l’accès à vos données à des fins d’analyse de mégadonnées. (Les conditions du site indiquent clairement que vos données seront utilisées de manière anonyme)
Cette semaine, Wolfram a publié un rapport massif sur ce que toutes ces données Facebook disent de nous. (Le rapport peut être trouvé sur son blog ici: http://blog.stephenwolfram.com/2013/04/data-science-of-the-facebook-world/
Tout d’abord, bien sûr, il y a la mise en garde que les données ne proviennent que du million d’utilisateurs de Facebook qui se sont inscrits à Personal Analytics For Facebook. Mais comparer les données de Wolfram avec ce que Facebook nous a dit montre que ses données correspondent étroitement à celles de la population générale.
Quels sont les gros « a-ha ? »
Il y a un grand nombre de personnes sur Facebook qui n’ont presque pas d’amis du tout. L’implication est que quelqu’un leur tend la main pour être un ami et c’est ainsi que leurs comptes ont été établis.
Oh, et il y a un grand nombre d’adolescents (et peut-être de jeunes enfants) sur Facebook et ils ont tendance à jouer vite et librement avec des faits, comme leur âge et leur statut relationnel. (Note à moi-même : consultez les pages Facebook de ma fille lorsque j’aurai terminé cet article.)
Le nombre moyen d’amis que nous avons est de 342 et augmente rapidement. Wolfram suppose que le moteur de recommandation de Facebook, qui limite à 200 personnes, contribue à augmenter le nombre moyen d’amis.
Le rapport contient des dizaines et des dizaines de graphiques et de groupes de mots sur diverses données démographiques et comportements. Mais l’une des analyses les plus fascinantes que Wolfram a faites avec les données de Facebook a été de modéliser les « groupes » d’amis de chaque utilisateur.
Par exemple, j’ai quatre grands groupes d’amis. Il y a d’abord des collègues à New York de l’époque de mon agence vers 2005, lorsque Facebook était juste en train de devenir un réseau majeur – il n’y avait personne d’autre que nous connaissions sur Facebook, alors nous nous sommes connectés les uns aux autres. Deuxièmement, il y a des amis à Los Angeles et à San Francisco des années 1990, lorsque j’étais étudiant à l’USC et que je travaillais ensuite dans la Bay Area. Les troisièmes sont des amis à Minneapolis, où je vis maintenant. Et les quatrièmes sont des membres de la famille, dispersés à travers le pays. Donc mon modèle « cluster » ressemblerait à ceci:
Il est composé des quatre groupes de personnes que je connais. Comme vous pouvez le voir sur les lignes, mes grappes ont peu de « croisement », c’est-à-dire que mes amis à New York ne connaissent pas mes amis en Californie parce que je suis tout ce qu’ils ont en commun. Wolfram a réduit chacun des millions et plus d’utilisateurs de Facebook qu’il a étudiés dans ces formes de cluster simples et a découvert que la forme de cluster avec le plus grand nombre d’utilisateurs était un triangle, suivi de deux nœuds, puis de trois nœuds en ligne droite (une personne avec trois nœuds avec petit croisement. ) Et puis le cluster à quatre nœuds comme le mien. Voici la distribution de ces modèles de cluster :
(crédit : Wolfram ! Alpha)
Le rapport est une mine d’ensembles de données qui permettent de larges comparaisons non seulement des comportements de Facebook, mais aussi de ce que nous disons à Facebook sur nous-mêmes. Par exemple, plus les femmes sont âgées, plus elles sont susceptibles de déclarer leur statut de « célibataire », mais il n’en va pas de même pour les hommes. Les modèles de cluster avec le plus de notes – quatre – sont plus susceptibles de provenir de personnes plus âgées qui sont actives sur Facebook. Cela a un sens intuitif, car à mesure que nous vieillissons, nous sommes plus susceptibles de déménager (comme je l’ai fait) ou de nouer des relations dans un nouveau groupe social. Wolfram a également examiné les activités qui nous intéressent et que nous répertorions sur Facebook. Ce n’est pas une surprise pour moi que les hommes soient beaucoup plus nombreux que les femmes qui aiment le « sport ». Mais il est également surprenant que les hommes aiment les films, la nourriture et les boissons fitness et voyagent plus que les femmes :
(crédit : Wolfram ! Alpha)
Les femmes sont plus intéressées que les hommes par les amis et la famille, les occasions spéciales, les citations et la philosophie de vie. Qui savait?
Des centaines d’autres pépites de ce type sont disponibles cette semaine. Si vous êtes intéressé, vous pouvez vous inscrire à Personal Analytics For Facebook ici.
J’ai hâte que Wolfram applique toute la puissance de sa technologie de traitement du langage naturel à ces données afin que je puisse découvrir combien il y a sur Facebook, le gaucher d’âge moyen Van Morrison qui aime les golfeurs moche.
Exactement comme moi.