Facebook Inc. teste la technologie qui élargirait considérablement le champ des données qu'il collecte sur ses utilisateurs, le chef du groupe d'analyse de la société a déclaré mardi.
Le réseau social peut commencer à recueillir des données en minute sur les interactions des utilisateurs avec son contenu, comme combien de temps la curseur passe d'un utilisateur sur une certaine partie de son site Web, ou si le fil d'actualité de l'utilisateur est visible à un moment donné sur l'écran de son portable téléphone, Facebook analytics chef Ken Rudin a déclaré mardi lors d'une interview.
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhcAK7bKpUH5EM0RLv4nlG5rICgAK84mYaqq06P6NOUCciDPgXoqZcFIvJD71FvwWihZwQjRK-d_SofvnK_x86rFioItF5EodBjNCz64fE8t0YzxINTKNuRcmphfzBzIMmPMeyEhCqwj2m5/s200/Ken-Rudin-Headshot-2010_11-v11.jpg)
Facebook recueille deux types de données, démographiques et comportementales. Les données démographiques, telles que où un utilisateur vies ou allaient à l'école-documents la vie d'un utilisateur au-delà du réseau. Les données, telles que comportementaux son cercle d'amis Facebook, ou «aime»-sont capturées en temps réel sur le réseau lui-même. Les essais en cours pourraient accroître considérablement les données comportementales qui sont recueillis, selon M. Rudin. Les tests sont en cours et une partie d'un vaste programme d'essais de la technologie, mais Facebook devraient connaître d'ici quelques mois s'il est logique d'intégrer la nouvelle collecte de données dans l'entreprise, at-il dit.
De nouveaux types de données Facebook peuvent recueillir comprendre "ce que votre curseur survolez cette annonce ... et a été le fil d'actualité dans une zone visible", a déclaré M. Rudin. "C'est une phase sans fin. Je ne peux pas promettre qu'il va sortir. Nous ne le saurons probablement dans quelques mois ", a déclaré M. Rudin, un vétéran de la Silicon Valley qui est arrivé à Facebook en Avril 2012 à partir de Zynga Inc., où il était vice-président de l'analyse et des technologies de plate-forme.
Comme le chef de l'analyse, M. Rudin prépare l'infrastructure de l'entreprise pour une augmentation massive du volume de ses données.
Facebook n'est pas la première entreprise à contempler enregistrement telle activité. Shutterstock Inc., une place de marché pour les images numériques, enregistre littéralement tout ce que ses utilisateurs font sur le site. Shutterstock utilise le système de fichiers distribués Hadoop open-source pour analyser les données comme l'endroit où les visiteurs du site placer leurs curseurs et combien de temps ils planent au-dessus d'une image avant de faire un achat. «Aujourd'hui, nous cherchons à chaque mouvement un utilisateur effectue, afin d'optimiser l'expérience de Shutterstock .... Toutes ces nouvelles technologies peuvent traiter que« Shutterstock fondateur et PDG Jon Oringer a déclaré au Wall Street Journal en Mars.
Facebook est aussi un grand utilisateur de Hadoop, un framework open-source qui est utilisé pour stocker de grandes quantités de données sur des clusters de machines peu coûteuses. Facebook conçoit son propre matériel pour stocker ses données Google Analytics énorme entrepôt, qui a augmenté de 4000 fois au cours des quatre dernières années à un niveau actuel de 300 pétaoctets. La société utilise une version modifiée de Hadoop pour gérer ses données, selon M. Rudin. Il ya des couches logicielles supplémentaires sur le dessus de Hadoop, qui classent la valeur des données et assurez-vous qu'il est accessible.
Les données de l'analyse entrepôt, qui est séparée de la partie données de l'utilisateur de l'entreprise, dont le volume n'a pas été divulgué, est utilisé dans le ciblage de la publicité. Comme la société capte plus de données, il peut aider les commerçants à cibler leur publicité de manière plus efficace, en supposant, bien sûr, que les données sont accessibles.
«Au lieu d'un entrepôt de données, vous pouvez vous retrouver avec un dépotoir de données", a déclaré M. Rudin, qui a parlé à CIO Journal pendant une pause lors de la Conférence mondiale Strata et Hadoop à New York. Il a dit qu'il a mené un projet d'indexer les données, essentiellement la création d'un moteur de recherche interne pour l'entrepôt Analytics.
Source: http://blogs.wsj.com
0 commentaires:
Enregistrer un commentaire