Clochix - Veille professionnelle (veille)

User profile

Photo
veille
Nickname
veille
Full name
Clochix - Veille professionnelle
Location
Cyberspace
Note
Veille à caractère professionnel, sur des sujets et avec des positions qui ne sont pas forcément les miennes, bienvenu dans ma schizophrénie.

User actions

Notices

  1. Firefox en 64bits pour Windows

    Firefox en 64bits pour Windows

    [micro-billet-bookmark, aucune info lue ni vérifiée] Si la version 64bits de #Firefox pour GNU/Linux existe et tourne plutôt bien depuis pas mal de temps (mais n'est pas officiellement supportée par Mozilla je crois), la version Windows semblait un peu à la traîne. Récemment, entre deux entraînement à la satellisation de trolls, Aza Dotzler a annoncé que la sortie de cette version était dans ses priorités. Parmi les dernières avancées du projet, Armen Zembrano, membre de l'équipe de release engineering vient d'annoncer la mise en place d'un petit pool de machines pour produire des nightlies de Firefox 64-bits windows. Deux articles non issus de Mozilla (donc dont j'ignore la fiabilité) en parlent: Le qu'il faut en retenir et Est-ce enfin l'ère de la navigation en 64 bits ?

    about 10 months ago from web
  2. Le futur du Web en six verbes, selon Kevin Kelly

    Le futur du Web en six verbes, selon Kevin Kelly

    Je ne crois pas avoir vu passer de compte-rendu d'une conférence donnée par Kevin Kelly à la Web 2.0 Expo de Mars à San Francisco. Kevin Kelly a été éditeur du mythique Whole Earth Catalog et fondateur de Wired. Il a donné une conférence sur les six verbes qui selon lui vont façonner le  futur du Web. En résumé (je garde les verbes en anglais, n'arrivant pas à trouver de traduction potable) :

    screening : il y aura des écrans partout et ils deviendront notre principale interface d'interaction avec le monde;

    interacting : nous ne serons plus dans une position de consommateurs mais interagirons en permanence avec notre environnement, avec les contenus en ligne, etc. Les applications Web par exemple s'adapteront aux comportements de chacun. Nous agirons sur le monde et il agira sur nous;

    sharing : tout ce qui peut être partagé le sera, non seulement les contenus, mais toutes les informations possibles, sur nous, nos relations, etc;

    flowing : dans notre rapport à l'informatique, nous en sommes à la troisième métaphore. Nous l'avons d'abord figurée en bureau, puis comme des pages. Aujourd'hui, la métaphore est le flux, le numérique comme un océan de flux nous apportant en temps réel des données brutes. Tout produit des flux d'information, l'enjeu est de les gérer;

    accessing : la propriété va décliner au profit de la possibilité d'accéder à : nous ne possèderons plus de livres, disques, films mais les consulterons en ligne (IRL, cela se traduit par les systèmes de partage de vélo, d'auto, voire le couchsurfing);

    generating : ce qui aura de la valeur est ce qui ne peut pas être facilement dupliqué. Les concerts plutôt que la vente de morceaux;

    (sources : articles sur TechCrunch et VentureBeat et notes sur github )

    about a year ago from web
  3. Prends garde au Wifi

    Prends garde au Wifi

    Les voitures de Google qui sillonnent le monde pour prendre les photos visibles dans Street View ne se contentent pas de prises de vues. Elles disposent également d'autres capteurs leur permettant de collecter nombre de données, notamment sur les réseaux Wifis. Suite à une "erreur de paramétrage" (je leur laisse le bénéfice du doute, ce n'est pas là l'important), ces capteurs ont enregistré des communications électroniques circulant sur les réseaux wifi non protégés qu'ils croisaient. Alertée, la CNIL vient d'infliger à Google une amende.

    L'intéressant dans l'histoire, c'est ce que l'analyse d'une fraction des données collectées a permis à la CNIL d'apprendre: ces données contenaient des mots de passe d'accès à des sites et de messagerie électroniques, des traces de connexion à des sites de rencontres ou pornographiques, des échanges de mails, etc. Données qui couplées aux coordonnées GPS de l'endroit où elles avaient été enregistrées, et aux l'identifiant de la connexion, permettent facilement d'identifier l'internaute émetteur.

    Pour recueillir ces informations, Google n'a procédé à aucun piratage: ses voitures se sont contentées d'écouter et d'enregistrer des communications non protégées accessibles depuis l'espace public. N'importe qui peut en faire autant, équipé d'un simple ordinateur avec une carte Wifi. Et je ne doute pas que des gens le fassent, et pas forcément avec des intentions altruistes. Il suffit de se promener dans la rue, de détecter les réseaux ouverts, et d'enregistrer ce qui y circule. D'une simplicité enfantine.


    Les exemples cités par la CNIL (la délibération complète est sur leur site, mais difficilement lisible, http://www.cnil.fr/la-cnil/actu-cnil/article/article/google-street-view-la-cnil-prononce-une-amende-de-100-000-euros/, je vous conseille d'aller lire ses meilleurs extraits par exemple sur le site de Numerama http://www.numerama.com/magazine/18339-infidelite-homosexualite-maladie-les-donnees-collectees-par-google.html) devraient inciter les internautes à plus de prudence, et à respecter quelques règles simple de sécurité:

    • ne jamais se connecter à un réseau Wifi n'utilisant aucun chiffrement, ou un chiffrement faible;
    • lorsqu'on se connecte à un site via un login/mot de passe, toujours le faire en httpS. L'ensemble du surf connecté doit se faire en https, et non juste la phase de login;
    • si des sites ne proposent pas la possibilité de se connecter en httpS, s'abstenir de s'y connecter via le Wifi, même sur un réseau protégé;
    • paramétrer ses logiciels (courrier et messagerie électronique par exemple) pour qu'ils utilisent des communications chiffrées. S'ils ne le permettent pas, changer de logiciel;
    • rester conscient que la plupart des méthodes de protection sont contournables pour qui veut s'en donner les moyens. Le gouvernement tunisien par exemple dans ses derniers jours a utilisé des mécanismes pour intercepter des communications, même chiffrées. Donc si vous avez besoin d'un niveau de sécurité élevé, utilisez des outils ad hocs.

    about a year ago from web
  4. Ouvrir des liens depuis un terminal

    Ouvrir des liens depuis un terminal

    Comme je suis en train d'essayer de minimiser ma consommation de ressources sur ma machine (une note devrait suivre sur le sujet), j'utilise de plus en plus d'applications en mode console, directement dans une XTerm. Voici la petite astuce en cours d'élaboration que j'utilise pour faciliter l'ouverture de liens qui s'affichent dans mon terminal.

    • première étape, sélectionner le lien. Par défaut, un double-clic sur un lien ne sélectionne qu'un mot. Si on regarde la documentation de XTerm, on découvre que celui-ci a la notion de classes de caractères, et qu'il sélectionne tous les caractères adjacents appartenant à la même classe. Si on veut sélectionner une url complète, il faut donc lui indiquer les classes qui sont similaires. On peut faire cela via la directive XTerm*charClass dans le fichier ~/.Xdefaults. Par exemple, XTerm*charClass: 46-47:48,58:48 lui indique que les classes 46 (le point) à 47 (la barre oblique) et 58 (les deux points) sont similaires à la classe 48 (les chiffres et les lettres). Une URI peut contenir encore bien d'autres caractères, je vous laisse affiner. Vous trouverez la table des caractères dans le manuel.
    • le lien sélectionné, reste à l'ouvrir dans un navigateur. J'utilise pour cela xclip, un petit utilitaire pour manipuler les presse-papiers. Avec XTerm, tout texte sélectionné est automatiquement placé dans un presse papier. J'ai donc créé un raccourci clavier pour ouvrir avec mon navigateur favori le lien dans le presse papier. Ce qui sous Fluxbox donne par exemple la ligne suivante ajoutée au fichier ~/.fluxbox/keys : Mod4 O :Exec firefox -url `xclip -o` (si votre système essaie d'ouvrir une nouvelle instance de Firefox à chaque fois, pensez à mettre MOZ_NO_REMOTE à 1 pour qu'il ré-utilise l'instance existante.

    C'est bien sûr encore améliorable, il faudrait que j'arrive à ce que la fenêtre de Firefox ne prenne pas le focus. La suite, j'espère, au prochain épisode.

    about a year ago from web
  5. Sur le Web, l'innovation n'est pas dans le modèle économique

    Sur le Web, l'innovation n'est pas dans le modèle économique

    Je suis tombé sur une présentation de dix sites "innovants" qui ont marqué 2010 et de leurs modèles économiques. Ce qui me frappe, c'est qu'à quelques exceptions près, ce modèle n'est lui pas particulièrement innovant, et n'a rien de spécifique au Web ou à la prétendue nouvelle économie. C'est avant tout de la réclame ou des commissions sur de la mise en relation commerciale.

    • la vente directe de biens ou services:
      • c'est le cas des jeux qui vendent des biens virtuels. Si les biens sont virtuels, cela reste une transaction commerciale tout ce qu'il y a de plus classique;
      • PatientsLikeMe : propose un service gratuit en échange de la permission de revendre les données de ses membres à des tiers. La vente de base de données de profil n'a pas attendu Internet;
      • PayWithaTweet : le site est payé par des entreprises pour inciter ses utilisateurs à promouvoir des produits dans leur réseau, à devenir leurs ambassadeurs. Une fameuse marque de boites de plastique a depuis longtemps adopté ce modèle;
    • la réclame:
      • Spotify : diffusion de musique, financée par des annonces publicitaires. Un modèle vieux comme la presse papier;
    • les commissions:
      • Groupon : site d'achats groupés en ligne avec fortes réductions, se rémunère en commissions;
      • HumbleBundle : achat de jeux à prix libres, une partie de l'argent étant reversé à des causes. Le site prend une commission;
      • Airbnb : mise en relation de chambres d'hôtes avec des clients et commission sur la transaction;
      • Kickstarter : commission sur du financement collaboratif de projets;
      • Quirky : plate-forme de co-création : les inventeurs paient pour soumettre leurs idées à une communauté, puis les profits de la vente du produit final sont partagés entre les initiateurs, la communauté du site et le site lui-même. C'est un peu plus intéressants car les sources et les flux financiers sont plus variés;
    • plus novateur:
      • Flattr : système de micro-paiement pour féliciter des auteurs, le site se rémunère avec des commissions. Certes ce sont encore des commissions sur des échanges, mais Flattr se positionne également dans le mouvement pour la création de monnaies alternatives, et cette réflexion, même si elle n'est ni neuve ni spécifique au Web, me semble elle prometteuse en terme d'innovation;

    Finalement, si le Web est un terreau fertile pour l'innovation dans divers domaines, l'économie ne semble pas encore être l'un de ceux-ci, et pour se faire des pépettes les sites utilisent toujours des recette pré-numériques.

    Wednesday, 12-Jan-11 14:11:57 CET from web
  6. Rechercher toutes les actions effectuées par une IP dans des logs serveur, en excluant images, js, css... :

    zgrep -P 'IP(?!.*(\.png|\.gif|\.jpg|\.js|\.css|\.ico).*)' *.log*

    • zgrep est la version de grep qui décompresse à la volée les fichiers compressés
    • -P permet d'utiliser, si grep a été compilé pour, les expressions régulières Perl

    #regexp

    Friday, 10-Dec-10 16:28:25 CET from web
  7. Etsy est un site de commerce en ligne, spécialisé dans la vente de produits artisanaux fabriqués par des créateurs. A l'approche de l'orgie consumériste de la fin d'année, il a décidé de faciliter la vie de ses utilisateurs en quête d'idées de cadeaux pour leurs contacts. Il utilise pour cela l'API de Facebook : en autorisant Etsy à récupérer les informations de vos contacts Facebook, il va analyser leur profil, leurs centres d'intérêt et les pages Web qu'il ont "likées", et vous proposera des objets de son catalogue en lien avec leurs gouts supposés.

    Saturday, 04-Dec-10 21:53:32 CET from web
  8. J'ai découvert cette semaine deux outils réseaux bien pratiques:

    • mtr  est une combinaison de ping et de traceroute permettant de surveiller en temps réel la latence d'une connexion: il envoie à intervalles réguliers des requêtes et affiche pour tous les nœuds par lesquelles elles transitent les temps de réponse minimum, moyen et maximum;
    • nethogs affiche en temps réel le trafic réseau sur une interface trié non par protocole mais par processus. Un complément indispensable à iftop pour analyser rapidement le trafic;

    PS: à propos de latence, vous avez lu l'excellent article d'@edasfr sur le sujet ?

    Saturday, 04-Dec-10 14:47:13 CET from web
  9. J'ai hésité à poster ce lien, il ne s'agit après tout que d'une réclame pour un logiciel privateur fonctionnant sur une plateforme carcérale. Mais j'ai apprécié la réalisation astucieuse, qui parvient à créer une expérience intéressante avec un minimum de JavaScript et de CSS. Bref, allez jeter un œil au source de http://benthebodyguard.com/

    Friday, 03-Dec-10 22:00:27 CET from web
  10. 73° Carrefour des possibles

    73° Carrefour des possibles

    La Fondation Internet Nouvelle Génération (FING) organisait mardi soir à la Maison des Métallos un Carrefour des possibles (#cpossibles) consacré à l'Innovation démocraTIC, au Lien social et à la démocratie participative. Au programme, treize présentations de projets, trois pour le plaisir et dix autour des thématiques du jour. Au programme quelques idées enthousiasmantes et d'autres qui m'ont moins convaincu, mais je mettrai ça sur le compte de la brièveté des présentations, à peine six minutes chacune, et m'abstiendrai de dire du mal.

    Petite revue des projets, simple compilation de mes notes, en espérant vous donner envie d'aller regarder de plus près l'un ou l'autre.

    Les mises en bouche
    • microDON comme son nom l'indique vise à collecter des dons pour des bonnes causes en récupérant les quelques centimes permettant d'arrondir une somme. Par exemple, à la caisse d'un supermarché, vous pouvez choisir d'arrondir à l'euro supérieur et de verser la différence à une œuvre;
    • iDact est un projet de cartographie utilisant les tablettes numériques pour rendre les lieux publics plus accessibles aux déficients visuels. Une expérimentation est en cours avec la RATP pour intégrer des plans des gares et stations de métro d'Ile de France. Une superbe idée malheureusement gâchée par sa réalisation, puisqu'ils développent une application qui ne fonctionnera que sur iBad. Je n'ai pas suivi l'évolution de la gestion des écrans tactiles dans les navigateurs mais aimerais bien qu'une version Web de cette application voit le jour;
    • Funky Projects, agence portugaise, s'intéresse à l'utilisation du design au service d'enjeux citoyens. Avec Magik Politik, elle essaie d'organiser des évènements pour inciter les jeunes à s'investir dans le débat public, en lui donnant une image un peu plus fun. J'avoue que le parallèle entre campagnes électorales et publicité m'a mis un peu mal à l'aise;
    Les dix projets
    • Ma Mairie Citoyenne se présente comme un réseau social de la démocratie local, qui vise à faciliter la concertation entre les différents acteurs, pour élargir le débat et augmenter la transparence, permettre aux citoyens de davantage s'impliquer et d'avoir plus de retours. Il offre à toutes les collectivités des espaces où lancer des débats. Les citoyens peuvent également avoir leur page personnelle, et le site permet des accès thématiques transversaux;
    • TalkMap porte le concept des cartes heuristiques à l'animation de débats en ligne. Au lieu de présenter les débats sous la forme classique de fils de discussion, il propose de les organiser en cartes facilitant la visualisation des interactions. Différents outils de modération permettent de mettre en évidence les contributions les plus intéressantes ou les contributeurs de bonne réputation. L'idée me plait beaucoup, d'autant que techniquement, à la différence de Pearltrees, ils ont décidé de partir sur une solution purement Web, sans Flash, voire intégrant à terme du SVG;
    • Eticode part du constat que la plupart des objets de la vie courante ont des codes-barres et que ces codes-barres permettent d'accéder à de nombreuses informations telles que les fiches produits. Pourquoi ne pas alors les utiliser pour faciliter la vie des aveugles, en équipant ceux-ci de lecteurs de codes barres et d'applications, par exemple dans des périphériques mobiles, pour lire les informations associées au code barre. Le projet a déjà passé avec succès l'étape du prototype, et l'AFNOR réfléchit déjà aux moyens de normaliser davantage les codes-barres pour permettre d'aller plus loin. Un projet réellement enthousiasmant;
    • MyRecycleStuff : yet another le premier réseau social... et yet another site qui se lance sur le créneau de plus en plus chargé du troc entre particuliers;
    • ServiceLab est un outil de concertation et de participation citoyenne qui expérimente dans un domaine que je crois prometteur, celui du design de services. C'est une application Web pour gérer aux moyens d'outils graphiques la conception de services au sein d'un territoire. Les habitants indiquent leurs besoins, équipement collectif, transports, dialoguent, enrichissent collaborativement leurs projets. Si vous avez suivi les travaux de la 27° Région, vous avez probablement vu des expérimentations du site. C'est encore un coup de cœur;
    • SuperMarmite , yet another le premier réseau social de proximité, celui-ci pour permettre aux gens qui cuisinent chez eux de vendre quelques parts qu'ils auraient préparées en trop. Pour avoir souvent en rentrant chez moi humé avec gourmandise les fumets provenant des cuisines voisines, avant d'aller déguster un paquet de chips, je trouve le concept intéressant, mais n'ai pas du tout accroché avec la présentation;
    • FriendsClear, yet another site de mise en relation entre petits porteurs de projets auxquels les banques ne veulent pas prêter de l'argent, et gens qui voudraient investir un peu d'argent hors du circuit bancaire;
    • Biθdiversité 2.0 : 2010 est l'année de la biodiversité, et pour continuer à avancer sur le sujet, une plate-forme va être mise en ligne dans les mois qui viennent pour faire avancer la réflexion, au travers par exemple d'une médiathèque participative, et organiser des actions concrètes. Le projet mêle des outils participatifs pour encourager la réflexion et l'action, et des outils sémantiques pour en dégager une expertise. La plate-forme Tθpos sur laquelle il se base est alléchante, à creuser;
    • Vox Publica (si quelqu'un connait l'adresse du site ?) est une expérience sur la représentation du pouvoir et la participation. Elle prend la forme d'un jeu d'anticipation politique, décliné via un site et des évènements IRL, pour établir à travers une centaine de question un programme politiques, et trouver les personnes pour l'incarner;
    • Ensemble 2 générations veut mettre en relation des personnes âgées qui disposent d'un grand logement mais souffrent de la solitude, et des étudiants en recherche de logement. Le but n'est pas que pratique, mais de créer de vrais solidarités intergénérationnelles, par exemple via des formations mutuelles, comme dans le domaine de l'accès aux nouvelles technologies. Ils ont déjà réussit à créer 500 binômes;

    Wednesday, 01-Dec-10 13:42:02 CET from web
  11. La chasse aux données est lancée

    La chasse aux données est lancée

    Une compétition internationale d'ouverture des données publiques a été lancée pour le 4 décembre 2010, et l'initiative est en train de prendre une large envergure. 63 villes, dans 25 pays, ont déjà annoncé leur participation et l'organisation d'évènements autour de cette date. En France, des initiatives sont prévues à Marseille, Nantes, Paris et Rennes... Un site et un Wiki coordonnent les informations autour de cet "international #opendata hackaton". A paris, le collectif Regards Citoyens lance ce soir à La Cantine une chasse aux trésors de l'#OpenData (#DataHunt).

    Friday, 26-Nov-10 09:53:08 CET from web
  12. Micro-sémantique embarquée

    Micro-sémantique embarquée

    Micro-sémantique embarquée

    J'ai découvert que Google propose un outil permettant de savoir comment il interprète les données sémantiques qu'il découvre dans les pages. Son moteur est en effet capable de comprendre certaines informations dans le code source, mais également de les exploiter pour modifier l'affichage des résultats.

    Cet outil me semble un bon moyen de promouvoir le Web Sémantique auprès de nos clients : il permet de visualiser instantanément comment, en ajoutant simplement quelques informations à leur pages, celles-ci seront bien mieux indexées et affichées dans Google.

    Il existe actuellement trois technologies pour ajouter de la sémantique à un code HTML existant. Deux sont matures, la troisième en cours de spécification et assez controversée. C'est évidemment cette dernière que privilégie Google, tout en sachant interpréter les deux autres.

    Mature et simple : les micro-formats : elle utilise uniquement l'ajout de classes au code existant. Par exemple, pour un profil utilisateur, on ajoutera la classe vcard au DIV englobant, name sur le SPAN autour du nom, etc. C'est donc une méthode qui fonctionnera sur toute les pages existantes. Son principal inconvénient est le manque de standardisation : peu de vocabulaires finalisés sont aujourd'hui disponibles. Mais certains s'imposent peu à peu, comme hCard, hCalendar ou hResume pour les CV.

    Mature et compliquée : RDFa : elle nécessite un document en XHTML et utilise des attributs supplémentaires pour embarquer du RDF dans le code. Ca nécessite un minimum de connaissance de RDF, des ontologies (vocabulaires) qu'on va utiliser, et de la syntaxe particulière de RDFa. Bref, c'est un peu plus casse-gueule à mettre en œuvre, mais, si on veut et peut s'en donner la peine, beaucoup plus puissant. Avec RDFa, on n'est plus dans le monde de la bidouille mais réellement dans le Web Sémantique. J'étais sur le point de publier ce mini-billet quanr David et Karl ont justement publié sur OpenWeb une introduction à l'utilisation de RDFa : à lire pour aller plus loin.

    Entre les deux : microdata est une des parties de la spécification HTML5. Elle propose d'ajouter au vocabulaire HTML de nouveaux attributs : itemscope pour un élément englobant, itemtype pour indiquer le vocabulaire employé, itemprop pour donner le nom de la propriété dont l'élément contient la valeur, etc. La spécification est encore loin d'être finalisée (et il y a débat entre les partisans de l'intégration de RDFa à HTML5 et ceux qui lui préfèrent microdata), mais Google a décidé de l'utiliser en créant des vocabulaires proches de ceux existant pour les micro-formats. microdata utilisant des attributs définis dans la nouvelles spécifications ne devrait fonctionner que pour les sites en (X)HTML5 (? - à vérifier)

    Google est capable de reconnaître et d'utiliser ces trois formats. Son outil de test affichera toutes les informations sémantiques qu'il a été capable d'extraire d'une page et de "comprendre". De plus, s'il découvre sur une page des microdata décrivant une personne ou des revues d'un produit, il pourra les exploiter pour afficher des informations supplémentaires dans ses résultats, c'est à dire par exemple faire remonter directement la note du produit ou, pour un profil, le nom et l'entreprise de la personne.

    Je ne vais pas recopier la documentation de Google et vous y renvoie donc pour la syntaxe détaillée et des exemples.

    Monday, 22-Nov-10 00:36:11 CET from web
  13. De même qu'une idée a besoin de prototypes, c'est au travers de visualisations que des données prennent sens et force. Le site visual complexity s'intéresse aux représentations d'interactions complexes et publie de nombreuses visualisations.Quelques exemples :

    • visualiser les centres d'intérêt de quelqu'un à partir de l'analyse de son expression en ligne, c'est le but du site Gravity, mais si l'information a créé un peu de ramdam, c'est en partie grâce aux graphes des centres d'intérêt créés par Kunal Anand;
    • weeplaces est encore une autre application qui utilise les données des réseaux sociaux géo-localisés pour essayer de créer des cartes mettant en lumière de nouvelles informations. Cela peut être utile au niveau macro (découvrir les lieux populaires à un moment) ou micro (se souvenir de tous les endroits où l'on a été comme sur cette vidéo de Shaun Tollerton)
    • analyse du contenu des appels au 311, le numéro du bureau des plaintes de New York;
    • des cartes de Paris redessinées en fonction de critères comme le temps de transport séparant deux points;
    • aux USA, trois compagnies, à travers une multitude de marques, contrôlent 89% du marché des boissons non alcoolisées. Coca se décline en 25 marques et 133 produits, Pepsi en 17 marques et 161 produits...Philip H. Howard a compilé ces informations;

    #OpenData #DataViz

    Sunday, 21-Nov-10 12:18:46 CET from web
  14. YQL permet également très simplement de créer des #WebServices en #JavaScript hébergés dans le nuage. Il suffit pour cela de placer le code dans un fichier XML décrivant une table au sens YQL, et de rendre ce fichier accessible sur le Net (par exemple en le publiant sur GitHub). On peut ensuite accéder au service via des requêtes YQL. Le Web est décidément un merveilleux terrain de jeu ! (source : Andrew Wooldridge et Arde en el infierno ) #hackability

    Saturday, 20-Nov-10 21:59:25 CET from web
  15. Le nouveau système de messagerie de Facebook utilisera HBase. HBase est une base de données clé-valeur orientée colonnes libre. Comme Cassandra (créée par Faccebook), elle est indiquée pour le traitement de grosses masses de données. Facebook indique avoir fait des tests avec MySQL, Cassandra et HBase, et que c'est cette dernière qui était la plus indiquée compte tenu de l'architecture de leur système de messagerie. Ce qui rappelle une fois de plus qu'il n'y a pas de bons ou de mauvais outils mais qu'il faut trouver le meilleur outil adapté à chaque tâche.

    Saturday, 20-Nov-10 21:19:31 CET from web
  16. La recommandation automatique, c'est d'ailleurs probablement un des objectifs de http://gravity.com . Le site a bâti une énorme base de données de phrases dont il a analysé la sémantique, et propose un service pour détecter les centres d'intérêt d'un internaute à partir de l'analyse des contenus qu'il publie, échange, etc. Le but est évidemment de personnaliser l'expérience des utilisateurs automatiquement, sans rien leur demander, simplement en analysant leurs moindres faits et gestes. Si ce genre de services se multiplie, aucun n'a encore à ma connaissance réussit à franchir la barrière de la langue qui permettrait de les utiliser y compris sur des sites destinés à un public non anglophone. (via http://venturebeat.com/2010/11/16/gravity-myspace-executives/  )

    Saturday, 20-Nov-10 20:52:32 CET from web
  17. Tom Foremski, dans deux articles complémentaires (Curation versus aggregation represents human web versus machine web et Curation And The Human Web ), décrit les principales méthodes d'accès à l'information : la recherche, l'agrégation (avec plus ou moins d'"intelligence" et de prise en compte de critères sociaux) et la recommandation. L'évolution actuelle semble aller vers un Web de plus en plus humain, où la recommandation par les pairs supplante l'agrégation et la recherche qui sont des procédés automatiques. J'aurais tendance à dire qu'avec les progrès du Web Sémantique, les machines vont bientôt reprendre le dessus, via des mécanismes de recommandation automatique.

    Saturday, 20-Nov-10 20:46:57 CET from web
  18. Encore un joli exemple d'agrégation de données fournies par plusieurs services : http://www.fourwhere.com/ compile sur une carte les informations géolocalisées saisies par les internautes sur Foursquare, Yelp et Gowalla. Le résultat est tout autant impressionnant qu'inquiétant. Imaginez ce que pourrait donner ce service dans quelques mois s'il intègre également les deux prochains mastodontes du secteur, Facebook et Google, ainsi que les status géolocalisés extraits de Twitter, Buzz, etc (cf par exemple l'activation de l'affichage des buzz sur Google Map);

    Saturday, 20-Nov-10 20:43:10 CET from web
  19. Mapnificent utilise les données ouvertes par des sociétés de transport pour afficher sur une carte tous les endroits accessible en un temps donné. Il peut également afficher tous les lieux à mi-chemin (en terme de temps de parcours et non de distance) entre deux endroits. Enfin, il propose une API pour inclure la carte de n'importe où. #OpenData #API #mashup

    Saturday, 20-Nov-10 20:41:02 CET from web

Subscriptions

    (None)

    Groups

      (None)

      Statistics

      User ID
      178
      Member since
      20 Nov 2010
      Subscriptions
      0
      Subscribers
      4
      Groups
      0
      Notices
      19
      Daily average
      0

      Map

      Full size