Ce que je vais faire au Japon

Logo FNS

Un certain nombre de personnes m’ont demandé ce que je pouvais bien aller faire au Japon. Vu que ces temps, j’ai surtout été préoccupé par les démarches administratives et les préparatifs, cet aspect de la question m’est un peu sorti de la tête. Je pars 18 mois au Japanese Advanced Institute of Science and Technology. Là bas, je travaillerais sur un projet de recherche concernant les communications de groupe, payé par le Fond National Suisse pour la recherche.

Voici le résumé en anglais du projet :

Group communication is a set of abstractions to handle a set of distributed processes as a single entity. Group communication primitives typically offer precise and strong properties even in the event of link and process failures. Group communication is meant to simplify the design of distributed applications, in particular fault-tolerant applications. Despite more than twenty years of research in the domain of group communication and tremendous progress in the domain of networking, group communication has seen little use outside of academic prototypes.

As group communication toolkits are typically implemented assuming different system models and offer primitives with complex specifications, building an application using group communication is a non-trivial task. Yet the design of applications based on group communication has not been studied extensively; in fact, there is a lack of literature on the subject. Finally, as there are many different and incompatible toolkits, an application can only be targeted to a single toolkit.

We believe that the lack of acceptance of group communication comes from the fact that group communication systems have typically been designed in isolation, with little consideration for the existing network infrastructure or application level issues.

The goal of our project is to address these issues by designing a group communication toolkit that integrates with the overall network infrastructure, and offers group communication primitives suited for real applications, primitives using standard interfaces.

The project will have two main contributions. First, it will present how different applications can use group communication. Second, it will show how a toolkit can be built using standard low level services, offering group communication functionalities encapsulated in standard interfaces. The design will be validated by a prototype implementation.

5 thoughts on “Ce que je vais faire au Japon”

  1. Wow. Même en ayant lu l’intitulé, je ne sais toujours pas ce que tu vas faire au Japon. 8)

  2. Hum tout cela ressemble fort a une reimplementation de plus des sockets (voir MPI). Personnellement je ne suis pas pour la proliferation des librairies même si il est bien claire que les librairies de bases ne sont pas forcement apropriées.

    Les mots de Systèmes Distribués et de partage de la charge semblent être les nouveaux terrains vers lequel se dirige la recherche informatique (peut être a cause des P2P comme seti@home…). mais est-ce réellement la solution? Ou la solution n’est elle pas plutôt dans un concepte plus avancé comme les exo-kernel et les OS réellement orienter vers une tel architecture (on pourrais reparler des CELLs).

    désolé…

  3. Wow. Même après avoir eu l’intitulé, je ne sais toujours pas ce que tu vas faire au Japon. :)

  4. wow, ben bravo :) C’est super, ça. J’espère que tu aura du plaisir sur place, dans ton travail et dans tes loisirs. :-)

  5. En fait le but est principalement de corriger des erreurs de systèmes comme MPI, d’abord au niveau des garanties, ensuite au niveau de la tolérance aux pannes. Une librairie comme MPI gère les pannes au moyen de time-outs, ce qui est très mauvais. Soit le time-out est trop court, et tu considères comme un échec une transmission qui est lente, soit il est trop lent, et ton système bloque au lieu de réagir à la panne. Comme en général, tu as plusieurs time-out super-posés (au niveau TCP, au niveau MPI, et au niveau applicatif), déterminer les valeurs de tous ces time-outs est un casse tête (sans parler du fait que ces valeurs devraient être dynamiques). Un autre problème que les librairies comme MPI gèrent mal en cas de panne ce sont les broadcast (scatter), and les gather. Selon les situations, tu veux certaines garanties, typiquement que certaines classes de messages soient ordonnés. Bref, il y a beaucoup de choses à corriger par rapport à un truc comme MPI, le problème, justement, c’est que les gens sont coincés sur ce modèle, et que pour l’instant les prototypes de communications avancées sont inter-opérables avec rien.

Leave a Reply to Dubouchet FredericCancel reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.