Programme thématique en sciences humaines et sociales : Corpus et outils de la recherche en sciences humaines et sociales

CO-SMA-GEMS

Corpus d’Ontologies pour les Systèmes Multi-Agents en Géographie, Economie, Marketing et Sociologie.

English version

GEMAS

UMR CNRS 8598

http://www.gemas.fr/dphan/cosmagems/

Participants

Bibliographie

mots clés : systèmes multi-agents, ontologie informatique, conceptualisation d'un domaine de connaissance, corpus structuré de concepts, partage de connaissances, meta-représentation, modèle de conception,  méronymie, spécification, réseau sémantique, systèmes d’information géographique, enquête, expérimentation, modélisation et simulation pour les sciences de l’homme et de la société, géographie, économie, sciences de gestion, sciences sociales.

Résumé : L’objectif du projet est d’initier la production collective d’un corpus public et documenté d'ontologies (au sens informatique) utilisable pour la modélisation et la simulation multi-agents, à partir d'un ensemble d'exemples et de données tirées de quatre domaines : Géographie, Economie, Marketing et Sociologie.

Les systèmes multi-agents (SMA) permettent à des entités informatiques appelées « agents » d’interagir entre eux et avec leur environnement. Cette méthode, employée depuis une quinzaine d’année en écologie, est aussi utilisée en géographie et dans les sciences de la société. Elle permet de conceptualiser et de simuler des “sociétés artificielles” qui reproduisent des situations complexes pouvant comporter des échelles multiples et des agents hétérogènes engagés dans des activités socialeset ainsi d’expliciter la nature des relations de l’environnement social des agents comme des déterminants individuels de l’action. Elles offrent un cadre adéquat pour poser des questions méthodologiques ou ontologiques, par exemple avec les phénomènes émergents. Enfin, les SMA peuvent être vus comme « compléments » ou « substituts » des formalismes classiques, en ayant comme objectifs de reproduire des faits stylisés ou des phénomènes observés, ou en étant fondés sur le couplage de modèles de natures différentes.
Ce travail répond à deux impératifs. Premièrement, un des objectifs de la simulation est de permettre des expérimentations contrôlées et reproductibles, mais de nombreux articles ne fournissent pas les informations suffisantes à la réplication du modèle et par conséquent à la reproduction des résultats. Ce projet vise à fournir un corpus de descriptions formelles de modèles (et éventuellement, des données empiriques associées, comme avec les Systèmes d’Information Géographiques) dans un langage approprié pour présenter rigoureusement l’ensemble des hypothèses nécessaires à la réplicabilité des expériences sans entrer dans les détails de l’implémentation informatique. Deuxièmement, les informaticiens ont parfois du mal à saisir précisément les besoins et les postures des utilisateurs (spécialistes SHS, modélisateurs). La constitution et le partage de ce corpus de descriptions formelles facilitera la conception et l’implémentation des SMA en SHS.

La réponse à ces impératifs passe ainsi par la constitution d’un corpus public et documenté d'ontologies, au sens informatique, c’est à dire une description formelle qui vise (1) à la représentation conceptuelle des connaissances d'un domaine au moyen (2) d’une spécification de cette conceptualisation. Ceci nécessite de choisir une manière de décrire le domaine et un formalisme descriptif approprié. Il s’agit en général d’une caractérisation logique et ensembliste des entités du domaine et de leurs relations, dans un langage formel. Il est par exemple possible de caractériser les entités d’un SMA et leurs relations à l’aide de notions méronymiques, comme « composés-composants-relations » ou « agents-groupes-rôles ». L’objectif de cette spécification n’est pas seulement l’organisation des connaissances, mais l’aide à la modélisation. Il s’agit donc d’un méta-modèle d’organisation et de conception des connaissances au moyen d’un langage formel de description qui fasse sens à la fois pour le spécialiste SHS du domaine, le modélisateur et l’informaticien.

Notre approche est interdisciplinaire et comparative. A partir de l’expérience de certains participants au projet, on cherchera à (1) élaborer des ontologies dans les quatre domaines SHS considérés, et à (2) élaborer une méta-ontologie pour des entités et des relations qui seraient communs aux quatre domaines, testables sur des exemples transversaux non encore modélisés (géomarketing). Dans une première phase, après une courte formation, les équipes constitutives du projet testeront indépendamment des langages formels de description sur des modèle existant. Les résultats des équipes seront ensuite comparés et discutés. La seconde phase sera consacrée à l’appropriation du formalisme choisi, ou à la dérivation de solutions adaptées à des besoins plus spécifiques. La troisième phase sera consacrée à la production d’une documentation et de supports pédagogiques pour diffuser ces ontologies à un public plus large dans le cadre d’une Ecole du GDR européen S4 (Spatial Simulation for Social Sciences). La quatrième phase sera consacrée à la rédaction d'un ouvrage de synthèse et à la publication d’un site web afin que le corpus d’ontologies soit disponible pour les autres chercheurs, mais aussi pour qu’ils puissent construire de nouvelles ontologies dans le même formalisme.

Il s'agit d'abord d'initier la capitalisation des connaissances acquises par les participants du projet déjà membres de la communauté SMA, afin d'améliorer les outils conceptuels et les procédures d'analyse et de stabiliser ces connaissances sous forme d'un corpus formel réutilisable par l'ensemble de la communauté SHS. En ce sens, il s'agit de prolonger le travail amorcé par l'Ecole thématique CNRS « SMASHS » (2005) et par le livre correspondant (Amblard, Phan, 2006), en vue de consolider et d'élargir la communauté SHS utilisatrice de SMA.

La consolidation passe par la constitution d'un corpus formalisé commun, public et documenté organisant les connaissances nécessaires pour travailler autour de modèles qui serviront d'exemple dans nos différentes disciplines. Sur cette base, l'expérimentateur sera mieux armé pour comparer modèles et implémentations, le modélisateur pour concevoir des modèles dérivés du corpus et l'informaticien pour concevoir de nouveaux moyens adaptés aux besoins. L'élargissement commence avec la participation au projet de collègues aux compétences disciplinaires reconnues, mais sans expérience en SMA. Il se poursuivra par le workshop de septembre 2007, relayé par les publications annoncées.


Participants

Responsable du projet : Denis Phan (GEMAS, UMR CNRS & Université ParisIV-Sorbonne)

Labos et participants : (correspondant)

GEMAS, UMR 8598 CNRS & Université ParisIV-Sorbonne : Mohamed Cherkaoui, Gianluca Manzo, Michel Dubois, Frank Varenne
chercheurs rattachés : Nigel Gilbert (University of Surrey, Guildford, UK), Jacques Ferber (LIRMM Université de Montpellier), Jean Louis Dessalles (ENST), Sylvaine Schwer (Université de Paris XIII), Jerôme Cardot (Université de Brest)

CREM UMR 6211 CNRS & Université de Rennes 1: Gerard Cliquet, Eric Darmon, Christine Petr,
chercheurs rattachés : Robert Axtell (George Mason’s University, Center for Social Complexity) Jerome Baray (Université de Tours), Gilles Daniel (Chair of Entrepreneurial Risks ETH Zurich ), Roger Waldeck (ENST de Bretagne),

Géographie-cités, UMR 8504, CNRS & Université de Paris I : Denis Pumain, Lena Sanders, Anne Bretagnolle,
chercheurs rattachés : Arnaud Banos (CNRS Université de Strasbourg)

MTG (Laboratoire Modélisation et Traitement Graphique) IDEES (Identité et Différenciation des Espaces de l'Environnement et des Sociétés) FRE-2795, CNRS & Université de Rouen : Eric Daude, Patrice Langlois, chercheurs rattachés : Edwige Dubos-Paillard, Damienne Provitolo,  (Université de Franche-Comte)

IRIT (Institut de Recherche en Informatique de Toulouse) - UMR 5505 CNRS  et Université de Toulouse (équipe Systèmes à Objets Coopératifs) : Christophe Sibertin-Blanc, Frédéric Amblard, chercheurs rattachés : Pascal Roggero, Michel Grossetti, Guillaume Deffuant (Cemagref), Jean-Pierre.Muller (Cirad)

CEPERC (Centre d'EPistémologie et d'ERgologie Comparatives) UMR 6059 CNRS & Université de Provence : Pierre Livet; chercheurs rattachés : Frédéric Nef (EHESS & Institur Jean Nicod),  Juliette Rouchier (GREQAM),


Corpus of Ontologies for Multi-Agents Systems
in Geography, Economics, Marketing and Sociology

Our aim is to start the collection, documentation and standardisation of a publicly available corpus for modelling and simulation using multi-agent systems. Examples and data will be taken from four areas: Geography, Economics, Marketing and Sociology.

Multi-Agent Systems (MAS) are built from a set of agents, which interact with each other and their environment. They have been used for the last 15 years or so to model phenomena in Ecology and now in Geography and the Social Sciences. In a MAS, artificial societies are represented and their behaviour simulated. Heterogeneous agents engage in social interaction, which can lead to complex behaviour of the society. The architecture of a MAS makes explicit the nature of the social relationships between agents, as well as the individual determinants of actions. A MAS provides a framework within which interesting inter-level questions can be posed, for example concerning the micro causes of emergent phenomena. Simulations using MAS should be seen as a complement or a substitute to the classical methods of scientific modelling. Their purpose can be to fit observable phenomena, or to explain stylised facts, or to couple models of varying levels.

There are two major reasons for this project. Firstly, even though one objective of simulation is to run controlled reproducible experiments, many articles do not give sufficient detail to reproduce even the model; consequently it is frequently impossible to reproduce the results. This project should provide the first corpus of formal descriptions of models (and eventually, of the empirical data on which they were run, such as GIS) in a language that is suited to the rigorous presentation of the assumptions that are necessary to reproduce the experiments, but without going deeply into computational details. Secondly, computer scientists sometimes have difficulty in understanding the needs of the users - the modellers who are specialists in the Humanities and Social Sciences (HSS). The constitution and distribution of this corpus of formal descriptions should facilitate the conception and implementation of MAS in HSS.
The creation of such a public corpus will not happen spontaneously; it must be facilitated. A first step is to create an ontology of the concepts used in each specific domain in which the MAS are being built. Such ontologies need to be formally specified. So first a choice must be made for the manner in which concepts are to be described, then which concepts need to be represented and finally how they should be represented – roughly the equivalent of a formal dictionary of the domain of interest such as is currently available in some areas of medicine. For example, it is possible to describe the agents in a MAS and their interrelationships using notions from meronomy, such as part-whole-relationship or agent-group-role. The point of creating this ontology is not only to capture the current knowledge in a domain, but also to facilitate the building of domain models. It will thus act as a meta-model for organising and conceptualising the knowledge in a domain by means of a formal language which is understandable not only to the HSS domain experts and modellers but also to the computer scientists.

Our approach is interdisciplinary and comparative. Based on the experience of participants in the project, we intend (1) to develop the ontologies in the four chosen areas and (2) to develop a meta-ontology for agents and their relations which will be common to all four areas. This latter will be tested on examples that are cross disciplinary, e.g. geo-marketing.

In the first phase, after a short initial get together, the project groups will each independently test the suitability of available formal ontology languages to capture an existing simulation model. The results of this phase will be discussed and compared at a project workshop and a preference will be expressed.
In the second phase an attempt will be made to recast MAS in the four domains in the preferred formalism, adapted if necessary. These attempts will be evaluated at a second workshop.

In the third phase, the chosen formalism will be fully documented and learning tools provided. Then it will be tested, with full technical support, by a group of domain experts such as those attending the School of the European GDR S4 (Spatial Simulation for the Social Sciences) to be organised in September 2007.
In a fourth phase, scientific articles will be published, the results will be brought together in an book, and most importantly, a web site will be built to enable not only to share the ontologies, but also new ontologies to be built according to the same formalism.

The most important outcome will be to capitalise knowledge acquired by the project participants who are already members of the MAS community by improving MAS model building techniques. A further outcome will be to stabilise this body of knowledge, in the form of a publicly available corpus that is also usable by the specialists in the HSS. In this it will extend the work of the CNRS thema group “SMASHS,” already begun at Porquerolles (2005) and in the companion book (Amblard & Phan, 2006), with the aim of consolidating and growing the community of HSS scholars using MAS. The consolidation will start by creating a documented and publicly available formal corpus organising the skills required for working with the models that will serve as exemplars in our four domains. From this basis, experimenters will be better prepared to compare models and their implementations, modellers better able to propose models based on domain knowledge and computer scientists better able to adapt methods for implementing these new models. The further extension will start with the participation in the project of colleagues with recognised domain expertise, but without much experience in MAS. It will be followed by an open European workshop in September 2007.