Eprist

Association des responsables IST des organismes de recherche

Dossier : Text Datamining

Opportunités du TDM pour l’analyse de l’évolution des sciences

 LogoCNRS David Chavalarias, Directeur de l’Institut des Systèmes Complexes de Paris Île-de-France, CNRS – UPS 3611

Cette présentation, émise lors des journées Innométriques en octobre 2016, démontre comment l’analyse des publications scientifiques permet de proposer une représentation interactive de l’évolution des sciences. En effet, les données et méta-données des publications scientifiques permettent d’extraire les réseaux multi-partite de la science.

L’étude des microorganismes et de leurs habitats : les dangers de la voie contractuelle pour l’usage de la fouille de texte (TDM)

 EPRIST-TDM3
logoInra

Claire Nédellec de l’Inra présente une expérience de fouille de texte pour la mise en place d’un moteur de recherche OntoBiotope qui est une application développée pour les microbiologistes afin de déterminer quelles bactéries vivent où, à partir de l’information disponible dans du texte libre, base de données et articles scientifiques. Elle présente les avantages du TDM (Text Data Mining) pour le projet et explique pourquoi la voie contractuelle avec chaque éditeur n’est pas suffisante pour mener à bien le projet.

Le projet de nouvelle directive « droit d’auteur » présenté par la Commission européenne prévoit une exception obligatoire au droit d’auteur en faveur du TDM scientifique

 LogoCE 23 septembre 2016

Le 14 septembre dernier, la Commission européenne a publié son projet de directive « On copyright in the digital single-market ». Ce texte a suscité une levée de boucliers de la part des acteurs de l’économie numérique, dénonçant des dispositions jugées trop favorables aux industries culturelles. Quoi que l’on pense de ce jugement, il faut noter qu’en proposant une exception au droit d’auteur – qui serait obligatoire pour tous les Etats-membres – pour rendre juridiquement sûrs les usages du Text & Data mining à des fins de recherche scientifique publique, la Commission n’a sur ce point pas suivi les désidératas des éditeurs scientifiques. Le texte proposé par la Commission apparaît tout à fait compatible avec les dispositions récemment adoptées par le législateur français dans le cadre de la discussion du projet de loi pour une République numérique.

Saluons une mobilisation et une coordination exemplaires de la recherche !

 ActualitésIST 7 juillet 2016

Le 29 juin au soir, la Commission Mixte Paritaire (CMP) trouvait un accord sur la loi Pour une République numérique. Après plusieurs mois d’une mobilisation des milieux de la recherche, nous pouvons nous réjouir du fait que la recherche française dispose désormais d’un cadre juridique plutôt favorable.

 

Pour rappel, dès la consultation, nos scientifiques, nos établissements et notre association EPRIST, tout comme la CPU, l’ADBU, Couperin et le CNNum, se sont mobilisés pour défendre nos positions :

  • pour limiter au maximum les embargos des éditeurs sur les écrits de la recherche publique (articles scientifiques) – article 17
  • pour disposer d’un article complémentaire permettant la pratique de la fouille de texte et de données sans entrave ni juridique ni technique – article 18 bis ajouté et voté par l’Assemblée Nationale grâce à ces contributions.

A l’amont, durant près d’un an, autour du Livre blanc « Une science ouverte dans une République numérique » a pu être initiée par le Conseil scientifique du CNRS, une réflexion sur les pratiques et une expertise sur les textes, qui ont compté pour  l’élaboration de la Consultation nationale et, par la suite, pour la defense de nos positions.

Notre engagement a permis de mobiliser les responsables de nos organismes et nos scientifiques pour interpeller le gouvernement et les parlementaires sur ce sujet fondamental pour la place de la France dans le Monde. Il a permis d’écarter la voie contractuelle pour l’usage du TDM qui se dessinait au travers de la version de l’article 18bis proposée par le Sénat.

Jusqu’aux derniers jours avant la CMP, nous avons dû nous mobiliser pour convaincre, face aux pressions exercées par le SNE (Syndicat National de l’Edition).

Mais nos scientifiques ont eu l’occasion de faire la démonstration de la nécessité de disposer des outils actuels à l’ère du Big Data (fouille de texte et de données – FTD ou Text and Data Mining – TDM) pour pratiquer la recherche, afin de pouvoir jouer à armes égales avec leurs concurrents (GB, USA, Japon, etc.) ; ils ont pu montrer qu’attendre la future révision de la directive européenne n’était pas raisonnable étant d’ores et déjà confrontés à cette concurrence. Ils ont pu expliquer que la France, pourtant en avance sur le développement des outils de traitement et d’analyse sémantique (outils de FTD) commence à se faire distancer par des concurrents qui disposent d’outils moins performants mais qui ont en revanche accès à des corpus de textes et de données beaucoup plus importants du fait de l’exception au droit d’auteur dont ils bénéficient pour accéder à toute la littérature scientifique nécessaire. Le préjudice pour la France, à la fois sur le plan scientifique (positionnement sur de nouveaux champs de connaissances pour produire de nouvelles connaissances) et économique (potentiel d’innovation et d’emploi en matière de TDM) aurait été énorme et cela a finalement été bien compris du politique.

La recherche française dispose désormais d’un article 18bis dans la version Assemblée nationale assortie d’une modification du code de la propriété intellectuelle.

Plusieurs questions demeurent cependant en suspens et nous attendons les décrets d’application pour pouvoir œuvrer à l’ajustement des politiques d’établissements en matière de gestion, de traitement et de diffusion des productions de la recherche.

Au niveau européen, cette bonne nouvelle permet d’envisager avec optimisme la révision future de la directive européenne sur le droit d’auteur.

Argumentaire pour définir un cadre juridique clair pour développer les usages de la fouille de texte et de données (FTD)

 synthèseist 27 mai 2016

Dans le cadre de la discussion du projet de loi pour une République numérique discutée puis votée successivement à l’Assemblée nationale et au Sénat, un point essentiel au devenir de la recherche publique française a été abordé via l’introduction d’un article 18bis autorisant la fouille de textes et de données (FTD, parfois aussi désignée de l’acronyme anglais TDM pour « Text & Data mining »). L’adoption d’un cadre juridique sûr encadrant le développement de la fouille de textes et de données est un préalable indispensable à la compétitivité de la recherche publique française.

Dans la perspective de la discussion en Commission Mixte Paritaire, et sans méconnaître la volonté novatrice du Sénat sur ces dispositions, EPRIST propose une synthèse des arguments pour sécuriser le développement du FTD en France.

Une tribune en faveur du Datamining

 tdm 27 avril 2016
Une tribune concernant le TDM proposée par le Conseil National du Numérique dans le cadre du projet de loi « République numérique » a été publiée par Les Echos, mardi 26 avril. Un grand nombre de responsables d’établissements de recherche et de personnalités de l’ESR, tout comme EPRIST et l’ADBU ont co-signé cette tribune. Le texte « Data mining : la loi ne doit pas enterrer la recherche française » est accessible à l’adresse suivante :

Vous trouverez l’ensemble du débat au Sénat sur la loi numérique à l’adresse suivante :

 

« Mission Text and Data Mining »: beaucoup de bruit pour rien…

 tdm 20 avril 2016
Le rapport aux ministres chargés de la Culture et de l’Enseignement supérieur sur la « Mission Text and Data Mining » rédigé par Charles HUOT, vient d’être rendu à ses deux commanditaires. Pour les chercheurs, que ce document prétend notamment représenter, ce rapport n’apporte rien : pas de vision des intérêts de la France ou de sa recherche scientifique, pas d’inscription au sein du projet européen, ou de prise en compte de la simple réalité du droit et des pratiques étrangères….
Nous, professionnels de l’Information scientifique et technique et chercheurs des Organismes membres d’EPRIST, entendons très clairement faire savoir notre opposition à ces propositions dangereuses pour l’avenir et la place de notre pays : elles ont notamment conduit nos établissements à quitter le GFII, Association présidée par Charles HUOT, qui, s’écartant de ses objectifs initiaux, s’est faite à plusieurs reprises l’écho partial d’idées et de propositions qui sont en contradiction flagrante avec les positions de la recherche et de nos Etablissements. Ce départ permettra d’ailleurs d’imaginer de nouvelles modalités de travail en collaboration avec les industriels de l’information dans un cadre plus constructif.Le TDM pour la science, c’est avant tout une démarche citoyenne et une occasion majeure de faire progresser la connaissance, pour tous les chercheurs et sans entrave, pour le plus grand bénéfice de la société ; c’est ensuite une décision d’ouverture majeure sur laquelle l’Assemblée nationale, en plaçant au premier plan l’intérêt commun, ne s’est pas égarée dans des considérations partisanes …

La recherche publique pourrait rapidement disposer d’un cadre juridique sûr pour porter ses développements TDM ?

12 avril 2016
Le secrétariat d’Etat à l’Enseignement supérieur et à la Recherche et le secrétariat d’Etat à l’Economie numérique organisaient le 6 avril une conférence d’une demi-journée sous l’intitulé «Ouvrir la diffusion des savoirs par le numérique : quelles opportunités pour la recherche ? ». Ce débat intervenait à un moment particulier : le gouvernement, au travers d’un amendement déposé au Sénat dans le cadre de la discussion du projet de Loi pour une République numérique, avait rendu officiel le 5 avril son souhait de voir supprimer l’article 18bis voulu par l’Assemblée nationale. Cet article instituait une exception au droit d’auteur visant à sécuriser juridiquement les usages de la fouille de textes et de données (TDM : Text & Data Mining). Dans un mouvement tout à fait inattendu la Commission des lois du Sénat a rejeté le 6 avril l’amendement gouvernemental et a adopté un amendement de Mme Colette Mélot, sénatrice « Les Républicains » de Seine-et-Marne qui réécrit l’article 18bis en évitant toute référence au code de la propriété intellectuelle, mais qui en substance vise les mêmes objectifs. Le gouvernement désavoué sur cette question tant par les députés que par les sénateurs est dans une position inconfortable, que ses membres appellent à dépasser. Un cadre juridique sûr pour le TDM au sein de la recherche publique a donc toutes les chances de voir le jour dans le cadre de la version définitive de la loi pour une République numérique.

Complément à la position d’EPRIST sur le TDM

 tdm 21 mars 2016
Les responsables IST du CNRS, INRA, CEA, INRIA, INSERM, CIRAD, IFSTTAR, IRSTEA, IRD, BRGM, Institut Pasteur, IFPEN, INERIS, IFREMER, IRSN, ADEME, ANSES et scientifiques et établissements membres de l’Association EPRIST, qui ont saisi l’occasion des récentes  auditions sénatoriales sur la Loi numérique pour vérifier une convergence persistante de leurs positions, disposent à ce jour d’informations nombreuses, parfois contradictoires au premier abord, et qui font débat.

L’assemblée nationale crée une exception au droit d’auteur en faveur du Text et Data Mining

logo assemblée nationale En bref  : Le projet de loi pour une République numérique a été adopté en séance plénière dans la nuit du 26 au 27 janvier. A la surprise générale et contre l’avis du gouvernement, il créé dans son article 18 une exception au droit d’auteur de façon à rendre possible les pratiques de Text et de Data Mining des institutions publiques de recherche dans un cadre juridique sûr.

 

Projet de loi Pour une république numérique

Consultation nationale

Mobilisation des membres EPRIST sur l’article 9  » Accès aux travaux de la recherche financée par des fonds publics »  pour soutenir l’amendement proposé par la DIST à partir de la recommandation du Conseil Scientifique du CNRS.

Afin de montrer l’importance du Text et Data Mining (TDM) comme outil de traitement de données à des fins de recherche, EPRIST a rassemblé des exemples de pratiques au sein des équipes de recherche des org!nismEs grançais de recherche,

Suite à la journée du vendredi 16 octobre avec Axelle Lemaire, le groupe BSN7 rédige une nouvelle proposition pour l’article 9. Ce travail se fait en mode collaboratif à partir d’un Google docs. N’hésitez pas à participer :