entretiens

Entretien avec Gaspard Lépine, Chargé de valorisation – INRA Transfert –

-> site web INRA Transfert

Gaspard Lépine

Chargé de valorisation

27 juillet 2017

Entretien conduit par Agnès Robin (MCF HDR Université de Montpellier) et Benoît Humblot (EC HDR EPF)

 

L’INRA est-il une structure très consommatrice de données ?

Oui pour le moins ! L’INRA travaille essentiellement à partir de données. Il s’agit de données de toutes sortes – y compris des images – et ces données proviennent aussi bien de l’INRA en interne que de l’extérieur, et notamment des agriculteurs qui sont aujourd’hui très connectés. La production de ces données, leur acquisition, est encadrée par des protocoles. C’est vrai des données internes mais aussi tout particulièrement des données externes dont nous devons connaître et maîtriser les conditions de production et de collecte. Les points d’attention peuvent donc varier selon la source des données. Un exemple concernant les données agricoles : les agriculteurs auprès desquels sont parfois menées des enquêtes utilisent un vocabulaire parfois différent de celui de la nomenclature scientifique des végétaux. La collecte des données nécessite donc une bonne expertise du contexte, des conditions de terrain.

Il est vrai que l’on pense essentiellement aux aspects techniques de la collecte des données, mais il y a toute une composante sociologique du fait des enjeux économiques sous-jacents…

Il serait intéressant d’aller à la rencontre d’agriculteurs pour discuter avec eux de la sincérité des données collectées ! Il ne fait pas mystère que certains agriculteurs refusent de communiquer leurs données à l’INRA en cela qu’elles pourraient permettre de révéler leurs pratiques. A la marge il peut s’agir de pratiques non conformes, mais c’est aussi plus largement une forme de réticence – pour diverses raisons – à travailler en transparence. Donc en effet, au plan scientifique, la question de la sincérité des données collectées doit être envisagée. Il est bien certain que la collecte de données fausses, parcellaires, peut générer par la suite des problèmes de validité des résultats. Cela peut interroger sur les voies de collecte. Ainsi, pour les données de vigilance, sans doute vaudrait-il mieux mettre en place un réseau intentionnel de lanceurs d’alerte avec un rôle moteur confié à un établissement de recherche, aux chambres d’agriculture ou aux instituts techniques. L’INRA a d’ailleurs commencé à y réfléchir avec les instituts techniques et les chambres d’agriculture.

Une fois collectées, les données ont vocation à être traitées ; l’INRA se réserve cette étape, ou rend-t-il ses bases de données accessibles aux tiers ?

C’est un sujet qui fait l’objet de réflexions amont. C’est évidemment une question importante et qui peut faire débat. Ainsi, certains chercheurs de l’INRA ont publié des analyses et réflexions sur la diffusion des données. C’est donc un sujet qui anime les esprits ! Disons toutefois que dans le cadre des partenariats public/privé le principe est la temporisation de la diffusion des données ; celles-ci ne sont accessibles qu’aux chercheurs de l’INRA et aux partenaires engagés dans l’action de recherche. Plus précisément encore, le nom des chercheurs autorisés à accéder aux données peut être spécifié. C’est bien sûr un moyen de contrôler l’opération de production de connaissance et de valorisation qui en découle.

L’INRA est également soumis à la politique d’open data. Comment cette politique est-elle mise en œuvre en interne ?

L’INRA est un organisme public et donc la question se pose en effet, mais une évaluation est nécessaire ; il faut se garder de tout automatisme. Si l’on pend l’exemple des bases de données génétiques, leur partage est assuré mais avec une différence selon que le destinataire est public ou privé. Ainsi, l’accès à la base est-il payant pour les partenaires privés alors qu’il est gratuit pour les partenaires publics. Il est vrai que l’argument fondé sur l’open data pour forcer l’accès aux données est parfois avancé par certains opérateurs privés !

Pour leur part, les Instituts Techniques Agricoles sont-ils soumis à la politique d’open data ?

C’est un cas intéressant  ! Parce qu’ils sont financés par des taxes parafiscales collectées par l’ACTA, les Instituts Technique Agricole sont – de ce fait – des organismes privés. En ce sens, ils ne sont pas soumis aux exigences d’open data. Mais, dans le but d’obtenir des moyens publics de fonctionnement, ils affirment quant à eux assurer une mission de service public. Assurément, la question du périmètre de la loi sur l’ouverture des données se pose pour de tels organismes à statut hybride.

Concernant le stockage des données scientifiques, l’INRA dispose de ses propres serveurs ?

L’outil technique actuellement utilisé est celui du GIS France Grilles qui propose une solution pas trop coûteuse. Précisons qu’il s’agit d’un Groupement d’Intérêt Scientifique créé en 2010 et qui rassemble notamment l’INRA, le CNRS, l’INRIA, l’INSERM, etc.. Pour dire les choses rapidement, il s’agit d’un partage de capacités de stockage et de traitement réparties sur le territoire national.

D’autres solutions sont-elles développées en interne ?

Oui, l’INRA est actuellement en train de développer, sous l’impulsion de Pascal Neveu, une plateforme dénommée Silex. L’objectif est de permettre l’accès contrôlé aux données par la technique du chaînage d’informations. Le modèle juridique utilisé serait celui des licences libres et virales.

 

Catégories :entretiens

Tagué:

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s