OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines....

53
OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ? Thierry Chanier, Université Blaise Pascal Thierry Chanier, Université Blaise Pascal Colloque « Open Data : enjeux communicationnels et sociétaux », 7-8 nov 2013, Clermont-Ferrand Diaporama téléchargeable à http://goo.gl/GUEO07

description

Le monde universitaire est producteur de données de différentes natures. L'ouverture et le partage de chaque type de données introduit des problématiques spécifiques. Cette variété s'explique en premier lieu par les situations particulières qui ont gouverné leur création. Mais les enjeux d'utilisation, par les communautés universitaires, les communautés de chercheurs ou la société en général, diffèrent aussi suivant chaque type de données. Nous évoquerons brièvement un premier type de données, celles pédagogiques, en lien avec le mouvement en accès libre intitulé Open Educational Ressources (OER). Le second type de données, cette fois faisant partie du résultat de la recherche, concerne les publications. Notre communication rappellera brièvement, afin de mieux les distinguer du dernier type de données, les contraintes particulières qui ont motivé le développement de l'accès libre (open access) aux publications, les différentes voies suivies, l'état actuel après plus de 10 ans d'existence. L'essentiel de notre propos sera consacré au partage des données de la recherche, qui peuvent ou non être reliées aux publications. Nous décrirons les motivations de ce mouvement OpenData, les enjeux pour les chercheurs, les conditions particulières de mise à disposition que devront avoir ces données pour être réellement OpenData. Nous évoquerons enfin les transformations profondes du métier de chercheur qui peuvent en résulter, en nous appuyant sur des exemples provenant principalement des sciences humaines.

Transcript of OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines....

Page 1: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

OpenData : au-delà des publications, le partage des données de la recherche en

sciences humaines. Pour qui ? Comment ?

Thierry Chanier, Université Blaise PascalThierry Chanier, Université Blaise Pascal

Colloque « Open Data : enjeux communicationnels et sociétaux », 7-8 nov 2013, Clermont-Ferrand

Diaporama téléchargeable à http://goo.gl/GUEO07

Page 2: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

OpenData : différencier les OpenData : différencier les enjeuxenjeux

22

Page 3: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

PrésuppositionPrésuppositionss

On s’intéresse ici aux On s’intéresse ici aux universitaires / universitaires / chercheurs en tant que chercheurs en tant que producteurs de données producteurs de données (et non travaillant sur des (et non travaillant sur des données qu’ils n’ont pas données qu’ils n’ont pas produites)produites)

Open access Open access = accès = accès librelibre, permanent, , permanent, irrévocable sur la Toile et irrévocable sur la Toile et accès accès gratuitgratuit 33

Page 4: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

RESSOURCES ÉDUCATIVES RESSOURCES ÉDUCATIVES LIBRESLIBRES

Open Educational Resources (OER)Open Educational Resources (OER)

44

Page 5: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Partager les ressources éducatives Partager les ressources éducatives pour les enseignants : années 2003pour les enseignants : années 2003

Développement des Développement des TICE sur Internet : TICE sur Internet : réseaux réseaux d’enseignants, d’enseignants, partagepartage

Mouvement Mouvement internationalinternational

Formation enseignant Formation enseignant Introduction C2i Introduction C2i enseignantenseignant

Focalisation sur Focalisation sur métadonnées LOM métadonnées LOM ((Learning Object MetadataLearning Object Metadata)) 55

Page 6: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Aujourd’hui : apprenant , Aujourd’hui : apprenant , institution, réseaux sociauxinstitution, réseaux sociaux

Développement réseaux sociaux (Web 2.0) : Développement réseaux sociaux (Web 2.0) : Apprentissage formel vs informel, apprentissage auto-Apprentissage formel vs informel, apprentissage auto-guidé, tout au long de sa vie, liberté pour formateurs. guidé, tout au long de sa vie, liberté pour formateurs.

Une autre façon de faire cours ou se former ? : MOOC Une autre façon de faire cours ou se former ? : MOOC (accès libre et gratuit, accès de masse)(accès libre et gratuit, accès de masse)

Questionnement sur rôles institutionsQuestionnement sur rôles institutions Modèles économiques à développer (coût formations) Modèles économiques à développer (coût formations) Repères théoriques encore floues (Know, 2013) : pour Repères théoriques encore floues (Know, 2013) : pour

quels apprenants (autonomie demande quels apprenants (autonomie demande compétences) ? Pédagogie ou seulement tourne-compétences) ? Pédagogie ou seulement tourne-pages ? Institutions non nécessaires ? Mais toutes pages ? Institutions non nécessaires ? Mais toutes cherchent la première place – certification- , …cherchent la première place – certification- , …

66

Page 7: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

ACCÈS LIBRE AUX ACCÈS LIBRE AUX PUBLICATIONSPUBLICATIONS

Début dans les années 90, encore Début dans les années 90, encore du chemin à parcourir …du chemin à parcourir …

77

Page 8: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

88

Demandes sociétales : Demandes sociétales : résultats de la recherche = un bien résultats de la recherche = un bien

publicpublic Position des directions de Position des directions de

recherche internationalesrecherche internationales– Les bénéfices que l’on tire de la Les bénéfices que l’on tire de la

recherche dépendent de l’accès aux recherche dépendent de l’accès aux résultatsrésultats

– Si l’accès aux recherches est Si l’accès aux recherches est restreint restreint (aux chercheurs, citoyens, (aux chercheurs, citoyens, entreprises), entreprises), c’est la société qui en c’est la société qui en pâtit pâtit (conséquences néfastes varient (conséquences néfastes varient suivant type acteurs)suivant type acteurs)Une évidence ? Où est le problème ?

Page 9: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Coûts recherche et publication résultats Coûts recherche et publication résultats (SHS, niveau établissement)(SHS, niveau établissement)

99

Salaire chercheurs : 40 K€ (1/2temps, coût UBP)

Part projet : 15 K €(fonct, CDD)

Infrastructure : 10 K € (?)

Contrib équipe et donnéesantérieures : non comptées

Recherche

Contrib réseau communauté : non compté

données

Versions article

Relecteurs: 2*6h500 €

Dif revue

15 €

Dif 0A

500 à 1000 €

Page 10: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Le coût de la publication Le coût de la publication scientifique à un niveau scientifique à un niveau

nationalnational

Lecture écriture Relecture (par paires)

Activités éditoriales

Comité éditorial

Prép prog financements (Dir. Recherche)

Sélection prog financements (Dir.)

Coûts publishers

51% 30% 3,7% 1,15% 0,13%

2,3% 0,36% 10,8%

1010

- Études sur Danemark, Hollande, Grande-Bretagne, ici GB avectotal à 8 Milliards d’euros (Houghton, 2009)

-On notera que le chercheur se trouve impliqué dans 7 des 8 activités-Le budget total fait partie du budget total recherche et est financé sur fonds publics

Page 11: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Deux problèmes essentielsDeux problèmes essentiels

L’accès aux publications pour les L’accès aux publications pour les chercheurs (et le citoyen)chercheurs (et le citoyen)

Les contrats de cession des droits Les contrats de cession des droits d’auteurd’auteur

1111

Page 12: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

L’accès aux L’accès aux publicationpublication

ss

1212Image, extraite de présent. Björn Brembs, Freie Universität Berlin

Page 13: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Crise des abonnements aux Crise des abonnements aux revuesrevues

Modified from ARL: http://www.arl.org/bm~doc/arlstats06.pdf, http://www.arl.org/bm~doc/arlstat08.pdf

% C

hange

(présent. Björn Brembs)

Page 14: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Grandes voies pour accès libre (Grandes voies pour accès libre (open open accessaccess) et les modèles économiques) et les modèles économiques

1414

Voie verte (green road)Archives ouvertes

Archives institutionnelles

Archives thématiques

Ici publi aussi

Archive nationale/inter.

Voie dorée (gold road)Revues AL

Auteur-payeur Communautaire

Rapport KE de (Friend, F, 2011)

Page 15: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Lente progression de l’accès libre: Lente progression de l’accès libre: illustrationillustration

1515

60% of researchers give open access to, at least, half of their publications. 38% of respondents to almost all of them

Source : Chanier, T. (2013). Results of the survey “CALL within the Digital Humanities: considering CALL journals, research data and the sharing of research results” [document with associated data]. http://edutice.archives-ouvertes.fr/edutice-00876430

Milieu international chercheurs en TICE et langues (CALL)

Page 16: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

La question des droits quand le La question des droits quand le « publisher » rémunère l’auteur« publisher » rémunère l’auteur

1616

auteur

Éditeur(publisher)

lecteur

Domaines tels que : Les livres, contenus multimédia (musique, vidéo, etc.) hors domaines académiques,L’édition pédagogique, Les ouvrages de vulgarisation scientifique

Ces domaines ont une base et des problématiques juridiques spécifiques (droit d’auteur, copyright, licence, contrat cession, loi Adopi, etc.)i.e. Les notions de droit doivent être abordés différemment en ce qui concerne la publication scientifique

Page 17: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Contrat de cession des droits Contrat de cession des droits établis par publishers établis par publishers

commerciauxcommerciaux Souvent encore abusifs (auteurs Souvent encore abusifs (auteurs

perd tout, circulation et perd tout, circulation et réutilisation freinées)réutilisation freinées)

Positions qui se rapprochent de Positions qui se rapprochent de l’intimidation, pouvant aller l’intimidation, pouvant aller jusqu’à l’illégalité assuméejusqu’à l’illégalité assumée

1717

Page 18: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Un exemple récent : Un exemple récent : Taylor & Francis (2013) Taylor & Francis (2013)

““Subject to the provisions of the accompanying Subject to the provisions of the accompanying publishing agreement information form, publishing agreement information form, you assign to you assign to us with full title guarantee all rights of copyright and us with full title guarantee all rights of copyright and related rights in your Articlerelated rights in your Article. So that there is no doubt, . So that there is no doubt, this assignment includes the assignment of the rights this assignment includes the assignment of the rights (i) to publish, reproduce, distribute, display and store (i) to publish, reproduce, distribute, display and store the Article worldwide the Article worldwide in all forms, formats and media in all forms, formats and media now known or as developed in the futurenow known or as developed in the future, including , including print, electronic print, electronic and digital forms, […]and digital forms, […]

You are permitted to use the material in the ways You are permitted to use the material in the ways described in the Schedule of Author's Rights […] described in the Schedule of Author's Rights […] These These are rights which are personal to you and cannot be are rights which are personal to you and cannot be transferred by you to anyone transferred by you to anyone else  »else  »

1818

Page 19: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Soyons optimistes !Soyons optimistes !

“The Commission proposes to make open access to scientific publications a general principle of Horizon 2020, building on the already existing activities in FP7 (e.g. eligibility of open access publishing costs, embargo for 'Green' open access of six to twelve months).

1919

http://ec.europa.eu/research/science-society/document_library/pdf_06/background-paper-open-access-october-2012_en.pdf

Page 20: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Soumettre et publier Soumettre et publier articles et donnéesarticles et données

Projet Datapublication.orgProjet Datapublication.org

Page 21: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Situation aujourd’huiSituation aujourd’hui

Articles reposant sur des données de Articles reposant sur des données de recherche publiés sans les donnéesrecherche publiés sans les données

Imaginez une enquête sans que l’on Imaginez une enquête sans que l’on puisse voir le questionnaire, sa puisse voir le questionnaire, sa formulation, les données recueillies, formulation, les données recueillies, les calculs : peut-faire confiance ? Puis-les calculs : peut-faire confiance ? Puis-je comparer ces résultats à d’autres ?je comparer ces résultats à d’autres ?

Comment les relecteurs peuvent –ils Comment les relecteurs peuvent –ils faire un travail de certification de la faire un travail de certification de la qualité scientifique ?qualité scientifique ?

2121

Page 22: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

ObjectifsObjectifs

Relecteurs accèdent aux données déposées Relecteurs accèdent aux données déposées par l’auteur pendant processus de relecturepar l’auteur pendant processus de relecture

Lorsque l’article est accepté, les données Lorsque l’article est accepté, les données sont publiéessont publiées

Le lecteur (chercheur) peut accéder à ces Le lecteur (chercheur) peut accéder à ces données afin de répliquer, joindre ces données afin de répliquer, joindre ces données aux siennes pour étendre étudedonnées aux siennes pour étendre étude

Auteur gagnant ! Deux références pour son Auteur gagnant ! Deux références pour son travail : données auront une référence travail : données auront une référence distinctes (mais reliées à l’article)distinctes (mais reliées à l’article)

2222

Page 23: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Début en Tice en France : projet Début en Tice en France : projet Datapublication .orgDatapublication .org

2323

http://sticef.univ-lemans.fr/num/vol2012/05-guichon/sticef_2012_guichon_05.htm

http://datapublication.tge-adonis.fr/data/d-001-102

Page 24: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Ce que nous dit l’EuropeCe que nous dit l’Europe

2424

COMMISSION RECOMMENDATION of 17.7.2012 on access to and preservation of scientific information : http://ec.europa.eu/research/science-society/document_library/pdf_06/recommendation-access-and-preservation-scientific-information_en.pdf

Page 25: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Qu’en pensent les chercheurs ?Qu’en pensent les chercheurs ?

2525

Suppose you submit a paper to a journal which is based on research data, would you be willing to deposit your data for the review process?

83% of survey participants would accept to deposit their data in order to be taken into account for this data to be considered during the review process.

Source : Chanier, T. (2013).

Page 26: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Un projet à l’étude au niveau Un projet à l’étude au niveau international en SHSinternational en SHS

Plusieurs revues internationalesPlusieurs revues internationales en Tice et langues en Tice et langues

Et quelques autres revues en SHSEt quelques autres revues en SHS Poser projet européen, type Poser projet européen, type

Datapublication.org avec soutien Datapublication.org avec soutien DARIAH (Humanités numériques)DARIAH (Humanités numériques)

2626

Page 27: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

OPENDATA SUR LES OPENDATA SUR LES DONNÉES DE LA DONNÉES DE LA RECHERCHERECHERCHE

2727

Page 28: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Des habitudes tenaces en Des habitudes tenaces en sciences humainessciences humaines

Je publie et jette mes données ; Je publie et jette mes données ; argent public gaspillé argent public gaspillé

Je ferme l’accès à mes analyses Je ferme l’accès à mes analyses et jette la clefet jette la clef

Je garde mes vielles données Je garde mes vielles données dans les placardsdans les placards– «vous voulez des données, «vous voulez des données,

elles sont là !»elles sont là !»– … … mais elles sont inutilisables et mais elles sont inutilisables et

perdues à jamaisperdues à jamais

2828

Page 29: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Differentes couvertures pour Differentes couvertures pour les donnéesles données

2929

En linguistique, on les baptise « corpus »

Déjà mentionné

Page 30: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Opendata def Opendata def

“Open data is data that can be freely used, reused and redistributed by anyone – subject only, at most, to the requirement to attribute and sharealike." OpenDefinition.org

3030

Page 31: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Qu’en pensent les chercheurs ?Qu’en pensent les chercheurs ?

3131

Source : Chanier, T. (2013).

If research data from learning situations was available in open-access formats, would you be interested in doing research on this data that you did not personally collect?

88% of researchers find that doing some research on learning situations they did not design nor tutor may be of interest (in blue),

Page 32: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Partager ce n’est pas Partager ce n’est pas seulement vouloirseulement vouloir

Cela implique une mutation dans les Cela implique une mutation dans les façons de travaillerfaçons de travailler

Organiser, structurer ses données, Organiser, structurer ses données, les renseigner, le tout de façon les renseigner, le tout de façon standardstandard

Développer des outils d’analyse Développer des outils d’analyse interopérablesinteropérables

Régler les questions d’éthique et de Régler les questions d’éthique et de droitsdroits

3232

Page 33: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Former les chercheurs sur Former les chercheurs sur l’ensemble du flux de l’ensemble du flux de

production production

3333

Page 34: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Un exemple : banque de corpus Un exemple : banque de corpus Mulce diffusée à la MSH Clermont Mulce diffusée à la MSH Clermont

par LRLpar LRL

3434

For usage:licence

For participants:Informed consent form+Anonymization process

Open Data:http://opendefinition.org/guide/

Note : Incoherence between licences on our sites: changes are not yet achieved

Page 35: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

35

Simuligne (2001)

UK-FR

fre

Copéas (2005)

eng

UK-FR

Tridem(2005-06)

UK-FR-USA

eng, fre

Ecofralin (2008)

CO-FR

fre,spa

VMT-teamC (2006)

math

UK-USA-SG

INFRAL (2009)

deu,fra

DE-FR

FR

FAVI (2006-08)

fra

ARCHI21 (2011)

eng,fra

FR

SLIC (2013)

USA-FR

fra

Page 36: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Computer-Mediated Communication in TEI: What Lies AheadTEI-MM 2013 (Rome)

People: 14 researc. from 8 research units. Coord: Chanier, T (Clermont), Poudat, C. & Sagot, B (Paris), Longhi, J. (Cergy), Antoniadis, G. (Grenoble)

Objective: Kernel corpus assembling existing corpora of different CMC genres and new corpora build on data extracted from the Internet. These heterogenous corpora will be structured and processed in a uniform way, complemented with metadata. CoMeRe will be released as OpenData through the national infrastructure Ortolang, following constraints which will be reused for the forthcoming “Corpus de Référence du Français”.

Documentation and activities : http://comere.org

CoMeRe (Communication Médiée par les Réseaux): a reference corpus of French CMC (2013-14)

Project supported by the national consortium Corpus-écrits, sub-part of Huma-Num, and Ortolang (French correspondant to DARIAH)

http://corpusecrits.corpus-ir.fr/

Passage à l’échelon national

Page 37: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Passage à l’échelon européen Passage à l’échelon européen (2013-2014)(2013-2014)

Organiser ses données de façon Organiser ses données de façon standardstandard

groupe européen (Italie, groupe européen (Italie, Allemagne, Hollande, France) TEI-Allemagne, Hollande, France) TEI-CMC pour étendre TEI aux CMC pour étendre TEI aux communications médiées sur communications médiées sur réseauxréseaux

Soutien de DARIAHSoutien de DARIAH3737

Page 38: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Critères pour être OpenDataCritères pour être OpenData

“Availability and Access: the data must be available as a whole and at no more than a reasonable reproduction cost, preferably by downloading over the internet. The data must also be available in a convenient and modifiable form.

Reuse and Redistribution: the data must be provided under terms that permit reuse and redistribution including the intermixing with other datasets. The data must be machine-readable.

Universal Participation: everyone must be able to use, reuse and redistribute – there should be no discrimination against fields of endeavor or against persons or groups. For example, ‘non-commercial’ restrictions that would prevent ‘commercial’ use, or restrictions of use for certain purposes (e.g. only in education), are not allowed. “OpenDefinition.org

3838

Page 39: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

LA QUESTION DES LA QUESTION DES LICENCES D’UTILISATIONLICENCES D’UTILISATION

3939

Page 40: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

L’accès libre n’est pas L’accès libre n’est pas automatique sur Internetautomatique sur Internet

I seriously doubt that we would create the I seriously doubt that we would create the Web today—at least if policy makers and Web today—at least if policy makers and market incumbents understood what the market incumbents understood what the technology might become early enough technology might become early enough to stop it. (p.278)to stop it. (p.278)

Almost everything on Almost everything on the Internet is copyrighted, the Internet is copyrighted, even if its creators do not know that and would even if its creators do not know that and would prefer it to be in the public domain. (p. 26)prefer it to be in the public domain. (p. 26)

(Boyle, J.2008, (Boyle, J.2008, The Public Domain: Enclosing the The Public Domain: Enclosing the Commons of the Mind) Commons of the Mind) Boyle is one of the Boyle is one of the creators ofcreators of

the Creative Common – CC projectthe Creative Common – CC project4040

Page 41: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Pourquoi doit-on se soucier des Pourquoi doit-on se soucier des licences ?licences ?

“In most jurisdictions there are intellectual property rights in data that prevent third-parties from using, reusing and redistributing data without explicit permission. Even in places where the existence of rights is uncertain, it is important to apply a license simply for the sake of clarity. Thus, if you are planning to make your data available you should put a license on it — and if you want your data to be open this is even more important.” OpenDefinition.org

4141

Page 42: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

On croit que c’est libre, mais cela ne On croit que c’est libre, mais cela ne l’est pas : exemple ELFAl’est pas : exemple ELFA

Open access, but for personal use (hence not for research)Open access, but for personal use (hence not for research) Important restriction (NC), where are the sound files?Important restriction (NC), where are the sound files?

4242

https://elomake.helsinki.fi/lomakkeet/43518/lomake.html

Page 43: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Les licences Creative Commons - Les licences Creative Commons - CC (pas toutes compatibles avec CC (pas toutes compatibles avec

l’OpenData)l’OpenData)

4343

Page 44: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

2 licences sur les données 2 licences sur les données compatibles OpenDatacompatibles OpenData

4444

Page 45: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

CC0 and PPDLCC0 and PPDL

CC0 : en tant que créateurs, je peux CC0 : en tant que créateurs, je peux avoir des droits (droits sur les modèles avoir des droits (droits sur les modèles ou les données) As creators, I may ou les données) As creators, I may have had some rights (rights on have had some rights (rights on models, rights on data, etc.) , je les models, rights on data, etc.) , je les abandonne (de façon permanenet , et abandonne (de façon permanenet , et irrévocable)irrévocable)

PPDL : je ne mentionne même pas que PPDL : je ne mentionne même pas que je pourrai avoir des droitsje pourrai avoir des droits

4545

Page 46: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Question angoissante pour les Question angoissante pour les chercheurs chercheurs

Que va-t-il se passer si je Que va-t-il se passer si je n’indique plus mes droits n’indique plus mes droits d’auteur (copyright) sur les d’auteur (copyright) sur les données (on ne parle pas ici des données (on ne parle pas ici des publications) ?publications) ?

Va-ton me voler mon travail ? Ne Va-ton me voler mon travail ? Ne va-t-on plus me citer ?va-t-on plus me citer ?

4646

Page 47: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Ne pas confondre attribution droits Ne pas confondre attribution droits d’auteur (IPR) avec façons de citer et d’auteur (IPR) avec façons de citer et

référerréférer Contestation sur droits d’auteur se règle au Contestation sur droits d’auteur se règle au

tribunaltribunal Dans le monde académique, procédures de Dans le monde académique, procédures de

relecture : un auteur qui utilise sans citer les relecture : un auteur qui utilise sans citer les travaux / données des autres voit son article travaux / données des autres voit son article rejeté.rejeté.

Développer références aux données et les rendre Développer références aux données et les rendre visibles (métadonnées, OAI-MPH)visibles (métadonnées, OAI-MPH)– 1) creator of the corpus1) creator of the corpus

Wigham, C.R. (2013). Wigham, C.R. (2013). Distinguished Corpus: Interplay between textchat and Distinguished Corpus: Interplay between textchat and audio modalities during the Second Life Reflective Sessionsaudio modalities during the Second Life Reflective Sessions. Mulce.org : . Mulce.org : Clermont Université. [oai : mulce.org:mce-archi21-modality-textchat ; Clermont Université. [oai : mulce.org:mce-archi21-modality-textchat ; http://repository.mulce.org] http://repository.mulce.org]

– 2) creator and editor2) creator and editor Stahl, Gerry ; Weimar, Steve ; Shumar, Wes (2009). Stahl, Gerry ; Weimar, Steve ; Shumar, Wes (2009). LETEC Corpus Virtual LETEC Corpus Virtual

Math TeamMath Team. Reffay, C. (editor). Mulce.org : Clermont Université. [oai : . Reffay, C. (editor). Mulce.org : Clermont Université. [oai : mulce.org:mce-vmt-letec-teamc ; http://repository.mulce.org]mulce.org:mce-vmt-letec-teamc ; http://repository.mulce.org] 4747

Page 48: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

QQue pensent les chercheurs ?ue pensent les chercheurs ?

4848

Occasionally, would you be ready to waive your intellectual property rights when you deposit data (data, not publications), provided that your data can be clearly cited / referred to?

Source : Chanier, T. (2013).

Page 49: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Qu’est ce qui se prépare Qu’est ce qui se prépare après ?après ?

4949

O’Reilly a inventé récemment le terme « Web2.0 »

Les chercheurs en SHS peuvent se dire …

Page 50: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Big data Big data cela veut dire …cela veut dire …

Mélanger des données afin d’obtenir de Mélanger des données afin d’obtenir de grands ensembles (Tera octets)grands ensembles (Tera octets)

0 base de données, pas de structure 0 base de données, pas de structure sur les donnéessur les données

Calcul intensif (Calcul intensif (cloud computingcloud computing, , apprentissage automatique) apprentissage automatique)

Façon montante de construire les Façon montante de construire les questions de recherche et les modèles questions de recherche et les modèles

Certains secteurs SHS commencent à Certains secteurs SHS commencent à bougerbouger

5050

Page 51: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Atelier BigData en SHSAtelier BigData en SHS

5151

Page 52: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

RecommendationRecommendationss

ActionsActions– Libérer ses données (si éthique est OK – faire le Libérer ses données (si éthique est OK – faire le

nécessaire pour anonymisation)nécessaire pour anonymisation)– Choisir la licence imposant le moins de restrictionsChoisir la licence imposant le moins de restrictions– Citer les données des autres et les vôtres dans les Citer les données des autres et les vôtres dans les

publicationspublications– Lister ces références dans vos travaux (évaluation)Lister ces références dans vos travaux (évaluation)

ImplicationsImplications– La reconnaissance viendra progressivement (de la part La reconnaissance viendra progressivement (de la part

des institution et des collègues)des institution et des collègues)– La recherche progressera (re-analyses, couverture La recherche progressera (re-analyses, couverture

étendue des bases d’analyse)étendue des bases d’analyse)– Les données seront réutilisées dans d’autres domaines Les données seront réutilisées dans d’autres domaines

que ceux des disciplines d’origineque ceux des disciplines d’origine 5252

Open our data!

OpenData

Open

Data

Page 53: OpenData : au-delà des publications, le partage des données de la recherche en sciences humaines. Pour qui ? Comment ?

Merci pour votre attention ! Merci pour votre attention ! Questions ? Réactions ?Questions ? Réactions ?

Thierry.chanier at univ-bpclermont.frThierry.chanier at univ-bpclermont.fr

http://lrl.univ-bpclermont.fr/spip.php?rubrique98http://lrl.univ-bpclermont.fr/spip.php?rubrique98

5353

Diaporama téléchargeable à http://goo.gl/GUEO07