Publié par Pierrot le Chroniqueur


Préambule
Ce billet est un essai de réflexion et de présentation de ce que je pense être une nécessité sur Wikipédia, à savoir : les sources. Disons-le immédiatement : j'ai essayé d'être le plus clair possible et de dégager les informations pertinentes, le tout en condensant au maximum. Malheureusement, le résultat est long. Je vais donc présenter le tout en plusieurs morceaux, faute de pouvoir faire mieux (attention, les notes suivent la disposition originale). Allons-y !

Le contexte
Wikipédia est une encyclopédie ouverte à tous. C'est une des bases de ce projet d'encyclopédie et cela a une importance cruciale à plusieurs niveaux pour l'évolution de son contenu.
Tout d'abord cela lui permet de croître vite. Très vite, même1. Lors de ses 9 premiers mois d'existence, 55 articles (oui, cinquante cinq) ont été créés. Au bout d'un an, 406 articles. À la fin de la deuxième année, aux alentours de 2000 articles existaient (ce qui correspond en moyenne à entre 5 et 10 articles crées par jour). 25000 la 3e année. 70000 la 4e, 210000 la 5e, puis  420000, 600000 et enfin à ce jour dans les environs de 700000 articles.
Si le rythme de création semble se ralentir un petit peu cela fait en moyenne depuis la création de Wikipédia, le 22 mars 2001, 255 articles (enfin disons pages) sont créés par jour2. Ce qui est absolument considérable.
Le revers de cette médaille, c'est que cet afflux continu et de plus en plus massif nécessite de plus en plus d'efforts de vérification(s), ce qui est aussi logique. L’admissibilité du sujet proposé est l’une de ces vérifications3, la véracité des informations en est une autre. Et, comme on peut l’énoncer facilement, pas la moindre. La véracité des informations, leur exhaustivité et leur hiérarchisation constituent par nature même le centre d’une encyclopédie, l’élément essentiel. Si l’on considère une encyclopédie comme une démarche scientifique de synthèse d’information4, bien sûr.
Et bien sûr aussi, ce point constitue l’un des angles d’attaque favori des détracteurs de Wikipédia, et avec raison. En tout cas quand l’attaque est vraiment justifiée. Mais c’est un autre débat.
Donc, la construction d’une encyclopédie comme Wikipédia passe, à l’évidence (y compris pour les Wikipédiens dans leur majorité5), par l’utilisation de sources identifiables et solides. Car, comme le disait Euclide, "Ce qui s'énonce sans preuve peut se réfuter sans preuve".

Les petits ruisseaux font les grandes rivières … et les marécages
Ne nous trompons pas. Si l’utilisation de sources est, pardon, semble une évidence, la réflexion sur leur nature même, leur fiabilité et leur hiérarchisation reste une zone très (trop) floue sur Wikipédia. Il est ainsi, et la liste n’est pas exhaustive, intéressant voire indispensable de distinguer les sources (ou prétendues telles) selon :
  • Leur niveau d’approche d’un sujet (source dite primaire ou secondaire, voire tertiaire).
  • Leur provenance (internet, journal, encyclopédie, publication scientifique ou autre).
  • Le sujet traité (sciences dures, sciences humaines, autres).
  • Leur(s) auteur(s) (pour satisfaire à la politique de neutralité, mais pas seulement).
  • Leur "interprétabilité", si l’on peut dire. Autrement dit, la présentation que l’on pourra en faire dans Wikipédia.
J’en oublie certainement.
Cependant, lorsque l’on liste ces exigences successives, on peut d’ores et déjà se rendre compte que leur maîtrise n’est pas à la portée du contributeur lambda, contrairement au postulat initial de libre modification, ni même réellement universelle. On y reviendra.

Source primaire ou secondaire ?
J’ai toujours été étonné, voire stupéfait, de la légèreté manifeste avec laquelle certains sujets sont abordés (ça, c’est une chose, et je ne parle même pas de la question de l’admissibilité), mais aussi et surtout la manière dont certaines personnes utilisent tout et surtout  n’importe quoi comme source. Un peu comme si on pensait : il existe, je l’ai vu. Et ceci en ignorant superbement une règle pourtant fondamentale de Wikipédia : l’interdiction de ce qu’on appelle le travail inédit.
Le "travail inédit" (sur Wikipédia) consiste – tout simplement, si l’on peut dire – à construire une page traitant d’un sujet à partir de ses propres travaux, ou, plus souvent6, ses propres spéculations. Il est donc normal, si l’on réfléchit au besoin de vérifiabilité de l’information encyclopédique et analytique, d’écarter comme source dans la rédaction d’un article tout document de type source primaire (c’est-à-dire, pour faire simple, qui présente des matériaux fournis par le témoin de première main d'un phénomène ou assimilé7). Ce qui implique, de manière immédiate, d’écarter les articles de la presse classique comme sources pour des articles dignes de ce nom sur Wikipédia. Oui mais voilà, c’est un matériau fort prisé (et d’ailleurs au cœur d’une autre bataille wikipédienne8) … sans que cela émeuve vraiment, et surtout, rajouterai-je, quand il s’agit de promouvoir sa marotte, pour ne pas dire effectuer du prosélytisme. Sont visées, parmi les plus visibles, les pages touchant le sport, la politique locale ou internationale. Qui pourtant disposent de sources secondaires en quantités impressionnantes.

Faisons une petite digression, qui a mon avis explique un peu les choses. La dénomination même du "travail inédit" est problématique, à mon sens. Elle laisse penser que la présentation de l’information (ou considérée comme telle) doit avoir un antécédent pour ne plus être inédite, au sens premier du terme. La consultation de la page sur Wikipédia (voir le lien fourni plus haut) dissipe ce malentendu … Mais introduit un petit couac : elle valide implicitement l’utilisation de sources primaires, ce qui est assez illogique. Passons.

Dans l’absolu, donc, un article de Wikipédia doit être construit en se basant sur un matériau disponible de présentation d’une part et d’analyse d’autre part d’un fait ou d’un thème. Donc sur une source de type secondaire (comme disent les chercheurs en histoire). Un autre argument implicite, mais important à mon sens, qui va dans le sens de l’utilisation des sources secondaires, est le manque de recul vis-à-vis du fait : le libre accès à la modification des articles par tout à chacun ne garantit pas que le tout à chacun en question ait la capacité d’analyse nécessaire à la construction d’un article … dans une démarche scientifique. Et cela indépendamment du niveau d’études : un spécialiste de l’électronique ne pourra remplacer un étudiant en philosophie comparée sur ce dernier sujet. L’inverse est vrai aussi, bien sûr. Or, une source secondaire est justement un traitement d’un thème et de sources primaires par un spécialiste du thème en question9, ce qui théoriquement valide ce travail … Les Wikipédiens n’auraient alors plus qu’à extraire la substantifique moelle de ladite source pour ne pas avoir trop à s’en faire. Mais cela n’est pas toujours simple, surtout face aux idées reçues, sources de bien des bêtises écrites10.

Ceci étant dit, il est aussi quelques exceptions, a priori. Un fait indéniable (et encore, cela reste à prouver) comme un résultat sportif (machin a gagné sur truc 1-0, par exemple) et non une analyse dudit évènement sportif à chaud ou une démonstration mathématique (avec toutes les précautions d’usage) peuvent par exemple être issus de sources primaires … La distinction entre les deux types de sources n’étant pas toujours évidente. Mais on va y revenir.

Sources des sources ?
Ou plutôt, où devons nous chercher les sources sensées étayer les articles écrits sur Wikipédia11 ? Indépendamment de leur nature (primaire ou secondaire), il est important de considérer le média ayant apporté ces briques élémentaires de la construction encyclopédique.
D’un point de vue personnel, j’en distinguerai six types (à l’exclusion des catalogues et autres objets de vente), facilement identifiables et catégorisables (a priori) :
  • Presse ou littérature de loisir.
  • Presse ou littérature de vulgarisation.
  • Presse ou littérature professionnelles.
  • Internet.
  • Cours et autres contenus d’enseignement.
  • Audiovisuel
Par presse ou littérature de loisir, j’entends romans, journaux (quotidiens d’information, par exemple, mais aussi des hebdomadaires de bandes dessinées ou autres). Pour moi, et sauf à l’utiliser dans un but uniquement descriptif, ce type de documents est à exclure d’office : dans le meilleur des cas, on peut considérer qu’ils constituent des sources primaires d’information. Et, bien sûr, la question de la vérifiabilité des informations proposées est sujette à caution, d’une part, et la dimension analytique globale est très souvent totalement absente12. Et pour cause : journalistes, chroniqueurs et éditorialistes ne sont pas des synonymes de spécialistes. Quand bien même ils le sont (et ça arrive), il est douteux qu’ils parviennent à développer un support encyclopédique en quelques lignes.

La presse ou littérature de vulgarisation (certaines revues scientifiques ou livres spécialisés sans être hermétiques pour le tout venant … comme les encyclopédies) est, toujours à mon sens, un bon moyen pour trouver rapidement et de manière relativement fiable de l’information générale sur tel ou tel thème, mais sans en constituer la référence absolue. Il s’agit d’une accroche, comme on peut en trouver dans certains de mes billets. Bien que le niveau des sujets abordés puisse être relativement élevé, ces sources restent sujettes à caution suivant la présence ou non d’une autorité de vérification (ou comité éditorial). Mais de fait, la présence d’une signature et souvent de sources aux informations proposées placent ces documents en bonne place pour la rédaction d’une encyclopédie … Sans toutefois en être les meilleurs matériaux, car la vulgarisation à ses limites.

La presse ou littérature professionnelles (adjectif utilisé pour faciliter la compréhension) comprend essentiellement les publications à la pointe de la connaissance dans un domaine donné, ou celles faisant la somme des connaissances de base pour spécialistes13. Ces documents constituent, dans l’idéal, les meilleurs matériaux pour les articles, car la présence d’un comité vérificateur est quasiment une constante. Et les critiques par d’autres spécialistes aussi (lettres à l’éditeur pour les revues scientifiques, comité d’évaluation pour certains rapports, jurys de thèses, etc.). Cependant, ne nous y trompons pas : les problèmes existent, et sont parfois bien plus durs à détecter que pour les niveaux inférieurs. On en reparlera sans doute.
Pour le lecteur moyen (et averti de la difficulté de la chose, quand même), de l’information a priori vérifiée et relativement objective est accessible. A condition de pouvoir interpréter le vocabulaire propre à la spécialité abordée ainsi qu’au sens profond de l’écrit. Un travail d’exégèse qui n’est pas toujours évident14.

Internet constitue à la fois la source absolue et la pire de toutes, une sorte d’avatar électronique de Janus15.
Commençons par le meilleur, ça sera plus rapide (ou pas). De nombreuses bases de données scientifiques (enfin, plutôt dans le domaine des sciences dures) sont disponibles en ligne. Las, il est très souvent nécessaire de disposer d’un abonnement spécifique. Cependant, une proportion relativement importante des Wikipédiens gravite dans le milieu de l’enseignement supérieur ou de la recherche, à tout niveau, et donc peut en faire profiter l’encyclopédie indirectement. Un autre point intéressant est la présence sur la toile de sites institutionnels ou de passionnés qui peuvent présenter du matériel intéressant … Et parfois le moyen d’y accéder. Encore faut-il pouvoir apprécier la valeur réelle de ce matériel, ce qui constitue un autre problème. Par contre, le meilleur se situe dans un fatras d’informations (ou plutôt d’octets) sans aucun apport réel ou potentiel pour Wikipédia. Il est d’ailleurs logique, dans le fonctionnement commun des projets de la Wikimedia Foundation (WMF), de décourager fortement l’insertion de liens vers les blogs, forums, sites de fans ou hébergeurs de vidéos diverses et variées. Question de fiabilité, neutralité et … absence d’analyse critique, par nature. Et, bien qu’Internet soit un descendant d’un projet militaro-universitaire, les applications sérieuses16 sont devenues minoritaires.
Résultat des courses, seules les personnes sachant ce qu’elles cherchent exactement sont potentiellement capables d’exploiter internet pour étayer l’écriture de leurs articles sur Wikipédia. Ce qui revient souvent, de fait, à accéder aux bases de données professionnelles.

Les cours et supports d’enseignements (étendons aux supports de conférences ou d’expositions) constituent également un apport pouvant s’avérer intéressant, si l’on considère qu’ils sont en général basés sur des informations validées et vérifiables17. Un cours peut constituer une source secondaire de fait, ce qui n’est pas forcément le cas d’une conférence, et surtout proposer également ses propres sources … ou les références pour y accéder. Mais ce genre de documents est, à mon avis, bien plus adapté à d’autres projets de la WMF, les Wikiversities, sans surprise.

L’audiovisuel enfin, quasiment par essence et à l’exception notable du documentaire (et encore, pas entièrement) relève de la source primaire.

1. Les chiffres suivants ne concernent que la version francophone de Wikipédia.
2. Ce qui, en supposant qu'un volume d'encyclopédie papier fait 500 pages au format A4, imprimées recto verso, reviendrait à remplir un volume d'encyclopédie tous les 4 jours.
3. Et l’un des thèmes favoris d’affrontements entre Wikipédiens.
4. Malheureusement pour Wikipédia, cette notion n’est pas aussi répandue qu’on pourrait le souhaiter.
5. A priori. Il ne faut quand même pas rêver.
6. Je dirais dans 70 % des cas, à vue de nez. Et ce chiffre manque de source. Je sais, mais j’assume : je ne suis pas sur Wikipédia.
7. En gros.
8. Ou : faut-il traiter l’actualité sur Wikipédia ? Question simple au premier abord.
9. A priori. Il y a des exceptions, volontaires ou non.
10. Wikipédia n’est pas détentrice exclusive des erreurs commises à cause de ces idées reçus. Surtout pas, même.
11. Ou ailleurs. J’en profite pour remercier avant d’oublier quelques unes de mes sources à moi, dont les échanges ont permis la rédaction de ce billet.
12. Il ne s’agit pas de remettre en cause les performances de telle ou telle publication dans son domaine et vis-à-vis des attentes des lecteurs, mais bien leur apport pour une encyclopédie comme Wikipédia. Ce qui n’est pas du même ressort.
13. J’aime bien cette expression. Disons que c’est une barre floue qui sépare l’amateur éclairé du routinier de la chose. Un peu comme dans le sport entre amateurs et professionnels, mais le dopage en moins.
14. Enfin, quand je dis lecteur moyen … Moyen bon quoi. Et avec de la culture générale.
15. Un dieu romain, avec deux visages, en charge des portes. Sans doute le dieu tutélaire de Wikipédia, en raison des claquages desdits portes sur l’encyclopédie en ligne.
16. Pour ce qui nous intéresse ici.
17. J’ai bien écrit en général.

 

Commenter cet article

GillesC 30/09/2008 13:25

Que disais-je déjà à propos de la volatilité des sources sur le Web ? Ah oui...

Pierrot le Chroniqueur 30/09/2008 13:37



Oui. Et ne parlons pas des blogs. Franchement, quelle idée ...



Perce-Niais 02/09/2008 17:53

La proscription des sources primaires sur Wikipédia, n'est-ce pas une légende urbaine (puisque, semble-t-il, on ne dit plus "légende" mais "légende urbaine") ?La page de la Wikipedia anglaise sur les sources primaires est ici :http://en.wikipedia.org/wiki/Wikipedia:OROn y lit notamment :"
Primary sources that have been published by a reliable source may be
used in Wikipedia, but only with care, because it is easy to misuse
them. For that reason, anyone—without specialist knowledge—who reads
the primary source should be able to verify that the Wikipedia passage
agrees with the primary source. Any interpretation [je souligne : interprétation, non citation) of primary source
material requires a reliable secondary source for that interpretation.
To the extent that part of an article relies on a primary source, it
should:

only make descriptive claims about the information found in the
primary source, the accuracy and applicability of which is easily
verifiable by any reasonable, educated person without specialist
knowledge, and
make no analytic, synthetic, interpretive, explanatory, or evaluative claims about the information found in the primary source."

Il me semble donc que citer des sources primaires est permis, ce qui ne l'est pas (ou est déconseillé), c'est un travail d'interprétation non appuyé sur des sources secondaires.

Pierrot le Chroniqueur 03/09/2008 09:39



Je le dis dans mon texte, tu as du rater le passage :) (où je parle d'interprétation et des sources). Ceci dit, la réflexion sur les sources n'est pas finie, les parties suivantes vont traiter un
peu plus des unes et des autres.



GillesC 01/09/2008 22:59

Pierrot, tu dis que la question de l'accessibilité est parfois aussi criante pour un support papier... à cela près que quand on fait référence à telle édition de telle ouvrage (voir par exemple ce qui se pratique dans Wikisource), on peut espérer qu'il existe par le monde au moins un exemplaire de cet ouvrage qu el'on peut consulter ; dans la plupart des cas, l'ouvrage se trouve dans e nombreuses bibliothèques. Leur conservation dépend du bon vouloir des gens qui en ont la garde ; mais dans le cas des sources Internet, le problème est que bien que la source soit disponible simultanément sur tout le globe, elle n'en reste pas moins stockée physiquement à un unique endroit. Pour peu que cet endroit disparaisse, la source disparaît avec elle, tandis que quand un bibliothèque brûle, il est rare que partent en fumée des ouvrages uniques (mis à part la Comédie d'Aristote, bien entendu...)à Mathieu P: Il est possible de faire un travail sur des sources primaires...mais dans ce cas je pense qu'un projet comme Wikibooks serait finalement plus adapté...

Pierrot le Chroniqueur 01/09/2008 23:15



Oui, bien sûr, tu vois les choses de façon rationnelle et (un peu) dramatique... Mais pour autant, on ne peut pas, à cause de cette potentielle disparition de source internet, mettre une croix
dessus quand même, non ?

Et tant que la source n'a pas disparu, elle reste nettement plus accessible que nombre d'ouvrages confidentiels.



DocteurCosmos 01/09/2008 17:02

Mais qu'est-ce qui reste alors, Poppy ?

Pierrot le Chroniqueur 03/09/2008 14:52



Je laisse à Poppy le soin de répondre :D



Poppy 01/09/2008 11:21

Je serais beaucoup plus réservé concernant la "presse ou littérature professionnelles". De ce que j'en connais les comités de lecture sont nuls voire inexistants pour un certain nombre de publications. Je ne parle même pas des conférences professionnelles où des articles d'un niveau consternant (i.e. mauvais, faux, promotionnels, ...) sont publiés

Pierrot le Chroniqueur 03/09/2008 09:43



J'ai quand même quelques réserves (fortes) pour des raisons diverses et variées. Mais on rentre à nouveau dans la notion d'expertise et de libre modification de Wikipédia.



Mathieu P. 01/09/2008 10:54

J'ai assez vigoureusement défendu l'idée que le travail sur des sources primaires devait être proscrit. Il donne en effet des résultats le plus souvent déplorables, ces sources étant maniées par des autodidactes sans aucun recul vis-à-vis du texte qu'ils emploient. J'ai cependant mis de l'eau dans mon vin en consultant les articles traitant des héros Marvel sur la Wikipédia anglophone. Considérons l'article http://en.wikipedia.org/wiki/Wolverine_(comics) Formellement, il a l'air plus que correct : développé, illustre (grâce à l'interprétation anglo-saxonne du fair use, que Marvel ne semble pas vouloir contester, avec une abondance de notes. Mais à quoi renvoient ces notes ? Aux albums eux-mêmes. Il s'agit donc à la fois d'un travail sur des sources primaires, et d'un TI. L'article doit-il pour autant être supprimé ? À l'évidence non : ;la qualité du travail effectué est telle que les règles usuelles ne s'appliquent pas en la matière. Tout cela pour dire que l'exigence de sources doit parfois être appliquée avec souplesse, en particulier quand le sujet traité n'a pas ou peu attiré l'attention des milieux universitaires.

Pierrot le Chroniqueur 03/09/2008 09:42



La proscription des sources primaires est, à mon sens, une bonne chose d'autant plus que :

l'interprétation des sources est du ressort des spécialistes (normalement)

les sources secondaires (normalement) avalisent en grande partie l'admissibilité d'une fiche.

Mais on y reviendra dans les parties suivantes consacrées aux sources.



DocteurCosmos 01/09/2008 08:46

a mon avis -> à mon avis ;-)Billet très intéressant. Je pense que tu soulignes le fait essentiel : Wikipédia avec son slogan "le projet d’encyclopédie que chacun peut améliorer" est trompeuse et/ou démagogique. En théorie, et pour réellement rédiger/élaborer des articles (mettons le cas de la "maintenance" à part), on ne devrait venir sur Wikipédia que parce qu'on a déjà potassé des sources (et qu'on les a sous la main !). Personne n'a la science infuse...

Pierrot le Chroniqueur 01/09/2008 10:40


Bien sûr que tout le monde ne peut rédiger sur n'importe quoi... En même temps, on vient sur Wikipédia d'abord un peu au hasard, j'imagine, et c'est au fur et à mesure qu'on se rend compte de
l'exigence du sourçage. Et là, forcément la "sélection" se fait : on peut (ou ne peut pas) écrire sur certains sujets.


GillesC 31/08/2008 23:55

Je trouve curieux de placer Internet parmi les sources, alors qu'il ne s'agit que d'un support. Cela conduit d'ailleurs à différencier le meilleur du... meilleur (oui, petit lapsus ;-)) qui s'y trouve.À mon avis, on toruve de tout sur Internet tout comme on trouve de tout sur le papier: du flyer de promo de groupe de garage distribué à la sortie d'un lycée à... l'Encyclopédie.Internet est un moyen comme un autre d'avoir accès à telle ou telle information. Il se trouve "juste" que c'est le plus utilisé sur Wikipédia:
quand on écrit un article, on est face à son ordinateur et par conséquent souvent avec Internet à portée de clic
les moteurs de recherche ("grand public" ou "professionnels", consacrés à un type de données particulier) sont souvent bien plus commodes d'emploi que la consultation des index d'une bibliothèque papier
cela donne l'illusion(1) de permettre aux internautes de pouvoir vérifier cette information directement par eux-mêmes, alors qu'en fait, une source imprimée est beaucoup plus stable dans le temps (que disait Aliesin déjà ?)
Il y a cependant des types d'informations qui ne figurent que sur papier et pas (encore?) sur Internet, comme les oeuvres (sources primaires) qui ne sont pas encore dans le domaine public, tout comme il existe des types d'informations qui ne sont disponibles que sur Internet (par exemple, autre source primaire, des communiqués de presse des organismes que tout un chacun peut consulter sans devoir passer par le truchement des agences de presse dont la collecte de ce genre de données fait partie du métier). Mais là encore, il s'agit de sources primaires.Quoi qu'il en soit, la question de la crédibilité de la source se pose de la même manière sur un support papier (ou audio, ou vidéo...) que sur Internet, avec le désavantage que la pertinence de la source ne peut être vérifiée que par une personne ayant un accès à une copie de cette source, ce qui est assuré avec Internet (à quelques réserves près que j'ai exposées dans la note ci-dessous, si le système de publication de commentaire l'a laissée passer ;-))Bref, il n'est pas du tout évident pour moi qu'une telle classification soit correcte...


Illusion parce que les sources sur Internet peuvent disparaître totalement (voir le débat sur la possibilité de fournir des liens vers des archives des pages Internet), voire, ce qui est plus grave, changer de contenu. >retour au texte

Pierrot le Chroniqueur 01/09/2008 01:01


Dans le meilleur de ce qu'on peut trouver sur internet (et à peu près stable), il y a quand même pas mal de rapports, études, thèses etc. en .pdf

Je pense que son utilisation est très dépendante du sujet traité : tu pourras trouver des études sérieuses et fiables sur internet dans certaines sciences dures, alors qu'en sciences humaines et
sociales, la pratique de la mise en ligne n'est pas encore vraiment entrée dans les mœurs, donc les ressources en lignes sont moins professionnelles, donc moins fiables.

Tout est toujours question de tri et de choix, sur papier comme sur internet... Et la question de l'accessibilité est parfois aussi criante pour les sources papier.