OpenRefine
OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.
| Développé par | Google, Metaweb (en) et Antonin Delpeuch (d) |
|---|---|
| Première version | 10 octobre 2010 |
| Dernière version | 3.10.1 (4 mars 2026)[1] |
| Dépôt | github.com/OpenRefine/OpenRefine |
| Assurance qualité | Intégration continue |
| Écrit en | Java et JavaScript |
| Système d'exploitation | Microsoft Windows, macOS et Linux |
| Formats lus | TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation, Notation3, XLS, OpenDocument Spreadsheet file format family (d), PC-Axis data (var 2) (d), fichier texte et MediaWiki-Markup (en) |
| Langues | Anglais, italien, chinois, japonais et français |
| Type | Outil de Wikidata (d) |
| Licence | Licence BSD |
| Documentation | openrefine.org/docs |
| Site web | openrefine.org |
OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.
Historique
[modifier | modifier le code]Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.
Le 10 mai 2010, est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].
Le 16 juillet 2010, Google a racheté la société Metaweb[3].
Le 10 novembre 2010, Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].
En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.
En décembre 2017, Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].
- Logo d'Openrefine
-
Avant 2018
-
Depuis 2018
Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].
Fonctionnalités
[modifier | modifier le code]- Nettoyage de données.
- Manipulation de données, d'un format à un autre.
- Moissonnage de données d'un site web.
- Ajout de données depuis un service web.
- Alignement avec une Wikibase (dont Wikidata).
Notes et références
[modifier | modifier le code]- ↑ « Release 3.10.1 », 4 mars 2026 (consulté le 7 avril 2026)
- ↑ (en) Unknown, « Freebase Gridworks 1.0 released! » [html], sur freebase-gridworks.blogspot.com, 10 mai 2010 (consulté le 2 décembre 2019).
- ↑ (en) Jack Menzel, « Deeper understanding with Metaweb » [html], sur googleblog.blogspot.com, Google, 16 juillet 2010 (consulté le 2 décembre 2019).
- ↑ (en) David Huynh, « Announcing Google Refine 2.0, a power tool for data wranglers » [html], sur opensource.googleblog.com, Google, 10 novembre 2010 (consulté le 2 décembre 2019).
- ↑ (en) Unknown, « Update: Google News Initiative and technical road map » [html], sur openrefine.org, 16 juin 2018 (consulté le 2 décembre 2019).
- ↑ (en) Unknown, « OpenRefine funded by the Chan Zuckerberg Initiative as an Essential Open Source Software for Science »(Archive.org • Wikiwix • Google • Que faire ?) [html], sur openrefine.org, 14 novembre 2019 (consulté le 2 décembre 2019).
Voir aussi
[modifier | modifier le code]Bibliographie
[modifier | modifier le code]- (en) Kelli Ham, « OpenRefine (version 2.5). http://openrefine.org. Free, open-source tool for cleaning and transforming data », Journal of the Medical Library Association, ULS (d), vol. 101, no 3, 1er juillet 2013, p. 233-234 (ISSN 1536-5050 et 1558-9439, OCLC 47728400, PMCID 3738091, DOI 10.3163/1536-5050.101.3.020).
Articles connexes
[modifier | modifier le code]Liens externes
[modifier | modifier le code]
- (en) Site officiel
- (en) « Manuel sur la page de la School of data de l'Open Knowledge Foundation », sur schoolofdata.org (consulté le 3 février 2021)
- Maïwenn Bourdic, « #36 - OpenRefine, "Excel aux hormones" pour nettoyage de données - Patrimoine et numérique », sur www.patrimoine-et-numerique.fr, 12 avril 2017 (consulté le 3 janvier 2021)
- Dépôt du code source