A Representative User-centric Dataset of 10 Million GitHub Developers

Kuvaus

Using GitHub APIs, we construct an unbiased dataset of over 10 million GitHub users. The data was collected between Jul. 20 and Aug. 27, 2018, covering 10,649,574 users, 118,602,740 commits, and 20,999,258 repositories. Each data entry is stored in JSON format, representing one GitHub user, and containing the descriptive information in the user’s profile page, the information of her commit activities and created/forked public repositories.
Näytä enemmän

Julkaisuvuosi

2018

Aineiston tyyppi

Tekijät

Department of Communications and Networking

Jiayun Zhang - Tekijä

Pan Hui - Tekijä

Qingyuan Gong - Tekijä

Xiang Li - Tekijä

Xiaoming Fu - Tekijä

Xin Wang - Tekijä

Yang Chen - Tekijä

Yu Xiao Orcid -palvelun logo - Muu tekijä

Fudan University - Muu tekijä

Harvard Dataverse - Julkaisija

University of Göttingen - Muu tekijä

University of Helsinki - Muu tekijä

Projekti

Muut tiedot

Tieteenalat

Tietojenkäsittely ja informaatiotieteet

Kieli

Saatavuus

Avoin

Lisenssi

Creative Commons Yleismaailmallinen (CC0 1.0) Public Domain lausuma

Avainsanat

Asiasanat

Ajallinen kattavuus

undefined

Liittyvät aineistot