BANCO DE DADOS DIVERSOS – abertos e livres

Reunimos aqui uma série de links, websites e dicas de listas contendo dados abertos e de livre acesso para que os estatísticos possam aprender a manusear grandes massas de informação e melhorar suas habilidades para compreender, analisar e concluir analiticamente. Alguns websites têm informações repetidas, mas achamos melhor deixar como estão para que o estatístico possa escolher a partir de seus links preferidos.

 

  • Big Data: 33 Brilliant And Free Data Sources For 2016 – Data is ubiquitous — but sometimes it can be hard to see the forest for the trees, as it were. Many companies of various sizes believe they have to collect their own data to see benefits from big data analytics, but it’s simply not true.
  • 10 Great Healthcare Data Sets – Healthcare will be one of the biggest beneficiaries of big data & analytics. Here are 10 great data sets to start playing around with & improve your healthcare data analytics chops. 
  • Google Public Data – Various datasources
  • Miscellaneous Datasets – University of Florida – Journal of Statistical Education Data Archive
  • UCI Machine Learning Repository – The UCI Machine Learning Repository is a collection of databases, domain theories, and data generators that are used by the machine learning community for the empirical analysis of machine learning algorithms
  • KD Nuggets – Data Mining Community's Top Resource – for Data Mining and Analytics Software, Jobs, Consulting, Courses, and more
  • Big data sets available for free – A few data sets are accessible from our data science apprenticeship web page
  • Data, Data, Data: Thousands of Public Data Sources – We love data, big and small and we are always on the lookout for interesting datasets. Over the last two years, the BigML team has compiled a long list of sources of data that anyone can use. It’s a great list for browsing, importing into our platform, creating new models and just exploring what can be done with different sets of data.
  • QUORA – Where can I find large datasets open to the public? – Hundreds of lists/websites
  • GITHUB – Awesome Public Datasets – This list of public data sources are collected and tidied from blogs, answers, and user responses. Most of the data sets listed below are free, however, some are not. Other amazingly awesome lists can be found in the awesome-awesomeness and sindresorhus's awesome list.
  • Multivariate Data Analysis – HAIR/BLACK/BABIN/ANDERSON – A number of datasets are available to enable students and faculty to perform the multivariate analyses described in the textbook.  While some techniques require specialized datasets (e.g., multidimensional scaling, conjoint analysis and structural equation modeling), many of the techniques are performed using conventional survey data. 
  • 70+ websites to get large data repositories for free – Do you require GBs of data to check the performance of your app? The easiest way is to download samples of data from free data repositories available on the Web. But the main disadvantage of this approach is the data will have very less unique content and it may not give desired results. Below are 70+ websites to get large data repositories for free. 
  • Bancos de dados públicos da AWS – A AWS hospeda uma variedade de conjuntos de dados públicos que qualquer um pode acessar gratuitamente.
  • RDataMining.com: R and Data Mining – There are many datasets available online for free for research use.
  • Pew Research Center makes its data available to the public for secondary analysis after a period of time.
  • Augmented Intel: Searchable list of public data mining data sets – Public data resources: research-quality, free data mining data sets
  • QUANDL – The World's Largest, Most Usable Collection of Free Financial and Economic Data – The World’s Leading Platform for Open Data
  • A Social Work Research Guide – Here are links to the boxes on this Free Datasets subpage.
  • Universidade de Stanford – Mining Massive Datasets – This class teaches algorithms for extracting models and other information from very large amounts of data. The emphasis is on techniques that are efficient and that scale well.
  • IBGE – DOWNLOADS – Canal que reúne os arquivos para download de todas as áreas do IBGE. Você também pode acessar os downloads mais frequentes da última semana.
  • IBGE – MICRODADOS – Pesquisa Mensal de Emprego – microdados consistem no menor nível de desagregação dos dados de uma pesquisa, retratando, sob a forma de códigos numéricos, o conteúdo dos questionários, preservado o sigilo das informações. Os microdados possibilitam aos usuários, com conhecimento de linguagens de programação ou softwares de cálculo, criar suas próprias tabelas. Os arquivos de microdados ora apresentados são acompanhados de uma documentação que fornece os nomes e os respectivos códigos das variáveis e suas categorias, a metodologia da pesquisa, e o instrumento de coleta.
  • INEP MICRODADOS – Acesso a microdados gerados pelo Inep – Estão disponíveis para consulta os microdados gerados por avaliações, pesquisas e exames realizados pela Inep. Os arquivos podem ser obtidos via download, em formato ASCII, e contêm inputs (canais de entrada) para leitura utilizando os softwares SAS e SPSS.
  • CIS – Consórcio de Informações Sociais – O Consórcio de Informações Sociais (CIS) é um sistema de intercâmbio de informações científicas sobre a sociedade brasileira. Tem como objetivo oferecer gratuitamente dados qualitativos e quantitativos resultantes de pesquisas sobre varios aspectos da vida social.
  • DATASUS – Informações de Saúde (TABNET) – O DATASUS disponibiliza informações que podem servir para subsidiar  análises objetivas da situação sanitária, tomadas de decisão baseadas em evidências e elaboração de programas de ações de saúde.
  • CEM – Centro de Estudos da Metrópole (CEM/Cepid) é uma instituição de pesquisa avançada em ciências sociais, que investiga temáticas relacionadas a desigualdades e à formulação de políticas públicas nas metrópoles contemporâneas.