Jusqu'à présent, des grandes entreprises de puce verte à un très petit esprit d'entreprise, vous pouvez utiliser plus de données que jamais. Beaucoup de mes clients les recherchent pour voir les principales sources de données pouvant être utilisées lorsqu'elles travaillent fort pour les grandes données. La section suivante décrit maintenant maintenant certaines d'entre elles sont faciles à utiliser.
1. DATA.GOV http://data.gov/
Le gouvernement américain a promis de mettre en œuvre toutes les données de gouvernement en ligne gratuites. Ce site est la première étape, en tant que portail, y compris une grande information du climat aux criminels.
2. Le département de la population américaine http://www.census.gov/data.html
Une riche information sur la vie de ces citoyens américains, y compris la population données, données régionales et éducation.
3. Le portail ouvert de l'Union européenne http://open-data.europa.eu/en/data/
selon la description ci - dessus, mais elle basée sur Données européennes de l'organisation syndicale.
4. Data.gov.uk http://data.gov.uk/
Données du gouvernement britannique, y compris la "bibliigraphie britannique" tous les livres et métadonnées d'Angleterre et de métadonnées de publications depuis 1950.
5. Aperçu du monde émotionnel HTTPS://www.cia.gov/L Bibliothèque / Publications / The-World-Fastbook /
267 Histoire nationale, Population , économie, gouvernement, infrastructures et informations militaires.
6. HealthData.gov https://www.healthdata.gov/
Données de soins de santé chinois, y compris les données d'assurance maladie requises, épidémiologie et données démographiques traduites.
7. Centre d'information sur les informations sur la santé et la santé NHS http://www.hscic.gov.uk/home
Données sur l'état de santé Conformité aux services médicaux nationaux britanniques.
8. Set de la fonction publique de la fonction publique d'Amazon http://aws.amazon.com/datas
d'énormes sources de données publiques, dont 1000 Projet de généting, essayez de mettre en place l'installationU NASA la plus complète d'informations génétiques et de la base de données d'images satellites.
9. Tableau Facebook https://developers.facebook.com/docs/graph-apiBien que plus d'informations sur les utilisateurs de Facebook soient privées, mais beaucoup de gens ne sont pas - Facebook fournit un Way pour une API de graphique afin d'interroger davantage d'informations et que ses utilisateurs sont heureux de partager avec le monde (ou s'ils ne sont pas cachés car ils n'ont pas mis en place des fonctions privées).
10. Gapminder http://www.gapminder.org/data/
Organisation mondiale de la santé et collecte de données de la Banque mondiale, y compris la santé des Kinh, les soins médicaux et les statistiques sociales.
11. Google Google Trend http://www.google.com/trends/exploreRecherche Tous les mots-clés (nombre total) depuis 2004 Statistiques de données de milliards de niveaux de recherche).
12. Google Finance https://www.google.com/finance
40 ans Données boursières et mises à jour en temps réel.
13.Google Books ngramshtp: //storage.googleapis.com/books/grams/books/dataasv2.html
Des millions de texte intégral des livres numériques, dans le cadre de la partie du projet de livre Google .
14. Centre national de données climatiques http://www.ncdc.noaa.gov/data-access/quick-links#Loc-Clim
Du matériel diabolique de l'United L'environnement des États collecte des centres, des météorologies et des ensembles de données climatiques. Stocker les plus grandes données météorologiques du monde.
15. dbpedia http://wiki.dbpedia.org
Wikipedia contient des millions de données, structurées et non structurelles. DBPEDIA est une grande technique classée et créée un public, publiée gratuitement et permet à quiconque d'analyser la base de données de ces données.
16. Topsy http: /topsy.com/
Les données de médias sociaux gratuites et complets sont très difficiles - après tout, ces données sont pour les gros joueurs (Facebook, Twitter, etc. ) sont rentables, alors ils ne veulent pas cunG délivré à tout le monde facilement. Toutefois, TOPSY permet de rechercher un micro-blogging public en 2006 et maintenant certains outils sont utilisés pour analyser les sessions.
17. Likebutton http://ikebutton.com/
De votre propre réseau, vous pouvez apprendre de votre propre réseau. Chaque fois que tout le monde "aime" quelque chose.
18. NEW YORK Times "New York Times" http://developer.nytimes.com/docs
L'indice de fichier pour d'éventuels articles d'actualités exécutez à nouveau 1851.
19. Freebase http://www.freebase.com/
Une base de données communautaire pour des données structurées sur les personnes, l'emplacement et les choses, plus de 45 records dix mille.
20. Million Données de la chanson http://aws.amazon.com/datas/6468931156960467
Super données pour plus d'un million de chansons et d'œuvres de musique. Partie est un service de réseau Amazon.