Veri Madenciliğinde kullanılan Veri Setleri
- Bağlantıyı al
- X
- E-posta
- Diğer Uygulamalar
Dinamik görsel grafikler ile Google Public Data şu an da en iyisi değil ancak iddialı bir sitedir.
Google Public Data ile benzer özelliklere sahip bir veri tabanı olan Tableau Public ücretsiz bir uygulamadır.
Veri Tabanları
- KDD Cup center, tüm verilerinizi, görevlerinizi ve sonuçları sunar.
- UCI KDD Database Repository, makine öğrenme ve bilgi keşfi araştırmaları kullanılan büyük veri kümeleri için veritabanı deposudur.
- UCI Machine Learning Repository.
- AWS (Amazon Web Services) Public Data Sets, bulut tabanlı uygulamaları entegre edilebilir ve kamusal veri setlerini merkezi bir havuzda kullanıcıya sunar.
- Canada Open Data, birçok hükümet ve coğrafi veri setlerini bu pilot proje ile elde etmek mümkündür .Data Source Handbook, A Guide to Public Data, by Pete Warden, O’Reilly (Jan 2011).
- Data.gov.uk, Birleşik Krallık’tan kamuya açık veri tabanı (bakınız London datastore)
- Data.gov/Education, yüksek değerli veri setleri, veri görselleştirme araçları, sınıf için kaynak, açık veri ve daha oluşturulan uygulamalar dahil olmak üzere eğitim veri kaynakları için merkezi bir kılavuz.
- DataMarket, 100 milyon BM zaman serisi, Dünya Bankası, Eurostat ve diğer önemli veri sağlayıcıları ile birlikte, dünya ekonomisinin, toplumlar, doğa ve sanayi verileri grafikleri ile birlikte sunmaktadır.
- Datamob, Kamu verileri.
- DataSF.org, City & County of San Francisco, CA mevcut veri setleri.
- DataFerrett, birçok ABD Hükümeti’nin online olarak sunduğu bir veri madenciliği aracı.
- EconData, ABD devlet kuruluşları tarafından üretilen ekonomik zaman serisinin verileri.
- Enron Email Dataset, yaklaşık 150 kullanıcıların verileri.
- FEDSTATS, ABD istatistikler ve daha kapsamlı bir kaynak.
- Financial Data Finder at OSU, Finansal Veri Bulucu, finansal veri setlerinin geniş bir katalog.
- GEO (GEO Gene Expression Omnibus), bir gen ekspresyonu / MIAME uyumlu veri gönderimleri destekleyen moleküler depo ve gen verileri tarama, sorgu ve erişim için online bir kaynak.
- GeoDa Center, coğrafi ve mekansal veri.
- Google ngrams datasets, Google tarafından taranan milyonlarca kitap metin.
- Grain Market Research, Hisse senetleri, vadeli vb. dahil finansal veriler.
- Hilary Mason research-quality Big Data sets birçok metin ve görüntü veri setleri.
- ICWSM-2009 dataset veri kümesi 1 Ağustos ve 1 Ekim 2008 tarihleri arasında yapılan 44 milyon blog yazılarını içeriyor.
- Infochimps, veri için bir açık katalog ve pazar.
- Investor Links, finansal veriler içerir.
- Kevin Chai list of datasets, metin için veri listesi, SNA, ve diğer alanlar.
- KONECT, Koblenz Ağ Koleksiyonu ile ağ madencilik alanında araştırma yapmak üzere her türlü büyük ağ veri setleri içerir .
- Linking Open Data herkesçe özgürce kullanılabilen veri tabanı.
- Million Song Dataset
- MIT Cancer Genomics gene expression datasets and publications, Genomu Araştırma MIT Whitehead Merkezi’nden MİT Kanser Genomik gen ekspresyonu veri setleri ve yayınlar.
- ML Data, AB Pascal2 ağlarının veri deposu.
- NASDAQ Data Store, piyasa verilerine erişim sağlar.
- National Government Statistical Web Sites, Milli Hükümeti İstatistik Web Siteleri, veri, Afrika, Avrupa, Asya ve Latin Amerika ülkeleri dahil yaklaşık 70 web siteleri, raporlar, istatistik yıllıkları, basın bültenleri ve daha fazlasını içerir.
- National Space Science Data Center NASA’nın verileri gezegen keşfi, uzay ve güneş fiziği, yaşam bilimleri, astrofizik, ve daha fazlasını içerir.
- OpenData from Socrata, iş, eğitim, hükümet ve eğlence dahil olmak üzere 10.000 ‘den fazla veri kümelerine erişim sağlar.
- Peter Skomoroch dataset Bookmarks
- PubGene(TM) Gene Database and Tools, genomik ilgili yayınlar veritabanı
- Robert Schiller data Konut, borsa vb. veriler içerir.
- SMD: Stanford Microarray Database, mikroarray deneyler ham ve normalleştirilmiş verileri saklar.
- SourceForge.net Research Data, Araştırma Verileri, yaklaşık 100.000 projelerde ve proje yönetimi web sitesi az 1 milyon kayıtlı kullanıcıya ‘faaliyetleri üzerinde tarihi ve durum istatistikleri içerir.
- StatLib, CMU Kümeleri Arşiv.
- STATOO Datasets part 1 ve STATOO Datasets part 2
- Time Series Data Library
- Visual Analytics Benchmark Repository.
- UCR Time Series Data Archive, UCR Zaman Serisi Veri Arşivi, veri setleri, kağıtları, bağlantılar, ve kod sunuyor.
- United States Census Bureau ABD Sayım Bürosu.
- Wikiposit, kullanıcılar farklı kaynaklardan gelen verileri birleştirme sağlayan bir (sanal) birleşmesi (çoğunlukla mali) birçok farklı sitelerden veri elde etmektedir.
- Yahoo Sandbox datasets veri setleri, Dil, Grafik, Tavsiyeleri, Reklam ve Pazarlama, Rekabet
- Yelp Academic Dataset, öğrenciler, akademisyenler ve araştırmacılar için 30 üniversite ve 250’ye yakın işletmelerin tüm verileri ve değerlendirmelerini içerir.
- Bağlantıyı al
- X
- E-posta
- Diğer Uygulamalar
Yorumlar
Yorum Gönder