Beginning AI

統計学・経済学・機械学習を用いて、ほんの少し。世界をもっと良くしてみたい。

機械学習に使える、オープンデータ一覧 ※随時更新

機械学習をやりたいんだけど、データがない!他のデータ使ってみたい! そんな方のために、機械学習に使えるオープンデータを集めました。

他にも、このデータセットオススメ!というものがあれば、是非ご紹介して頂けると嬉しいです。m(__)m

UC Irvine Machine Learning Repository

カリフォルニア大学アーバイン校が公開した、データセット。351件のデータセットがあり後述する DATA GO に比べれば少ないが、ほとんどがMachine Learning用のデータ・セットなので、かなりオススメ。

UCI Machine Learning Repository

かの有名なあやめの花(iris)のデータセットもここから見ることができます。

f:id:lasershow151:20161011231501p:plain

国立情報学研究所

情報学研究データリポジトリ データセット一覧

yahoo,楽天,ニコニコなどのデータがあります。

DATA.GO.JP

日本政府が、保有しているデータを公開したもの。

www.data.go.jp

ちなみに、一番人気は平成25年産野菜生産出荷統計らしい。

平成25年産野菜生産出荷統計 - DATA GO JP

DATA.GOV

DATA.GO.JPが参考にした、オープンデータサイト。こちらは、U.S. Governmentのデータになります。 現在、185,967 DATASETSという膨大なオープンデータを公開している。
※DATA.GO.JPは、17,105 件のデータを公開している。

www.data.gov

土地代データ

www.tochidai.info

日本全国の土地代と、その年間推移が載っています。

各種SNS

SNSAPIを公開しているので、それを利用してデータを取得できます。

Twitter

dev.twitter.com

Facebook

developers.facebook.com

Github

matome.naver.jp

参考

matome.naver.jp

DataSet - 機械学習の「朱鷺の杜Wiki」

openlabs.go.jp