Public Data Sets on AWS
GAEとの比較でAWSを見ていたら、一般に公開されているデータセットのミラーをAWSでホスティングしていて、EC2から無償で利用できるんですね。
Public Data Sets on AWS
もちろん自分自身で使っている計算資源に対しては課金されますが、Public Data Sets on AWSの利用は課金されません。EC2とS3とかの内部トラフィックには課金されないので、外部アクセスによる課金は押さえられますし、自分でデータセットをS3とかに保管する経費も不要になります。
そして提供しているデータセットもすごいんですね。ぱっと見ただけでも:
- Wikipedia Extraction (WEX)
- Freebase Data Dump
- DBPedia
- GenBank
- Ensembl Annotated Human Genome Data
- 1980 US Census、1990 US Census 、2000 US Census
- Labor Statistics Databases
などなど。昔だと大規模な機関でなければ実現できないようなことも、個人レベルで実現できそうな。
あと最近話題の
も提供されています。