計算機の知識は、データの前処理や機械学習のモデルの実装、データの可視化など、データサイエンスにおいて必要不可欠なものです。しかし、興味を持って調べているだとか、情報工学系に在籍しているだとかではない限り、事前に計算機の知識を学ぶ時間がなかなか取れないという方も多いのではないでしょうか。
電子計算機(いわゆるコンピュータ)による統計の処理には、統計学・数学的知識はもちろんのこと、コンピュータをうまく扱うためのアーキテクチャやアルゴリズム、特に大量のデータを扱うのであれば記憶装置、さらにはRDBなどソフトウェアの利用、さらには分析プログラムを書くための知識も必要になります。
本ウェブサイトでは、これらの知識を1ヶ月程度で簡単に学ぶことができるようになっています。また、本ウェブサイトの教材は、可能な限りオープンソースで公開されています。ぜひ、この教材を使って、データサイエンスのための計算機の知識を学んでいただければ幸いです。
原則として本ウェブサイト上で提供します。動画についてはYouTube、ニコニコ動画、Google Driveのいずれかで、Scratchなど外部WEBサービスで作成された教材についてはそのサービス上で提供される場合もあります。
教材の内容を概ねまとめたPDFおよびサンプルコードはご自由にダウンロードしていただくことが可能です。各教材に表示されたライセンスでご利用いただけます。
本ウェブサイトはGitHub上で展開しています。
もしあなたが概ね問題なくGitHubで貢献できるのであれば、mizphses/learn-computer-for-datascienceにて、IssueやPull Requestを立ててください。
また、間違いのご指摘などはメールでも受付可能です。mizphses@gmail.comまでお問い合わせください。ただし、回答は保証しません。