【8月5日19時~21時半 ゼロから始めるデータサイエンス講習会@沖縄】

2016/08/05(金)19:00 〜 21:30 開催
ブックマーク

イベント内容

【8月5日(金)19時~21時半 ゼロから始めるデータサイエンス講習会@沖縄】

“沖縄で新しい産業を作りたい!” “沖縄で雇用創出したい”とのことで、沖縄の株式会社ヒューマンサポートさんとsettenlabさんに招かれ、東京で、定期的にデータサイエンスの講義をやっている、一般社団法人Bizjapan(http://bizjapan.org/en/)の鈴木瑞人(東京大学大学院博士課程1年)が、沖縄でデータサイエンスの講義を開催することになりました!

【データサイエンスとは何か?】
データサイエンス、と聞いても、大部分の人は、え?それって何?と思うかもしれません。「データサイエンス」とは「データ」を「サイエンス」する、ものです。さらにわかりやすくいいますと、「データ」を「解析」して、「ビジネス」や「研究」に生かすものです。
「データサイエンス」は「人工知能」とも呼ばれ、現在世界中のIT企業が注目し、その有望性のために、ものすごい金額のお金が投資されています。幅広いビジネスに適用でき、今までできなかった、顧客一人一人にきめ細やかなサービスを提供できるようになります。

【アメリカのデータサイエンス事情】
アメリカでは、データサイエンスの学位を持っていると、大学を卒業して初年時の給与は軽く1000万円を超えます。アメリカでは、学部でデータサイエンスを学ぶ大学が数多くあります。しかし、大学で生産するデータサイエンスをできる学生の数が足りず、例えば、Microsoft社は、自前で一般向けにデータサイエンスの講義を公開して、データサイエンティスト育成に乗り出しました。

【日本のデータサイエンス事情】
データサイエンスに特化した学部を持つ大学は、滋賀大学のみ。滋賀大学も、まだデータサイエンスの学部を設置したばかり。基本的に東京でも、学生のデータサイエンスへの興味は薄く、講習会を行っても、来るのは、大部分は社会人。日本の多くの企業もデータサイエンスや人工知能に手をだそうとしているものの、どう手を出していいかわからないのが現状のようです。いろいろな企業の方から相談を受けます。

【一般社団法人Bizjapanとは何か?】
東大・慶応・早稲田の大学生と大学院生からなる、学生団体で、2014年にサークルを一般社団法人化。AI、VRなど最新技術の講習会やコンテストを一般向けに行う、新産業育成事業と、海外の学生を日本に招待して、日本のベンチャー企業を訪問してもらい、日本の経済の伸びしろを知ってもらう企画を多数行っています。
【講義内容】
今回の講習会の内容は、大まかに、データサイエンス概略、多変量解析・機械学習概略、データ解析を行うためのツール比較(Excel、R、Python) 、R言語入門、多変量解析・機械学習の実行に最低限必要な統計知識、Rを用いたデータの可視化基礎、データの層別化、全変数での同時可視化、Rでの多変量解析実行、機械学習関数実行の解説を行います。

【目的】
学生向け:Rを使えるようになり、データの可視化、多変量解析・機械学習の概念を理解してもらい、自分でそれらのデータ解析ができるようになってもらい、論文の深い理解、データ解析まで考えた実験計画の作成をできるようになってもらう。
社会人向け:データの可視化、多変量解析・機械学習の概念を理解してもらい、一度それらを本講習会で自分の手で実行してもらい、データ解析の雰囲気と流れを理解していただく。今後データ解析をご自身で学んで実行するためのきっかけをつかんでいただく。
【日時】2016年8月5日(金)19:00-21:30
【会場】
浦添市の結の街
http://yuinomachi.jp/
浦添市勢理客4-13-1

以下イベント詳細となります。

【タイムライン】
18:30- 開場
19:00-19:15 主催者と共催者挨拶
19:15-19:45 データサイエンス・多変量解析・機械学習概要
19:45-19:50 質疑応答
19:50-20:20 多変量解析・機械学習の各種手法紹介
20:00-20:05 質疑応答
20:05-20:15 休憩
20:15-20:35 Rプログラミング基礎
20:35-21:00 Rを用いたデータの可視化(低級可視化関数、全変数の可視化、層別化)
21:00-21:30 Rによる多変量解析・機械学習の実践
21:30-21:35 質疑応答
21:35- 解散
※あくまでこのタイムラインは目安です。
※初めに各参加者の興味分野と今回参加したモチベーションを一人ひとりお聞きします。その内容によって各話題のボリュームを調整しようと思います。

【本レクチャーコースの特徴】
データの可視化のうち、層別化と、全変数の可視化を体系立ててしっかり教えられる人・書籍は現状かなり少なく、その部分の資料作成にかなりの時間を割いたので、特にデータの可視化に特徴があるコースです。

【対象者層】
・研究・ビジネスでデータ解析・機械学習を使いたい方。
・書店で機械学習関連の本たくさん買ってたくさん勉強したけど結局できるようにならなかった方。
・仕組みを詳しく知るより、とりあえずデータの集計・データ可視化・解析ができるようになりたい方。
・どういうデータからどんな情報が取り出せるか知りたい方。
・Rでのデータ解析の初歩を学びたい方
・機械学習に興味はあるがどこから勉強を始めてよいかわからない方
・データサイエンスのビックピクチャーを知りたい方
・実際に自分の手で一通りデータ解析ができるようになりたい方

【Rとは?】
 オープンソースで無償である高機能な統計ソフト。世界中のRユーザが開発したRプログラム(パッケージ)がCRAN(The Comprehensive R Archive Network)というネットワークにより提供されています。プログラミング初心者でも扱いやすく、Referenceが充実しています。Excelと比べデータ可視化のツールのレパートリーが圧倒的に豊富です。R言語によりプログラムを記述します。
【参加方法】
Doorkeeperでご登録ください。
【定員】
20名
【参加費】
学生 無料
社会人3000円
(当日受付にてお支払ください。Doorkeeperの価格表示は社会人用です。学生の方は当日学生証を受付にてご提示くだされば無料です。)

【当日の持ち物・必要なPCのスペック・必要なソフトウェア】
※ご自身のノートPCを必ずお持ちください。
【Windowsの方】
Windows 10推奨 (Xquartzのダウンロードは不要。Rだけダウンロードインストールお願いします)
※Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/bin/windows/base/
のDownload R 3.3.0 for Windows (62 megabytes, 32/64 bit)をクリックして、インストールを進めてください。
【Macの方】
Mac OSX(10.6以上推奨)
MacでXQuartzが入っていない場合、いくつか実行できないコマンドがあります。
※Windows環境とMac環境両方お持ちの場合は、Windowsを推奨します。
※Rを事前にダウンロードしてきてください(RStudioではありません)。
https://cran.r-project.org/
のR-3.3.0.pkgをダウンロード・インストールしてください。
XQuartz(Macのみ)が入っていない方いましたら、ダウンロードを事前に行ってください。
※XQuartzが入ってない場合、講習会の一部でコードが実行できないことがあることをご了承ください(講習会のごく一部で、GGallyパッケージとrglパッケージです)。
https://www.xquartz.org/
ダウンロード後、ユーティリティの中にあるx11をダブルクリックしてからRをで、コードをご使用ください。
(※当日のパソコン貸し出しは行いません。もし動作がうまくいかない場合、講義を聞くだけになります。その旨ご了承いただける方のみご参加ください。RはOSだけでなく各マシンの種類・設定によっても一部動作しない場合がありますが、それをご理解いただける方のみご参加ください)
・無線LAN搭載
・HDD空き容量1GB以上

【開発環境設定】
当日の運営を円滑に行うため、環境設定はできるだけご自身で事前に行ってください。
※RとRパッケージのダウンロード・インストールで生じたマシンのすべての不具合に関して運営側は責任を負いかねます。

【お願い】
当日、一部でネット環境を必要とします。会場のWi-Fi回線は混みあうことが予想されますので,お持ちの方はモバイルルーターなどをご持参ください(こちらでも用意しています)。
【講習会の満足度】
・満足 約50%
・やや満足 約30%
・普通 約15%
・やや不満 約2.5%
・不満 約2.5%
【参加者が感じた講義の難易度】
・やや難33%
・普通33%
・やや易しい22%
・易しい12%
【参加者が感じたハンズオンの難易度】
・やや難11%
・普通33%
・やや易しい44%
・易しい12%
【講義の内容について参加者のご感想】
・5時間だけど濃かった。
・今後のためのよいインデックスとなった。
・初期の段階でまずデータを眺める時に、もっとスピーディにスマートにカラフルにグラフィック表示で特徴量やdfの特性を把握したいとモヤモヤしていました(Rのグラフィックは面倒と思ってた)のが解消されました。膨大な資料もありがとうございます。レファレンスに使えます!
・文系出身で高校数学の統計(数Ⅱ)もやっていない私には、基本的な単語もおぼつかない状況ではあったのですが、意外と理解できてすごく良かったです。 もちろん分からない言葉・概念も多々あったのですが、そういう分からなさ含めて良い体験でした。
・入門としてはちょうど良かった。
・講義の評価を「やや難しい」としましたが、普通に考えると難解かつ広範囲な学習の成果をシンプルにまとめていただいていたので、実のところは全然難しい感じを受けなかったですし、それってすごいことなんだろうなと思いました。
・文系出身者でも一分野の奥深い世界にコミットできる一端に入り込める余地があった。
・多変量解析が重要であることがよく分かった。

・やや早口でちょっと大変だった。→改善努力はします。。
・ボリュームはやや多いけど、それはありがたいことでもあるので良かった。
・分析手法そのものを使う前の処理(型の変換や正規化など)がもう少しあるとよいと思った。
・私はこれまでデータ解析に携わっていなくかったが、データの可視化と様々な分析法について分かりやすく解説されていたため、非常に理解しやすかった。また、それぞれの解析法がどのような場面で使えるかが示されており、実際の解析のイメージがしやすかった。
・数学や統計に関する知識がゼロのためそれぞれの単語の意味や使い方はわからなかったが、データの可視化や分析に関する多くの知識をまとめて得られたのがよかった。
・5章が駆け足でなかなか理解出来ませんでした。→改善努力します。
【ハンズオンの内容についてご感想】
・データの可視化方法に関して教えて頂き、デモデータをもとに進めるという流れで時間のロスも少なくて良かったです。これを自分の思い通りに使いこなせるようになると楽しくなるだろうと思いました。
・コピペでも対応できるようになっていたのは親切だと思った。
・実際に何度も手を動かすことでRに慣れることが出来た。
・スキルに個人差があるため、躓く人は多かったが、ある程度無視して進めたのが良かった。
・インストールしたRのシステムエラーこそあったものの、独学で学んでいた頃に比べて、「このようにシンプルに解析・グラフィクスができる」のを身を持って実感できた。
・解析のためのグラフィックの作成手法を学ぶことができ、とてもためになった。Rは独学で学んだことがあるが、可視化の手法について、このハンズオンより分かりやかったものはなかった。
・コピーも出来て良かった、ちょっとボリュームが多い感じがしたので、絞ってテーマを深掘りするのもありかと思います。
・コピペまで落とし込んでいただいて、遅れることなくついて行けました。
【イベント全体に関するご感想】
・結果を出すことを考えると簡単であるが、やはり解析とかの裏側がわからないとやや難しいなと感じた。
・とてもよかったです。非常にわかりやすかったし、新しい発見も多く、また基本だからこそ「あ、こういうやり方と考え方もあるのか!」という場面が多々ありました。 今回の講義の手法をもとに、もう少し次のレベル(例えば、モデルのチューニングや、Feature Engineeringに特化した超地味な講義があると面白いだろうな、とは期待しています。ありがとうございます。
・とても良かったです。 業務経験のみでデータサイエンスなんて全くの門外漢の私が、統計・解析の基本スキルを勉強でき、ツールで実際に操作できて、いろんなことを知ることができました。 データサイエンスの分野に対して以前と比べて格段にかなり近くなれた気がします。
・オーディエンスのレベルがばらついているのが難しいなと思いました。
【講師紹介】
鈴木瑞人(東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 博士課程1年)
2014年3月東京大学理学部生物学科卒業
2016年3月東京大学大学院新領域創成科学研究科 メディカル情報生命専攻 修士課程卒業
【お問い合わせ先】
bizjapan.org@gmail.com
【共催】
株式会社ヒューマンサポート様(http://humansupport-okinawa.co.jp/)
settenlab様(http://settenlab.jp/)
【主催】
一般社団法人Bizjapan(http://bizjapan.org/en/)

注意事項

※ こちらのイベント情報は、外部サイトから取得した情報を掲載しています。
※ 掲載タイミングや更新頻度によっては、情報提供元ページの内容と差異が発生しますので予めご了承ください。
※ 最新情報の確認や参加申込手続き、イベントに関するお問い合わせ等は情報提供元ページにてお願いします。