誰でも簡単に分析環境構築 ~Anacondaセットアップ~

このエントリーをはてなブックマークに追加

こんにちは。データデザイン部でデータサイエンティストを担当しております。堀です。

我々データサイエンティストはプログラミング言語を活用し、データサイエンスを行っています。最近は品質の高いBIやAIモデル構築サービスが公開されているため、プログラムを書かずにデータサイエンスを行うことも可能です。しかし、公開されている分析サービスでは手軽に出来る反面、かゆいところに手が届かないケースがあります。

そこで、今回はデータサイエンティストが使用しているプログラミング環境の紹介とセットアップ方法をお伝えいたします。

 

もくじ

  • 使用するツールの説明
  • Anacondaセットアップ
    1. ダウンロード
    2. インストール
    3. 起動テスト
  • まとめ

使用するツールの説明

データサイエンティストがよく使用するプログラミング言語として「Python」と「R」があります。
よく、「PythonとRどちらがいいの?」と聞かれることがありますが、ケースバイケースです。データ分析においては基本的にどちらも同じことが表現できますが、それぞれ得意な分野が少し異なっています。

「Python」はシステム開発、機械学習やディープラーニングが得意です。特にディープラーニングに関しては「Python」でモデル作成を行っている場合がほとんどです。

「R」は統計学にとても強い言語になっています。「Python」は基本的な統計分析をするにも外部のライブラリを使用する必要がありますが、「R」は標準で統計分析の機能が実装されており、手軽に始めることができます。

私は、目的に応じて「Python」か「R」を使い分けていますが、分析を初めて行う方におすすめなのは、分析以外にも幅広く活用できることに加え、入門書籍や記事が数多く出ている「Python」です。

「Python」を実行する方法は数多くあります。その中でも今回は「Anaconda」というアプリケーションを使用して環境構築を行っていきます。この「Anaconda」は「Python」を実行できるだけではなく、データサイエンティストが普段活用しているPythonのライブラリが標準で内包されています。つまり、「Anaconda」をインストールすることで、データ分析を行う準備が整います。
また、プログラミングを行うための環境構築は手順が難しいことが多いのですが、この「Anaconda」はインストールするだけで簡単に環境ができるため、魅力の一つになっています。

Anacondaセットアップ

さっそくAnacondaのセットアップを行っていきます。AnacondaはWindows、macOS、Linuxと複数のOSに対応しているクロスプラットフォームの開発環境です。今回は、Windows(windows10 64bit)を対象にセットアップを行っていきますが、LinuxもmacOSも基本的には紹介内容と同じですので、お試しください。

1. ダウンロード

まずはブラウザからAnacondaをダウンロードしましょう。
https://www.anaconda.com/distribution/#download-section

「Windows」の「Python3.7 version」の「64-Bit Graphical Installer」か「32-Bit Graphical Installer」を選択してください。今回は、対象環境を64bitと想定して「「64-Bit Graphical Installer」を選択し、インストーラーをダウンロードします。
※ 実際はご自身のOSに対応した方(64-Bit か 32-Bit)を選択します。

2. インストール

次にダウンロードしたインストーラーを起動して「Anaconda」のインストールを行います。
起動を行うと以下の画面が出るので「Next」を選択します。

ライセンスが確認できたら、「I Agree」を押します。

インストールするユーザーを聞かれますが、「Just Me」で問題ないでしょう。「Just Me」が選択されていることを確認し、「Next」を押します。

インストール先を設定する必要があります。特にこだわりがなければ最初から入力されているものでも構いません。Destination Folderにインストール先を入力したら「Next」を押します。

次にインストールオプションの設定を行います。
ひとつめのチェックボックスは「Anacondaを環境変数のPATHに設定」、ふたつめのチェックボックスは「Python3.7を標準に設定」です。
よくわからない場合は2つにチェックを入れることをおすすめしますが、状況に応じて変更して構いません。チェックができましたら「Install」を押します。

しばらく待つと「Completed」と表示されるので「Next」を押し、「Finish」でインストールを完了します。

3.起動テスト

インストールが完了したら、次は実際にPythonが実行できるかテストしてみます。

Windowsのデスクトップの左下のスタートメニューを開くと「Anaconda 3(64-bit)」があり、その中に「Anaconda Navigator(anaconda 3)」があるので、起動します。
スタートメニューにない場合は、インストール場所をたどり、そこから起動します。

「Anaconda Navigator」を起動すると以下のような画面が出てくると思います。「OK」を押し、「Jupyter Notebook」の「Launch」を押してみましょう。

「Launch」を押すと、ブラウザが起動し、以下のような画面が出ます。これは自身のパソコンのフォルダやファイルの場所を表しています。

「Python」の実行を行うためには、プログラム言語を記述するファイルが必要になるため、以下の手順でファイルを作成します。
まず、画面右上の「New」を押すと「Python 3」、「Text File」、「Folder」、「Terminal」が出てきますが、「Folder」を選択し、任意の場所にフォルダを作成してください。

「Untitled Folder」という名前のフォルダが作成できたら、フォルダの名前を変更します。「Untitled Folder」の左側にあるチェックボックスにチェックを入れ、画面上部にある「Rename」を選択します。

「Rename」を選択すると、フォルダ名を変更するための画面が出てくるため、任意の名前をつけ「Rename」ボタンを押し、名前を変更します。名前が変更できたらそのフォルダをクリックし、フォルダの中に入りましょう。

フォルダの中に入れたら、「New」から「Python3」を押して、プログラム言語を記述するファイルを作成します。「Untitled.ipynb」というファイルができるので、クリックしてみてください。

次はファイル名の変更です。「Untitled.ipynb」をクリックして出た画面の左上に「Untitled」と書かれている場所があるので、クリックをすると、リネーム画面が出てくるので、任意の名前にリネームしましょう。

これで、「Python」を実行する準備ができました。
実際にプログラムを記述し、「Python」で実行してみます。

画面の四角い枠に「print(“hello world!”)」とすべて半角で記述します。
記述が終わったら画面上部にある「Run」をクリックしてみましょう。

クリックすると以下の画面のようになり、「hello world!」と出力されることがわかります。

 

以上で、「Anaconda」のセットアップは終了です。

まとめ

今回は「Anaconda」を活用した「Python」の環境構築を行いました。

様々な分析サービスが世の中にはありますが、やはり自由度の高いプログラミング言語は便利です。BIでの分析に物足りなさを感じる方やExcelでの集計に限界が来ている方は、今回セットアップした「Anaconda」を活用して、分析を行ってみてはいかがでしょうか?

何かご不明点がございましたら、お気軽にお問い合わせください
最後までご覧いただきありがとうございました。

12月が最終開催!データサイエンス基礎講座

過去80社以上の企業様のご参加、90%以上のご参加者様が満足(アンケート結果より)の実績。
半日集中セッションで基礎から体験までフルセットで学べる入門編として、データサイエンス基礎講座を毎月開催しております。

開催日・詳細を見る

WRITER
Takahito Hori

データサイエンティスト

堀 貴仁Takahito Hori

複数業界にてAI活用プロジェクトのデータアナリティクス、データサイエンスを担当。大手飲食店様・不動産会社様のAIモデル構築実績あり。

最新記事

ページTOPへ