SHOYAN BLOG

機械学習ことはじめ

機械学習をやるぞ!と息巻いてから半年が経とうとしている。
進捗はてんでダメ。ほとんど勉強せずに時間だけが過ぎてしまった。
さすがにこれではいけないと学習を始めた。

とりあえず学ぶにも何かしらの教材がないと効率が悪いと思い、基礎的な理論が勉強できそうな 「機械学習理論入門」を買った(半年前に)。
機械学習の理論を優しく書いてあるはずなのだが、高校数学の理解もままならない自分の数学力では理解に苦しみ、本棚の肥やしとなっていた。
この段階では機械学習にも色々種類があるんだなということがわかった。

次に機械学習理論の入門としてわかりやすそうなやる夫シリーズを読みだした。

まずは最小二乗法についての話が出てきた。
これはそれとなく理解できたので、最小二乗法を使って誤差を求めるプログラムをRubyで実装してみたりもした。

しかし、最急降下法でつまづいてしまった。
最急降下法に出てくる合成関数の微分がよく分からない

そもそも合成関数ってなんだというところで、合成関数について勉強した。
合成関数は関数の引数が関数になっている関数だった。

関数: y=g(x)
合成関数: y=g(f(x)) ←こういう感じで引数が関数となっている

やる夫シリーズを理解するには微分の知識が必要だということがわかったので、微分について勉強するために数学ガールを読んでいる。微分について会話形式で学んでいけるので、なかなかわかりやすい。

というところで、現状は微分を学んでいる。

だいぶ遠回りしている感がある。
道のりは険しい。

Railsで日付をいい感じ(スラッシュ区切り)に表示する

日付は日本だと /(スラッシュ)区切りが一般的なのでそのように表示したい。
しかし、RailsでDateオブジェクトやDateTimeオブジェクトを表示すると以下のような感じになってしまう。

1
2
3
4
5
pry(main)> Date.today.to_s
=> "2016-11-10"

pry(main)> DateTime.now.to_s
=> "2016-11-10T17:47:01+09:00"

strftimeメソッドで書式を指定すれば良いのだが、面倒だしイケてないように感じる。

Rails国際化APIのI18nにまさにというメソッドがあったので紹介する。
その名もlocalizeメソッドだ。
localizeメソッドはDateオブジェクトやDateTimeオブジェクトを現地のフォーマットに変換する。

1
2
3
4
5
pry(main)> I18n.localize(Date.today)
=> "2016/11/10"

pry(main)> I18n.localize(DateTime.now)
=> "2016/11/10 18:05:04"

ちなみにlocalizeの省略形で l というエイリアスが用意されている。

1
2
3
4
5
pry(main)> I18n.l(Date.today)
=> "2016/11/10"

pry(main)> I18n.l(DateTime.now)
=> "2016/11/10 18:07:24"

PHPUnitの後処理でテーブルをTRUNCATEする

PHPUnitでテスト用のレコードを作成するのだが、テストで作成したレコードが残ってしまい再度テストを行うと失敗するという現象に遭遇した。

以下のようにAppTestCase を作成してカスタマイズしている。
setup() メソッドで datasets ディレクトリにymlファイルがあればその内容でデータを作成している。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
class AppTestCase extends PHPUnit_Extensions_Database_TestCase
{
    static private $_pdo = null;
    private $_conn       = null;
    private $_dataSet;
    private $_obj;

    protected function setUp()
    {
        $fixturePath = 'datasets/' . get_class($this) . '/' . $this->getName() . '.yml';
        if (file_exists($fixturePath)) {
            $this->_dataSet = new PHPUnit_Extensions_Database_DataSet_YamlDataSet($fixturePath);
        } else {
            $this->_dataSet = new PHPUnit_Extensions_Database_DataSet_DefaultDataSet();
        }
        parent::setUp();
    }

    public function getConnection()
    {
        if ($this->_conn === null) {
            if (self::$_pdo == null) {
                self::$_pdo = new PDO(DB_DSN, DB_USER, DB_PASSWD);
            }
            $this->_conn = $this->createDefaultDBConnection(self::$_pdo, DB_DBNAME);
        }
        return $this->_conn;
    }

    public function getDataSet()
    {
        return $this->_dataSet;
    }
}

PHPUnitのドキュメントにはTRUNCATEが実行されると書いてあるが、TRUNCATEはテストデータが作成される前に行われるので最後に作成されたレコードは残ってしまう。

MySQLサーバのクエリログは以下。
ドキュメント通りデータが作成される前にTRUNCATEが実行されている。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
2016-11-08T07:47:26.906619Z        26 Connect   root@192.168.75.91 on app_test using TCP/IP
2016-11-08T07:47:26.907174Z        26 Query     SET NAMES 'ujis'
2016-11-08T07:47:27.136497Z        27 Connect   root@192.168.75.91 on app_test using TCP/IP
2016-11-08T07:47:27.248506Z        28 Connect   root@192.168.75.91 on  using TCP/IP
2016-11-08T07:47:27.249034Z        28 Init DB   app_test
2016-11-08T07:47:27.256189Z        28 Init DB   app_test
2016-11-08T07:47:27.256837Z        28 Query     select * from users
2016-11-08T07:47:27.258065Z        28 Init DB   app_test
2016-11-08T07:47:27.258473Z        28 Init DB   app_test
2016-11-08T07:47:27.331138Z        27 Query     SET FOREIGN_KEY_CHECKS = 0
2016-11-08T07:47:27.331548Z        27 Query     TRUNCATE `users`
2016-11-08T07:47:27.349437Z        27 Query     SET FOREIGN_KEY_CHECKS = 1
2016-11-08T07:47:27.349922Z        27 Query     SHOW COLUMNS FROM `users`
2016-11-08T07:47:27.350848Z        27 Query     SHOW INDEX FROM `users`
2016-11-08T07:47:27.351590Z        27 Query     INSERT INTO `users`
                (`account_id`, `domain`, `created_at`)
                VALUES
                ('1', ‘example.com', '2016-11-02 18:40:10')
2016-11-08T07:47:27.354645Z        28 Init DB   app_test
2016-11-08T07:47:27.355089Z        28 Init DB   app_test
2016-11-08T07:47:27.355386Z        28 Query     select * from users
2016-11-08T07:47:27.360299Z        26 Quit
2016-11-08T07:47:27.391481Z        27 Quit
2016-11-08T07:47:27.431965Z        28 Quit

テストを実行した後にTRUNCATEするには getTearDownOperation メソッドを追加する。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
class AppTestCase extends PHPUnit_Extensions_Database_TestCase
{
    static private $_pdo = null;
    private $_conn       = null;
    private $_dataSet;
    private $_obj;

    protected function setUp()
    {
        $fixturePath = 'datasets/' . get_class($this) . '/' . $this->getName() . '.yml';
        if (file_exists($fixturePath)) {
            $this->_dataSet = new PHPUnit_Extensions_Database_DataSet_YamlDataSet($fixturePath);
        } else {
            $this->_dataSet = new PHPUnit_Extensions_Database_DataSet_DefaultDataSet();
        }
        parent::setUp();
    }

    public function getConnection()
    {
        if ($this->_conn === null) {
            if (self::$_pdo == null) {
                self::$_pdo = new PDO(DB_DSN, DB_USER, DB_PASSWD);
            }
            $this->_conn = $this->createDefaultDBConnection(self::$_pdo, DB_DBNAME);
        }
        return $this->_conn;
    }

    public function getDataSet()
    {
        return $this->_dataSet;
    }

    // テスト後にテーブルをTRUNCATEする
    public function getTearDownOperation()
    {
        return PHPUnit_Extensions_Database_Operation_Factory::TRUNCATE();
    }
}

あとは各UnitTestのtearDownメソッドで parent::tearDown() を実行する。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
<?php
class SampleTest extends AppTestCase
{
    public function setUp()
    {
        parent::setUp();
    }

    public function tearDown()
    {
        parent::tearDown();
    }
    .....
}

以下が変更後のMySQLのクエリログだ。
最後にTRUNCATEが実行されている。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
2016-11-08T08:43:49.367260Z       120 Connect   root@192.168.75.91 on app_test using TCP/IP
2016-11-08T08:43:49.367966Z       120 Query     SET NAMES 'ujis'
2016-11-08T08:43:49.626685Z       121 Connect   root@192.168.75.91 on app_test using TCP/IP
2016-11-08T08:43:49.743978Z       122 Connect   root@192.168.75.91 on  using TCP/IP
2016-11-08T08:43:49.744418Z       122 Init DB   app_test
2016-11-08T08:43:49.751453Z       122 Init DB   app_test
2016-11-08T08:43:49.752239Z       122 Query     select * from users
2016-11-08T08:43:49.758493Z       122 Init DB   aap_test
2016-11-08T08:43:49.759944Z       122 Init DB   app_test
2016-11-08T08:43:49.760656Z       122 Query     select * from users
2016-11-08T08:43:49.828928Z       121 Query     SET FOREIGN_KEY_CHECKS = 0
2016-11-08T08:43:49.829372Z       121 Query     TRUNCATE `users`
2016-11-08T08:43:49.852672Z       121 Query     SET FOREIGN_KEY_CHECKS = 1
2016-11-08T08:43:49.853435Z       121 Query     SHOW COLUMNS FROM `users`
2016-11-08T08:43:49.854605Z       121 Query     SHOW INDEX FROM `users`
2016-11-08T08:43:49.855462Z       121 Query     INSERT INTO `users`
                (`account_id`, `domain`, `created_at`)
                VALUES
                ('1', ‘example.com', '2016-11-02 18:40:10')
2016-11-08T08:43:49.863268Z       122 Init DB   app_test
2016-11-08T08:43:49.864301Z       122 Init DB   app_test
2016-11-08T08:43:49.864678Z       122 Query     select * from users
2016-11-08T08:43:49.869473Z       121 Query     SET FOREIGN_KEY_CHECKS = 0
2016-11-08T08:43:49.869882Z       121 Query     TRUNCATE `users`
2016-11-08T08:43:49.885689Z       121 Query     SET FOREIGN_KEY_CHECKS = 1
2016-11-08T08:43:49.888006Z       120 Quit
2016-11-08T08:43:49.914728Z       121 Quit
2016-11-08T08:43:49.941933Z       122 Quit

StudyPlusを使った英語の勉強をはじめて5ヶ月目の記録

StudyPlusに英語の勉強を記録し始めて5ヶ月。
幸運なことに継続して学習を続けることができている。

勉強時間は128時間(累計)。
覚えた単語数は4600。
前回が3500だったので1ヶ月で1100、語彙数が増えた。
だんだん単語が覚えやすくなってきた感じがしている。

前回から変わった点としては洋書を読み始めたことがあげられる。
Kindle Unlimitedを契約したので、洋書の入手に事欠かなくなったからだ。

最近読んだのは以下の本。
英語の効果的な勉強法を英語で勉強できるので1粒で2度おいしい。

Kindle Unlimitedは洋書が132万冊あるので、これから存分に活用させてもらうつもりだ。
ちなみにLearn Englishによると、知っている映画の本を読むのがリーディングに最適だそうだ。

また、洋画を観ることも始めた。
こちらはまだ習慣化するところまで至っていないが、基本的には同じ映画のセリフを覚えるまで何回も繰り返し観るということをやろうと考えている。
題材はThe Devil Wears Plada(プラダを着た悪魔)だ。
これにした理由はニューヨークを舞台とした映画が良いと思っていて(これについては完全なる好みの問題)たまたま手元にあったのがプラダを着た悪魔だった。

過去の英語の勉強記録

Slackで定期的にRubotyに仕事をさせる

ChatOpsの一環としてSlackにRubotyを常駐させているのだが、Rubotyに定期的にタスクを実行させたいことがあった。
最初はruby-cronを使ってみたのだが、Slackだとうまく動かなかった。
具体的にはジョブの登録はできるのだがジョブの実行(通知)がされない。

うまくいかなかったのでSlackのリマインダー機能を使ってみることにした。
Slackのリマインダー機能を使うと Reminder: と言うプレフィックスが入るのでRubotyが反応せず、こちらもうまくいかなかった。

最終的にはcronでスクリプトを定期実行させることにした。
Slackに通知するスクリプトを作って、それをcronで定期的に実行させる。
メッセージを拾ったRubotyがタスクを実行するといった感じだ。

サンプルコード

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
require "faraday"

username = 'your name'
channel = 'your channel'
slack_token = 'your slack token'
icon_url = 'your icon url'

body = {
  username: username,
  channel: channel,
  icon_url: icon_url,
  text: "ruboty ping"
}

Faraday.new('https://slack.com') do |c|
  c.request :url_encoded
  c.adapter Faraday.default_adapter
end.post("/api/chat.postMessage?token=#{slack_token}", body)

これでRubotyに定期的に仕事をさせることができるようになった。