ラベル 機械学習 の投稿を表示しています。 すべての投稿を表示
ラベル 機械学習 の投稿を表示しています。 すべての投稿を表示

2016年5月20日金曜日

C言語で学ぶ機械学習:『機械学習と深層学習』の要点(サンプルDL/電子版案内)

C言語だけで写経できる入門/処理手続きの理解に向く。深層の網羅性は限定的なので“実装で掴む”用途に最適

機械学習と深層学習 ―C言語によるシミュレーション


  • Q. サンプルコードはどこ?
    A. **オーム社公式の「ダウンロード」**にzip(約24KB)。本書購入者向け、著作権等の注意書きあり。 ohmsha.co.jp

  • Q. 正誤表はある?
    A. 公式記載「正誤表はございません」ohmsha.co.jp

  • Q. 電子版は?
    A. Amazon Kindle/達人出版会/BookWalkerなどで入手可(試し読みありのサイトも)。 Amazon Japan達人出版会電子書籍ストア | BOOK☆WALKER


  •  

     

    ・ソースコードはこちら



    2016年5月18日水曜日

    『強くなるロボティック・ゲームプレイヤーの作り方』復刊|C++で学ぶ実践的強化学習[プレミアムブックス版]サンプルDL案内つき

    2008年刊の名著『強くなるロボティック・ゲームプレイヤーの作り方』がプレミアムブックス版として2016年に復刊。C++でロボット/ゲームAIに強化学習を実装する実践書です。著者は八谷大岳・杉山将。紙版・電子版あり、サンプルコードはマイナビのサポート/商品ページから入手できます(発売日:2016/06/08、ISBN:978-4-8399-5673-8)。

    強くなるロボティック・ゲームプレイヤーの作り方 プレミアムブックス版 ~実践で学ぶ強化学習~ 


    • C++によるロボット強化学習
    • サンプルソースのダウンロードはこちら

    追記:よくある質問(FAQ)

    Q. 復刊で内容は変わりましたか?
    A. 基本内容は2008年版と同一で、プレミアムブックスとして再刊されています。
    Q. 使用言語は? Pythonでも学べますか?
    A. 本書の実装はC++中心です。概念は他言語にも応用できますが、サンプルはC++です。
    Q. サンプルコードはどこで入手できますか?
    A. 出版社の商品/サポートページからダウンロードできます(販売サイトの案内を参照)。
    Q. 電子版(eBook)はありますか?
    A. あります。販売状況は各ストア(出版社サイト、Amazon等)でご確認ください。
    Q. どんな人に向いていますか?
    A. C++で強化学習を実装してみたい初中級者〜実務者、ロボット制御やゲームAIに関心のある方。
    Q. 具体的に何が学べますか?
    A. 強化学習の基礎からアルゴリズム、ロボット/ゲームエージェントへの実装手順までを通しで学べます。
    Q. 事前に必要な知識・環境は?
    A. C++の基礎、確率・線形代数・微積の初歩。標準的なC++コンパイラ/IDE(GCC/Clang/Visual Studio等)。
    Q. 価格や在庫は?
    A. 変動するため、最新情報は出版社ページや通販サイトでご確認ください。

    主要トピック(各1行)

    • MDP:状態・行動・遷移・報酬で問題を定式化する土台。

    • 動的計画法:モデル既知前提で価値・方策を反復更新して最適化。

    • モンテカルロ:エピソード平均で価値推定。モデル不要・高分散。

    • TD学習:1歩先の推定でブートストラップ更新。オンラインに向く。

    • SARSA:実行中の方策で更新するオンポリシー。安全寄り。

    • TD(λ):エリジビリティ痕跡で多段のTD誤差を混合。

    • Q学習:max行動で更新するオフポリシー。理論収束性が強い。

    • 近似(線形/カーネル):特徴表現で連続空間の価値関数を近似。

    • 政策勾配:方策を確率分布として直接最適化(REINFORCE等)。

    代表課題

    • 三目並べ:離散・完全情報で基礎検証に最適。

    • Mountain Car:連続状態で谷脱出。探索設計がカギ。

    • Acrobot:二重振子のスイングアップ。制御系の定番難題。