2016年5月12日木曜日

NiFiプロセサ紹介 ExecuteProcessとPutFile

ExecuteProcess
OSのシステムコマンドを実行して結果をFlowFileに出力する。
処理が長くなりそうな場合はBatch Durationに時間を設定するとその時間間隔で出力を分けてくれるのでテキストの出力の場合は活用してもいいかもしれない。

PutFile
ローカルのファイルシステムにFlowFileを書き込む。
DirectoryにFlowFileを書き込むディレクトリを設定する。

sample1は上記二つのプロセサを組み合わせて/tmp/nifi_tempディレクトリにデータを出力するテンプレートファイル
ExecuteProcessプロセサが"Hello"を引数としてEchoの実行を行い、PutFileプロセサがFlowFileの出力を行う。

※windowsでExecuteProcessを使用する場合は、commandをcmdとして引数に実際のコマンド( /c echo hello)などと打てば、動く
**************
ExecuteStreamCommand

図にするとこんな感じかな


やり方いろいろあるだろうがExecuteStreamCommandのCommand Pathにはシェルスクリプトやバッチファイルの場所を書いたほうが無難みたい。

***************
 GenerateFlowFile
 負荷テストなどの目的で利用できるランダムデータからなるFlowFileの生成が行える。
 File Size :生成したいファイルサイズ
 Data Format  :テキストかバイナリか選べる

sample2ではGenerateFlowFileプロセサが10KBのランダムな文字列からなるテキストファイルを2秒ごとに生成し、PutFileプロセサがFlowFileの出力を行う。
*************
GetHTTP
指定したURLに対してGETリクエストをかけて、取得したボディを指定した名前のFlowFileにする。

sample3ではHTTPGetプロセサがhttp://localhost:8080/nifiを呼び出し、結果をtest3.txtというファイルに保存する。念のためSchedule Durationを十日後に設定している。PutFileプロセサがFlowFileの出力を行う。
(SDKのバージョンによってエラーが出る場合があるため注意せよ)
*******

2016年5月11日水曜日

Apache NiFi ドキュメントリンク(最新版への導線+2.x対応メモ)


ドキュメント構成はこちら

Getting Started with Apache NiFi は初めてNiFiを使う人向けの「とりあえず動くの確認」用のチュートリアル
Apache NiFi User Guide はUIの操作を中心にNiFiでユーザーができることをガイド
Apache NiFi Expression Language Guide は属性値の判定や書き換えに使えるスクリプト言語の仕様書
 The NiFi Expression Language で属性値の参照したり別の値と比較したり加工したりできます。

NiFi System Administrator’s Guide はユーザーの管理を含むシステム管理者向けの技術資料
/nifi-api はNiFiをリモート操作できるRest APIの仕様
NiFi Developer’s Guide はProcessorを中心としたNiFiのコンポーネント開発のための解説書
Apache NiFi Development Quickstart はNiFi本体を開発したい人のためのクイックガイド
Example Dataflow Templates はデータフローのサンプルをtemplate形式でお送りしている

For Developers は開発者向けの情報(アーキテクチャーやバージョンルールなど)

hortonworks-gallery/nifi-templates はhortonworksによるtemplate集

Indexing Tweets with NiFi and Solr NiFiでツイッターから情報とるサンプル

***************
プロセサの設定について
・プロセサは指定されたスケジュールにしたがって実行される。選べるのは
Timer driven: ‘Run duration.’の間隔にしたがって実行
Event driven:イベントドリブンで仮実装中(一部のプロセサで実行可能)
CRON driven:CRONの仕組みにしたがる。
の三種類

追記:NiFi 2.x の重要メモ(旧記事からの補足)

  • Event-driven スケジューリングは 2.0 で削除
    1.x では一部プロセサで実験的に提供されていましたが、2.0 で除去されました。今後は Timer-driven または CRON-driven を利用します。Apache IssuesCloudera Documentation

  • XML テンプレートは廃止 → フロー定義(JSON)+レジストリ(NiFi Registry / GitHub/GitLab クライアント)
    既存テンプレートはフロー定義へエクスポートし、レジストリでバージョン管理に移行します。MediumCloudera DocumentationStackable Documentation

北斎漫画


  •  4000図1400ページがあなたのKindleに
  •  北斎壮年時の作品集(つーか、気ままに書いた絵)
  •  海外にも多大な影響を与える


2016年5月10日火曜日

Apache NiFi入門と活用ガイド|特徴・インストール・Expression Language徹底解説


Apache NiFi は、大量データの「収集・変換・転送」をノーコードで自動化できるオープンソース ETL/データフローツールです。本記事では NiFi の特徴とアーキテクチャ、Windows・Linux へのインストール手順、Expression Language の基礎、Kafka 連携など現場で役立つベストプラクティスを体系的に解説します。

Apache nifi

2016年5月7日土曜日

量子力学メモ

電子・物性系のための量子力学 デバイスの本質を理解する

 

  •  エネルギーという概念の重要性は、これが変換されることにあり、しかもその過程で常に保存されることにある

子どもは遊べなくなったのか―「気になる子ども」とヴィゴツキー=スピノザ遊び理論

子どもは遊べなくなったのか―「気になる子ども」とヴィゴツキー=スピノザ遊び理論

 

神谷栄司京都橘大学教授編纂の『子どもは遊べなくなったのか』(2011)によると、最近、ルールの下で勝ち負けを競う遊びをできない子どもたちが目につくようになっています。自尊感情と遊び

自覚なき殺戮者

スペシャリスト / 自覚なき殺戮者

 

 

  •  ミルグラムは閉鎖的な状況下での倫理性に関わる実験を行った
  • これはアイヒマン実験とも呼ばれている