whyfields(ja) -- or Modern use of fields.pm and %FIELDS.
Modern Perl では、 perl で OOP 開発をする場合には Moose を使うよう 勧めて います。ですが、 yatt_lite は懐かしの fields を活用して書かれています。 ここでそのこだわりの理由を解説します。
(なお、ここでは読み易さのために perl5.14 以後の package Name {...}
構文を用います。古い perl で 試す場合は {package Name; ...}
へと書き換えて下さい)
fields は、 use strict
のスペルミス検査を オブジェクトメンバーへの参照/代入にも適用可能にするためのものです。
use strict; use 5.014; # For "package Name {block} syntax" package Cat { use fields qw/name birth_year/; # メンバー宣言 sub new { my Cat $self = fields::new(shift); # 型注記付き my $self->{name} = shift; # Checked! $self->{birth_year} = shift # Checked! // $self->_this_year; $self; } sub age { my Cat $self = shift; return $self->_this_year - $self->{birth_year}; # Checked! } sub _this_year { (localtime)[5] + 1900; } }; my @cats = map {Cat->new($_, 2010)} qw/Tuxie Petunia Daisy/; foreach my Cat $cat (@cats) { print $cat->{name}, ": ", $cat->age, "\n"; # print $cat->{namae}, "\n"; # コンパイルエラー! }
このプログラムではクラス Cat
にメンバー {name}
, {birth_year}
を宣言しています。 ですので、 Cat を格納すると注記した変数 $self
, $cat
でメンバー名を間違えても、 コンパイル時に エラーを検出することが出来ます。 (unit test を書くまでもなく、です。もし vim の perl mode や yatt-lint-any-mode のような、 ファイル保存と同時に perl -wc
検査 を行う仕組を使っていれば、 間違いに即座に気付けるでしょう)
use strict
の重要性は perl コミュニティに広く知れ渡っています。 なら fields の利用も広がってよさそうなのに、なぜ滅多に使われないのでしょう?
それには幾つかの理由が考えられます。
上記の例の Cat
程度の長さならともかく、 普通のクラス名は MyProject::SomeModule::SomeClass
のように長くなります。
my MyProject::SomeModule::SomeClass $obj = ...;
とは、普通の perl プログラマーは書きたくないでしょう。時々見掛けるスタイルとして
my __PACKAGE__ $obj = ...;
という書き方もありますが、依然として長過ぎます。
オブジェクトのユーザにメンバー変数を直接参照/代入させることは、 そもそも OOP のカプセル化の思想に逆行しています。ですから、 結局ユーザ向けに(なんらかの手段で)アクセサを作らねばなりません。 コンストラクタも同様です。
つまり、 fields を宣言しただけでは十分に使いやすいクラスにならないため、 結局 Class::Accessor などを使う羽目になるのです。 それなら最初からアクセサ作成用のモジュールだけ使おう、 と考えるのは自然なことでしょう。
fields が perl に導入されたのは perl5.005 に遡ります。 当時はメモリー効率のため、 HASH の代わりに ARRAY ベースのオブジェクトが 用いられました。メンバーは ARRAY 上のオフセットとして表現されました。 このため、多重継承は禁止とされました。
その後、 perl5.009 で fields::new
が本物の HASH を返すようになった後も、 多重継承を禁止する仕様が (互換性維持のため) 残ってしまいました。
なら Moose や Mouse 使う、が結論でいいじゃない? と思う人も多いでしょう。 でも、それは use strict
検査を一つ諦めることに他なりません。 メンバーアクセスの度に sub を呼ぶので速度も遅くなります。 (perl の sub 呼び出しは、それなりに重い操作です) 私から見れば、それは perl の強みを捨てて ruby や python の真似をする道 に見えます。外野から見れば、なら最初から ruby や python 使えば? と思ってしまうのではないでしょうか?
ここでもう少し、 fields
と strict
の組合せの可能性を見直して頂くため、 あまり知られていない事実を紹介します。
fields
works even for unblessed HASH!
fields と型注記によるメンバー名検査はコンパイル時に行われるため、 実行時にその変数に何が入っているかは、実は無関係です。これはつまり、 bless していない HASH にすらスペル検査を適用可能であることを意味します。 以下は PSGI の $env
を静的検査する例です。 ( YATT::Lite::PSGIEnv
の短縮版です)
use strict; use 5.012; { package Env; use fields qw/REQUEST_METHOD psgi.version/; # and so on... }; return sub { (my Env $env) = @_; given ($env->{REQUEST_METHOD}) { # Checked! when ("GET") { return [200, header(), ["You used 'GET'"]]; } when ("POST") { return [200, header(), ["You used 'POST'"]]; } default { return [200, header() , ["Unsupported method $_\n", "psgi.version=" , join(" ", $env->{'psgi.version'})]]; # Checked too! } } }; sub header { ["Content-type", "text/plain"] }
my TYPE
slot. 実は型注記の箇所にはフルスペルのクラス名以外に、定数関数を書くことが出来ます。 (参考: aliased)
ですので、
my MyProject::SomeModule::Purchase $obj = ...;
は
sub Purchase () {'MyProject::SomeModule::Purchase'} ... my Purchase $obj = ...;
と書き直すことが出来ます。 この程度のキータイプ量なら、我慢できる人も増えるのではないでしょうか?
また副次的なメリットとして、コンストラクタ呼び出し時のクラス名も短く出来る上に、 サブクラス側でオーバライドすることも可能になります。
... # Subclass can override ->Purchase(). my Purchase $obj = $self->Purchase->new(...); ...
%FIELDS
can be anything now.
fields は %FIELDS
の抽象化APIです。 perl の内部的には、コンパイル時検査はパッケージごとの %PKG::FIELDS
変数を用いて行われます。 perlのコンパイラーは、 my PKG $var
のようにスカラー変数の宣言に型注記がついていた場合、 定数をキーとする hash 要素参照 $var->{myfield}
や代入 $var->{myfield} = ...
の式を見付ける度に、 そのキー myfield
がその時点での %PKG::FIELDS
に含まれるかどうか検査します。 見付からない場合はエラーとしてコンパイルを中断します。
ところで、 %FIELDS
の value 側はどう使われるのでしょう? 実は、最近の perl 5.12, 5.14 では value には何が入っていても構わないようです。 ...ならば、ここにメンバーに関するメタ情報を含めるスタイルもあり得るのではないでしょうか?!
以上を踏まえて、あまり頑張らなくても strict のメリットを享受できる、 fields 活用スタイルを提案します。
まず始めに、外部と内部、クラスのユーザー側と、 そのクラスの中身を定義する側とを分けて考えることにします。
つまり、ユーザー側コードがオブジェクトの中身を直接参照/操作することは害が大きいですが、 それと比べてクラス定義本体の中でアクセサ関数を使うメリットは、 せいぜいフックやデフォルト値を持ちやすくなること程度です。 むしろアクセサのスペルミスが実行時まで検出されないことのデメリットの方が 大きいのではないでしょうか?
my $foo = new Foo(width => 8, height => 3); $foo->{width} * $foo->{height}; # Evil! package Foo { use fields qw/width height/; sub area { my Foo $self = shift; $self->{width} * $self->{height}; # No problem. } };
ですので、 fields + strict の静的検査は、 モジュール内部のコード品質を改善するための道具と割り切って使うことにしましょう。
my MY $obj
型注記用の 型名 alias に、もっと短い名前を予め決めておくのはどうでしょう。 例えば、 package 宣言の先頭で sub MY () {__PACKAGE__}
と書くことにすれば、以後のメソッド定義では my
に加えて MY
を書き加えるだけで strict 検査を効かせることが出来ます。
package MyYATT::Model::Company::LongLongProductName { sub MY () {__PACKAGE__}; use fields qw/price/; sub add_price { (my MY $self, my $val) = @_; $self->{price} += $val; $self } };
勿論、短くて分かりやすい alias が他に思い付くならそれを用いれば良いのですが、 良い名前を考えることはそれなりの負担です。 ならば、基本の名前を決めておくのも悪くはないでしょう。 既に my
を書くことに慣れ親しんだ use strict
ready なプログラマーなら、 更に三文字を加えることにはすぐ慣れるはずです。
configure
, cget
+ hand-made accessors.ではクラスのユーザーに提供するアクセサとコンストラクタはどうするのか... ここでも一つの妥協を提案します。
メンバー名を引数とする汎用のアクセサ(cget と configure)と、 コンストラクタを持った短いクラスを定義し、 単にそれを継承して使うのです。 (ここでは "Perl/Tk" や tcl/tk の widget の API をモデルにします)。
# ユーザ側コードゆえ、型注記なし my $obj = Foo->new(width => 8, height => 3); print $obj->cget('width') * $obj->cget('height'); $obj->configure(height => undef, width => 3); print $obj->cget('width') * $obj->cget('height', 8); # default value
cf_...
で始まる名前を 付けることにします。なお、これは必須ではありません。 従来のアクセサ生成モジュールと併用したい場合にはプレフィックスを付けません。configure_$name
を実装します。 これは公開メンバ名に別名を持たせるためにも使えます。sub configure_file { (my Foo $foo, my $fn) = @_; $foo->{cf_string} = read_file($fn); }
sub dbh { (my Foo $foo) = @_; $foo->{DBH} //= do { DBI->connect($foo->{cf_user}, $foo->{cf_password}, ...); }; }
sub after_new { (my Foo $foo) = @_; $foo->{cf_name} //= "(A cat not yet named)"; $foo->{cf_birth_year} //= $foo->default_birth_year; } sub default_birth_year { _this_year(); }
以下はサンプルとなるベースクラスです。 yatt の YATT::Lite::Object の短縮版です。
use strict; use 5.009; package MyProject::Object { sub MY () {__PACKAGE__} use Carp; use fields qw//; # Note. No fields could cause a problem. sub new { my MY $self = fields::new(shift); $self->configure(@_) if @_; $self->after_new; $self } sub after_new {} sub configure { my MY $self = shift; my (@task); my $fields = _fields_hash($self); my @params = @_ == 1 && ref $_[0] eq 'HASH' ? %{$_[0]} : @_; while (my ($name, $value) = splice @params, 0, 2) { unless (defined $name) { croak "Undefined key for configure"; } if (my $sub = $self->can("configure_$name")) { push @task, [$sub, $value]; } elsif (not exists $fields->{"cf_$name"}) { confess "Unknown configure key: $name"; } else { $self->{"cf_$name"} = $value; } } $$_[0]->($self, $$_[1]) for @task; $self; } sub cget { (my MY $self, my $name, my $default) = @_; my $fields = _fields_hash($self); unless (not exists $fields->{"cf_$name"}) { confess "Unknown configure key: $name"; } $self->{"cf_$name"} // $default; } sub _fields_hash { my ($obj) = @_; my $symtab = *{_globref($obj, '')}{HASH}; return undef unless $symtab->{FIELDS}; my $sym = _globref($obj, 'FIELDS'); *{$sym}{HASH}; } sub _globref { my ($thing, $name) = @_; my $class = ref $thing || $thing; no strict 'refs'; \*{join("::", $class, defined $name ? $name : ())}; } }; 1;
これを継承したクラスの例です。
package MyProject::Product; sub MY () {__PACKAGE__} use base qw/MyProject::Object/; use fields qw/ cf_name cf_price /; 1;
fields をコマンド行オプションに活用する手もあります。
fields
and %FIELDS
XXX: YATT::Lite::Types
の解説: モジュールの内部で使う、細かいレコード用のクラスのために 一々 *.pm を作るのは徒労感が激しい。データ構造を渡せば 一群のクラスを生成して fields を定義してくれる、そんなモジュールを作っておけば便利。
%FIELDS
.
XXX: YATT::Lite::MFields
の技法の解説
XXX: YATT::Lite::Partial
の技法の解説
Hey! The above document had some coding errors, which are explained below:
alternative text '"Perl/Tk"' contains non-escaped | or /