今年の一冊(Multiple View Geometry in Computer Vision)
いろんな所で僕が選んだ私が選んだ今年の3冊が紹介されているので、僕も参加します。
今年は読んだ本が少なくて、強いて3冊というと素数夜曲: 女王陛下のLISP 、インパール、Multiple View Geometry in Computer Visionにします。前2冊は他の人が書いてくれるとして、最後のMultiple View Geometry in Computer Visionを簡単に紹介します。
この本を読み始めたのが6月25日からなので、ちょうど半年かけて全22章のうち9章まで読み終わりました。普通に読むと一年コースの本です。読み始めたときは年内に14章まで読み切りたかったのですが、予想以上に数学が手強くて時間がかかりました。
この本の内容を一言で言うと、Computer Visionの基礎となる数学を教える本です。最小から最後まで数式ばかりで、アルゴリズムも数式がメインです。レビューに図が多くてわかりやすいと書いている人が多いのですが、このジャンルが素人の僕には全然図も説明も足りず難易度が高く感じました。数学の表記も慣れてないととても難しく感じます。何が難しいかというと、最初から虚数解や無限(at infinity)が出てきます。上手く図で説明出来るところは良いのですが、虚数付きの二次曲線や、二次曲面のような全く見えない物を全面に出して説明してくるのは、分かったような分からないようなそんな気になりました。
良いところはいっぱいあります。おそらく執筆時にかなりのフィードバックがかかっているようで、これ何だっけ?って時には必ずポインターが示してあります。ちゃんと調べたわけではないですが、章単位で新しく出てくる数式には全部説明がある感じです。例えば、2章で何かを証明したとします。5章で最初にそれを使うときには2章のどこどこを見ろと書いてあり、7章で同じようなときにも2章のどこどこを見ろとわかりやすくポインターが示してありました。そのポインターの先も、明確に証明が書かれてあり、あっちこっち読んだけどよくわわからないという状況にはなりませんでした。あと、今まで読んだ範囲だけでも全体の構成がわかりやすいです。
この本の僕にとって良くないところを上げます。一つ目が、数値計算的な練習問題が少ない事です。理解しているのかどうかが手を動かして分からないので、不安が積もります。もう一つが、英語が手強く流し読み出来ないことです。
例えば9章の始めですが、このような文から始まります。
The epipolar geometry between two views is essentially the geometry of the intersection of the image planes with the pencil of planes having the baseline as axis (the baseline is the line joining the camera centres).単語も構文も特別難しくないのですが、シャーペン片手にスラッシュを入れて区切っていかないと意味が取れない事が多かったです。
この本をお勧めする人は、Computer Visionのライブラリを作る人、ライブラリの怪しい挙動を調べる必要がある人、既存のライブラリがサポートしていない処理を書かないといけない人です。ライブラリ使って直ぐにでも動かしたいプログラムがある人は、OpenCVの解説本の方が良いと思います。
The comments to this entry are closed.
Comments