最近感動したこと

そのいち


一週間ほど前のこと。
ツクツクホーシの姿を初めてみた。
あんなに小さいとは知らなかった。
でもあれが本当にツクツクくんなのか
目の前で鳴いてもらわにゃ分からん。
そう思ってじーっと見ていた。
鳴きだした。


オーーーシイーーー...


確かにホンモノだ。
と思った刹那、木陰に隠れていたカマキリに捕まりやがった。
緑色のカマキリに捕まったツクツクくんは


ジジジ...


とつぶやきつつ、ご臨終。
残暑が終わる。

そのに

やはり一週間ほど以前のこと


大事な ppt ファイルを dropbox に置いて、
ノートパソコンで作業していた。
作業をデスクトップに引き継ぐときに
「保存」のタイミングをちょっと間違えた。
あちゃー。これは同期時に上書きされてしまったかもわからんね。
と思ってみてみたら、
ディレクトリには
ノートパソコンでコンフリクトしたファイルとかいう名前のファイルができていて、
どっちのバージョンも無事だった。
dropbox すばらしい
こりゃ信頼感があるわー。

ガウシアンコンボリューションの繰り返しについて

画像をぼやけさせるために、適当なコンボリューションフィルターをかけることがある。
ガウス関数をコンボリューションカーネルとして用いたガウスフィルターはとくによく使われる。
ガウシアンコンボリューションカーネル C(σ,r) を以下で定義する。


C( Δx ; σ, r ) = exp( - Δx^2 / (2*σ^2 ) ) / Z


ここで σ はガウシアンカーネル標準偏差、r はカーネルの半径である。
例えば r = 2 のとき2次元画像のコンボリューションカーネルは 5×5 の画像パッチで表現される。3次元画像ならば 5×5×5 の3次元パッチである。
Z は正規化係数でありコンボリューションカーネルパターンの要素の合計が1になることを保証する。

コンボリューションカーネル C を画像 I(x) に t 回繰り返し適用したものを


I^t = (...((( I × C ) × C ) × C )...× C ) = I × C^t


と書く。ここで × の記号でコンボリューションを表すことにする。
ここで、ガウシアンコンボリューションカーネルの適用を繰り返すときに、以下の性質が成り立つ。


C( σ,r ) ^t = C( sqrt(t) σ, tr )


もしくは、等価変形として以下が成り立つ。


C( σ,r ) = C( σ/sqrt(t) , r/t ) ^t




一般にガウシアンカーネル標準偏差 σ が大きいときには、カーネル半径 r を大きくしないと誤差が大きくなってしまう。カーネル半径 r が有限であるとき、ガウス関数の裾のカーネル範囲外にはみ出た部分をゼロで近似していることになっているからである。しかし、カーネル半径 r を大きくするためには大きな画像パッチを用意する必要が生じる。
上記の性質を使う事により、比較的小さい半径 r/t のコンボリューションカーネルを繰り返し用いても等価な結果が得られることがわかる。
3次元画像パッチによるコンボリューションでは、計算量削減の効果が大きいだろう。



さて、以上のことはたぶん至極当たり前のことで適当な教科書を探せば載っているような気がするのですが、どこかにこういうことが学べるいい教科書ないかしら。ご存じの方がいらっしゃいましたら、こっそり教えてください。

突風の爪痕

shige-o2009-08-03


先日(8月1日の土曜日)宇治地区を襲った嵐では、
ゴルフ場の街灯がぼきぼき折れたり、
道沿いのガレージの屋根が飛んだり、
その屋根が電柱をなぎ倒したり、
と様々な被害がニュースで流れた。


僕は愛知県にある妻の実家でそのニュースを見て
「ああ、僕らのお家、飛んでいってしまったかもわからんね。」
とつぶやいたのであったが、戻ってきてみたところ
目立った被害はひとつもなかった。


本日出勤してきてみたところ、我が宇治キャンパス内にも
ちょいちょい爪痕が残っていて、
キャンパス内の松の立木がぶち折れて構内道路をふさいでいたりとか、
閉め忘れた窓から振り込んだ雨で廊下が水浸しになっていたりとか、
その手の被害があったようだ。
写真は、折れた木の処理をしてくれている業者らしい。

「Netflixの賞金分配とベイジアンの哲学」という記事を和訳してみた

最近、Netflix賞の受賞者が決まったようだ。
Netflix賞は映画評点データを処理する機械学習アルゴリズム間で性能を競うコンペティションであり、1億件を越える巨大データと100万ドルという賞金で業界の注目を集めていた。

最近以下のようなタイムリーなブログ記事を見つけたので、ついカッとして和訳してみた。



(和訳ここから)

Netflixの賞金分配とベイジアンの哲学


今月はドラマティックな一ヶ月になった。
一ヶ月前に、映画推薦モデルの性能において10%を越える性能向上を達成したことにより複数トップチームの連合チーム100万ドルの大賞受賞資格を得たのだが、このコンペティションはその瞬間から数えて30日間後に終了することになっていた。これは、その他のチームがこれ以上の結果を出す可能性を考慮したルールであった。はたして、締め切り日までたった一日だけ残して、実際にこれを越えるチームが現れた。このチームは23の異なるチームや個人による「アンサンブル」であった。


もちろん、この勝利に貢献した新しいアイディアのほとんどはデータに含まれる重要で新しいパターンを抽出するモデル
(例えば映画評点を行った時刻の効果を考慮に入れるモデル)を通して得られたものであったのだが、多くの異なるチームのアンサンブルが開発されたこともまさしく重要な成果であったわけであり、アンサンブルチームにおける賞金の配分率は、正解率のパーセンテージの向上結果に対する貢献の度合いに基づくものとするNetflix大賞の賞金分配ルールは、この過程に対して洞察的であったと言える。


ベイズ統計の仕事は常にアンサンブルとともにあった。事後確率とは全てのモデルの重み付き平均であり、その重みはデータから見た各モデルの適合度と事前に決定されたそのモデルの品質の積によって決まる。これに加えて、今後このようなコンペティションがあった場合に考慮にいれたほうがよい考え方としてベイズ的得点関数というものを以前筆者が紹介している。


以前に筆者はオッカムの剃刀(Occam's razor)とエピキュロスの原則との違いについて質問を受けたことがある。
オッカムの剃刀ベイズ的事前確率のことであり、陰陽の「陽」と言える。すなわち、より単純なモデルがより大きな事前重みに持つ(なぜなら通常そちらのほうが思考の節約になり有用だから)という原則である。
オッカムの剃刀という考え方はアリストテレスにまでさかのぼる。
彼はその物理学において、「十分でさえあれば、求めるものは常に少ない方がよい」そして「結果が同じでさえあれば、前提とする仮定は少なければ少ないほどよい」とした。我々はそれを事前確率として数学的に表現する。


エピキュロスの原則は、陰陽の「陰」にあたる。数学的にいうならば、モデル空間上の積分である。
アンサンブルという考え方はエピクロスヘロドトスに送った手紙にさかのぼる。
「したがって、われわれが現象の原因を研究するときには、よく似た現象を発生しうる原因のうち経験上考え得るもの全てにわたる多様性を考慮に入れなければなりません。」
したがって、ベイズ統計は不確実性という制限のなかで単純性追求のバランスをとりながら、これらの陰と陽を結びつけていることになるわけだ。


(和訳ここまで)



エピキュロスの原則について「快楽原則」という訳語があるようなのですが、あえて避けました。
アンサンブル推定のベースにこんなものを持ってくる話は初めて聞きました。
陰・陽の話もピンとこないなぁ。

SugarSync の試用続報その4

ぶっちゃけ、以下リンクを経由して SugarSync に登録してくれたかたが
これまでに10人いらっしゃるようです。

https://www.sugarsync.com/referral?rf=bxihy46otco34

結果としてこれまでに合計5GBのボーナス容量をいただき、
無料アカウントの人用のデフォルト容量2GBと
登録時にいただいたボーナス容量を加えて合計7.5GBの容量を
無料で利用させていただいております。


使用中のみなさま、様子はいかがでしょうか?
僕自身はますます便利に使っていて何の不具合にも出会っていませんので、
こうしたあからさまお奨め宣伝モードについて良心に恥じることありません。
なかなか便利でしょ?


ただ、この便利さは容量の大きさによるものもありまして
2.5GBでできることには自ずと限界があるかもしれません。
僕の場合は仕事上で必要なデータに加えて、溜まった音楽ファイルを置いておいて
SugarSync上のプレイヤーで聞くために
合計5GBぐらいは欲しいと思っていたところそれは既に達成したのですが、
今度は取り貯めたデジカメ写真のバックアップ(+知り合い限定公開)の場所として
さらに倍ぐらいは欲しくなってきました。
有料オプションで、ほいっと30GBにしてしまってもよいのですが
どうやらボーナス倍増キャンペーンが好評によりもう1ヶ月ぐらい続くようですので
僕としてもお奨めモードをもうちょっと続けてゆこうかな、と思っています。


さて、最近使ってみた機能はお友達へのファイル配布です。
数十メガバイトを越える巨大ファイルをメール添付で送ったりはしたくないので、
仕事上のファイルは職場のサーバーに置いてURLをメールで送るわけですが、
私的な音楽ファイルのやりとりに職場のサーバーは使えません。

相手がSugarSyncを使っている人ならば Share Folder 機能が便利で、
指名した相手の Shared Folders の中にこちらから Share したフォルダが現れて
手元のフォルダと同様に扱うことができるようになります。

相手がSugarSyncを使っていない人なら、Send Files 機能を使います。
ファイル(複数でもOK)をチェックボックスで選んで Send Files ボタンをポチッと押すと
メールフォームが出てきます。これに相手のメールアドレスを入れて Send すると
相手にはダウンロード用ページへのリンクの含まれたメールが送られ、
ダウンロード用ページにアクセスできるようになります。

SugarSync からのダウンロードは概ね「非常に早い」ようですので、
自分のサーバーなどに負荷をかけることもなく安心して大型ファイルのやりとりができます。


それから最近少しだけ不満に感じはじめたことなのですが、
ファイルのアップロードが(ダウンロードの速度と比べて)かなり遅いようです。
きちんと測っているわけではありませんが、数倍は違うようです。
アップロードの処理は SugarSync マネージャがバックグラウンドジョブと
して行ってくれるので、基本的に終わるまで放っておいて気にしなければいいだけなのですが、
僕の場合は家のノートパソコンに外部ハードディスクをつないでアップロード処理をさせるので
そろそろ終わっただろうからハードディスクを外して電源切って寝ようと思ったら
まだ終わってなかったよー。みたいなことが起こります。
まぁ電源を切っても、電源を入れ直せばアップロード処理が自動再開してくれるので、
そういうときは容赦なく電源切ってしまうんですけどね。

どうやら、有料オプションではアップロードも高速になってくれるそうで、
そこらへんで微妙に差別化を図っているようです。これから SugarSync を
使ってみようという人は用途によってはちょっと注意すべきところだと思います。
ちなみに DropBox ではアップロードが特に遅いというようなことは無かったはずです。



興味を持ったひとはぜひ以下のリンクから SugarSync に登録し
無料2GBストレージとボーナス容量500MBをゲットしてください。
https://www.sugarsync.com/referral?rf=bxihy46otco34
すると僕も500MBの追加ボーナス容量がゲットできます。

なお500MBという数字は、ボーナス倍量キャンペーン中だけということで、
キャンペーンが終われば半分になってしまうそうです。
ただ、もともと7月15日がその最終日だったのですが
好評につき8月末までキャンペーン期間延長になったそうです。

#その知らせを受けてまたもやこんな宣伝エントリを書いているわけなのでした。
#少しずつでも成果があがるというのもなかなかに楽しい体験。
#趣味に実益を兼ねるというのはこういうことやね。

SugarSync の試用続報その3

あからさまな宣伝モードは着実に実を結び、
少なからぬひとが以下リンクから登録してくれて
https://www.sugarsync.com/referral?rf=bxihy46otco34
少なからぬボーナス容量をゲットしてほくほくしています。
#でもまだ僕が必要とする容量には足りないんだ。
#30GBの有料オプションをクリックしそうになるのを
#ギリギリで我慢しつつ試用モードを継続し、
#宣伝エントリを書いているんだ。

    • -


ディレクトリ同期型である」というのが嬉しくて
DropBox および SugarSync を使っていたのですが、
一方でせっかくのウェブストレージなのに
ローカルにも実体ファイルを置いておかなければいけない、
というのはちょっとばかりストレスでした。
例えばハードディスク容量の小さめなノートパソコンで
全ての実体ファイルを持ち運んだりしたくない。
いつかは SSD 入りの安価・高速・軽量のネットブックとか
持ってみたいと思っているのですが、SSD の容量はまだまだ
ハードディスクほどには大きくなっていません。


SugarSync の良さは同期するべきディレクトリを指定できるという点で、
おかげで、コンピュータ毎に同期すべきハードディスク容量を
コントロールできるわけです。


今日、気付いた機能は WebArchive ディレクトリ。
SugarSync Manager のウィンドウを開き、WebArchive という場所に
ローカルの適当なディレクトリをドラッグアンドドロップで放り込むと、
これが Web上にアップロードされるんですが、
WebArchive ディレクトリにアップロードされたディレクトリ内のファイルは
とくに同期されないのです。


これが嬉しい、というのは盲点。
手元に溜まってきたデジカメ写真フォルダとか、音楽データファイルフォルダは、
同期ディレクトリに入れるのではなくて WebArchive ディレクトリに入れればよかった。
写真や音楽などのファイルには、ふつう書き換えなどは起こりません。
溜まってきたものをどこかに整理する、ということだけが必要とされます。
家のノートパソコン内蔵のハードディスクの容量はさほど大きくないので、
僕の場合はポータブルなUSBの外部記憶装置を保存場所にしていました。
しかしこれはつけたり外したりするものなので、
同期ディレクトリにすることは不可能。
でも WebArchive にアーカイブするなら可能です。
歴史上の種々 WebArchive サービスの進化ことを考えれば、
美しく同期するシステムのほうが高度なシステムであり
DropBox は現在までのところその最終進化形だと思っていたのですが、
ここへ来て旧来型の WebArchive システムがちょうど良いような場面にぶつかるとは盲点でした。


同期するシステムと、あえて同期しないシステムが
ひとつの場所を共有するシステムは
やっぱり DropBox をよくよく研究して
その欠点を洗い出したからこそ生まれたものなのであろうなぁ。


興味を持ったひとはぜひ以下のリンクから SugarSync に登録し
無料2GBストレージとボーナス容量500MBをゲットしてください。
https://www.sugarsync.com/referral?rf=bxihy46otco34
すると僕も500MBの追加ボーナス容量がゲットできます。

  • -

この宣伝モード、浅ましいかな。
浅ましくボーナス容量集めたりしなくても、
つい数ヶ月前に、毎月800円で合計500MBちょっとの
しょぼいウェブアーカイブを解約したところである僕としては
毎月5ドル弱の有料プランで30GBゲットしても元は取れるわけなのだけども、
まぁ、せっかくなのでもうちょっとお奨め魔を頑張ってみます。