8月 2010

スキャンしたPDFの最適化メモ

ScanSnapでPDFにしただけのものは特に問題ないが,AcrobatでOCR処理したものは,設定にもよるが,Mac OS Xのプレビューでの表示が遅いというか重たい。Adobe Readerならそれほどでもないが。ということで,その対策メモ。

Previewから別名保存でも良いが,サイズが倍近くなったりする。Acrobat 9で別名保存して,その際,PDF, optimized というのを選ぶ方が良さそう。標準だと150dpiにダウンサンプリングするが,これをダウンサンプリングなしにしてみた。結果は,サイズがやや増加(20パーセントくらいか?)するものの,Preview.appでもスムーズにスクロールして,極めて快適。

もう少し実験が必要だが,良さそうだったら,夜中にでもすべてのファイルにバッチ処理でこの最適化を施してみよう。

ステキなトポロジー入門書

Algebraic Topology: A First Course (Graduate Texts in Mathematics)

William Fultonと言えば、Benjaminから出ている代数曲線の入門書のイメージがあったので、代数的トポロジー?ふーん、というのが第一印象だった。邦訳を本屋で見かけた気もするが、スルーしてしまったような。

最近になって、原書の方を読む機会があって驚いた。代数的トポロジー(位相幾何)というと、三角形分割とか単体的ホモロジーとか、特異ホモロジーとか、CW複体とか、そんなイメージでいたのだが、この本は全然違う。低次元の具体的な場合を中心にして、微分形式や積分との関係、リーマン面や代数曲線、ドラム・コホモロジー、そんなことが次から次へと出てくるのだ。

著者によれば、これは歴史にも沿っているのだという。確かにガウスが複素積分を考えたときあたりから、道(パス)のホモトピーなどは始まったわけだが、それでも、第1章のタイトルが「線積分」というのはかなりインパクトがある。だって、代数的位相幾何の本ですよ。そのとっぱじめが積分なのだから。


ということで、ざっと目次を眺めてみる。第1部「平面上の微分積分」第1章 線積分。最初から微分形式の積分、閉形式($d\omega=0$)が完全形式($\omega=df$)になるか、とかと単連結性が関係してくる話。第2章 角度と変形 では、Winding数を積分で定義して(もちろん動機付けあり)、それが整数になること、そして、パスの持ち上げから被覆面(Covering surface)の話へ。第2部「Winding Number」は、いかにもトポロジーらしい話。第3部「コホモロジーとホモロジー」ホモロジーからでなく、コホモロジーから入る。しかも、ドラム・コホモロジーだ 😯 まあ、第1部からの流れではこうなるのだろう。とは言っても、0次元と1次元のみに限定みたいだから、抽象的でめげることはないだろう。言葉がちょっとばかり難しそうだってことを除けば。

このあと、Meyer-Vietorisの完全列やVan Kampenの定理、チェックのコホモロジーと、位相幾何らしくなる。何となく Bott-Tu の本をもっと易しくしたような感じ。とにかく2次元までなのが良い(笑)。

油断していると最後にリーマン面と代数曲線の話が来る。リーマンの双1次形式やヤコビアンとか、アーベル・ヤコビの定理とか。リーマン・ロッホの定理まであって、このあたりは完全に代数曲線論になってしまっている。

詳しく読まずにざっと眺めただけなのに、知ったふうに書いてしまった(汗)。これからちゃんと読んでみます 😉 。

Twitter 2010-08-21 の記録

  • 00:40  町内会+マンションで検索していたら、個人的に、どストライクなページに遭遇。この変わり者らしい困ったちゃん理事長にかなり感情移入なう(笑)
    http://tsuraiyo.com/topic8404GAITOU.html
  • 01:08  駄目だ、面白くて読んでしまう。こんなことをしてたら、時間がいくらでも奪われてしまう〜。
    http://tsuraiyo.com/janru.html
  • 10:48  朝からクリーニング出し。シャツが綿麻シャツとかに分類されて400円だー ( ̄◇ ̄;)
  • 17:37  マンション管理室から試しにつぶやいてみる。管理室のWindows Vista 使い方全く分かんないので、自分のMacBook Pro持ち込んでみた。
  • 22:37  カミサンの下請けで英語と格闘中!数学以外の英語って,なんて難しいんだ!

Powered by Twitter Tools

Twitter 2010-08-20 の記録

  • 10:03  ぽちっとアスクル,早い!昨日の昼過ぎ注文したプリンター用紙&インク,たったいま配送された。やっぱり重たいものは通販が便利!
  • 12:22  両手とも上鍵盤(Upper Manual)が続くと腕が萎える(笑)。UMのレジストをLMに瞬間的に移すボタンとかないのかな。そしたら両手とも下鍵盤で弾けるのに。D-Deckだと下5オクターブあるし。
  • 12:26  NHKプロフェッショナル、司会者コメント飛ばしながら(^^;)、録画を少し見た。えびぞう氏若いのに良いこと言う。曰く、満足すると油断につながり失敗する率が上がる、と。
  • 13:33  L'Enseignement Mathématique / Band 16 (1970) の Halmos : How to write Mathematics くすくす笑いながら読んだ。Dicksonの真似だけはすまい(笑)。 http://ow.ly/2senl
  • 13:51  知らないうちにFirefoxが1.5Gもメモリー使ってた(汗)。タブ使い過ぎか?否、メモリーリークだよなあ。
  • 15:30  サビの部分で思わず吹いた!可笑しすぎる。 RT @kohe46: すでに盛り上がっているよですが、これは笑った! 凄い発見だ。 http://www.youtube.com/watch?v=JGf_gs2320o&feature=player_embedded
  • 16:46  小腹が空いたので、先日お土産でもらったインスタントの九州ラーメンを食べる。味は・・・まあこんなものですかね、インスタントだし。
    http://flic.kr/p/8tPtoH
  • 19:06  役目柄、町会のお祭り打合せに出席なう。これって、打ち合わせという名の宴会なのか!?(・_・;?
  • 19:08  と言うか、苦手な雰囲気(>_<)
  • 19:14  ビール注がれてしまったあ~。年長者の方に(>_<)
  • 19:15  何か挨拶しなくてはならない模様(>_<)
  • 19:36  こんな感じ!?(・_・;? http://twitpic.com/2gfh20
  • 21:16  町内会という名の宴会から帰宅なう。お疲れさま>自分。
  • 23:46  iTunes Storeから購入したアルバムが「不明なアルバム」になってしまい、アルバムジャケットが表示されない〜(怒)。さっそく苦情入れたけど、なんでこんなことになる?

Powered by Twitter Tools

Twitter 2010-08-19 の記録

  • 06:25  おはようございます。朝からネット繋がらずばたばた。結局,ネット(プロバイダー)側が落ちていた。無線ルーター調べたりイーサケーブル引っ張り出したりで疲れた。朝からまったく〜。
  • 07:56  ゲゲゲの女房。戦時中の話。ズンゲン支隊 という聞きなれない言葉。検索してみたが,こんなひどい事が当時は当然にように行われていたことに愕然。
  • 13:39  プリンターのインク等を初めてネット通販で注文した。1500円以上だと送料無料。迂闊なことに今まで知らなかった。かみさんが自慢顔(苦笑)。
  • 13:43  通販は便利だけど、何となく不条理というか釈然としない気持ち。苦労を宅配業者さんに押し付けているだけで、全体としては無駄にエネルギー使っている気もする。
  • 19:15  iPhoneから返信したPCメールが文字化けしたらしく,読めないという返信来た。文字コード調べるとiPhoneからの返信はUTF-8だった。向こうはOutlookらしい。何故UTF-8で返信したのか謎。OutlookがUTF-8を読めないのも謎。
  • 19:27  iPhoneでの文字化け対策。とりあえず,OutlookからのMutlipartのメールに直接返信せずに,新規作成で送信する。すると文字コードはISO-2022-JPつまりJISコードになり,文字化けしない。
  • 19:38  文字化けの主たる原因はOutlookにあるようだ。マルチパートで text/plainがiso-2022-jp, text/htmlがutf-8になっているとOutlookで文字化け。
  • 21:54  鈴むら本店にて。サンマ高いってニュースで言ってたから諦めてたけど、ラッキー。 http://twitpic.com/2g5w0b
  • 22:00  Now Playing♪Carly & Carole:Eumir Deodato:Live from Rio #TwitRody
  • 22:06  Now Playing♪San Juan Sunset:Eumir Deodato:Live from Rio #TwitRody
  • 22:32  Now Playing♪しっぽのきもち:谷山浩子:しっぽのきもち http://twitpic.com/2g66ha

Powered by Twitter Tools

Twitter 2010-08-18 の記録

  • 10:13  目が覚めた。完全二日酔い。また寝る。
  • 11:42  昨夜から急にiPhone 3GS でメールの中身が読めなくなった。受信はするが,タイトルのみ表示される。Mobile MeだけじゃなくGMailやその他のIMAPメールすべて。何故だ。
  • 11:59  iPhoneのメール解決。メモリー解放したら無事に表示されるようになった。というか,iOS4になってからアプリを終了させてもメモリーに駐在するようになったのが諸悪の根源。メモリー管理できないならマルチタスクとかするなよな!
  • 12:01  まだエタノール残っている。また寝るか?(笑)
  • 12:02  訂正。残ってるのはアセトアルデヒドだった(爆)
  • 12:06  ところで昨日友人にドコモのエクスペリアを見せてもらったが,良さそうな感じだった。iPhoneも良いけど,Googleアンドロイド携帯も悪くないと思った。なにより電波が素晴しい(笑)。

Powered by Twitter Tools

Twitter 2010-08-16 の記録

  • 09:57  朝採りくろとり茶豆、クール便で届く。いただき物です。これから茹でます。(^-^) http://twitpic.com/2f62ly
  • 10:56  Mac上のVirtualBox上でUbuntuを久しぶりに起動。10.04LTSにアップグレードするオススメに従って、只今アップグレード中。10.04かなり良くなっているという噂なので、楽しみ〜。
  • 11:01  ううむ VirtualBoxVMが1G以上メモリー使うので、スワップしまくりだ〜。メモリー4Gじゃ辛い。8Gにアップしたい〜。でも、ネジはずして分解したくない〜(笑)。簡単ですよ、と友人N氏は言うが。
  • 11:08  今日のGoogleロゴは不気味だ〜(笑)。何かと思ったよ。 http://twitpic.com/2f6ok2
  • 11:20  メモリー8Gで3万切っている!分解できれば自分でやるんだけどなあ(ため息) RT MacBook Pro のメモリを 8GB に増設してみた | tobu iPhone http://t.co/CT9ZPxS via @tobu1
  • 12:04  頑張ってみます。RT @tobu1: 簡単ですよ RT @sukarabe3: 分解できればなあ RT MacBook Pro のメモリを 8GB に増設してみた | tobu iPhone http://t.co/CT9ZPxS via @tobu1
  • 17:08  いやあ、助かった。この記事に従ってplistからUTF-8を消去したら文字化けなくなった。RT MacOSX 上の Acrobat の OCR の奇妙な文字化けに対処する http://t.co/FMaj3gV via @AddThis
  • 17:56  野暮用で、ちょっと外出。暑いなあ。サウナみたい。もう夕方なのに。
  • 18:24  文字化けも直ったので、本格的にOCR処理第1弾。いきなり1200ページは無謀だったか(笑)。1時間たったが、700ページくらい。あと30分は掛かるかなあ。
  • 22:30  テレ朝の報道ステーション。ルービックキューブ、任意の面から20手以内で元に戻るらしい。最後はコンピューターがしらみつぶしに調べたらしい。しかしなあ、群構造はとっくに分かっているのに、それだけでは難しいのかな?
  • 23:26  Ted's Bakeryのハウピア・クリーム・パイ
    http://flic.kr/p/8rzwc7

Powered by Twitter Tools

MacOSX上のAcrobatによるOCRでの文字化け対策

諸般の事情で、MacのPreviewで快適に見るには、やはり自前でOCR処理できなくちゃなあということで、ちょっこし実験してみた。ところが、のっけから文字化けで、参ったのなんのって。

文字認識はしているようなのであった。検索しまくった結果、次のページを発見。

MacOSX 上の Acrobat の OCR の奇妙な文字化けに対処する

正にワタシと同じ状況!そうなのだ。UTF-8にされちゃっているのだ。ということで、上記記事に従って、~/.MacOSX/environment.plist を見てみると、案の定 LANG変数は UTF-8 に設定してある。しかし、これを自分で設定した記憶がない。デフォルトでこうなってるんじゃなかったのかなあ。ううむ。

ともあれ、これを削除してみた。再起動させてから、おもむろに Acrobat 9 を起動し、OCR処理させてみたところ、文字化けせずにちゃんと認識できた。

ということで、一件落着。2時間無駄にしたけどな 😉 それにしても、LANG変数、いつ設定したのだろうか。というか、削除して他のアプリに影響ないのかなあ。ちょっと心配。