8月 16, 2010

Twitter 2010-08-16 の記録

  • 09:57  朝採りくろとり茶豆、クール便で届く。いただき物です。これから茹でます。(^-^) http://twitpic.com/2f62ly
  • 10:56  Mac上のVirtualBox上でUbuntuを久しぶりに起動。10.04LTSにアップグレードするオススメに従って、只今アップグレード中。10.04かなり良くなっているという噂なので、楽しみ〜。
  • 11:01  ううむ VirtualBoxVMが1G以上メモリー使うので、スワップしまくりだ〜。メモリー4Gじゃ辛い。8Gにアップしたい〜。でも、ネジはずして分解したくない〜(笑)。簡単ですよ、と友人N氏は言うが。
  • 11:08  今日のGoogleロゴは不気味だ〜(笑)。何かと思ったよ。 http://twitpic.com/2f6ok2
  • 11:20  メモリー8Gで3万切っている!分解できれば自分でやるんだけどなあ(ため息) RT MacBook Pro のメモリを 8GB に増設してみた | tobu iPhone http://t.co/CT9ZPxS via @tobu1
  • 12:04  頑張ってみます。RT @tobu1: 簡単ですよ RT @sukarabe3: 分解できればなあ RT MacBook Pro のメモリを 8GB に増設してみた | tobu iPhone http://t.co/CT9ZPxS via @tobu1
  • 17:08  いやあ、助かった。この記事に従ってplistからUTF-8を消去したら文字化けなくなった。RT MacOSX 上の Acrobat の OCR の奇妙な文字化けに対処する http://t.co/FMaj3gV via @AddThis
  • 17:56  野暮用で、ちょっと外出。暑いなあ。サウナみたい。もう夕方なのに。
  • 18:24  文字化けも直ったので、本格的にOCR処理第1弾。いきなり1200ページは無謀だったか(笑)。1時間たったが、700ページくらい。あと30分は掛かるかなあ。
  • 22:30  テレ朝の報道ステーション。ルービックキューブ、任意の面から20手以内で元に戻るらしい。最後はコンピューターがしらみつぶしに調べたらしい。しかしなあ、群構造はとっくに分かっているのに、それだけでは難しいのかな?
  • 23:26  Ted's Bakeryのハウピア・クリーム・パイ
    http://flic.kr/p/8rzwc7

Powered by Twitter Tools

MacOSX上のAcrobatによるOCRでの文字化け対策

諸般の事情で、MacのPreviewで快適に見るには、やはり自前でOCR処理できなくちゃなあということで、ちょっこし実験してみた。ところが、のっけから文字化けで、参ったのなんのって。

文字認識はしているようなのであった。検索しまくった結果、次のページを発見。

MacOSX 上の Acrobat の OCR の奇妙な文字化けに対処する

正にワタシと同じ状況!そうなのだ。UTF-8にされちゃっているのだ。ということで、上記記事に従って、~/.MacOSX/environment.plist を見てみると、案の定 LANG変数は UTF-8 に設定してある。しかし、これを自分で設定した記憶がない。デフォルトでこうなってるんじゃなかったのかなあ。ううむ。

ともあれ、これを削除してみた。再起動させてから、おもむろに Acrobat 9 を起動し、OCR処理させてみたところ、文字化けせずにちゃんと認識できた。

ということで、一件落着。2時間無駄にしたけどな 😉 それにしても、LANG変数、いつ設定したのだろうか。というか、削除して他のアプリに影響ないのかなあ。ちょっと心配。