fc2ブログ

Entries

SDカードのデータ復旧

デジカメの写真をいつもと違うソフトで弄っていたらデータにアクセスできなくなってしまった(汗)

通常なら一旦PCに全部保存するのだけれど、夜中にツイートしようと思い、パソコンにSDカードを差し込んで1つの画像を読み込み、リサイズし、そのままパソコンに保存した。

どう考えてもあまり問題のない手順だと思うのだが…ソフトが悪いのか、カードが悪いのか。

とにかく、その後、他のデータ全部にアクセスできなくなった。USB経由の「リムーバブル・ディスク」として認識せず、使いたければ「フォーマット」しろという。

取り込んでいないのが300ショットぐらい溜まっていたので焦った。


そこで、以前、HDDがクラッシュしたときに購入した「ファイナルデータ」を試した。


120901a.jpg


通常の「ファイルの復元」ではドライブを認識しなかった。しかし、このソフトには「ドライブを正常に認識しない場合」という項目がある。それを試すと約1/3のデータとなぜか2年前に撮った写真が多数サルベージされた。


諦めきれず、他のソフトを使ってみることに。最近ではフリーソフトでもデータ復元ソフトの優秀なものがあるというので試してみた。


EASEUS Deleted File Recovery
いろいろと優秀なフリーソフトを提供してくれているEASEUSのソフト。

Pandora Recovery


(以上、リンク先は「k本的に無料ソフト・フリーソフト」様)


DataRecovery
(窓の杜)
窓の杜大賞2006年の金賞受賞ソフト。


結論からいうと残念ながら上記のソフトでは今回は復旧は出来なかった。ごみ箱から消去したデータなどには役立つかもしれないのでリンクを貼っておく。


さて、そこで、「リムーバブル・ディスク」として認識しないのだから、いっそのことダメもとでフォーマットしてしまうことにした。データがますます消えてしまう危険性もあるが、フォーマットって確かラベルを書き換えるだけの筈だし…と素人判断。

で、カメラで再フォーマットしてPCで読み込むと当然ながら空のディスクとして認識された。そこで再度「ファイナルデータ」を試した所、無事、全てのデータをサルベージすることができた。良かった~(;^_^A

上記3つのフリーソフトでは再フォーマット後もデータ復旧は出来なかったが、唯一有効だったフリーソフトがある。

「DiskDigger」(Gigazine)

このソフトは優秀で全てのファイルを認識してくれた。上記Gigazineさんの記事の時点から時間が経っているので多少仕様が変わっているようだ。

ただし、認識したファイルを保存する際、フリー版だと一つずつになってしまう。SDカードに大量のファイルがある場合は面倒だが、数が少なければ使えるだろう。


ちなみに「ファイナルデータ」でも100%復元できるとは限らないし、フリーソフトを使う場合は自己責任で。

それにしても毎月のように使っているSDカードの中に2年前のある日のデータだけが大量に残っていたのも不思議。




PDFデータの困った現象

先日ちょっと書いたようにイラレなどで作ったドロー系の絵をそのまま綺麗にネットで表示しようとするときには、PDFを使うのが一般的な選択肢かと思う。普通のブログなどで表示するには多少面倒だったりするのだけれど。

PDFファイルはテキストだけでなく、ドローデータやらjpgなどの画像データも表示してくれるので非常に便利だ。

しかしながら、使っているといろいろと一筋縄ではいかない部分もあって注意が必要だ。

下の絵はドロー系のソフトに画像の「集中線」を埋め込んだものをPDFで吐き出したものだ。この「集中線」の部分は、背景(白い部分)を透明にしたpng形式のデータになっている。
PDFのビューワーは「PDF-Xchange Viewer」である。


120207a.jpg


一応ちゃんと、ドローソフトで描いたそのままに見えている。




ところが、全く同じデータをデファクトスタンダードとも言える「Adobe Reader」で開いてみると…


120207b.jpg


な、なんじゃ、こりゃあ!?氷結しとる?


背景の透過した部分との境界が妙なことになってしまう。埋め込まれた画像を表示する際になんらかの処理がされているようだ。
ちなみに他のビューワー「Foxit J-Reader」で開いても同様の現象が出た。

この現象はそのまま印刷にも反映されてしまう。

なので、このデータをネットに上げると、「PDF-Xchange Viewer」を使っている人には問題なく見えても、他のビューワーを使っている人には「おいおい」ってことになる。

過去に私が作ってアップしているPDFデータにもそんなものがあるかもしれない。いやいや…

実際、ネットで公表されているカレンダーなどのデータでも、ビューワーによっては、不具合が出て表示あるいは印刷されるものがあった。

こういうことがないように製作者がチェックできれば良いのだが、一般的な現象ではないために限界もある。逆に、何らかの不具合のあるPDFデータがある場合は、ビューワーを変えることによって解決する場合もあるということだ。





メールで絵手紙を送ろう。

さて、ときどきオリジナルの便箋を掲載していますが、知り合いの方から、「手紙を出すことがない。」という話を伺いました。

じゃあ、メールに使ってみるのは?と思った次第。ここで言うメールとはもちろん「eメール」です(笑)。

メールなら誰でも毎日のように使っているでしょう。ビジネスだけでなく、家族や友人知人とのやり取りも多い筈。そんな折りに少しだけデータ量を増やすことで、無味乾燥でないメールを送ることができるのでは?ということです。


今では「テキストメールしか受け取らない」という設定にしている人は、それほど多くないと思いますが、この方法のためにはメーラーを「HTMLメールの送受信をする」という設定にしなければなりません。


OutlookExpressならオプションの「送信」からメール送信の形式を「HTML形式」にします。
MozillaのThunderbirdなら各アカウント設定の「編集とアドレス入力」で「HTML形式でメッセージを編集する」という項目にチェックを入れておきます。詳細は各メーラーのヘルプ等に従って下さい。また、データ量やセキュリティの問題は各自で判断願います。


さて、一般にメーラーで背景に画像を貼り付けると、その上に文字を打てるようになるのですが、背景画像自体はタイル状に敷き詰められてしまいます。
ネットで調べてみると、HTMLを設定して1枚だけにするようなこともできるのですが、やや面倒です。

少し試してみた結果、とても便利な方法がありました。


それはフリーのグラフィックソフト「AzPainter2」を使うことです。


まず、各自のビューワなどで下敷きにしたい画像の横幅を800ピクセルぐらいにしておきます。私がアップしている便箋では、データ量や見かけの大きさから800ピクセルぐらいが適当だろうと判断しました。受け取った方の環境にもよるので、多少は試行錯誤が必要になるかもしれませんが。


次にその便箋をAzPainter2で開きます。


111004b.jpg
(クリックで拡大)


まず、写真の左下にあるように前面に新規レイヤ(レイヤ1)を作り、そこに書き込むようにします。(オレンジ色にハイライトしている部分。)

そうしておくと、書き損じたときに消しても、書いたものだけが消え、便箋まで消えることがありません。


ペンタブレットを持っている方はぜひ、フリーハンドで文字や絵を描いてみてください。画面を見ながらつるつるしたタブレットを使うのは多少コツが要ります。私はいくら文字を書いても普段と違う筆跡になりコントロールしにくかったのですが…(とヘタくそな字の言い訳を)

右上のボックスにあるように筆圧や補正の設定、ペンのサイズを弄ることでかなり書き味が変わります。ほとんど直感的に使えるので、いろいろと試してみると楽しいです。

また、どうしても手書きがうまく行かない、あるいはタブレットがない、という場合は、テキストを使うこともできます。
ここでは試しに「ふい字」と「恋文ペン字」を使ってみました。


このソフトがすばらしいのは目で確認しながら位置及びサイズ、文字間や行間を設定できるというところです。なので罫線のある便箋にも文字位置を自由に合わせることができます。「描画」ボタンを押すまでは何度もやり直すことができます。

書き終わったら保存しますが、通常保存すると後から編集可能な独自形式(apd)となります。
メールに貼り付ける場合はjpg形式で保存するのがよいでしょう。ただし、便箋の名前と同じだともとの便箋に上書きされてしまうので、名前を変更しておく必要があります。



contrail01-800pix111004a.jpg



あとは各メーラーの設定に従って、本文に画像を貼り付けて送るだけです。(添付ファイルとしてではなく、本文に画像として貼り付けます。)

多少データ量は増えますが、たまには面白いのではないでしょうか?











フリーのOCRソフトでテキストを抽出してみる

いきなりちょっと残念な話で恐縮だが、フリーのOCRソフトを紹介しようと思ったら、つい3ヶ月ほど前まで無料だったものが配布終了になっていた。

どーも、フリーのOCRソフトというのは消え去ってしまう運命にあるようだ。これまでも「SmartOCR」というソフトや「クセロPDF」のOCR機能を持つものが消えていった。


OCR(Optical Character Reader)とは

光学式文字読取装置。手書き文字や印字された文字を光学的に読み取り、前もって記憶されたパターンとの照合により文字を特定し、文字データを入力する装置。スキャナで読み取った画像から文字を識別して文書に変換するOCRソフトもある。
(IT用語辞典 e-Wordsより)





今回、紹介しようと思っていたものは「Real Reader Lite」というソフトで、正確に言うと、バージョンアップに伴い、使用期間付き有料版になったのである。


OCRというのは非常に高度な技術の集積であり、各ソフトにより認識精度などにも差がある。もちろん、まだまだ人間が認識する精度には及ばない。

手書き文字の認識の難しさは誰もが想像するところだが、対象が活字であったとしても、フォントの種類や解像度などの違いにより認識率が落ちたりする。

もっと言うと、日本語か英語か、あるいは全角か半角かで認識できたりできなかったりということもあるのだ。


素人の私の勝手な見解だが、「Real Reader Lite」は、活字が対象の場合、かなりの実用レベルにあると思う。

私が試したのはVer.5.1。現在はVer.7となっている。


「Real Reader Lite」((株)データデジタル)



ただし、このソフトは画像ファイル(TIFF、JPEG、BMP、PNG、GIF)が対象で、PDFには対応していない。

そこで、このソフトを使って、テキストの貼り付いていないPDFからテキストを抽出するテストをしてみよう。


PDFファイルは例えテキストが表示されていても、画像のように表示されている。つまり、通常のテキスト文書とは違ってクリックしてカーソルで反転させ、テキストをコピペする、というようなことはできない。

まず、前提として、PDF文書からテキストを抽出するためには、前もってテキストが埋め込まれているという条件が必要だ。


最近のスキャナでは付属ソフトにOCRが組み込まれていることが多い。文書をスキャンしてPDF化するときに、「検索可能なPDFにする」というような選択ができる。これは「透明テキスト付き」とか「テキストの埋め込み」などとも言われる。

また、パソコン上で作った文書でも、フリーソフトなどを使ってPDF化するときにはテキストを埋め込むことができる。まずはこのような作業が行われた文書であることが必要となる。


このようにあらかじめ、PDF作成時に透明テキストが貼り付いているファイルなら、Adobe Reader (旧Acrobat Reader) などでテキストを抽出することは簡単だ。保存するときにテキスト形式で保存すればいいだけだ。(もちろん、スキャナのソフトがOCRするときに間違えてしまえば間違ったテキストが抽出される。)


また、フリーのPDFビューワーである「Foxit J-Reader」を使えば、面倒無くテキストを表示してくれる。


昨年、ちょっとややこしいPDFファイルを見つけたのでそれを使ってテストしてみる。

そのファイルは「第4回キッズデザイン賞」のプレスリリースである。



http://www.kidsdesignaward.jp/2011/news/pdf/n20100709.pdf



このファイルは12ページもあるので第1ページめだけを抽出し、参考としてJPEGで貼り付けておく。


110822a.jpg
(クリックで拡大)



さて、ところがこのファイルをAdobe Readerで開いてテキスト保存してみると…


110822b.jpg



なぜかこのように文字化けしてしまうのだ。分量も少ない。



同じく「Foxit J-Reader」で開きテキストビューワーにしてみると…



110822c.jpg




文字化けこそしなかったが、分量が少なく、意味不明な数字などが抽出された。



このファイル自体はセキュリティロックなども掛けられておらず、画像の部分はマークとその横のグレーの文字だけなのだ。他は拡大表示してみてもすべて追従して綺麗に表示される。なのになぜ、このような部分的な不明テキストが貼り付いているだけなのか、私にはよく分からない。もしかしたら暗号化などが施されているのかもしれない。


いずれにせよ、このようにテキストが見えているのにうまく抽出できない場合は往々にしてある。一番多いのはもともとテキストとして見えている部分が実は画像だったというような場合だろうか。


このときに前回のエントリで紹介した「PDF-Xchange Viewer」が役に立つ。



まず、このファイルを「PDF-Xchange Viewer」で開き、BMPなどの画像フォーマットでエクスポートする。このとき、BMPやTIFFなど非圧縮の形式の画像が良い。また、解像度も高いほど認識の精度がいいようだ。もちろんデータ量が重くなるのでそこは適切に。



さて、生成されたBMPファイルを前述の「Real Reader Lite」で認識させる。


110822d.jpg
(クリックで拡大)



これをテキスト保存すると…(一部抜粋)


[報道関係各位]
2010年7月9日
子どもたちの安全・安心に黄献するデザイン、創造性と未来を拓くデザイン、そして子どもを産み育てやすいデザインの顕彰制度
KlDS 「少子化対策担当大臣貪」の新設で益々注目を集め、過去最高335件の応募の中から、
DESICN
「第4回キッズデザイン賞」185点が決定!
AWARD
2010 ★8月3日には、r絵済産業大臣貪及び「少子化対策担当大臣賞など最優秀作品を発衷!
主な受賞作品を、「キッズクリエイトTOKYO2010」(会期・8月27日~2g日/会場:幕張メッセ)にて展示・公開
キッズデザイン協議会(内閣府認証NPO、本部:東京都文京区、会長:和田勇)は、様々な産業の製品や施設、
コミュニケーション・調査研究活動を対象に、子どもの安全・安心と健やかな成長発達に役立つデザインを顕彰す
るr 4・キッズデザイン 作ロ185点 出し 日 しました (※諸般の事情により、7/12に予定してい
た本発表を繰り上げさせていただきました。報道関係の皆様方におかれましては、ご配慮の程、宜しくお願い申し上げます。)
同賞では、今月7月中に最終審査会を行い、最優秀作品として「経済産業大臣賞」4点と、今回から新設された
「"子化対 担当大臣 2点及び
8 3日(火)に 翌8 4日(水)に ・式 二_いま
ニム
『キッズクリエイトTOKYO 2010』で展示・公開します。


見事にテキストが抽出できた。

「大臣賞」が「大臣貧」になっている(笑)ところなど、部分的に誤認識はあるが、ぱっと見た感じでも95%以上の精度で変換されているようだ。十分に使えるレベルである。

おもしろいことに、保存時に「透明テキスト付き」のPDFににして保存することもできる。(ただし、元が画像ファイルなのでPDFも画像形式となり、拡大表示には耐えられなくなる。)


「Real Reader Lite」は現在、使用期間が2週間となっている。




さて、調べてみた限りでは、フリーで使えるOCRがもう一つあった。
オープンソースで開発中の日本語文字認識プログラムとのこと。



日本語文字認識 - beta





このサイトでは画像をアップすると、日本語文字を認識して表示してくれる。
クラウドなのであまり大きなファイルをアップすると時間がかかるかもしれない。

同じBMPファイルをアップしてテストしてみる。

結果抜粋

【報道関係各位】
zojo . T. g B
子どもたちの安全・安心に貢献するデザイン、創造性と未来を拓<デザイン、そして子どもを産み育てやすいデザインの顕彰制度
KlDS 「少子化対策担当大臣賞抑新設で益々注目を集め、過去最高8%件の応募の中かム
DES怖N
討こ'こゝ 「第4回キッズデザイン賞Ti85点が決定!
20T0
★8月8日には/経済産業大臣賞」及W少子化対策担当大臣賞体ど最優秀作品を発表!
主な受賞作品を、「キツズクリエイトTOKYO2oloバ会期:8月27日v29日ノ会軌幕張tyセijこて展示・公開
キッズデザイン協議会納閣府認証NPへ本部:東京都文京区、会長和田勇ij\様々な産業の製品や施設、
コミユニケーショゾ調査研究活動を対象に、子どもの安全・安心と健やかな成長発達に役立つデザインを顕彰す
る「第4回キッズデザイン賞」受賞作品l85点を選出し、本日発表しました。 (※諸般の事情によYr7/12に予定してい
た本発表を繰り上げきせていただきましな報道関係の皆様方におかれましては、ご配慮の程、宜し<お願い申し上げます/
同賞では、今月 了月中に最終審査会を行い、最優秀作品として「経済産業大臣賞M点と今回から新設きれた
「少子化対策担当大臣賞〃点及び優秀賞等を8月8日秋ijこ発表、翌8月ィ臥水ijこ表彰式を行います。
主な受賞作品をバ月 z了 Et金)?29 Et臥のs 日間、幕張メッセ国際展示場(千葉市美浜区)l=て開催する
『キッズクリエイトTOKYO2ol加で展示・公開します。




結果的には「Real Reader Lite」に比べるとかなり精度が落ちる。ざっと見たところ8割ぐらいの精度か。まあギリギリ使える感じだ。

しかしながら、テキストが貼り付いていないPDFから、フリーソフトのコンボでここまでテキストが抽出できた。何かの場面で役に立つこともあるのではないだろうか。

※フリーソフトの使用は自己責任で。




Inkscapeでの出力問題 & オリジナル便箋 マーブルチョコレート

いつもドロー系の絵を描くときはフリーソフトの「Inkscape」を使っているわけですが。

イラレよりもノードやハンドルが扱いやすくて、好きなのです。機能的にもほぼ遜色ないでしょう。個人で使うなら十分な性能だと思います。
(それにしても、最近、他にも海外のドロー系のフリーソフトを弄ってみたら、本当に使いやすいのでビックリしました。イラレがプロ御用達のデファクトスタンダードでいられるのも長くないのでは…?とにかく、有料バージョンでもお値段が比較にならないぐらいお安いし…)


さはさりながら、Inkscapeにも歴代ずっと引きずっている大きな欠点がありまして…

出力系統が貧弱なんですねー。

ドロー(ベクター)系なのでwebなどで利用するためにペイント(ラスター)系データに変換したいわけです。気の利いたソフトならペイントのイメージ形式はjpegはじめいろいろなものに変換できるのですが、Inkscapeはpng形式のみ。しかもそれが見えている通りに行きません。

今までは仕方ないから別のソフトで画面をキャプチャーして変換していたのです。名刺サイズなど小さなものならそれで間に合うのですが、A4だとさすがに小さくなって品質が悪くなります。

(オリジナルのフォーマットはsvgというドロー形式なのですが、これをイラレなどで開くとこれまたかなり崩れてしまうのです…)


見えているのをキャプチャーしたもの。こういう風に出力してくれたらいいのですが。

110817a01.jpg


実際にpngでエクスポートすると…

110817a.png

不透明ははじかれてしまうし、エッジの乱れは何?




で、いろいろと試していたら漸く、数年の試行錯誤を経て(涙)、なんとか対応できる方法を発見しました!
覚え書きとして記録しておきます。



それはPDF形式で保存すること。
このとき、「フィルタエフェクトをラスタライズ」にチェックを入れておきます。


110817a02.jpg



さて、これで解決、と言いたいところですが、このPDFがまたくせ者で、Adobe ReaderやFoxit Readerでは表示できなかったり、崩れていたりするのです。そのため今までこれが使えることに気がつきませんでした。



これを「PDF-Xchange Viewer」で開くのです。(データ量により時間がかかる場合があります。)


PDF-Xchange Viewerは他のビューワーにはない特徴があって、ほとんどの一般的なイメージフォーマットでエクスポートすることができるのです。しかもオプションで細かい設定も効きます。

110817a03.jpg



これはもちろん、グラフィック以外でも、PDFをイメージ化したいときには有効な方法です。例えば、透明テキストの貼り付いていないPDFファイルがあって、PDFのOCRソフトを持っていないときなど、イメージ化すれば、フリーのOCRソフトでテキストを抽出することができたりします。このやり方はまたの機会にでも…


もちろん、お使いの環境によって、100%うまく行くかどーかは保証の限りではありません。


さて、舞台裏の説明が長くなってしまいました。

便箋と封筒を貼り付けておきます。例によってA4サイズです。




110817c.png





110817b.png













Appendix

プロフィール

horirium

  • Author:horirium
  • My Home Page→horirium

検索フォーム

メールフォーム

名前:
メール:
件名:
本文:

月別アーカイブ