株式会社 IDS



INFORMATION
BUCK 

文書情報に関する基礎知識

  Basic knowledge about the Document information

1.イメージ情報とは

イメージ'情報をコンピュータへ取り込む場合、アナログからデジタノレデータへの変換を行なう。いったんデジタノレデータになるとその後はプリンタに出力するまでデジタルで、処理が行われる。
このデジタル信号の処理の過程で、色・階調変換・拡大縮小・画像合成などの画像処理が加えられる。ここではアナログのデジタル化についての詳細と、デジタル化された'情報量の表し方及び色に関する基礎的な内容を記述する。

(1)デジタルとアナログの変換について

実世界のほとんどはアナログ'情報である。しかし、コンピュータは全ての情報をデジタルで表現する。そのため実世界のデータをパソコンに入力するには、アナログ情報からデジタル情報への変換作業が必ず必要になる。 例えば、音声は連続的に変化する情報であり、アナログデータの代表的なものである。音声はマイクによって取り込まれた時点においても単に空気信号が電気信号に変わっただけでアナログ信号である。
パソコンではすべてのデータをデジタルとして処理するので、外部からのアナログ信号はデジタル信号へ変換する必要がある。逆に再生時にはアナログ信号に戻さなければならない。この音声処理を例にとって説明すると、以下のようになる。
@アナログデータからデジタルデータへ
1.マイクによって取り込まれた音声はアナログ電気信号としてパソコンに入力される。
2.アナログ信号を一定間隔ごとに断片の数値として取得する。この段階でこの値を数値として置き換えていく。この段階でデジタルデータとして符号化されるため、ハードディスクなどに取り込むことができる。 これをサンプリングあるいは標本化といい、一定間隔のことを標準化周期という。この数値(近似値)を求めて、それを符号化する処理をA/D変換という。
Aデジタルデータからアナログデータへ
1.ハードディスク内の音声ファイノレを読み、このデータをもとに1つ1つの標本の大きさを復元する。
2.標本の頭を滑らかにすることによって元の波形を復元して(D/A変換という)アンプなどを介してスピーカーから音声を再生する。

(2)アナログ→デジタルの変換(A/D変換)

例を用いてA/D変換を理解してみよう。・例:気温の変化
気温は時間と共に連続的に変化するアナログ量で、ある時間における気温を厳密に表現しようとすると、一般に
「17.529245874230900121…(℃)」と小数点以下が無限に続いてしまう。これに対して、小数点の2桁目で四捨五入するものと約束すれば「17.5(℃)」と3桁の10進数で表現されるデジタル量となる。
このようにアナログ'情報は、適当な近似(量子化)を行えばデジタル'情報として表現される。これを、アナログ・デジタル変換(A/D変換)と呼ぶ。
連続的な気温の変化をデジタル化する場合は、一定間隔の時間での値を取り出して、その値をデジタル化すればよい。これをサンプリングと呼ぶ。
さてA/D変換を行う際、どのような近似を行うかでその結果は変わってくる。近似のやり方を決めるファクターは次の3つである。

●デジタル化するデータ範囲の下限 (オフセット)
●デジタル化するデータ範囲の上限
●階調数=下限と上限の間の分割数

ここで、上限と下限の差はデジタル信号のダイナミックレンジと呼ばれる。これらが与えられれば、サンプルデータの値から近似値が求められ、さらに符号数=”下限を0、上限を階調数とした場合の近似値に対する番号”を最終的に求めることができる。符号数がデジタルデータ値である。

2.イメージ'|情報のタイプ

イメージ情報は、大きく分けて@ビットマップデータと Aベクトルデータの2種類に分類される。

(1)ビットマップデータ

ビットマッブは小さな点で画像を表現する仕組みで、その画像を描く最小の単位は「画(ピクチャ:picture)」と「要素(エレメント:element)」という意味を合わせて、「画素(ピクセル:pixel)」と呼ぶ。また単に「点(ドット:dot)」とも呼ばれている。厳密に言えばピクセルとドットは違うが同じモノと考えていいだろう。
ビットマッブは1つの画像(イメージ)を1つ1つの小さな点で表現する。したがってその特性上、画素が小さいほど精密な画像が描けることになる。
この画素の細かさの単位を「解像度」といい、1インチあたりの画素数で表わす。単位は「dot(ドットピッチ:dot per inch)」という。プリンタのカタログなどにある解像度はこれにあたる。また、スキャナでスキャンする場合の解像度も同じで、指定した解像度でピクセル化を行う

(2)ベクトルデータ

ー方ベクトノレデータは、画像を「書き方の命令」の集まりととらえ、CADなどで利用されているデータである。出力時にはその書き方に則って出力デバイス(ディスプレイやプリンタ)の解像度に合わせてビットマップを作成する。たとえば、ディスプレイに表示する際にはいったんビットマッブデータに変換して表示することとなる。したがってベクターグラフィックには解像度という概念はない。

(3)画質について

画像の品質(画質)を決める要素には次のものがある。
・画素数
・階調数
・画像のダイナミックレンジとS/N比

@画素数

画像を構成する画素の数を画素数という。デジタルカメラで画素数といった場合、使用しているCCDの受光部である素子の数を表している。スキャナで読みこんだ画像の画素数は、dpi(dot per inch)で表す。画素数が多いほど品質は良くなるが、ファイルサイズが大きくなるため、入出力時間やパソコンでの処理時間がかかるなどの問題も発生する。
特にネットワークを通じて送受信する際には、ネットワークの環境により通信時間などが問題となる事が多いので、画素数を多くすることがよいのではなく、使いやすさとのバランスから画素数の決定が必要である。
人間の目の解像力は、20dot/mm程度といわれている。印刷するプリンタの固有差や、文字原稿と画像とでは異なるが、文字原稿では20dot/mm前後の画素数が、一般のカラー画像ではその半分の300dpi(11.8dot/mm相当)とすればまず満足される値となる。
スキャナで読みこんだ画像はdpiだけで画質が決まるのではなく、読み込んだデータを処理(エッジ強調、文字部の濃度レンジを高くする、2値化する濃度値の変更なビ)しているので、同じdpiでもスキャナによって画質が違う場合もある。スキャナの実力は事前によく確認する必要がある。

A階調数

カラーやグレースケールの調子の段階を階調という。デジタル信号は文字原稿のような白黒のみの画像では、2値情報が使われることが多いが、写真など連続の階調を持った原稿では多値の情報を使用する。
パソコンが扱い易い単位として8bit(ビット)が使われるケースが多い。8bit上は2の8乗で256の階調を表す。カラーの場合はRGBそれぞれの色に256階調を持たせると、256×256×256=16,777,216色の再現ができることになる。パソコンの画像処理ソフトなどで画像に補正をかけると画質が劣ってしまうので、16bit,24bitで画像を扱い出力の時に8bitにする場合が多い。8bitの256階調では滑らかなトーンのある明るさの変わり目などで段差が出てしまうことがあるので、デジタル化の前に明るい部分と暗い部分で階調に差をつけ(非線形処理)、段差を目立たなくする処理をする場合もある。また、階調数を16bit,24bitにすることもある。
画素数で平面状の解像度、再現する濃度の段階(階調)のbit数で、おおよその画質がわかる。最近はカラー画像を扱うことが多くなり、入力する原稿の持っている濃度幅のどれだけを入力できるかも、画質を決める要因となっている。

B画像のダイナミックレンジとS/N比

 入力する光学的な画像に対して信号として受け取ることの出来る明るさの範囲、または再現出来る明るさの範囲の能力をダイナミックレンジという。最近、聴覚刺激(音)に関して広く使用されているデシベル(Db)による強度の表示方法が、明るさに関しても適用されている。このDb値は基準となる明るさと比較する明るさの比率であり、両者の比の対数の10倍で表される。カラーマイクロの最高濃度は約3.5〜4.0、最低濃度は約0.1あるが、最大濃度を3.0としてダイナミックレンジであらわすと、ndB=10log(1÷1/1000)となり30dBとなる。実際にはこれほど厳密な値ではなく、原稿の濃度をどのレベルまでスキャナが読み取れるかなどに使われ、"ダイナミックレンジが濃度3ある“などと使ったりしている。スキャナのダイナミックレンジが、被写体である資料の濃度レンジより狭いと、低濃度側や高濃度側の階調(濃度変化)がなくなってしまう。特にカラー写真をスキャンするときには、このダイナミックレンジに気をつける必要がある。  8W比は、信号(S)と雑音(N)の比で、この値が大きいほどよい画質になる。ノイズが多いと、信号がノイズに打ち消されて、ダイナミックレンジは狭くなってしまう。
また、画像をくっきりさせるような処理をするときにSN比が低いと、ざらついた汚い画像になってしまうので、SN比にあった画像処理をする必要がある。

3.モノク□画像のデジタル化

 モノクロ画像には、大きく分けて2値(白か黒)とグレースケールに分けることができる。

(1)白黒2階調(2値)

画像の各ピクセルを、白か黒かのいずれかに当てはめることによって表現する方法であり、一般的には感熱タイプのFAXなどで力される文字原稿などがこれである。
単純に1画素を1ビットに対応させているだけで色成分を保存しておく必要がないため、データはもっともコンパクトである。

(2)グレースケール

モノクロ写真などのようなアナログの画像は、各点ごとに明るさの決まった連続的なデータと考えられる。これをデジタル化するには次のような処理を行なう。
1.画像を縦横n×mの小さな四角の点に分割する。 この1つ1つの点を(ピクセルpixcel:画素)という。
2.デジタル化の階調を決定する。
モノクロ画像の階調とは、1ピクセルを何段階に分けて表現するかを決めるためで、一般のモノクロの場合2階調から256階調まで設定する。
3.各ピクセルに明るさを量子化した数値 (近似値)を求める。
256階調の場合は0から255までの数値に置き換えることによって、モノクロ画像をデジタル化する。

4.カラー画像のデジタル化

私たちは光の波長の違いで色を認識している。すべての色の成分を含んでいると白、まったく含んでいないと黒になる。
言い換えれば、任意の色は光の3原色(R:赤、G:緑、B:青)を一つの単位として表されており、カラー画像のデジタル化とはその最小単位である各ピクセルの色をRGBに分解することをいう。
例えば、RGB各色を256階調(8ビット)で量子化とすると、その組み合わせで表現できる色数は256の3乗の約1670万色が表現できることになる。これを24ビットカラーとかフルカラーという。

(1)色の基礎について

色は多数の'情報をもち、千変万化に富んでいる印象を与えるが、人間の目はたった3色に分解しているだけである。人間の目での認識と光の物理的特'性、色の表現方法について説明する。

@光の物理的特性

光は電磁波の一種であり、電磁波は波長によって区別される。太陽光などの白色光は様々な波長の光が重なり合ったもので、プリズムによって異なる波長の単色光に分解することができる。

(2)色の表現方式とカラーモデル

色は人間の目と脳が作り出しているものであり、その仕組みから明らかなように、すべての(人間に見える色は)赤[R]、緑[G]、青[B]の強弱である重ね合わせで表現できる。
実際に色を表す場合には用途や目的に応じてさまざまなカラーモデルが使用される。 その主要なものは「CMY(青:Cyan、赤Magenta、黄:Yellow)」と「RGB(青:Blue、赤:Red、緑:Green)という2つのモデルが用途に合わせて使い分けられる。

@混色の仕方

・加法混色(←RGB)

CRT画面のように自ら発光する表示装置の色の混色原理で、すべての色はRGBの強弱のある重ね合わせで表現される。RGBを全て重ねると白になる。パソコンで画像を処理する場合は、この加法混色が適用される。

・滅法混色(←CMY(K))

印刷に用いるインクのように、光を当てて、その光の一部を吸収することによって発色するものの混色原理である。すべての色を重ねると黒となる。が、完全に黒にはならないため黒(Black)を補色として利用することで自然なカラー発色を得ている。

A人間の感性に近づけたカラーモデルの場合

RGBのデータを同じ強さの信号としてストレートに表現した場合、私たちは緑をもっとも明るく、青をもっとも暗く感じる。したがってRGBの単純な配合だけでは人間の感性に合ったカラーモデルにはならない。

・HLSモデル

そこで、「HLSモデル」(色相:hue、彩度:saturation、明度:lightness)に代表される光の3属'性に注目したカラーモデルなどが一般に利用されている。「色相」は赤や青といった色そのものの属'性のことで、RGBでいうと各要素のバランスという事になる。「彩度」は色みの強弱を示す属'性で、色みが強ければ純色に弱ければ、無彩色になる。RGBでいうと各要素の差が大きければ鮮やかな色に、小さければ着色が薄い状態になる。彩度ゼロは白から黒までの階調になる。「明度」は言うまでもなく明るさのことで、 最も明るいのがRGBともに100%の白になり、もっとも暗いのが0%の黒になる。

・Labカラースペース

「彩度」と色相を2つのパラメータで表し、それに明るさの軸を加えてできた座標系。Apple社のカラーマッチングシステムである。
ColorSync2.0ではLabスペースを色空間の基準として採用されている。

(3)カラー色数

パソコン内部では、デジタルですべて表現されるため各色を無段階に調整はできない。それらは使用目的に応じていくつかのパターンに分けて選択される。

@24ビットカラー

もっとも一般的なカラー画像の場合にはRGB各色に256階調(8ビット=1バイト)のレベルを持たせる。1ピクセルはRGB3チャネルで構成されている。したがって計24ビットを使用することから「24ビットカラー」とも呼ばれている。
色数でいうと約1670万色を作り出すことができる。これは人間が識別できるといわれている色数(300万色程度)をはるかに上回る発色数なので、カラー写真もきれいに再現される。

A32ビットカラー

32ビットカラーは、全ビットを3チャネルで分けるのではなく8ビット×4チャネノレという使い方をする。このRGBに加えて新しく追加されたチャネルを「アルファチャネル」といい、一般に画像処理時のマスク処理などに利用される。つまり、3チャネルとは別に8ビット分の明度を持ち、それによってはみ出した部分や画像の一部をマスク(隠す)する機能を付加した情報となる。

B16ビットカラー

24ビットカラーよりは色数を少なくしたデータには「16ビットカラー」がある。実際の色数では約3万2700色を表現できる。

Cインデックスカラー

さらに少ないビット数で色を扱う場合には「インデックスカラー」といわれるものを利用する。これはカラーパレットと呼ばれる「色の見本帳」を参照して表現する方法で、1ピクセルの色表現に8ビットを用意すれば256色を参照することができる。画像データは、全ての色が均等に出てくるわけではない。頻繁に出てくる色を優先的に扱ったり、似たような色をまとめて代表する色を表示することによって擬似的により自然な画像に近づけるものである。

(4)画像の情報量

イメージ情報は、コード情報と比べて容量サイズが巨大になる。電子メールなどに写真を添付して送ると、たいへん時間がかかる。
プロバイダーによっては大きな画像を受け付けない(メールの容量が決められている)ところが一般的なので、イメージ情報を扱うには注意が必要である。
社団法人 日本画像情報マネジメント協会 デジタル化に対応した文書情報マネジメントの基礎と応用(H135.31)より掲載
top