Registered 2022.01.10 Update 2023.05.21  自己防衛:必須なIT知識とQ&A

目次

電子納品CALSの管理ファイルとは

電子納品における「管理ファイル」とは、業務名などの業務情報やファイル情報などをリスト化したデータです。

電子納品ではファイル名を半角英数字に置き換えて納品するため、ファイルを開かないと内容がわからない状態です。そのため「報告書のこのページは●●●.pdfが該当し、そのオリジナルファイルは▲▲▲.xlsxです」と示す管理ファイルを作成する必要があります。

管理ファイルのファイル形式がどの環境でも利用できるXML形式です。XMLとは文書内容、データの意味や構造を記述するための表示言語の一つになります。

電子納品の管理ファイルをWebブラウザやWindowsのメモ帳で表示すると、以下のようになります。

<基礎情報>
  <メディア番号>1</メディア番号>
  <メディア総枚数>1</メディア総枚数>
  <適用要領基準>土木200406-01</適用要領基準>
  <報告書フォルダ名>REPORT</報告書フォルダ名>
  <報告書オリジナルファイルフォルダ名>REPORT/ORG</報告書オリジナルファイルフォルダ名>
  <図面フォルダ名>DRAWING</図面フォルダ名>
  <写真フォルダ名>PHOTO</写真フォルダ名>
  <測量データフォルダ名>SURVEY</測量データフォルダ名>
  <地質データフォルダ名>BORING</地質データフォルダ名>
</基礎情報>

禁則文字(使用禁止文字)の概要

電子納品におけるXML形式の「管理ファイル」では使用できる文字を以下のように定めています。

半角カタカナの禁止
半角文字(1バイト文字)はJIS X 201 で規定されている文字から片仮名用図形文字を除いたラテン文字用図形文字を使用する。
全角英数字の禁止
全角文字(2バイト文字)はJIS X 208 で規定されている文字から数字とラテン文字を除いた文字を使用する。
機種依存文字・外字の禁止
機種依存文字及び外字は、登録されていない端末では表示できない為使用を認めない。管理ファイル作成時で必要な時は、平仮名もしくは片仮名などの標準化された全角文字で表現する。オリジナルファイル作成時も可能な限りそれに準じることが望ましい。

ネット上で使われる禁則文字(使用禁止文字)とほぼ同じですね。

なぜこのように規定があるのかというと、「どんな環境でも読める」ことが前提のため、閲覧環境に左右されない文字を使うように指示されています。

尚、報告書はPDFファイルですが、「不要なフォントの埋め込みをしない・特殊なフォントを用いない」になっています。PDFはフォントを埋め込めばどの環境でも文字化けせず読めるので、むしろ埋め込めと思うのですが。まぁ、ファイルサイズが大きくなりことと、一部のフォントはライセンスの都合で埋め込めないため、仕方のない措置なのでしょう。

機種依存文字・環境依存文字の文字化け

使用中の端末では表示できても他の端末で表示できるかわからない文字を機種依存文字環境依存文字と言います。

例えば以下の画像にはWindows10のMicrosoft日本語IMEで「カフェ」と入力した時に表示されるものです。

カフェの種依存文字・環境依存文字

お使いの環境ではどのように表示されますか?

場合によっては「=」の太い文字に変換されたり、中国語なのか日本語なのかわからない文字になったりと、環境によって見え方が変わります。地名や人名漢字が顕著ですね。

入力アプリや設定により変換中の文字の横に「機種依存」や「環境依存」の文字が出るものが対象と思うと概ね回避できます。

エンコード違いによる文字化け

エンコード違いの文字化けのイメージを示すと以下のような表示のことです。

���̕��͂�UTF8�ō쐬���܂����B
�ǂ߂܂����H

正常なら「この文章はUTF8で作成しました。読めますか?」と表示するのですが、上記は読めませんよね?

拡張子.txtのテキストファイルをUTF8で作成し、次に別アプリで開いてANSIで保存し、最初に作成したアプリで開いたらこのようになります。

基本的に業務アプリのExcelやWordファイルのエンコードをユーザーが意識することはありませんし、これらのファイルで化けることは多分ないでしょう。問題はメールやテキストファイルです。

企業は証拠の残せるメールを使うため、打ち合わせのバックデータとして保存することがあります。

メールデータもテキストデータも電子納品では使われることのないファイルですが、もし納品する場合は、標準的なUTF8で作成することをお勧めします。

禁則文字(使用禁止文字)の一覧

文字形式使用可能使用不可備考
英数字半角全角
ひらがな全角なし
カタカナ全角半角
漢字第1水準と第2水準の全角それ以外第3以降の水準、IBM拡張やNEC拡張の特殊漢字は「フォントの埋め込み」扱いになるため使用不可。
ギリシャ文字全角及び半角なし
ロシア文字全角及び半角なし
罫線罫線で変換できるものなし
機種依存文字なし全部Microsoft IMEでは囲み英数字、ローマ数字(アラビア数字)、単位記号、省略文字、囲み文字、年号、数学記号にあたります。
外字なし全部

現実の電子納品では禁則文字(使用禁止文字)を使っています

管理ファイル内で禁則文字(使用禁止文字)を使用すると、電子納品作成支援アプリのチェック機能が対応していればで警告表示が出ます。

もし文字を置き換えて良いなら、置き換えることをすすめします。

丸付き数字は普通の数字やカッコ付に置き換える。ギリシャ文字の数字はIとVとXの組み合わせに置き換える。

報告書や図面は使わないことが望ましい程度の扱いのため、丸付の数字やギリシャ文字あたりは高頻度で使っていますね。

トップへ