文字エンコードの処理

Merge は ASCII、MBCS(マルチバイト文字セット)および Unicode フォーマット ファイルを含め、さままざな文字エンコード ファイルを比較することができます。Merge は、ファイルの編集に IME(東アジア言語で使用する Input Method Editor)もサポートしています。

Merge は開いたファイルのメモリ内表現には Unicode 形式を使用します。コード ページは、ファイルの読み込みおよび保存時に、ディスク ベースのシングルバイトまたはマルチバイト文字セット表現を Unicode に変換する場合、またはその逆の処理を行う場合に使用されます。

Merge でファイルを開いた後、リボンの エンコード ボタンを使用して、ファイルを保存する際に使用されるコード ページを変更することができます。このコマンドによって開くウィンドウの使用方法は、文字エンコードの選択トピックで説明しています。

ファイルを異なるエンコードで再度開く

間違った文字エンコードを使用してファイルを開いてしまった場合、文字の一部または全部が正しく表示されません。このような場合は、ファイル ペイン上で右クリックして開くショートカット メニューのエンコード付きでファイルを再度開く…コマンドを使用して、正しいコード ページでファイルを再度開きます。このコマンドを使用すると、別のコード ページを選択することができるウィンドウが表示されます。ファイル比較ウィンドウ上の別のファイルは影響を受けず、最初に開かれたときのコード ページを使用し続けます。

ASCII および MBCS

ASCII または MBCS 形式を使用するファイルは、通常どのエンコードを使用するかの情報を含んでいません。

Unicode 以外を使用するファイルを開いた場合、Merge はデフォルトで、お使いのコンピューターの現在の言語設定のデフォルト コード ページ、または、オプション ダイアログのテキスト比較ページで選択したコード ページを使用します。ファイルが別のコード ページで保存されていることがわかっている場合は、そのコード ページをアプリケーション メニュー 開く (Merge 2020 以降)またはファイル開く (Merge 2019 以前)ダイアログで指定することができます。

ファイルを保存するとき、Merge はデフォルトでそのファイルを読み込んだときのコード ページを使用して保存します。アプリケーション メニュー 名前を付けて保存… (Merge 2020 以降)またはファイル名前を付けて保存… (Merge 2019 以前)ダイアログを使用すると、保存時に異なるコード ページを選択することができます。

Unicode

Unicode は、通常 2 バイトの識別子(0xFFFE または 0xFEFF)で開始し、アプリケーションはこれを使用してそのファイルが Unicode を使用していることを判断します。識別子はテキスト エディターでは表示されません。Merge はファイルを開くときに、この識別子を調べます。この識別子がある場合、Merge はそのファイルを Unicode として開きます。識別子がない場合、Merge はそのファイルが Unicode で格納されていないと見なし、デフォルト コード ページまたはアプリケーション メニュー 開く (Merge 2020 以降)またはファイル開く (Merge 2019 以前)ダイアログで指定されたコード ページ/Unicode 形式のいずれかで開きます。

Merge は UTF-7、UTF-8、およびビッグエンディアンとリトルエンディアンの両方の Unicode フォーマットをサポートします。