環境依存文字(機種依存文字)の一覧と文字化け防止方法
環境依存文字(機種依存文字)の一覧や文字化けを防止する方法を紹介します。環境依存文字による文字化けに悩む前に、対策方法を知りましょう。
目次
環境(機種)依存文字とは?
環境依存文字とは、特殊な記号や半角カタカナなど特定の機種にしか存在しない文字のことで、機種依存文字とも言います。
対応していない機種や環境においては正しく表示されなかったり、文字化けを起こしたりすることがあります。
主な環境(機種)依存文字一覧
代表的な環境(機種)依存文字をご紹介します。
丸囲みの数字 | ①②③④⑤⑥⑦⑧⑨⑩ ⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳ |
---|---|
ローマ数字 | Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅸ ⅹ |
単位 | ㎜ ㎝ ㎞ ㎎ ㎏ ㏄ ㍉ ㌔ ㌢ ㍍ ㌘ ㌧ ㌃ ㌶ ㍑ ㍗ ㌍ ㌦ ㌣ ㌫ |
省略文字 | № ℡ № ㏍ ℡ ㊤ ㊥ ㊦ ㊧ ㊨ ㈱ ㈲ ㈹ ㍾ ㍽ ㍼ ㍻ ≡ ∑ ∫ |
縦書き記号 | 纊 鍈 蓜 炻 棈 兊 夋 奛 奣 寬 﨑 嵂 咊 咩 哿 喆 坙 坥 垬 埈 |
半角カタカナ | アイウエオ カキクケコ サシスセソ タチツテト ナニヌネノ ハヒフヘホ マミムメモ ヤ ユ ヨ ラリルレロ ワ ヲ ン ァィゥェォ ャ ュ ョ |
半角句読点など | 。 「 」、 ・ - ゛ ゜ |
拡張文字 | 纊 褜 鍈 銈 蓜 俉 炻 昱 棈 鋹 曻 彅 丨 仡 仼 伀 伃 伹 佖 侒 侊 侚 侔 俍 偀 倢 俿 倞 偆 偰 偂 傔 僴 僘 兊 兤 冝 冾 凬 刕 劜 劦 勛 匀 匇 匤 卲 厓 厲 叝﨎 咜 咊 咩 哿 喆 坙 坥 垬 埈 埇 﨏 など |
上記の環境依存文字は、通常通りに使用すると文字化けを起こす可能性があります。
それでも環境依存文字を使いたい場合、複数の文字を組み合わせて表現します。例えば、「Ⅵ」というローマ数字は大文字の「V」と「I」と並べて「VI」と表します。「㊤」は「(上)」、「㎜」は「mm」といった具合です。
なぜ文字化けするのか?
機種依存文字の文字化けは、Shift-JISという文字コードを使用する際に起こります。文字コードとは、PC上で文字を表示するキャラクターコードのことです。Shift-JISもその規格に含まれます。
PCが扱えるデータ
そもそもPCが扱えるデータは、「0」と「1」の2進数のみです。「A」や「B」といった文字を表現するには、8bitのバイト表現に文字を対応させる必要がありました。そのような状況で考案されたのが、ASCIIコードをはじめとするバイト表現リストです。「A」は「00110000」、「B」は「00110001」というように、特定のバイト表現に対してさまざまな文字、記号を割り当てました。
日本語を表現する文字コード
一方、日本語を8bitで表現するのは困難でした。日本語には平仮名や片仮名に加え、漢字が存在するためです。そこで0から9の数字、AからFの文字を組み合わせる16bitの文字コードが作られます。それがShift-JISであり、1982年頃に誕生しました。
日本語を表現する文字コードは、Shift-JISのほかにJIS、EUC-JP、UTF-8、UTF-16などがあります。これまで、日本語のWebサイトで使われてきたのはShift-JISであり、同規格で扱えない文字は機種依存文字に分類されました。
規格毎のキャラクターコード
また、文字に割り振られたキャラクターコードは、規格毎に異なります。例えば、EUCにおける「あ」のキャラクターコードは「A4A2」ですが、Shift-JISでは「82A0」に割り振られています。この違いにより、Webサイト上で特定の文字を異なる規格間で変換すると、文字化けする可能性が出てきます。
ベンダーがShift-JISに定義されていないキャラクターコードに、新しく文字を割り当てたのも問題です。例えば、先述した機種依存文字の「①」は、Shift-JISでは「8740」というキャラクターコードとなります。これがWindows環境においては「①」と正しく表示されますが、Mac環境では「㈰」と文字化けします。この要因により、異なる環境下において文字化けが発生するようになりました。
文字化けの解決方法
なお、Webページ上で起きた文字化けは、正しい文字コードを読み込ませることで解決します。一般的なブラウザは、文字コードの変換機能を搭載しており、それらを一つひとつ試すことで、正しく表示されるようになります。Webページ閲覧時の文字化けに悩んだ際はぜひお試しください。
関連記事はこちら日本語メールの仕組みとは?文字コードの種類と文字化けしたときの対処法をご紹介
文字化けしないために気を付けること
機種依存文字による文字化けは、文字コードにUTF-8を採用することで防げます。UTF-8とは、符号化文字集合と呼ばれるUnicodeで定義された文字コードのことです。ASCIIコードに世界各国の文字を加えたもので、日本語、韓国語、ロシア語、ギリシャ語などを共通の文字コードで表現できるのが特徴です。
UTF-8はASCIIコードとの互換性が高く、世界中のWebサイトやソフトウェアに採用されています。いわば“コンピューターにおける世界共通言語”です。文字に割り当てた固有番号が閲覧環境に左右されず、文字化けが起こらなくなります。
運営者側の対策
文字化け対策は、Webサイトの運営者と閲覧者でやるべきことが変わります。まず、サイト運営者はHTMLのコーディングにおいて、ファイル内に文字コードを指定するタグを入れてください。文字コードはmetaタグを使い、「<meta http-equiv="content-type" charset="utf-8">」のように記述します。この作業により、Webページで使われる文字コードをブラウザが解釈できるようになります。
仮に指定しなかった場合、ブラウザは文字コードの判別、解釈ができません。UTF-8で書いたWebページをShift-JISで表示するなど、想定外の動作をすることがあります。それが文字化けに繋がるのはいうまでもありません。なお、metaタグで指定する文字コードは、UTF-8がおすすめです。最新のHTML規格であるHTML5においても、UTF-8を文字コーディングに推奨しています。
閲覧者側の対策
閲覧者目線での文字化け対策は、専用サービスを活用するのがおすすめです。例えば、文字化けした文章をフォームに貼り付け、内容を解読してくれる無料サービスがあります。ブラウザの文字コード変換機能を使っても解決しない場合に有効です。
文字化けは未然に防止でき、従来よりも大きな問題ではなくなりました。それでもなお、一定の対策は必要です。UTF-8などを積極的に採用し、文字化けしない閲覧環境づくりを進めてください。
まとめ
文字化けを防ぐ最も簡単な方法は、UTF-8でWebページを書くことです。機種依存文字による文字化けから開放され、ユーザーに快適な閲覧環境を提供します。それにともない、一部の機種依存文字はサイズが小さくなり、読みづらくなるケースがあります。「㈱」といった省略文字、「㎜」などの単位が代表的です。機種依存文字を使用する場合、プレビュー画面で表示を確かめてから利用することをおすすめします。
また、Webサイトだけでなく、メールでもこのような機種依存文字の問題は存在します。メーラーやメール配信サービスによってもUTF-8の対応有無が分かれますので注意が必要です。メールマーケティングサービスの配配メールでは、多言語配信オプションを利用すれば、UTF-8でのテキストおよびHTMLでのメール配信が可能です。
関連記事はこちらECサイト運営におけるメルマガの役割とは?
関連記事はこちらECサイト運営におけるメルマガ配信のポイント
関連記事はこちらメルマガとは?10分でメルマガを説明できるようになる基礎講座
「配配メール」は、企業の集客・販促活動に携わる方のメールマーケティング業務を支援するサービスです。
シンプルな配信操作、見やすい成果指標レポート、メールの反応による見込み客の可視化、サイト来訪通知といった機能によりメールマーケティングの実践をサポートします。
また、機能の提供だけではなく、ナレッジ提供や個社の運用に踏み込んだ手厚いアフターフォローにより、お客様の販促の成功に向け伴走します。
メール配信の初心者から本格的なメールマーケティングの実践を目指している方まで、どなたでも安心してお使いいただけるサービスとして、お客様に長く愛され、98%の継続利用率を維持しています。
記事執筆者紹介
人気記事
- 【2024年最新】メールの一斉送信を効率化するメール配信ソフト12選!活用方法も紹介 2024年08月07日
- 一斉送信メールのマナーとは?複数送信のBCC・CCの使い分けを解説 2024年08月23日
- メルマガとは?5分で基本知識から効果的な配信方法がわかる基礎講座 2024年09月13日