

 U+E0B7 Unicode文字




 




Other, Private Use(その他,プライベート用途)


Base64エンコード : 7oK3





In Unicode, a Private Use Area (PUA) is a range of code points that, by definition, will not be assigned characters by the Unicode Consortium. Three private use areas are defined: one in the Basic Multilingual Plane (U+E000–U+F8FF), and one each in, and nearly covering, planes 15 and 16 (U+F0000–U+FFFFD, U+100000–U+10FFFD). The code points in these areas cannot be considered as standardized characters in Unicode itself. They are intentionally left undefined so that third parties may define their own characters without conflicting with Unicode Consortium assignments. Under the Unicode Stability Policy, the Private Use Areas will remain allocated for that purpose in all future Unicode versions.
Assignments to Private Use Area characters need not be private in the sense of strictly internal to an organisation; a number of assignment schemes have been published by several organisations. Such publication may include a font that supports the definition (showing the glyphs), and software making use of the private-use characters (e.g. a graphics character for a "print document" function). By definition, multiple private parties may assign different characters to the same code point, with the consequence that a user may see one private character from an installed font where a different one was intended.[出典:Wikipedia]


という文字は、Unicodeにおける「CJK互換用文字」の一つであり、Microsoft Windows環境下では機種依存文字として表示されます。このように、一見すると普通の文字列に見えるが実際にはオリジナルの文字が異なる「互換用文字」は、伝統的な文字の細かい部分を省略することで、文字の形や意味を維持しながらもデータサイズを削減する目的で使われてきました。 しかし、互換用文字は文字認識技術にとって大きな問題となっています。例えば、OCR(光学文字認識)を用いた書類のスキャンや自動翻訳、検索システムなどでは、文字コードの互換用文字への変換が適切に行われない場合、誤った文字認識結果が生じてしまいます。そのため、最近では各社が独自に開発した文字認識技術を用いるなど、大変な労力をかけてこの問題に対応しています。 また、互換用文字は文字セットの一部として広く使われており、個人情報や金融情報などに用いられるキーの暗号化や、HTML文書内での文字表現にも使用されています。このため、互換用文字の使用は現代社会において不可欠なものとなっています。 しかし、互換用文字の使用はマルウェア制作者にも好都合なものとなっています。互換用文字を使うことで、誤認識や混乱を利用して正規のアプリケーションの挙動を模倣する「フィッシング」詐欺や、コンピューターウイルスの偽装などが行われています。 今日ではデジタル化が進んでおり、互換用文字など様々な特殊な文字が使用される時代になりました。しかし、文字認識技術の発展のためには、正確に文字を識別するための新たな技術の開発が必要となってきます。このような課題に向き合い、研究開発が進められることで、より正確かつ安全な情報処理環境が構築されていくことが期待されています。 以上、互換用文字についての説明と、その現代社会における問題について述べました。デジタル技術の進化によって生じた新しい問題に向き合いながら、現代社会の発展に貢献していくことが求められます。
