

 U+F70A Unicode文字




 




Other, Private Use(その他,プライベート用途)


Base64エンコード : 75yK



In Unicode, a Private Use Area (PUA) is a range of code points that, by definition, will not be assigned characters by the Unicode Consortium. Three private use areas are defined: one in the Basic Multilingual Plane (U+E000–U+F8FF), and one each in, and nearly covering, planes 15 and 16 (U+F0000–U+FFFFD, U+100000–U+10FFFD). The code points in these areas cannot be considered as standardized characters in Unicode itself. They are intentionally left undefined so that third parties may define their own characters without conflicting with Unicode Consortium assignments. Under the Unicode Stability Policy, the Private Use Areas will remain allocated for that purpose in all future Unicode versions.
Assignments to Private Use Area characters need not be private in the sense of strictly internal to an organisation; a number of assignment schemes have been published by several organisations. Such publication may include a font that supports the definition (showing the glyphs), and software making use of the private-use characters (e.g. a graphics character for a "print document" function). By definition, multiple private parties may assign different characters to the same code point, with the consequence that a user may see one private character from an installed font where a different one was intended.[出典:Wikipedia]


という文字は、一見すると目立たないように見えるかもしれませんが、実はとても特殊なものです。この文字はUnicodeで「ゼロ幅非接着文字(Zero Width Non-Joiner, ZWNJ)」と呼ばれ、文字列を繋げずに分離するために使用されます。 例えば、英語で「blackboard」と「goose」を繋げたい場合、普通に書くと「blackboardgoose」となり、読みづらくなります。しかし、を使って「blackboardgoose」と書くことで、繋げていることは明示しながらも、単語として分けて書くことができます。 さらに、はアラビア語やペルシャ語などの言語でも使われます。これらの言語では、単語同士を繋げる場合にアラビア文字の形態素が変化することから、単語同士を区切る必要があります。そこで、単語同士を繋げずに分離するためにが使用されます。 しかし、このように特殊な文字であるため、一般的にはあまり使われることがありません。実際、この文章でも、文字エンコーディングの問題などから、表示されているかどうかわからないかもしれません。 それでも、という文字は、文字列の分離や言語の特性を反映するなど、意外と重要な役割を果たしています。文字や言語の奥深い世界には、まだまだ知られざることがたくさんあります。
