

 U+E60C Unicode文字




 




Other, Private Use(その他,プライベート用途)


Base64エンコード : 7piM



In Unicode, a Private Use Area (PUA) is a range of code points that, by definition, will not be assigned characters by the Unicode Consortium. Three private use areas are defined: one in the Basic Multilingual Plane (U+E000–U+F8FF), and one each in, and nearly covering, planes 15 and 16 (U+F0000–U+FFFFD, U+100000–U+10FFFD). The code points in these areas cannot be considered as standardized characters in Unicode itself. They are intentionally left undefined so that third parties may define their own characters without conflicting with Unicode Consortium assignments. Under the Unicode Stability Policy, the Private Use Areas will remain allocated for that purpose in all future Unicode versions.
Assignments to Private Use Area characters need not be private in the sense of strictly internal to an organisation; a number of assignment schemes have been published by several organisations. Such publication may include a font that supports the definition (showing the glyphs), and software making use of the private-use characters (e.g. a graphics character for a "print document" function). By definition, multiple private parties may assign different characters to the same code point, with the consequence that a user may see one private character from an installed font where a different one was intended.[出典:Wikipedia]


』、この文字を見たことがありますか?この文字は、漢字における「十」や「口」などの意味を持つ部品を組み合わせて作られたものであり、UnicodeにおいてはU+D40Cというコードポイントで表されています。 しかし、この文字が特別な意味を持っているわけではありません。それでも、なぜこの文字が自然言語処理やコンピュータ言語の分野で使用されることがあるのでしょうか? それは、この文字が「珍しい」からです。この文字は、漢字やひらがな、カタカナなどの一般的な文字と比較して使用頻度が非常に低く、また、日本語以外の言語で使用されることはまれです。 そのため、この文字を用いた文章やデータは、特別な意味を持つことがあります。たとえば、自然言語処理の分野では、この文字を用いて単語分割の精度を評価することがあります。また、コンピュータ言語の分野では、この文字を用いて文字エンコーディングの問題をテストすることがあります。 さらに、日本では、『』という文字は、縁起物として扱われることもあります。特に、商売繁盛や家内安全などを願う際に、この文字を使用することがあるといわれています。 『』という文字を用いた文章やデータが、特別な意味を持つことはありますが、それはあくまでも利用者が意図するものであり、文字そのものが意味を持つわけではありません。しかし、この文字が持つ「珍しさ」を利用し、興味深いプログラムやシステムを開発することができるかもしれません。
