如何找到下标字母的unicode?

IT技术 javascript unicode three.js subscript
2021-01-16 06:13:56

我找到了一些字母,但我需要找到其他字母,例如“c”、“m”、“p”,这可能吗?

3个回答

查看维基百科文章Unicode 下标和上标看起来这些分布在不同的范围内,并非所有字符都可用。

Unicode 标准为剪切和粘贴目的而合并,为数字和常用数学符号定义了完整的子和上标 ( ⁰ ¹ ² ³ ⁴ ⁵ ⁶ ⁷ ⁸ ⁹ ⁺ ⁻ ⁼ ⁽ ⁾ ₄ ₆ ₄ ₄ ₈ ₉ ₊ ₋ ₌ ₍ ₎ ),一个完整的上标拉丁小写字母,除了 q ( ᵃ ᵇ ᶜ ᵈ ᵉ ᶠ ᵍ ʰ ⁱ ʲ ᵏ ˡ ᵐ ᵐ ˡ ᵐ ˛ ᵐ ⳕ ˛ ᵐ ⳕ ᵐ Ⳡ ᵐ (ᴬᴮᴰᴱᴳᴴᴵᴶᴷᴸᴹᴺᴼᴾᴿᵀᵁⱽᵂ),几下标小写字母(ₐₑₕᵢⱼₖₗₘₙₒₚᵣₛₜᵤᵥₓ),以及一些希腊字母( ᵅ ᵝ ᵞ ᵟ ᵋ ᶿ ᶥ ᶲ ᵠ ᵡ ᵦ ᵧ ᵨ ᵩ ᵪ )。请注意,由于这些字形来自不同的范围,因此它们的大小和位置可能不同,具体取决于字体。

您可以添加小资本,看起来像标:Aᴀʙᴄᴅᴇғɢʜɪᴊᴋʟᴍɴɪᴘǫʀsᴛᴜᴠᴡxʏᴢ,也有一些其他的小字母,看起来像标(除B,O和Q):ₐ𝒸𝒹ₑ𝒻𝓰ₕᵢⱼₖₗₘₙₚᵣₛₜᵤᵥ𝓌ₓᵧ𝓏
2021-03-24 06:13:56
凯文:Unicode 范围与字符的大小和位置是否相同无关。许多脚本分散在整个代码点范围内,如果您有一种涵盖所有脚本的字体,我希望它们看起来一致(如果不是,则是字体错误)。但是,您最有可能看到的是,您想要的字体只有少数几个,因为字形和字体替换为其他字体启动,因此它们看起来格格不入(不出所料)。
2021-03-28 06:13:56
他们失踪只是为了惹恼你。
2021-03-29 06:13:56
想知道为什么没有大写 C。还有一些其他的也不见了。
2021-03-30 06:13:56
@TylerM:因为 Unicode 不打算涵盖通常使用标记完成的事情。之所以存在,是因为它们在某些上下文中被用作与它们看起来像的字符实际上不同的东西(例如,IPA 使用了很多这样的字符)。Unicode 联盟对此的立场是,如果您需要任意上标或下标,则使用标记或其他更高级别的机制。
2021-04-13 06:13:56

您可以characters从另一个答案中提到的维基百科页面复制然后在python中

characters = '⁰ ¹ ² ³ ⁴ ⁵ ⁶ ⁷ ⁸ ⁹ ⁺ ⁻ ⁼ ⁽ ⁾ ₀ ₁ ₂ ₃ ₄ ₅ ₆ ₇ ₈ ₉ ₊ ₋ ₌ ₍ ₎ ᵃ ᵇ ᶜ ᵈ ᵉ ᶠ ᵍ ʰ ⁱ ʲ ᵏ ˡ ᵐ ⁿ ᵒ ᵖ ʳ ˢ ᵗ ᵘ ᵛ ʷ ˣ ʸ ᶻ ᴬ ᴮ ᴰ ᴱ ᴳ ᴴ ᴵ ᴶ ᴷ ᴸ ᴹ ᴺ ᴼ ᴾ ᴿ ᵀ ᵁ ⱽ ᵂ ₐ ₑ ₕ ᵢ ⱼ ₖ ₗ ₘ ₙ ₒ ₚ ᵣ ₛ ₜ ᵤ ᵥ ₓ ᵅ ᵝ ᵞ ᵟ ᵋ ᶿ ᶥ ᶲ ᵠ ᵡ ᵦ ᵧ ᵨ ᵩ ᵪ'
for c in characters.split():
    print(c + '=' + hex(ord(c)))

⁰= 0x2070¹= 0xb9²= 0xb2³= 0xb3⁴= 0x2074⁵= 0x2075⁶= 0x2076⁷= 0x2077⁸= 0x2078⁹= 0x2079⁺= 0x207a⁻= 0x207b⁼= 0x207c⁽= 0x207d⁾= 0x207e

₀= 0x2080₁= 0x2081₂= 0x2082₃= 0x2083₄= 0x2084₅= 0x2085₆= 0x2086₇= 0x2087₈= 0x2088₉= 0x2089₊= 0x208a₋= 0x208b₌= 0x208c₍= 0x208d₎= 0x208e

ᵃ= 0x1d43ᵇ= 0x1d47ᶜ= 0x1d9cᵈ= 0x1d48ᵉ= 0x1d49ᶠ= 0x1da0ᵍ= 0x1d4dʰ= 0x2b0ⁱ= 0x2071ʲ= 0x2b2ᵏ= 0x1d4fˡ= 0x2e1ᵐ= 0x1d50ⁿ= 0x207fᵒ= 0x1d52ᵖ= 0x1d56ʳ= 0x2b3 ˢ=0x2e2 ᵗ=0x1d57 ᵘ=0x1d58 ᵛ=0x1d5b ʷ=0x2b7 ˣ=0x2e3 ʸ=0x2b8 ᶻ=0x1dbb

ᴬ= 0x1d2cᴮ= 0x1d2eᴰ= 0x1d30ᴱ= 0x1d31ᴳ= 0x1d33ᴴ= 0x1d34ᴵ= 0x1d35ᴶ= 0x1d36ᴷ= 0x1d37ᴸ= 0x1d38ᴹ= 0x1d39ᴺ= 0x1d3aᴼ= 0x1d3cᴾ= 0x1d3eᴿ= 0x1d3fᵀ= 0x1d40ᵁ= 0x1d41 ⱽ=0x2c7d ᵂ=0x1d42

ₐ= 0x2090ₑ= 0x2091ₕ= 0x2095ᵢ= 0x1d62ⱼ= 0x2c7cₖ= 0x2096ₗ= 0x2097ₘ= 0x2098ₙ= 0x2099ₒ= 0x2092ₚ= 0x209aᵣ= 0x1d63ₛ= 0x209bₜ= 0x209cᵤ= 0x1d64ᵥ= 0x1d65ₓ= 0x2093

ᵅ=0x1d45 ᵝ=0x1d5d ᵞ=0x1d5e ᵟ=0x1d5f ᵋ=0x1d4b ᶿ=0x1dbf ᶥ=0x1da5 ᶲ=0x1db2 ᵠ=0x61d60

ᵦ=0x1d66 ᵧ=0x1d67 ᵨ=0x1d68 ᵩ=0x1d69 ᵪ=0x1d6a

仅供参考 - 对于 JavaScript,字符串转义序列是 \uXXXX(其中 XXXX 是四位十六进制数)
2021-04-08 06:13:56
JavaScript 等效项: characters.split(' ').map(c => c.charAt(0)+'=U+'+c.charCodeAt(0).toString(16)).join(' ')
2021-04-13 06:13:56
import sys
# on windows run from QtConsole for unicode
#  (Cmd console only support codepage characters)
#  At present (6/10/2017), superscripts/subscript chars
#  are best viewed with terminal/text-editor set to monospace font
#       "DejaVu Sans Mono"
#  "Consolas" works also, but is missing a few characters...
#  and, "Courier" has the worst support at present...

if int(sys.version[0]) != 3:
    print('Aborted: Python 3.x required')
    sys.exit(1)

def table():
    unicode_map = {
         #           superscript     subscript
        '0'        : ('\u2070',   '\u2080'      ),
        '1'        : ('\u00B9',   '\u2081'      ),
        '2'        : ('\u00B2',   '\u2082'      ),
        '3'        : ('\u00B3',   '\u2083'      ),
        '4'        : ('\u2074',   '\u2084'      ),
        '5'        : ('\u2075',   '\u2085'      ),
        '6'        : ('\u2076',   '\u2086'      ),
        '7'        : ('\u2077',   '\u2087'      ),
        '8'        : ('\u2078',   '\u2088'      ),
        '9'        : ('\u2079',   '\u2089'      ),
        'a'        : ('\u1d43',   '\u2090'      ),
        'b'        : ('\u1d47',   '?'           ),
        'c'        : ('\u1d9c',   '?'           ),
        'd'        : ('\u1d48',   '?'           ),
        'e'        : ('\u1d49',   '\u2091'      ),
        'f'        : ('\u1da0',   '?'           ),
        'g'        : ('\u1d4d',   '?'           ),
        'h'        : ('\u02b0',   '\u2095'      ),
        'i'        : ('\u2071',   '\u1d62'      ),
        'j'        : ('\u02b2',   '\u2c7c'      ),
        'k'        : ('\u1d4f',   '\u2096'      ),
        'l'        : ('\u02e1',   '\u2097'      ),
        'm'        : ('\u1d50',   '\u2098'      ),
        'n'        : ('\u207f',   '\u2099'      ),
        'o'        : ('\u1d52',   '\u2092'      ),
        'p'        : ('\u1d56',   '\u209a'      ),
        'q'        : ('?',        '?'           ),
        'r'        : ('\u02b3',   '\u1d63'      ),
        's'        : ('\u02e2',   '\u209b'      ),
        't'        : ('\u1d57',   '\u209c'      ),
        'u'        : ('\u1d58',   '\u1d64'      ),
        'v'        : ('\u1d5b',   '\u1d65'      ),
        'w'        : ('\u02b7',   '?'           ),
        'x'        : ('\u02e3',   '\u2093'      ),
        'y'        : ('\u02b8',   '?'           ),
        'z'        : ('?',        '?'           ),
        'A'        : ('\u1d2c',   '?'           ),
        'B'        : ('\u1d2e',   '?'           ),
        'C'        : ('?',        '?'           ),
        'D'        : ('\u1d30',   '?'           ),
        'E'        : ('\u1d31',   '?'           ),
        'F'        : ('?',        '?'           ),
        'G'        : ('\u1d33',   '?'           ),
        'H'        : ('\u1d34',   '?'           ),
        'I'        : ('\u1d35',   '?'           ),
        'J'        : ('\u1d36',   '?'           ),
        'K'        : ('\u1d37',   '?'           ),
        'L'        : ('\u1d38',   '?'           ),
        'M'        : ('\u1d39',   '?'           ),
        'N'        : ('\u1d3a',   '?'           ),
        'O'        : ('\u1d3c',   '?'           ),
        'P'        : ('\u1d3e',   '?'           ),
        'Q'        : ('?',        '?'           ),
        'R'        : ('\u1d3f',   '?'           ),
        'S'        : ('?',        '?'           ),
        'T'        : ('\u1d40',   '?'           ),
        'U'        : ('\u1d41',   '?'           ),
        'V'        : ('\u2c7d',   '?'           ),
        'W'        : ('\u1d42',   '?'           ),
        'X'        : ('?',        '?'           ),
        'Y'        : ('?',        '?'           ),
        'Z'        : ('?',        '?'           ),         
        '+'        : ('\u207A',   '\u208A'      ),
        '-'        : ('\u207B',   '\u208B'      ),
        '='        : ('\u207C',   '\u208C'      ),
        '('        : ('\u207D',   '\u208D'      ),
        ')'        : ('\u207E',   '\u208E'      ),        
        ':alpha'   : ('\u1d45',   '?'           ), 
        ':beta'    : ('\u1d5d',   '\u1d66'      ), 
        ':gamma'   : ('\u1d5e',   '\u1d67'      ), 
        ':delta'   : ('\u1d5f',   '?'           ), 
        ':epsilon' : ('\u1d4b',   '?'           ), 
        ':theta'   : ('\u1dbf',   '?'           ),
        ':iota'    : ('\u1da5',   '?'           ),
        ':pho'     : ('?',        '\u1d68'      ),
        ':phi'     : ('\u1db2',   '?'           ),
        ':psi'     : ('\u1d60',   '\u1d69'      ),
        ':chi'     : ('\u1d61',   '\u1d6a'      ),
        ':coffee'  : ('\u2615',   '\u2615'      )
    }

    keys = sorted(unicode_map.keys())

    for key in keys:
        spr = "X" + unicode_map[key][0] 
        sub = "X" + unicode_map[key][1]        
        if (spr == "X?"): spr = ""
        if (sub == "X?"): sub = ""
        print('%-15s %s %s' % (key, spr, sub))

table()
它们用于语音学,不需要整个字母表
2021-03-15 06:13:56
为什么大部分字母表都没有下标?
2021-04-09 06:13:56