Hyper

Tested Software version 4.0.0-canary.5 on Darwin Full results available at ucs-detect repository path data/macos-Hyper-4.0.0-canary5.yaml

Wide character support

The best wide unicode table version for Hyper appears to be 12.0.0, this is from a summary of the following results:

version	n_errors	n_total	pct_success
‘5.1.0’	0	26	100.0%
‘5.2.0’	79	269	70.6%
‘6.0.0’	0	13	100.0%
‘9.0.0’	0	5000	100.0%
‘10.0.0’	0	735	100.0%
‘11.0.0’	0	62	100.0%
‘12.0.0’	0	62	100.0%
‘12.1.0’	0	1	100.0%
‘13.0.0’	500	500	0.0%
‘14.0.0’	41	41	0.0%
‘15.0.0’	15	15	0.0%
‘15.1.0’	5	5	0.0%

Sequence of a WIDE character from Unicode Version 15.1.0, from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+2FFE	‘\u2ffe’	Cn	2	na

Total codepoints: 1

Shell test using printf(1), '|' should align in output:
```
$ printf "\xe2\xbf\xbe|\\n12|\\n"
⿾|
12|
```
python wcwidth.wcswidth() measures width 2, while Hyper measures width 1.

Emoji ZWJ support

The best Emoji ZWJ table version for Hyper appears to be None, this is from a summary of the following results:

version	n_errors	n_total	pct_success
‘2.0’	21	22	4.5%
‘4.0’	500	508	1.6%
‘5.0’	100	100	0.0%
‘11.0’	73	73	0.0%
‘12.0’	112	112	0.0%
‘12.1’	165	165	0.0%
‘13.0’	50	51	2.0%
‘13.1’	83	83	0.0%
‘14.0’	20	20	0.0%
‘15.0’	1	1	0.0%
‘15.1’	109	109	0.0%

Sequence of an Emoji ZWJ Sequence from Emoji Version 15.1, from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0001F9D1	‘\U0001f9d1’	So	2	ADULT
U+200D	‘\u200d’	Cf	0	ZERO WIDTH JOINER
U+0001F9BC	‘\U0001f9bc’	So	2	MOTORIZED WHEELCHAIR
U+200D	‘\u200d’	Cf	0	ZERO WIDTH JOINER
U+27A1	‘\u27a1’	So	1	BLACK RIGHTWARDS ARROW
U+FE0F	‘\ufe0f’	Mn	0	VARIATION SELECTOR-16

Total codepoints: 6

Shell test using printf(1), '|' should align in output:

$ printf "\xf0\x9f\xa7\x91\xe2\x80\x8d\xf0\x9f\xa6\xbc\xe2\x80\x8d\xe2\x9e\xa1\xef\xb8\x8f|\\n12|\\n"
🧑‍🦼‍➡️|
12|

python wcwidth.wcswidth() measures width 2, while Hyper measures width 5.

Variation Selector-16 support

Emoji VS-16 results for Hyper is 100 errors out of 100 total codepoints tested, 0.0% success. Sequence of a NARROW Emoji made WIDE by Variation Selector-16, from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0001F325	‘\U0001f325’	So	1	WHITE SUN BEHIND CLOUD
U+FE0F	‘\ufe0f’	Mn	0	VARIATION SELECTOR-16

Total codepoints: 2

Shell test using printf(1), '|' should align in output:

$ printf "\xf0\x9f\x8c\xa5\xef\xb8\x8f|\\n12|\\n"
🌥️|
12|

python wcwidth.wcswidth() measures width 2, while Hyper measures width 1.

Language Support

The following 71 languages were tested with 100% success:

Adyghe, Aja, Amarakaeri, Arabic, Standard, Assyrian Neo-Aramaic, Baatonum, Bamun, Bora, Cherokee (cased), Chickasaw, Chinantec, Chiltepec, Dagaare, Southern, Dangme, Dari, Dendi, Dinka, Northeastern, Ditammari, Dzongkha, Evenki, Farsi, Western, Fon, Fur, Ga, Gen, Gilyak, Gumuz, Idoma, Kabardian, Lamnso’, Lao, Lingala (tones), Maldivian, Mazahua Central, Mixtec, Metlatónoc, Mongolian, Halh (Mongolian), Mòoré, Nanai, Navajo, Nuosu, Orok, Otomi, Mezquital, Panjabi, Western, Pashto, Northern, Picard, Pular (Adlam), Secoya, Seraiki, Serer-Sine, Siona, South Azerbaijani, Tagalog (Tagalog), Tai Dam, Tamazight, Central Atlas, Tamazight, Central Atlas (Tifinagh), Tamazight, Standard Morocan, Tem, Thai, Thai (2), Ticuna, Uduk, Urdu, Urdu (2), Vai, Veps, Vietnamese, Vietnamese (Han nom), Waama, Yiddish, Eastern, Yoruba, Yukaghir, Northern, Éwé.

The following 27 languages are not fully supported:

lang	n_errors	n_total	pct_success
Shan	500	533	6.2%
Tamil (Sri Lanka)	500	539	7.2%
Tamil	500	540	7.4%
Javanese (Javanese)	500	565	11.5%
Sanskrit (Grantha)	500	565	11.5%
Malayalam	500	579	13.6%
Bengali	500	588	15.0%
Khmer, Central	448	528	15.2%
Kannada	500	598	16.4%
Burmese	500	608	17.8%
Khün	361	442	18.3%
Sanskrit	500	677	26.1%
Tamang, Eastern	33	45	26.7%
Nepali	500	701	28.7%
Marathi	500	703	28.9%
Mon	500	711	29.7%
Gujarati	500	756	33.9%
Hindi	500	774	35.4%
Telugu	500	779	35.8%
Maithili	500	794	37.0%
Panjabi, Eastern	500	860	41.9%
Sinhala	500	947	47.2%
Bhojpuri	500	1009	50.4%
Magahi	500	1074	53.4%
Chakma	493	1444	65.9%
Tibetan, Central	1	275	99.6%
Yaneshaʼ	2	2536	99.9%

Shan

Sequence of language Shan from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+101C	‘\u101c’	Lo	1	MYANMAR LETTER LA
U+102D	‘\u102d’	Mn	0	MYANMAR VOWEL SIGN I
U+1075	‘\u1075’	Lo	1	MYANMAR LETTER SHAN KA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+1088	‘\u1088’	Mc	0	MYANMAR SIGN SHAN TONE-3
U+1015	‘\u1015’	Lo	1	MYANMAR LETTER PA
U+102D	‘\u102d’	Mn	0	MYANMAR VOWEL SIGN I
U+102F	‘\u102f’	Mn	0	MYANMAR VOWEL SIGN U
U+107C	‘\u107c’	Lo	1	MYANMAR LETTER SHAN NA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+107D	‘\u107d’	Lo	1	MYANMAR LETTER SHAN PHA
U+1062	‘\u1062’	Mc	0	MYANMAR VOWEL SIGN SGAW KAREN EU
U+101D	‘\u101d’	Lo	1	MYANMAR LETTER WA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+1087	‘\u1087’	Mc	0	MYANMAR SIGN SHAN TONE-2

Total codepoints: 15

Shell test using printf(1), '|' should align in output:

$ printf "\xe1\x80\x9c\xe1\x80\xad\xe1\x81\xb5\xe1\x80\xba\xe1\x82\x88\xe1\x80\x95\xe1\x80\xad\xe1\x80\xaf\xe1\x81\xbc\xe1\x80\xba\xe1\x81\xbd\xe1\x81\xa2\xe1\x80\x9d\xe1\x80\xba\xe1\x82\x87|\\n123456|\\n"
လိၵ်ႈပိုၼ်ၽၢဝ်ႇ|
123456|

python wcwidth.wcswidth() measures width 6, while Hyper measures width 9.

Tamil (Sri Lanka)

Sequence of language Tamil (Sri Lanka) from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0BAE	‘\u0bae’	Lo	1	TAMIL LETTER MA
U+0BA9	‘\u0ba9’	Lo	1	TAMIL LETTER NNNA
U+0BBF	‘\u0bbf’	Mc	0	TAMIL VOWEL SIGN I
U+0BA4	‘\u0ba4’	Lo	1	TAMIL LETTER TA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xae\xae\xe0\xae\xa9\xe0\xae\xbf\xe0\xae\xa4|\\n123|\\n"
மனித|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Tamil

Sequence of language Tamil from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0BAE	‘\u0bae’	Lo	1	TAMIL LETTER MA
U+0BA9	‘\u0ba9’	Lo	1	TAMIL LETTER NNNA
U+0BBF	‘\u0bbf’	Mc	0	TAMIL VOWEL SIGN I
U+0BA4	‘\u0ba4’	Lo	1	TAMIL LETTER TA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xae\xae\xe0\xae\xa9\xe0\xae\xbf\xe0\xae\xa4|\\n123|\\n"
மனித|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Javanese (Javanese)

Sequence of language Javanese (Javanese) from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+A9B2	‘\ua9b2’	Lo	1	JAVANESE LETTER HA
U+A9B8	‘\ua9b8’	Mn	0	JAVANESE VOWEL SIGN SUKU
U+A9A9	‘\ua9a9’	Lo	1	JAVANESE LETTER MA
U+A9A0	‘\ua9a0’	Lo	1	JAVANESE LETTER TA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xea\xa6\xb2\xea\xa6\xb8\xea\xa6\xa9\xea\xa6\xa0|\\n123|\\n"
ꦲꦸꦩꦠ|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Sanskrit (Grantha)

Sequence of language Sanskrit (Grantha) from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0001132E	‘\U0001132e’	Lo	1	GRANTHA LETTER MA
U+0001133E	‘\U0001133e’	Mc	0	GRANTHA VOWEL SIGN AA
U+00011328	‘\U00011328’	Lo	1	GRANTHA LETTER NA
U+00011335	‘\U00011335’	Lo	1	GRANTHA LETTER VA
U+0001133E	‘\U0001133e’	Mc	0	GRANTHA VOWEL SIGN AA
U+00011327	‘\U00011327’	Lo	1	GRANTHA LETTER DHA
U+0001133F	‘\U0001133f’	Mc	0	GRANTHA VOWEL SIGN I
U+00011315	‘\U00011315’	Lo	1	GRANTHA LETTER KA
U+0001133E	‘\U0001133e’	Mc	0	GRANTHA VOWEL SIGN AA
U+00011330	‘\U00011330’	Lo	1	GRANTHA LETTER RA
U+0001133E	‘\U0001133e’	Mc	0	GRANTHA VOWEL SIGN AA
U+00011323	‘\U00011323’	Lo	1	GRANTHA LETTER NNA
U+0001133E	‘\U0001133e’	Mc	0	GRANTHA VOWEL SIGN AA
U+00011302	‘\U00011302’	Mc	0	GRANTHA SIGN ANUSVARA

Total codepoints: 14

Shell test using printf(1), '|' should align in output:

$ printf "\xf0\x91\x8c\xae\xf0\x91\x8c\xbe\xf0\x91\x8c\xa8\xf0\x91\x8c\xb5\xf0\x91\x8c\xbe\xf0\x91\x8c\xa7\xf0\x91\x8c\xbf\xf0\x91\x8c\x95\xf0\x91\x8c\xbe\xf0\x91\x8c\xb0\xf0\x91\x8c\xbe\xf0\x91\x8c\xa3\xf0\x91\x8c\xbe\xf0\x91\x8c\x82|\\n1234567|\\n"
𑌮𑌾𑌨𑌵𑌾𑌧𑌿𑌕𑌾𑌰𑌾𑌣𑌾𑌂|
1234567|

python wcwidth.wcswidth() measures width 7, while Hyper measures width 14.

Malayalam

Sequence of language Malayalam from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0D2E	‘\u0d2e’	Lo	1	MALAYALAM LETTER MA
U+0D28	‘\u0d28’	Lo	1	MALAYALAM LETTER NA
U+0D41	‘\u0d41’	Mn	0	MALAYALAM VOWEL SIGN U
U+0D37	‘\u0d37’	Lo	1	MALAYALAM LETTER SSA
U+0D4D	‘\u0d4d’	Mn	0	MALAYALAM SIGN VIRAMA
U+0D2F	‘\u0d2f’	Lo	1	MALAYALAM LETTER YA
U+0D3E	‘\u0d3e’	Mc	0	MALAYALAM VOWEL SIGN AA
U+0D35	‘\u0d35’	Lo	1	MALAYALAM LETTER VA
U+0D15	‘\u0d15’	Lo	1	MALAYALAM LETTER KA
U+0D3E	‘\u0d3e’	Mc	0	MALAYALAM VOWEL SIGN AA
U+0D36	‘\u0d36’	Lo	1	MALAYALAM LETTER SHA
U+0D19	‘\u0d19’	Lo	1	MALAYALAM LETTER NGA
U+0D4D	‘\u0d4d’	Mn	0	MALAYALAM SIGN VIRAMA
U+0D19	‘\u0d19’	Lo	1	MALAYALAM LETTER NGA
U+0D33	‘\u0d33’	Lo	1	MALAYALAM LETTER LLA
U+0D46	‘\u0d46’	Mc	0	MALAYALAM VOWEL SIGN E
U+0D15	‘\u0d15’	Lo	1	MALAYALAM LETTER KA
U+0D4D	‘\u0d4d’	Mn	0	MALAYALAM SIGN VIRAMA
U+0D15	‘\u0d15’	Lo	1	MALAYALAM LETTER KA
U+0D41	‘\u0d41’	Mn	0	MALAYALAM VOWEL SIGN U
U+0D31	‘\u0d31’	Lo	1	MALAYALAM LETTER RRA
U+0D3F	‘\u0d3f’	Mc	0	MALAYALAM VOWEL SIGN I
U+0D15	‘\u0d15’	Lo	1	MALAYALAM LETTER KA
U+0D4D	‘\u0d4d’	Mn	0	MALAYALAM SIGN VIRAMA
U+0D15	‘\u0d15’	Lo	1	MALAYALAM LETTER KA
U+0D41	‘\u0d41’	Mn	0	MALAYALAM VOWEL SIGN U
U+0D28	‘\u0d28’	Lo	1	MALAYALAM LETTER NA
U+0D4D	‘\u0d4d’	Mn	0	MALAYALAM SIGN VIRAMA
U+0D28	‘\u0d28’	Lo	1	MALAYALAM LETTER NA

Total codepoints: 29

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xb4\xae\xe0\xb4\xa8\xe0\xb5\x81\xe0\xb4\xb7\xe0\xb5\x8d\xe0\xb4\xaf\xe0\xb4\xbe\xe0\xb4\xb5\xe0\xb4\x95\xe0\xb4\xbe\xe0\xb4\xb6\xe0\xb4\x99\xe0\xb5\x8d\xe0\xb4\x99\xe0\xb4\xb3\xe0\xb5\x86\xe0\xb4\x95\xe0\xb5\x8d\xe0\xb4\x95\xe0\xb5\x81\xe0\xb4\xb1\xe0\xb4\xbf\xe0\xb4\x95\xe0\xb5\x8d\xe0\xb4\x95\xe0\xb5\x81\xe0\xb4\xa8\xe0\xb5\x8d\xe0\xb4\xa8|\\n12345678901234567|\\n"
മനുഷ്യാവകാശങ്ങളെക്കുറിക്കുന്ന|
12345678901234567|

python wcwidth.wcswidth() measures width 17, while Hyper measures width 21.

Bengali

Sequence of language Bengali from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+09AE	‘\u09ae’	Lo	1	BENGALI LETTER MA
U+09BE	‘\u09be’	Mc	0	BENGALI VOWEL SIGN AA
U+09A8	‘\u09a8’	Lo	1	BENGALI LETTER NA
U+09AC	‘\u09ac’	Lo	1	BENGALI LETTER BA
U+09BE	‘\u09be’	Mc	0	BENGALI VOWEL SIGN AA
U+09A7	‘\u09a7’	Lo	1	BENGALI LETTER DHA
U+09BF	‘\u09bf’	Mc	0	BENGALI VOWEL SIGN I
U+0995	‘\u0995’	Lo	1	BENGALI LETTER KA
U+09BE	‘\u09be’	Mc	0	BENGALI VOWEL SIGN AA
U+09B0	‘\u09b0’	Lo	1	BENGALI LETTER RA
U+09C7	‘\u09c7’	Mc	0	BENGALI VOWEL SIGN E
U+09B0	‘\u09b0’	Lo	1	BENGALI LETTER RA

Total codepoints: 12

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa6\xae\xe0\xa6\xbe\xe0\xa6\xa8\xe0\xa6\xac\xe0\xa6\xbe\xe0\xa6\xa7\xe0\xa6\xbf\xe0\xa6\x95\xe0\xa6\xbe\xe0\xa6\xb0\xe0\xa7\x87\xe0\xa6\xb0|\\n1234567|\\n"
মানবাধিকারের|
1234567|

python wcwidth.wcswidth() measures width 7, while Hyper measures width 12.

Khmer, Central

Sequence of language Khmer, Central from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA
U+17C1	‘\u17c1’	Mc	0	KHMER VOWEL SIGN E
U+1785	‘\u1785’	Lo	1	KHMER LETTER CA
U+1780	‘\u1780’	Lo	1	KHMER LETTER KA
U+17D2	‘\u17d2’	Mn	0	KHMER SIGN COENG
U+178A	‘\u178a’	Lo	1	KHMER LETTER DA
U+17B8	‘\u17b8’	Mn	0	KHMER VOWEL SIGN II
U+1794	‘\u1794’	Lo	1	KHMER LETTER BA
U+17D2	‘\u17d2’	Mn	0	KHMER SIGN COENG
U+179A	‘\u179a’	Lo	1	KHMER LETTER RO
U+1780	‘\u1780’	Lo	1	KHMER LETTER KA
U+17B6	‘\u17b6’	Mc	0	KHMER VOWEL SIGN AA
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA
U+1787	‘\u1787’	Lo	1	KHMER LETTER CO
U+17B6	‘\u17b6’	Mc	0	KHMER VOWEL SIGN AA
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA
U+1780	‘\u1780’	Lo	1	KHMER LETTER KA
U+179B	‘\u179b’	Lo	1	KHMER LETTER LO
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA
U+17D2	‘\u17d2’	Mn	0	KHMER SIGN COENG
U+178A	‘\u178a’	Lo	1	KHMER LETTER DA
U+17B8	‘\u17b8’	Mn	0	KHMER VOWEL SIGN II
U+1796	‘\u1796’	Lo	1	KHMER LETTER PO
U+17B8	‘\u17b8’	Mn	0	KHMER VOWEL SIGN II
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA
U+17B7	‘\u17b7’	Mn	0	KHMER VOWEL SIGN I
U+1791	‘\u1791’	Lo	1	KHMER LETTER TO
U+17D2	‘\u17d2’	Mn	0	KHMER SIGN COENG
U+1792	‘\u1792’	Lo	1	KHMER LETTER THO
U+17B7	‘\u17b7’	Mn	0	KHMER VOWEL SIGN I
U+1798	‘\u1798’	Lo	1	KHMER LETTER MO
U+1793	‘\u1793’	Lo	1	KHMER LETTER NO
U+17BB	‘\u17bb’	Mn	0	KHMER VOWEL SIGN U
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA
U+17D2	‘\u17d2’	Mn	0	KHMER SIGN COENG
U+179F	‘\u179f’	Lo	1	KHMER LETTER SA

Total codepoints: 36

Shell test using printf(1), '|' should align in output:

$ printf "\xe1\x9e\x9f\xe1\x9f\x81\xe1\x9e\x85\xe1\x9e\x80\xe1\x9f\x92\xe1\x9e\x8a\xe1\x9e\xb8\xe1\x9e\x94\xe1\x9f\x92\xe1\x9e\x9a\xe1\x9e\x80\xe1\x9e\xb6\xe1\x9e\x9f\xe1\x9e\x87\xe1\x9e\xb6\xe1\x9e\x9f\xe1\x9e\x80\xe1\x9e\x9b\xe1\x9e\x9f\xe1\x9f\x92\xe1\x9e\x8a\xe1\x9e\xb8\xe1\x9e\x96\xe1\x9e\xb8\xe1\x9e\x9f\xe1\x9e\xb7\xe1\x9e\x91\xe1\x9f\x92\xe1\x9e\x92\xe1\x9e\xb7\xe1\x9e\x98\xe1\x9e\x93\xe1\x9e\xbb\xe1\x9e\x9f\xe1\x9f\x92\xe1\x9e\x9f|\\n1234567890123456789012|\\n"
សេចក្ដីប្រកាសជាសកលស្ដីពីសិទ្ធិមនុស្ស|
1234567890123456789012|

python wcwidth.wcswidth() measures width 22, while Hyper measures width 25.

Kannada

Sequence of language Kannada from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0CAE	‘\u0cae’	Lo	1	KANNADA LETTER MA
U+0CBE	‘\u0cbe’	Mc	0	KANNADA VOWEL SIGN AA
U+0CA8	‘\u0ca8’	Lo	1	KANNADA LETTER NA
U+0CB5	‘\u0cb5’	Lo	1	KANNADA LETTER VA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xb2\xae\xe0\xb2\xbe\xe0\xb2\xa8\xe0\xb2\xb5|\\n123|\\n"
ಮಾನವ|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Burmese

Sequence of language Burmese from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+1021	‘\u1021’	Lo	1	MYANMAR LETTER A
U+1015	‘\u1015’	Lo	1	MYANMAR LETTER PA
U+103C	‘\u103c’	Mc	0	MYANMAR CONSONANT SIGN MEDIAL RA
U+100A	‘\u100a’	Lo	1	MYANMAR LETTER NNYA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+1015	‘\u1015’	Lo	1	MYANMAR LETTER PA
U+103C	‘\u103c’	Mc	0	MYANMAR CONSONANT SIGN MEDIAL RA
U+100A	‘\u100a’	Lo	1	MYANMAR LETTER NNYA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+1006	‘\u1006’	Lo	1	MYANMAR LETTER CHA
U+102D	‘\u102d’	Mn	0	MYANMAR VOWEL SIGN I
U+102F	‘\u102f’	Mn	0	MYANMAR VOWEL SIGN U
U+1004	‘\u1004’	Lo	1	MYANMAR LETTER NGA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+101B	‘\u101b’	Lo	1	MYANMAR LETTER RA
U+102C	‘\u102c’	Mc	0	MYANMAR VOWEL SIGN AA

Total codepoints: 16

Shell test using printf(1), '|' should align in output:

$ printf "\xe1\x80\xa1\xe1\x80\x95\xe1\x80\xbc\xe1\x80\x8a\xe1\x80\xba\xe1\x80\x95\xe1\x80\xbc\xe1\x80\x8a\xe1\x80\xba\xe1\x80\x86\xe1\x80\xad\xe1\x80\xaf\xe1\x80\x84\xe1\x80\xba\xe1\x80\x9b\xe1\x80\xac|\\n12345678|\\n"
အပြည်ပြည်ဆိုင်ရာ|
12345678|

python wcwidth.wcswidth() measures width 8, while Hyper measures width 11.

Khün

Sequence of language Khün from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+1A20	‘\u1a20’	Lo	1	TAI THAM LETTER HIGH KA
U+1A32	‘\u1a32’	Lo	1	TAI THAM LETTER HIGH TA
U+1A65	‘\u1a65’	Mn	0	TAI THAM VOWEL SIGN I
U+1A20	‘\u1a20’	Lo	1	TAI THAM LETTER HIGH KA
U+1A63	‘\u1a63’	Mc	0	TAI THAM VOWEL SIGN AA
U+1A45	‘\u1a45’	Lo	1	TAI THAM LETTER WA
U+1A64	‘\u1a64’	Mc	0	TAI THAM VOWEL SIGN TALL AA
U+1A75	‘\u1a75’	Mn	0	TAI THAM SIGN TONE-1
U+1A2F	‘\u1a2f’	Lo	1	TAI THAM LETTER DA
U+1A60	‘\u1a60’	Mn	0	TAI THAM SIGN SAKOT
U+1A45	‘\u1a45’	Lo	1	TAI THAM LETTER WA
U+1A60	‘\u1a60’	Mn	0	TAI THAM SIGN SAKOT
U+1A3F	‘\u1a3f’	Lo	1	TAI THAM LETTER LOW YA
U+1A62	‘\u1a62’	Mn	0	TAI THAM VOWEL SIGN MAI SAT
U+1A3E	‘\u1a3e’	Lo	1	TAI THAM LETTER MA
U+1A36	‘\u1a36’	Lo	1	TAI THAM LETTER NA
U+1A69	‘\u1a69’	Mn	0	TAI THAM VOWEL SIGN U
U+1A54	‘\u1a54’	Lo	1	TAI THAM LETTER GREAT SA
U+1A29	‘\u1a29’	Lo	1	TAI THAM LETTER LOW CA
U+1A63	‘\u1a63’	Mc	0	TAI THAM VOWEL SIGN AA
U+1A60	‘\u1a60’	Mn	0	TAI THAM SIGN SAKOT
U+1A32	‘\u1a32’	Lo	1	TAI THAM LETTER HIGH TA

Total codepoints: 22

Shell test using printf(1), '|' should align in output:

$ printf "\xe1\xa8\xa0\xe1\xa8\xb2\xe1\xa9\xa5\xe1\xa8\xa0\xe1\xa9\xa3\xe1\xa9\x85\xe1\xa9\xa4\xe1\xa9\xb5\xe1\xa8\xaf\xe1\xa9\xa0\xe1\xa9\x85\xe1\xa9\xa0\xe1\xa8\xbf\xe1\xa9\xa2\xe1\xa8\xbe\xe1\xa8\xb6\xe1\xa9\xa9\xe1\xa9\x94\xe1\xa8\xa9\xe1\xa9\xa3\xe1\xa9\xa0\xe1\xa8\xb2|\\n123456789012|\\n"
ᨠᨲᩥᨠᩣᩅᩤ᩵ᨯ᩠ᩅ᩠ᨿᩢᨾᨶᩩᩔᨩᩣ᩠ᨲ|
123456789012|

python wcwidth.wcswidth() measures width 12, while Hyper measures width 15.

Sanskrit

Sequence of language Sanskrit from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0928	‘\u0928’	Lo	1	DEVANAGARI LETTER NA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0927	‘\u0927’	Lo	1	DEVANAGARI LETTER DHA
U+093F	‘\u093f’	Mc	0	DEVANAGARI VOWEL SIGN I
U+0915	‘\u0915’	Lo	1	DEVANAGARI LETTER KA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0930	‘\u0930’	Lo	1	DEVANAGARI LETTER RA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0923	‘\u0923’	Lo	1	DEVANAGARI LETTER NNA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0902	‘\u0902’	Mn	0	DEVANAGARI SIGN ANUSVARA

Total codepoints: 14

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa4\xbe\xe0\xa4\xa8\xe0\xa4\xb5\xe0\xa4\xbe\xe0\xa4\xa7\xe0\xa4\xbf\xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xb0\xe0\xa4\xbe\xe0\xa4\xa3\xe0\xa4\xbe\xe0\xa4\x82|\\n1234567|\\n"
मानवाधिकाराणां|
1234567|

python wcwidth.wcswidth() measures width 7, while Hyper measures width 13.

Tamang, Eastern

Sequence of language Tamang, Eastern from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+094D	‘\u094d’	Mn	0	DEVANAGARI SIGN VIRAMA
U+0939	‘\u0939’	Lo	1	DEVANAGARI LETTER HA
U+0940	‘\u0940’	Mc	0	DEVANAGARI VOWEL SIGN II
U+0938	‘\u0938’	Lo	1	DEVANAGARI LETTER SA
U+0947	‘\u0947’	Mn	0	DEVANAGARI VOWEL SIGN E

Total codepoints: 6

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa5\x8d\xe0\xa4\xb9\xe0\xa5\x80\xe0\xa4\xb8\xe0\xa5\x87|\\n123|\\n"
म्हीसे|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Nepali

Sequence of language Nepali from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0928	‘\u0928’	Lo	1	DEVANAGARI LETTER NA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa4\xbe\xe0\xa4\xa8\xe0\xa4\xb5|\\n123|\\n"
मानव|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Marathi

Sequence of language Marathi from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0928	‘\u0928’	Lo	1	DEVANAGARI LETTER NA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA
U+0940	‘\u0940’	Mc	0	DEVANAGARI VOWEL SIGN II

Total codepoints: 5

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa4\xbe\xe0\xa4\xa8\xe0\xa4\xb5\xe0\xa5\x80|\\n123|\\n"
मानवी|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 5.

Mon

Sequence of language Mon from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+101C	‘\u101c’	Lo	1	MYANMAR LETTER LA
U+102D	‘\u102d’	Mn	0	MYANMAR VOWEL SIGN I
U+1000	‘\u1000’	Lo	1	MYANMAR LETTER KA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT
U+101C	‘\u101c’	Lo	1	MYANMAR LETTER LA
U+101C	‘\u101c’	Lo	1	MYANMAR LETTER LA
U+1031	‘\u1031’	Mc	0	MYANMAR VOWEL SIGN E
U+102C	‘\u102c’	Mc	0	MYANMAR VOWEL SIGN AA
U+105A	‘\u105a’	Lo	1	MYANMAR LETTER MON NGA
U+103A	‘\u103a’	Mn	0	MYANMAR SIGN ASAT

Total codepoints: 10

Shell test using printf(1), '|' should align in output:

$ printf "\xe1\x80\x9c\xe1\x80\xad\xe1\x80\x80\xe1\x80\xba\xe1\x80\x9c\xe1\x80\x9c\xe1\x80\xb1\xe1\x80\xac\xe1\x81\x9a\xe1\x80\xba|\\n12345|\\n"
လိက်လလောၚ်|
12345|

python wcwidth.wcswidth() measures width 5, while Hyper measures width 7.

Gujarati

Sequence of language Gujarati from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0AAE	‘\u0aae’	Lo	1	GUJARATI LETTER MA
U+0ABE	‘\u0abe’	Mc	0	GUJARATI VOWEL SIGN AA
U+0AA8	‘\u0aa8’	Lo	1	GUJARATI LETTER NA
U+0AB5	‘\u0ab5’	Lo	1	GUJARATI LETTER VA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xaa\xae\xe0\xaa\xbe\xe0\xaa\xa8\xe0\xaa\xb5|\\n123|\\n"
માનવ|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Hindi

Sequence of language Hindi from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0928	‘\u0928’	Lo	1	DEVANAGARI LETTER NA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa4\xbe\xe0\xa4\xa8\xe0\xa4\xb5|\\n123|\\n"
मानव|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Telugu

Sequence of language Telugu from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0C2E	‘\u0c2e’	Lo	1	TELUGU LETTER MA
U+0C3E	‘\u0c3e’	Mn	0	TELUGU VOWEL SIGN AA
U+0C28	‘\u0c28’	Lo	1	TELUGU LETTER NA
U+0C35	‘\u0c35’	Lo	1	TELUGU LETTER VA
U+0C38	‘\u0c38’	Lo	1	TELUGU LETTER SA
U+0C4D	‘\u0c4d’	Mn	0	TELUGU SIGN VIRAMA
U+0C35	‘\u0c35’	Lo	1	TELUGU LETTER VA
U+0C24	‘\u0c24’	Lo	1	TELUGU LETTER TA
U+0C4D	‘\u0c4d’	Mn	0	TELUGU SIGN VIRAMA
U+0C35	‘\u0c35’	Lo	1	TELUGU LETTER VA
U+0C2E	‘\u0c2e’	Lo	1	TELUGU LETTER MA
U+0C41	‘\u0c41’	Mc	0	TELUGU VOWEL SIGN U
U+0C32	‘\u0c32’	Lo	1	TELUGU LETTER LA

Total codepoints: 13

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xb0\xae\xe0\xb0\xbe\xe0\xb0\xa8\xe0\xb0\xb5\xe0\xb0\xb8\xe0\xb1\x8d\xe0\xb0\xb5\xe0\xb0\xa4\xe0\xb1\x8d\xe0\xb0\xb5\xe0\xb0\xae\xe0\xb1\x81\xe0\xb0\xb2|\\n123456789|\\n"
మానవస్వత్వముల|
123456789|

python wcwidth.wcswidth() measures width 9, while Hyper measures width 10.

Maithili

Sequence of language Maithili from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0938	‘\u0938’	Lo	1	DEVANAGARI LETTER SA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0930	‘\u0930’	Lo	1	DEVANAGARI LETTER RA
U+094D	‘\u094d’	Mn	0	DEVANAGARI SIGN VIRAMA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA
U+092D	‘\u092d’	Lo	1	DEVANAGARI LETTER BHA
U+094C	‘\u094c’	Mc	0	DEVANAGARI VOWEL SIGN AU
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA

Total codepoints: 8

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xb8\xe0\xa4\xbe\xe0\xa4\xb0\xe0\xa5\x8d\xe0\xa4\xb5\xe0\xa4\xad\xe0\xa5\x8c\xe0\xa4\xae|\\n12345|\\n"
सार्वभौम|
12345|

python wcwidth.wcswidth() measures width 5, while Hyper measures width 7.

Panjabi, Eastern

Sequence of language Panjabi, Eastern from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0A2E	‘\u0a2e’	Lo	1	GURMUKHI LETTER MA
U+0A28	‘\u0a28’	Lo	1	GURMUKHI LETTER NA
U+0A41	‘\u0a41’	Mn	0	GURMUKHI VOWEL SIGN U
U+0A71	‘\u0a71’	Mn	0	GURMUKHI ADDAK
U+0A16	‘\u0a16’	Lo	1	GURMUKHI LETTER KHA
U+0A40	‘\u0a40’	Mc	0	GURMUKHI VOWEL SIGN II

Total codepoints: 6

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa8\xae\xe0\xa8\xa8\xe0\xa9\x81\xe0\xa9\xb1\xe0\xa8\x96\xe0\xa9\x80|\\n123|\\n"
ਮਨੁੱਖੀ|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Sinhala

Sequence of language Sinhala from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0DB8	‘\u0db8’	Lo	1	SINHALA LETTER MAYANNA
U+0DCF	‘\u0dcf’	Mc	0	SINHALA VOWEL SIGN AELA-PILLA
U+0DB1	‘\u0db1’	Lo	1	SINHALA LETTER DANTAJA NAYANNA
U+0DC0	‘\u0dc0’	Lo	1	SINHALA LETTER VAYANNA

Total codepoints: 4

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xb6\xb8\xe0\xb7\x8f\xe0\xb6\xb1\xe0\xb7\x80|\\n123|\\n"
මානව|
123|

python wcwidth.wcswidth() measures width 3, while Hyper measures width 4.

Bhojpuri

Sequence of language Bhojpuri from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0928	‘\u0928’	Lo	1	DEVANAGARI LETTER NA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0927	‘\u0927’	Lo	1	DEVANAGARI LETTER DHA
U+093F	‘\u093f’	Mc	0	DEVANAGARI VOWEL SIGN I
U+0915	‘\u0915’	Lo	1	DEVANAGARI LETTER KA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0930	‘\u0930’	Lo	1	DEVANAGARI LETTER RA

Total codepoints: 10

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa4\xbe\xe0\xa4\xa8\xe0\xa4\xb5\xe0\xa4\xbe\xe0\xa4\xa7\xe0\xa4\xbf\xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xb0|\\n123456|\\n"
मानवाधिकार|
123456|

python wcwidth.wcswidth() measures width 6, while Hyper measures width 10.

Magahi

Sequence of language Magahi from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+092E	‘\u092e’	Lo	1	DEVANAGARI LETTER MA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0928	‘\u0928’	Lo	1	DEVANAGARI LETTER NA
U+0935	‘\u0935’	Lo	1	DEVANAGARI LETTER VA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0927	‘\u0927’	Lo	1	DEVANAGARI LETTER DHA
U+093F	‘\u093f’	Mc	0	DEVANAGARI VOWEL SIGN I
U+0915	‘\u0915’	Lo	1	DEVANAGARI LETTER KA
U+093E	‘\u093e’	Mc	0	DEVANAGARI VOWEL SIGN AA
U+0930	‘\u0930’	Lo	1	DEVANAGARI LETTER RA

Total codepoints: 10

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xa4\xae\xe0\xa4\xbe\xe0\xa4\xa8\xe0\xa4\xb5\xe0\xa4\xbe\xe0\xa4\xa7\xe0\xa4\xbf\xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xb0|\\n123456|\\n"
मानवाधिकार|
123456|

python wcwidth.wcswidth() measures width 6, while Hyper measures width 10.

Chakma

Sequence of language Chakma from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0001111F	‘\U0001111f’	Lo	1	CHAKMA LETTER MAA
U+0001111A	‘\U0001111a’	Lo	1	CHAKMA LETTER NAA
U+0001112C	‘\U0001112c’	Mc	0	CHAKMA VOWEL SIGN E
U+0001112D	‘\U0001112d’	Mn	0	CHAKMA VOWEL SIGN AI
U+00011103	‘\U00011103’	Lo	1	CHAKMA LETTER AA
U+00011107	‘\U00011107’	Lo	1	CHAKMA LETTER KAA
U+00011134	‘\U00011134’	Mn	0	CHAKMA MAAYYAA
U+00011107	‘\U00011107’	Lo	1	CHAKMA LETTER KAA
U+00011125	‘\U00011125’	Lo	1	CHAKMA LETTER SAA
U+00011127	‘\U00011127’	Mn	0	CHAKMA VOWEL SIGN A
U+00011101	‘\U00011101’	Mn	0	CHAKMA SIGN ANUSVARA
U+00011122	‘\U00011122’	Lo	1	CHAKMA LETTER RAA
U+00011134	‘\U00011134’	Mn	0	CHAKMA MAAYYAA

Total codepoints: 13

Shell test using printf(1), '|' should align in output:

$ printf "\xf0\x91\x84\x9f\xf0\x91\x84\x9a\xf0\x91\x84\xac\xf0\x91\x84\xad\xf0\x91\x84\x83\xf0\x91\x84\x87\xf0\x91\x84\xb4\xf0\x91\x84\x87\xf0\x91\x84\xa5\xf0\x91\x84\xa7\xf0\x91\x84\x81\xf0\x91\x84\xa2\xf0\x91\x84\xb4|\\n1234567|\\n"
𑄟𑄚𑄬𑄭𑄃𑄇𑄴𑄇𑄥𑄧𑄁𑄢𑄴|
1234567|

python wcwidth.wcswidth() measures width 7, while Hyper measures width 8.

Tibetan, Central

Sequence of language Tibetan, Central from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0F7C	‘\u0f7c’	Mn	0	TIBETAN VOWEL SIGN O
U+0F42	‘\u0f42’	Lo	1	TIBETAN LETTER GA
U+0F66	‘\u0f66’	Lo	1	TIBETAN LETTER SA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F54	‘\u0f54’	Lo	1	TIBETAN LETTER PA
U+0F60	‘\u0f60’	Lo	1	TIBETAN LETTER -A
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F41	‘\u0f41’	Lo	1	TIBETAN LETTER KHA
U+0FB2	‘\u0fb2’	Mn	0	TIBETAN SUBJOINED LETTER RA
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F58	‘\u0f58’	Lo	1	TIBETAN LETTER MA
U+0F66	‘\u0f66’	Lo	1	TIBETAN LETTER SA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F60	‘\u0f60’	Lo	1	TIBETAN LETTER -A
U+0F42	‘\u0f42’	Lo	1	TIBETAN LETTER GA
U+0F63	‘\u0f63’	Lo	1	TIBETAN LETTER LA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F42	‘\u0f42’	Lo	1	TIBETAN LETTER GA
U+0FB1	‘\u0fb1’	Mn	0	TIBETAN SUBJOINED LETTER YA
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F42	‘\u0f42’	Lo	1	TIBETAN LETTER GA
U+0F53	‘\u0f53’	Lo	1	TIBETAN LETTER NA
U+0F66	‘\u0f66’	Lo	1	TIBETAN LETTER SA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F5A	‘\u0f5a’	Lo	1	TIBETAN LETTER TSHA
U+0F74	‘\u0f74’	Mn	0	TIBETAN VOWEL SIGN U
U+0F63	‘\u0f63’	Lo	1	TIBETAN LETTER LA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F45	‘\u0f45’	Lo	1	TIBETAN LETTER CA
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F60	‘\u0f60’	Lo	1	TIBETAN LETTER -A
U+0F51	‘\u0f51’	Lo	1	TIBETAN LETTER DA
U+0FB2	‘\u0fb2’	Mn	0	TIBETAN SUBJOINED LETTER RA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F5E	‘\u0f5e’	Lo	1	TIBETAN LETTER ZHA
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F42	‘\u0f42’	Lo	1	TIBETAN LETTER GA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F56	‘\u0f56’	Lo	1	TIBETAN LETTER BA
U+0FB1	‘\u0fb1’	Mn	0	TIBETAN SUBJOINED LETTER YA
U+0F74	‘\u0f74’	Mn	0	TIBETAN VOWEL SIGN U
U+0F44	‘\u0f44’	Lo	1	TIBETAN LETTER NGA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F62	‘\u0f62’	Lo	1	TIBETAN LETTER RA
U+0F74	‘\u0f74’	Mn	0	TIBETAN VOWEL SIGN U
U+0F44	‘\u0f44’	Lo	1	TIBETAN LETTER NGA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F49	‘\u0f49’	Lo	1	TIBETAN LETTER NYA
U+0F7A	‘\u0f7a’	Mn	0	TIBETAN VOWEL SIGN E
U+0F66	‘\u0f66’	Lo	1	TIBETAN LETTER SA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F45	‘\u0f45’	Lo	1	TIBETAN LETTER CA
U+0F53	‘\u0f53’	Lo	1	TIBETAN LETTER NA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F51	‘\u0f51’	Lo	1	TIBETAN LETTER DA
U+0F74	‘\u0f74’	Mn	0	TIBETAN VOWEL SIGN U
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F44	‘\u0f44’	Lo	1	TIBETAN LETTER NGA
U+0F7C	‘\u0f7c’	Mn	0	TIBETAN VOWEL SIGN O
U+0F66	‘\u0f66’	Lo	1	TIBETAN LETTER SA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F60	‘\u0f60’	Lo	1	TIBETAN LETTER -A
U+0F5B	‘\u0f5b’	Lo	1	TIBETAN LETTER DZA
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F53	‘\u0f53’	Lo	1	TIBETAN LETTER NA
U+0F58	‘\u0f58’	Lo	1	TIBETAN LETTER MA
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F56	‘\u0f56’	Lo	1	TIBETAN LETTER BA
U+0FB1	‘\u0fb1’	Mn	0	TIBETAN SUBJOINED LETTER YA
U+0F7A	‘\u0f7a’	Mn	0	TIBETAN VOWEL SIGN E
U+0F51	‘\u0f51’	Lo	1	TIBETAN LETTER DA
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F54	‘\u0f54’	Lo	1	TIBETAN LETTER PA
U+0F60	‘\u0f60’	Lo	1	TIBETAN LETTER -A
U+0F72	‘\u0f72’	Mn	0	TIBETAN VOWEL SIGN I
U+0F0B	‘\u0f0b’	Po	1	TIBETAN MARK INTERSYLLABIC TSHEG
U+0F41	‘\u0f41’	Lo	1	TIBETAN LETTER KHA
U+0F62	‘\u0f62’	Lo	1	TIBETAN LETTER RA
U+0F0D	‘\u0f0d’	Po	1	TIBETAN MARK SHAD

Total codepoints: 83

Shell test using printf(1), '|' should align in output:

$ printf "\xe0\xbd\xbc\xe0\xbd\x82\xe0\xbd\xa6\xe0\xbc\x8b\xe0\xbd\x94\xe0\xbd\xa0\xe0\xbd\xb2\xe0\xbc\x8b\xe0\xbd\x81\xe0\xbe\xb2\xe0\xbd\xb2\xe0\xbd\x98\xe0\xbd\xa6\xe0\xbc\x8b\xe0\xbd\xa0\xe0\xbd\x82\xe0\xbd\xa3\xe0\xbc\x8b\xe0\xbd\x82\xe0\xbe\xb1\xe0\xbd\xb2\xe0\xbc\x8b\xe0\xbd\x82\xe0\xbd\x93\xe0\xbd\xa6\xe0\xbc\x8b\xe0\xbd\x9a\xe0\xbd\xb4\xe0\xbd\xa3\xe0\xbc\x8b\xe0\xbd\x85\xe0\xbd\xb2\xe0\xbc\x8b\xe0\xbd\xa0\xe0\xbd\x91\xe0\xbe\xb2\xe0\xbc\x8b\xe0\xbd\x9e\xe0\xbd\xb2\xe0\xbd\x82\xe0\xbc\x8b\xe0\xbd\x96\xe0\xbe\xb1\xe0\xbd\xb4\xe0\xbd\x84\xe0\xbc\x8b\xe0\xbd\xa2\xe0\xbd\xb4\xe0\xbd\x84\xe0\xbc\x8b\xe0\xbd\x89\xe0\xbd\xba\xe0\xbd\xa6\xe0\xbc\x8b\xe0\xbd\x85\xe0\xbd\x93\xe0\xbc\x8b\xe0\xbd\x91\xe0\xbd\xb4\xe0\xbc\x8b\xe0\xbd\x84\xe0\xbd\xbc\xe0\xbd\xa6\xe0\xbc\x8b\xe0\xbd\xa0\xe0\xbd\x9b\xe0\xbd\xb2\xe0\xbd\x93\xe0\xbd\x98\xe0\xbd\xb2\xe0\xbc\x8b\xe0\xbd\x96\xe0\xbe\xb1\xe0\xbd\xba\xe0\xbd\x91\xe0\xbc\x8b\xe0\xbd\x94\xe0\xbd\xa0\xe0\xbd\xb2\xe0\xbc\x8b\xe0\xbd\x81\xe0\xbd\xa2\xe0\xbc\x8d|\\n12345678901234567890123456789012345678901234567890123456789012|\\n"
ོགས་པའི་ཁྲིམས་འགལ་གྱི་གནས་ཚུལ་ཅི་འདྲ་ཞིག་བྱུང་རུང་ཉེས་ཅན་དུ་ངོས་འཛིནམི་བྱེད་པའི་ཁར།|
12345678901234567890123456789012345678901234567890123456789012|

python wcwidth.wcswidth() measures width 62, while Hyper measures width 63.

Yaneshaʼ

Sequence of language Yaneshaʼ from midpoint of alignment failure records:

Codepoint	Python	Category	wcwidth	Name
U+0303	‘\u0303’	Mn	0	COMBINING TILDE
U+0079	‘y’	Ll	1	LATIN SMALL LETTER Y
U+0065	‘e’	Ll	1	LATIN SMALL LETTER E
U+0079	‘y’	Ll	1	LATIN SMALL LETTER Y
U+0063	‘c’	Ll	1	LATIN SMALL LETTER C
U+0308	‘\u0308’	Mn	0	COMBINING DIAERESIS
U+0068	‘h’	Ll	1	LATIN SMALL LETTER H
U+0061	‘a’	Ll	1	LATIN SMALL LETTER A
U+0027	“’”	Po	1	APOSTROPHE
U+0079	‘y’	Ll	1	LATIN SMALL LETTER Y
U+0065	‘e’	Ll	1	LATIN SMALL LETTER E
U+006E	‘n’	Ll	1	LATIN SMALL LETTER N
U+0061	‘a’	Ll	1	LATIN SMALL LETTER A

Total codepoints: 13

Shell test using printf(1), '|' should align in output:

$ printf "\xcc\x83yeyc\xcc\x88ha'yena|\\n12345678901|\\n"
̃yeyc̈ha'yena|
12345678901|

python wcwidth.wcswidth() measures width 11, while Hyper measures width 12.